SEO HARDCORE
  • Разборы патентов
    • Патенты Google
  • Скоро SEO инструменты
  • Скоро SEO аналитика
  • seohardcore
SEO HARDCORE
назад

Как Google использует распознавание лиц и кластеризацию для очистки и переранжирования выдачи в Поиске по Картинкам

ADJUSTMENT OF FACIAL IMAGE SEARCH RESULTS (Корректировка результатов поиска изображений лиц)
  • US9268793B2
  • Google LLC
  • 2014-03-12
  • 2016-02-23
  • Мультимедиа
  • SERP
  • Описание
  • Разбор
  • Выводы
  • Практика
  • FAQ
  • Похожие

Google применяет технологию компьютерного зрения для улучшения поиска изображений по именам людей. Система анализирует топ выдачи, распознает лица и группирует похожие изображения. Определив доминирующий кластер (искомого человека), система переранжирует результаты: визуально похожие изображения повышаются, а "выбросы" (фото других людей) понижаются, игнорируя противоречивые текстовые сигналы.

Описание

Какую проблему решает

Патент решает проблему появления «выбросов» (outlier images) в результатах поиска изображений по запросам, содержащим имена людей. Эта проблема возникает, когда стандартные алгоритмы ранжирования слишком полагаются на внешние сигналы, такие как текстовые подписи, теги изображений или поведенческие метрики (selection rates/CTR). В результате в топе могут оказаться изображения, которые текстуально релевантны, но визуально изображают другого человека. Изобретение направлено на обеспечение визуальной консистентности выдачи.

Что запатентовано

Запатентована система корректировки ранжирования в Image Search, основанная на компьютерном зрении. Система анализирует визуальное содержание уже отобранных результатов, генерирует временные шаблоны лиц (facial templates) и кластеризует их. Определив визуальный консенсус (inlier cluster), система переранжирует выдачу, отдавая приоритет изображениям, которые соответствуют этому консенсусу, и понижая визуальные выбросы.

Как это работает

Механизм активируется на этапе пост-обработки результатов поиска:

  • Распознавание: Система детектирует лица на изображениях в топе выдачи и создает временные facial templates.
  • Кластеризация: Изображения группируются на основе схожести этих шаблонов.
  • Определение эталона: Самый большой кластер определяется как inlier cluster (предполагаемое лицо искомого человека).
  • Обработка дубликатов: Система идентифицирует и группирует дубликаты изображений, чтобы они не искажали результаты анализа.
  • Оценка (Inlier Score): Для каждого изображения рассчитывается inlier score — степень его схожести с эталонным кластером (с учетом дедупликации).
  • Переранжирование: Исходные оценки корректируются. Изображения с высоким inlier score повышаются, а с низким — понижаются.

Актуальность для SEO

Высокая. Использование компьютерного зрения для валидации и уточнения результатов поиска является стандартом в современных поисковых системах. Хотя конкретные методы распознавания лиц могли эволюционировать с момента подачи патента (например, к нейросетевым эмбеддингам), базовая концепция использования визуальной кластеризации для обеспечения релевантности в поиске по сущностям (людям) крайне актуальна.

Важность для SEO

Влияние значительно (7/10) в контексте Image Search. Патент демонстрирует механизм, при котором визуальный анализ может переопределить традиционные сигналы ранжирования (ALT-теги, подписи, CTR). Если изображение визуально не соответствует консенсусу выдачи по имени человека, оно будет понижено как outlier, независимо от качества текстовой оптимизации. Это критически важно для ORM и продвижения контента, связанного с персоналиями.

Детальный разбор

Термины и определения

Duplicate Images (Дубликаты изображений)
Изображения, чьи Facial Templates имеют оценку схожести, превышающую порог дублирования (duplicate threshold). Это могут быть идентичные или слегка измененные (например, кадрированные) версии одного фото.
Facial Template / Face Template (Шаблон лица)
Машинно-читаемое представление характеристик лица (например, вектор признаков, основанный на структурах лица). В патенте подчеркивается, что эти шаблоны временные (temporary) и не сохраняются в памяти (not persisted to memory).
Inlier Cluster (Внутренний / Эталонный кластер)
Кластер с наибольшим количеством изображений в наборе результатов. Он представляет визуальный консенсус — предполагаемое лицо искомого человека.
Inlier Score (Оценка соответствия эталону)
Метрика, измеряющая схожесть Facial Template конкретного изображения с шаблонами изображений из Inlier Cluster.
Name Query (Именной запрос)
Запрос, который указывает имя человека. Часто применяется к знаменитостям (Celebrity Query).
Outlier Images (Выбросы)
Изображения, попавшие в выдачу на основе внешних сигналов, но визуально не соответствующие Inlier Cluster.
Popularity Threshold (Порог популярности)
Критерий (например, частота запросов), который может использоваться для активации этого механизма только для популярных запросов.
Search Score (Оценка поиска)
Исходная оценка релевантности изображения, присвоенная поисковой системой до применения корректировок.

Ключевые утверждения (Анализ Claims)

Claim 1 (Независимый пункт): Описывает основной метод корректировки результатов.

  1. Система получает ранжированные изображения, релевантные запросу, с их Search Scores.
  2. Для первого набора изображений: детектируется лицо и генерируется временный Facial Template (не сохраняемый в памяти).
  3. Изображения кластеризуются на основе схожести шаблонов.
  4. Определяется количество изображений в кластерах.
  5. Кластер с наибольшим количеством выбирается как Inlier Cluster.
  6. Для каждого изображения определяется Inlier Score (схожесть с Inlier Cluster).
  7. Изображения переранжируются на основе Inlier Scores.

Ключевое уточнение в Claim 1: При определении Inlier Score, если изображения, принадлежащие к Inlier Cluster, определены как дубликаты друг друга, то для расчета используется только одно изображение из этой группы дубликатов.

Claim 5 и 6 (Зависимые): Детализируют обработку дубликатов.

Система вычисляет попарные оценки схожести (pairwise similarity scores). Пары, превышающие duplicate threshold, группируются как дубликаты; остальные считаются уникальными (Claim 5). Inlier scores рассчитываются на основе уникальных изображений и только одного представителя из каждой группы дубликатов (Claim 6).

Claim 9 (Зависимый): Уточняет расчет Inlier Score.

Inlier Score определяется как мера схожести центральной тенденции (central tendency similarity measure) — например, среднее или медианное значение схожести с изображениями из Inlier Cluster.

Claim 10 (Зависимый): Определяет область применения.

Метод применяется к изображениям, релевантным Name Query, который указывает имя человека и соответствует Popularity Threshold.

Где и как применяется

Изобретение применяется в системе поиска по изображениям (Image Search) и затрагивает финальные этапы обработки запроса.

RANKING – Ранжирование
На этом этапе генерируется исходный набор изображений с их Search Scores, основанными на стандартных сигналах (текст, теги, поведенческие факторы). Эти данные служат входом для системы корректировки.

RERANKING – Переранжирование
Основная область применения патента. Модуль Image Adjuster активируется после основного ранжирования:

  1. Query Filter проверяет, является ли запрос подходящим (например, популярный Name Query).
  2. Feature Extractor анализирует визуальный контент и генерирует временные Facial Templates.
  3. Image Clusterer группирует результаты и определяет Inlier Cluster.
  4. Score Adjuster рассчитывает Inlier Scores и выполняет финальное переранжирование.

Офлайн-процессы (Preprocessing / INDEXING)
Патент упоминает, что для популярных запросов корректировки могут быть рассчитаны заранее (pre-processed) и кэшированы для ускорения ответа. Обновление может происходить периодически (например, раз в день).

Входные данные:

  • Исходный ранжированный список изображений и их Search Scores.
  • Пиксельные данные изображений (для визуального анализа).

Выходные данные:

  • Переранжированный список изображений со скорректированными оценками.

На что влияет

  • Специфические запросы: Влияет исключительно на Name Queries (запросы с именами людей).
  • Конкретные типы контента: Изображения в Image Search, на которых система может детектировать лица.
  • Конкретные ниши или тематики: Новости, СМИ, развлечения, спорт, биографии и любые ниши, связанные с публичными персонами.

Когда применяется

  • Триггеры активации: Запрос идентифицирован как Name Query и, в некоторых реализациях, превышает Popularity Threshold (Claim 10).
  • Временные рамки: Может применяться в реальном времени (at query time), возможно, с ограничением на Топ-N результатов для скорости, или в режиме предварительной обработки (pre-processed).

Пошаговый алгоритм

Этап 1: Инициализация и Извлечение признаков

  1. Система получает исходный набор ранжированных изображений.
  2. Feature Extractor обрабатывает изображения. Для каждого обнаруживается лицо и генерируется временный Facial Template. Изображения без лиц исключаются из процесса.

Этап 2: Кластеризация и Обработка дубликатов

  1. Вычисляются попарные оценки схожести (pairwise similarity scores) между всеми шаблонами.
  2. Изображения, чья схожесть превышает duplicate threshold, группируются как дубликаты. Остальные помечаются как уникальные.
  3. Image Clusterer группирует изображения на основе схожести шаблонов.

Этап 3: Идентификация эталона

  1. Подсчитывается количество изображений в каждом кластере (при подсчете дубликаты могут учитываться как один элемент).
  2. Кластер с максимальным количеством выбирается как Inlier Cluster.

Этап 4: Расчет Inlier Score

  1. Для каждого изображения рассчитывается Inlier Score.
  2. Расчет производится как мера центральной тенденции (например, среднее сходство) шаблона изображения с шаблонами из Inlier Cluster.
  3. Критически важно: При сравнении используются только уникальные изображения и по одному представителю от каждой группы дубликатов из Inlier Cluster.
  4. Изображениям из очень маленьких кластеров может быть присвоен минимальный балл.

Этап 5: Переранжирование и Выдача

  1. Score Adjuster корректирует исходные Search Scores, применяя функции повышения (Boost) или понижения (Demote) на основе Inlier Scores.
  2. Изображения пересортировываются.
  3. Временные Facial Templates удаляются из памяти.

Какие данные и как использует

Данные на входе

  • Мультимедиа факторы (Визуальные данные): Пиксельные данные изображений. Это основной источник данных для генерации Facial Templates. Анализируются машиночитаемые свойства структур лица.
  • Поведенческие факторы: Query Logs используются для определения популярности запроса (Popularity Threshold). Также упоминаются Selection rates (CTR) как фактор исходного ранжирования, который данный патент стремится скорректировать.
  • Контентные факторы: Image tags и подписи (captions) также упоминаются как факторы исходного ранжирования, которые могут приводить к появлению выбросов.

Какие метрики используются и как они считаются

  • Facial Template Similarity: Метрика схожести между двумя шаблонами лиц.
  • Inlier Score: Агрегированная оценка схожести изображения с Inlier Cluster, рассчитываемая как central tendency similarity measure.
  • Cluster Quantity (Cardinality): Количество изображений в кластере (часто с учетом дедупликации).
  • Duplicate Threshold: Порог схожести для признания изображений дубликатами.
  • Формулы расчета: Патент приводит пример линейных функций для корректировки оценок:

    Если IS>IST1IS > IST_1IS>IST1 (Порог бустинга):

    Adj_Scorej=SSj∗(B∗(ISj−IST1)+1)Adj\_Score_j = SS_j * (B * (IS_j - IST_1) + 1)Adj_Scorej​=SSj​∗(B∗(ISj​−IST1​)+1)

    Если IS<IST2IS < IST_2IS<IST2 (Порог демоутинга):

    Adj_Scorej=SSj∗max((D∗(ISj−IST2)+1),SD)Adj\_Score_j = SS_j * max((D * (IS_j - IST_2) + 1), SD)Adj_Scorej​=SSj​∗max((D∗(ISj​−IST2​)+1),SD)

    Где: B – фактор бустинга; D – фактор демоутинга; SD – фактор сильного демоутинга.

Выводы

  1. Визуальная консистентность как ключевой сигнал переранжирования: Для именных запросов в Image Search визуальное соответствие является приоритетным фактором, который может переопределить стандартные сигналы ранжирования (текст, теги, CTR). Система активно верифицирует, кто изображен на фото.
  2. Релевантность на основе консенсуса (Inlier Cluster): Система не полагается на заранее заданную базу лиц. Она динамически определяет эталон искомого человека, предполагая, что самый большой кластер похожих лиц в текущей выдаче является правильным.
  3. Сложная обработка дубликатов: Патент уделяет значительное внимание дедупликации. Дубликаты не должны искажать размер кластера или расчет Inlier Score. Это повышает точность определения эталона и оценки схожести.
  4. Борьба с манипуляциями и ошибками маркировки: Механизм напрямую направлен на исправление ошибок ранжирования, вызванных вводящими в заблуждение подписями или кликбейтом.
  5. Конфиденциальность и временные данные: Явно указано (Claim 1), что генерируемые Facial Templates являются временными и не сохраняются в памяти, что важно для обеспечения конфиденциальности при обработке биометрических данных.

Практика

Best practices (это мы делаем)

  • Обеспечение визуальной релевантности: Критически важно для Image SEO по персоналиям. Изображение должно четко и однозначно изображать человека, под запрос которого оно оптимизируется. Визуальное соответствие интенту является обязательным.
  • Использование высококачественных изображений лиц: Используйте четкие, качественные фотографии, на которых лицо хорошо различимо. Это облегчает генерацию точного Facial Template и увеличивает вероятность получения высокого Inlier Score.
  • Публикация разнообразных изображений: Поскольку система эффективно обрабатывает дубликаты (считая их за один элемент при анализе), для достижения максимальной видимости в топе Image Search стратегически выгоднее иметь несколько разных качественных фотографий персоны, а не множество копий одной.

Worst practices (это делать не надо)

  • Вводящие в заблуждение подписи и кликбейт (Misleading Captions): Использование фотографии Человека А для привлечения трафика по запросу «Человек Б» путем манипуляции подписями или тегами. Описанный механизм активно понижает такие изображения как outliers.
  • Игнорирование визуального содержания: Полагаться исключительно на оптимизацию ALT-текстов и окружающего текста. Этой оптимизации недостаточно, если само изображение визуально нерелевантно запросу о человеке.
  • Использование стоковых или нечетких изображений: Использование изображений низкого качества или аватаров вместо реальных фото может привести к ошибкам распознавания или невозможности сгенерировать Facial Template, исключая изображение из процесса бустинга.

Стратегическое значение

Патент подтверждает стратегическую важность компьютерного зрения в поиске. Google интерпретирует визуальное содержание и использует эту интерпретацию для верификации релевантности, особенно при поиске сущностей (людей). Для SEO это означает, что в Image Search фактическое визуальное содержание изображения становится важнее его метаданных. Это критично для управления репутацией (ORM) и видимости брендов/персон.

Практические примеры

Сценарий: Очистка выдачи по имени знаменитости от фото партнера.

  1. Запрос: Пользователь ищет «John Famous».
  2. Исходная выдача: В топе 7 фото John Famous и 3 фото его жены Jane Star. Фото Jane Star ранжируются высоко, так как взяты из популярных статей о John Famous.
  3. Активация механизма: Система идентифицирует запрос как Name Query.
  4. Кластеризация: Система анализирует лица. 7 фото формируют Кластер А (John), 3 фото — Кластер Б (Jane).
  5. Выбор эталона: Кластер А выбирается как Inlier Cluster.
  6. Переранжирование: Фотографии Jane Star (Кластер Б) получают низкий Inlier Score, так как не похожи на Кластер А, и понижаются в выдаче. Фотографии John Famous повышаются.
  7. Результат: В финальной выдаче Image Search доминируют изображения искомого человека (John Famous).

Вопросы и ответы

Применяется ли этот механизм ко всем запросам в поиске по картинкам?

Нет. Патент указывает, что механизм предназначен для именных запросов (Name Queries), особенно тех, которые касаются популярных личностей и превышают определенный порог популярности (Popularity Threshold). Для общих или неодушевленных запросов этот механизм не используется.

Что такое Inlier Cluster и как он определяется?

Inlier Cluster — это самая большая группа изображений среди результатов поиска, лица на которых визуально похожи друг на друга. Система предполагает, что этот кластер представляет искомого человека, и использует его как визуальный эталон для оценки всех остальных изображений в выдаче.

Как система обрабатывает дубликаты изображений?

Дубликаты обрабатываются очень тщательно (Claims 1, 5, 6). Система идентифицирует их через попарное сравнение Facial Templates. При расчете Inlier Score используется только один представитель из группы дубликатов. Это предотвращает искажение эталонного кластера из-за множества копий одной и той же фотографии.

Что произойдет, если я оптимизирую ALT-теги и заголовки, но использую фото другого человека?

Ваше изображение может попасть в первоначальную выдачу благодаря текстовой оптимизации. Однако затем механизм переранжирования сравнит его с Inlier Cluster. Поскольку визуально оно не соответствует искомому человеку, оно получит низкий Inlier Score и будет понижено в ранжировании.

Влияет ли качество изображения на работу этого алгоритма?

Да, косвенно. Для работы алгоритма необходимо успешное детектирование лица и генерация Facial Template. Если изображение низкого качества или лицо плохо видно, система может не справиться с этой задачей. В этом случае изображение исключается из процесса корректировки и его ранг не изменяется этим алгоритмом.

Сохраняет ли Google данные о лицах (Facial Templates)?

Согласно патенту (Claim 1), система генерирует временные шаблоны лиц (temporary face templates), которые «не сохраняются в памяти» (not persisted to memory). Они используются на лету для кластеризации и расчета оценок, а затем удаляются.

Что произойдет, если в выдаче нет явного доминирующего кластера (например, 50/50)?

Патент рассматривает ситуацию равенства размеров кластеров. Предлагаются варианты решения: случайный выбор одного из кластеров; анализ базовых оценок качества (quality scores) изображений в кластерах и выбор лучшего; оценка «плотности» (tightness) кластеров; или объединение этих кластеров.

Может ли этот механизм понизить релевантное изображение искомого человека?

Да, если оно сильно отличается от большинства других его фотографий в выдаче (например, очень старое фото или необычный грим). Если оно не попадет в Inlier Cluster и сформирует отдельный маленький кластер, оно может быть классифицировано как outlier и понижено.

Работает ли система в реальном времени?

Патент описывает оба варианта. Система может работать в реальном времени (at query time), анализируя Топ-N результатов для скорости. Также для очень популярных запросов анализ может выполняться заранее (pre-processed), а результаты кэшироваться и периодически обновляться.

Каково стратегическое значение этого патента для SEO?

Стратегическое значение заключается в подтверждении того, что для Image Search визуальное содержание имеет приоритет над метаданными при поиске сущностей (людей). Это требует от SEO-специалистов фокусироваться на качестве и фактической релевантности мультимедийного контента, а не только на оптимизации тегов.

Похожие патенты

Как Google выбирает главное изображение для новостных статей и кластеров в Google News и Top Stories
Google использует многофакторную систему для выбора наилучшего изображения, представляющего новостную статью или кластер. Система фильтрует неподходящие изображения (рекламу, логотипы), анализирует контекст (подписи, Alt-текст, расположение рядом с заголовком) и оценивает технические параметры (размер, формат), чтобы выбрать изображение для показа в результатах поиска новостей.
  • US8775436B1
  • 2014-07-08
  • Мультимедиа

  • Семантика и интент

  • SERP

Как Google комбинирует визуальное сходство и семантические метки для улучшения поиска по картинке (Visual Search)
Google использует систему поиска по изображению, которая сочетает анализ визуальных характеристик и семантических меток. Система генерирует высокоточные метки (High Confidence Labels) для изображения, анализируя текст, связанный с визуально похожими картинками в интернете. Затем она ранжирует кандидатов, используя модель визуального сходства, обученную на основе человеческих оценок, и применяет правила фильтрации для обеспечения однородности результатов.
  • US8429173B1
  • 2013-04-23
  • Семантика и интент

  • Мультимедиа

  • SERP

Как Google агрегирует и ранжирует пользовательские метки для идентификации объектов в Визуальном поиске (Google Lens)
Google использует этот механизм для повышения точности идентификации объектов при поиске по изображению. Система находит множество визуально похожих изображений, загруженных пользователями (UGC), и анализирует их текстовые метки. Метки группируются по смыслу, а затем эти группы ранжируются на основе совокупной визуальной релевантности. Это позволяет определить наиболее вероятное название объекта, опираясь на коллективное мнение.
  • US9424279B2
  • 2016-08-23
  • Мультимедиа

  • Семантика и интент

  • SERP

Как Google кластеризует результаты поиска по картинкам и выбирает репрезентативное (каноническое) изображение для показа
Google организует результаты поиска изображений в иерархические кластеры на основе визуального сходства. Для каждого кластера выбирается «каноническое изображение» — часто это изображение с самым высоким исходным рейтингом или наиболее визуально авторитетное (с использованием метрик типа VisualRank). Эта структура определяет, как изображения группируются и какое изображение получает максимальную видимость в интерфейсе Google Images.
  • US8352465B1
  • 2013-01-08
  • Мультимедиа

  • SERP

Как Google персонализирует результаты поиска изображений на основе языка и местоположения пользователя
Google персонализирует Поиск Изображений, анализируя исторические данные о кликах. Система сравнивает, на что кликает общая популяция пользователей, с тем, что предпочитают пользователи с тем же языком и местоположением. Если предпочтения значительно различаются, Google переранжирует изображения в соответствии с локальным консенсусом, обеспечивая культурно и контекстуально релевантные результаты.
  • US8504547B1
  • 2013-08-06
  • Персонализация

  • Мультимедиа

  • Поведенческие сигналы

Популярные патенты

Как Google (YouTube) ранжирует видео, повышая те, которые начинают сессию просмотра и приводят внешний трафик ("Lead Video")
Google использует систему ранжирования для видеоплатформ, которая идентифицирует "ведущее видео" (Lead Video), инициирующее сессию просмотра. Система применяет повышающие коэффициенты (Scaling Factors) ко времени просмотра этого видео. Видео, привлекшие пользователя на платформу из внешних источников (например, из социальных сетей или поиска Google), получают значительно больший коэффициент, чем те, что были найдены через внутренние рекомендации.
  • US10346417B2
  • 2019-07-09
  • Мультимедиа

  • Поведенческие сигналы

  • SERP

Как Google определяет ключевые аспекты (фасеты) сущности для организации и диверсификации поисковой выдачи
Google использует систему для автоматической идентификации различных «аспектов» (подтем или фасетов) сущности в запросе. Анализируя логи запросов и базы знаний, система определяет, как пользователи исследуют информацию. Затем эти аспекты ранжируются по популярности и разнообразию и используются для организации результатов поиска в структурированном виде (mashup), облегчая пользователю навигацию и исследование темы.
  • US8458171B2
  • 2013-06-04
  • Семантика и интент

  • SERP

  • Поведенческие сигналы

Как Google динамически фильтрует и изменяет подсказки Autocomplete в реальном времени при вводе навигационного запроса
Google использует систему для оптимизации функции автозаполнения (Autocomplete). При вводе частичного запроса система определяет широкий набор потенциальных навигационных ссылок (Superset) и фильтрует его до узкого подмножества (Subset) на основе сигналов, таких как история поиска, популярность и тип документа. Интерфейс может динамически изменять отображаемые подсказки, если пользователь делает паузу при вводе.
  • US9454621B2
  • 2016-09-27
  • Семантика и интент

  • SERP

  • Поведенческие сигналы

Как Google использует социальные связи для выявления предвзятых ссылок и борьбы со ссылочными схемами и кликфродом
Google анализирует взаимоотношения между администраторами веб-сайтов (используя данные социальных сетей), чтобы определить независимость ссылок или кликов по рекламе. Если обнаружена тесная связь, это интерпретируется как предвзятость (Bias). В результате вес ссылки для ранжирования может быть снижен (борьба с Search Spamming), или клик по рекламе может быть дисконтирован (борьба с Ad Spamming).
  • US10402457B1
  • 2019-09-03
  • Ссылки

  • Антиспам

  • Краулинг

Как Google ранжирует сущности (например, людей с одинаковыми именами) с помощью кластеризации, контекстной авторитетности и персонализации
Google использует систему двухуровневого ранжирования для обработки неоднозначных запросов (например, имен людей). Сначала ресурсы группируются в кластеры, представляющие разные сущности. Ресурсы внутри кластера ранжируются на основе их качества и авторитетности внутри этого кластера. Затем сами кластеры ранжируются с учетом релевантности запросу и сильной персонализации (социальные связи и местоположение пользователя).
  • US8645393B1
  • 2014-02-04
  • Персонализация

  • Семантика и интент

  • SERP

Как Google использует атрибуты пользователей и показатели предвзятости (Bias Measures) для персонализации ранжирования
Google анализирует, как разные группы пользователей (сегментированные по атрибутам, таким как интересы или демография) взаимодействуют с документами. Система вычисляет «показатель предвзятости» (Bias Measure), который показывает, насколько чаще или реже определенная группа взаимодействует с документом по сравнению с общей массой пользователей. При поиске Google определяет атрибуты пользователя и корректирует ранжирование, повышая или понижая документы на основе этих показателей предвзятости.
  • US9436742B1
  • 2016-09-06
  • Персонализация

  • Поведенческие сигналы

  • SERP

Как Google использует язык интерфейса пользователя и поведенческие сигналы для определения языковой релевантности документа
Google определяет, для носителей каких языков релевантен документ, анализируя агрегированные данные о кликах. Система изучает, какой языковой интерфейс поиска (например, google.fr или google.de) использовали пользователи, кликнувшие на результат. Учитывая поведенческие факторы, такие как время пребывания на странице (Dwell Time) и позиция клика, Google рассчитывает Оценку Языковой Релевантности. Это позволяет определить целевую аудиторию страницы независимо от языка ее контента.
  • US9208231B1
  • 2015-12-08
  • Мультиязычность

  • Поведенческие сигналы

  • SERP

Как Google динамически формирует Панели Знаний, выбирая блоки информации на основе истории поисковых запросов пользователей
Google использует гибридный подход для создания структурированных страниц о сущностях (например, Панелей Знаний). Система анализирует исторические данные о том, что пользователи чаще всего ищут об этой сущности или её классе. На основе этого анализа динамически выбираются блоки информации (например, «Награды», «Саундтрек»), которые дополняют стандартный набор данных, позволяя автоматически адаптировать выдачу под актуальные интересы аудитории.
  • US10110701B2
  • 2018-10-23
  • Knowledge Graph

  • Поведенческие сигналы

  • Персонализация

Как Google использует цитирования на веб-страницах для ранжирования книг в основной выдаче
Google использует механизм для определения релевантных книг по общим информационным запросам, даже если пользователь не искал книгу специально. Система анализирует, какие книги цитируются на топовых веб-страницах в выдаче. Книги получают оценку, основанную на авторитетности цитирующих страниц и контексте цитирования, и затем подмешиваются в результаты поиска.
  • US8392429B1
  • 2013-03-05
  • Ссылки

  • SERP

  • EEAT и качество

Как Google использует крупномасштабное машинное обучение и данные о поведении пользователей для предсказания кликов и ранжирования результатов
Google использует систему машинного обучения для создания модели ранжирования, которая предсказывает вероятность клика пользователя по документу. Модель обучается на огромных массивах данных о прошлых поисках (запросы, документы, клики). Система учитывает базовую вероятность клика (Prior Probability), основанную на позиции и предыдущей оценке документа, а затем корректирует её с помощью правил, выявляющих, какие признаки (Features) документа и запроса влияют на выбор пользователя.
  • US7231399B1
  • 2007-06-12
  • Поведенческие сигналы

seohardcore