Как Google идентифицирует и ранжирует людей, связанных с запросом, и различает однофамильцев с помощью контекста

CONTEXT-BASED PERSON SEARCH (Поиск людей на основе контекста)

US9245022B2
Google LLC
2010-12-30
2016-01-26

Google использует механизм для определения людей, наиболее релевантных поисковому запросу. Система анализирует контекст вокруг имен в документах, используя «термины классификации» (например, должности, локации, email), чтобы сгруппировать упоминания и различить людей с одинаковыми именами (дисамбигуация). Это позволяет точно идентифицировать сущности и организовать выдачу вокруг них.

Какую проблему решает

Патент решает две фундаментальные задачи. Первая — идентификация и ранжирование людей, наиболее релевантных запросу, даже если запрос не содержит имени (например, кто важен по запросу "lakers"). Вторая — разрешение неоднозначности имен (disambiguation). Система должна различать разных людей с одинаковыми именами (например, "Michael Jordan" – баскетболист и "Michael Jordan" – ученый), основываясь на контексте их упоминаний.

Что запатентовано

Запатентована система контекстного поиска людей, которая идентифицирует, оценивает релевантность и устраняет неоднозначность имен (Person Names). Ключевым механизмом является использование Classification Terms (уникальных контекстных идентификаторов) для группировки документов в Classification Clusters. Анализируя эти кластеры, система определяет различные идентичности (Person Identities) для одного имени.

Как это работает

Система работает в несколько этапов:

Индексирование (Офлайн): Система заранее идентифицирует имена людей (используя вероятностные методы и пороги для точности) и уникальные Classification Terms (например, email, должности, локации).
Кластеризация и Дисамбигуация (Офлайн): Документы группируются в кластеры на основе общих терминов. Если имя связано с разными, непересекающимися кластерами, система определяет несколько Person Identities.
Обработка запроса (Онлайн): При получении запроса система находит релевантные документы.
Ранжирование имен: Имена, найденные в этих документах, оцениваются на основе частоты, близости к терминам запроса и качества ресурса.
Вывод результатов: Система генерирует список наиболее релевантных людей, показывая разные идентичности для неоднозначных имен, вместе со связанными ресурсами.

Актуальность для SEO

Высокая. Распознавание сущностей (Entity Recognition) и устранение неоднозначности (Disambiguation) являются фундаментом современного семантического поиска и Knowledge Graph. Способность точно идентифицировать авторов и экспертов критически важна для оценки сигналов E-E-A-T.

Важность для SEO

Патент имеет высокое стратегическое значение для SEO (8.5/10). Он описывает конкретные механизмы, которые Google использует для идентификации и различения экспертов. Если система не может корректно идентифицировать эксперта или путает его с другим человеком, сигналы E-E-A-T могут быть неверно атрибутированы. Понимание этого механизма позволяет разрабатывать стратегии для четкой и однозначной презентации ключевых фигур организации.

Термины и определения

Classification Cluster (Кластер классификации): Группа ресурсов, объединенных на основе наличия одного или нескольких общих или связанных Classification Terms. Используется для определения контекста, связанного с именем.
Classification Term (Термин классификации): Слово или фраза (не являющаяся именем человека), используемая для группировки ресурсов в кластеры. Это контекстные идентификаторы, такие как адреса электронной почты, URL, географические названия или должности. Выбираются на основе их относительной уникальности.
Name Frequency (NF) (Частота упоминания с именами): Метрика (описанная в патенте), показывающая, как часто потенциальный Classification Term появляется в непосредственной близости к любому имени человека. Используется для оценки полезности термина для дисамбигуации.
Name Index (Индекс имен): Хранилище данных, содержащее идентифицированные имена людей и их ассоциации с ресурсами. Имена сохраняются только если вероятность идентификации превышает порог.
Person Identity (Идентичность человека / Личность): Конкретный человек, связанный с Person Name. Одно имя может иметь несколько идентичностей. Идентичность определяется через ассоциацию имени с определенными Classification Clusters.
Person Name (Имя человека): Текстовая строка, идентифицированная системой как имя человека.
Term Frequency (TF) (Частота термина): Метрика (описанная в патенте), показывающая, как часто термин появляется в наборе ресурсов. Используется для оценки уникальности потенциального Classification Term (слишком частые исключаются).

Ключевые утверждения (Анализ Claims)

Claim 1 (Независимый пункт): Описывает основной процесс идентификации и дисамбигуации людей.

Идентификация Classification Terms (не являющихся именами людей) в группе ресурсов.
Группировка ресурсов в Classification Clusters на основе этих терминов.
Идентификация имен людей в ресурсах внутри этих кластеров.
Вычисление оценки вероятности (score of a probabilistic determination) того, что набор слов является именем человека.
Ключевой шаг (Точность): Устранение ложных срабатываний путем сохранения имени в Name Index, только если оценка вероятности превышает определенный порог.
Ключевой шаг (Дисамбигуация): Идентификация как минимум двух разных людей (Person Identities), соответствующих одному имени. Эта идентификация основана на том, что имя связано с различными наборами Classification Clusters, которые отличаются (distinct) от кластеров другой личности.
Идентификация групп ресурсов, связанных с каждой личностью.
В ответ на запрос отображение дисамбигуированного списка (disambiguated listing) личностей с вложенными списками ресурсов.

Claim 5 (Зависимый): Уточняет выбор Classification Terms.

Classification Terms выбираются на основе их относительной уникальности (relative uniqueness) в наборе ресурсов.

Claim 7 и 9 (Зависимые): Уточняют ассоциацию имен с кластерами.

Ассоциация устанавливается, если имя находится в пределах заданной близости (predetermined proximity) от Classification Term. Чем ближе термин к имени, тем выше оценка (score) этой ассоциации.

Claim 18 и 19 (Зависимые): Определяют типы Classification Terms.

Термины включают слова из предопределенных категорий: email-адрес, URL, географическое название или должность (title).

Где и как применяется

Изобретение охватывает несколько этапов, с акцентом на предварительную обработку данных для точной идентификации сущностей.

INDEXING – Индексирование и извлечение признаков
Основная работа по подготовке данных происходит на этом этапе (офлайн):

Идентификация имен: Система сканирует ресурсы, использует вероятностные модели для определения имен и сохраняет их в Name Index, если достоверность превышает порог.
Идентификация и оценка терминов: Идентифицируются потенциальные Classification Terms. Вычисляются метрики (например, TF и NF) для оценки их уникальности и полезности.
Построение кластеров и Дисамбигуация: Ресурсы группируются в Classification Clusters. Система ассоциирует имена с кластерами (учитывая близость) и определяет различные Person Identities.

RANKING – Ранжирование
Система определяет набор ресурсов, релевантных запросу. Затем Scoring Module оценивает релевантность имен, найденных в этих результатах, самому запросу (на основе частоты, близости к терминам запроса и т.д.).

METASEARCH – Метапоиск и Смешивание / RERANKING – Переранжирование
На этом этапе формируется специализированная выдача (например, вертикаль "People Search" или блок с релевантными людьми). Система извлекает предопределенные Person Identities для высокоранжированных имен и генерирует финальный список с дисамбигуацией и вложенными ресурсами.

Входные данные:

Текст и метаданные ресурсов (Корпус документов).
Поисковый запрос.
Name Index и индекс Classification Terms.

Выходные данные:

Список релевантных людей (Person Identities, а не просто имена).
Дисамбигуированный список, если имя неоднозначно.
Вложенные списки ресурсов для каждой идентичности.

На что влияет

Конкретные типы контента: Наибольшее влияние на страницы об авторах, экспертах, биографии, новости, научные публикации – везде, где важна идентификация личности.
Конкретные ниши или тематики: Критично для YMYL-тематик, где авторитетность автора (E-E-A-T) имеет решающее значение, а также в академических кругах и журналистике.
Специфические запросы: Запросы, подразумевающие поиск людей (например, "krispy kreme ceo") или тематические запросы, где система определяет ключевых фигур (например, "lakers").

Когда применяется

Триггеры активации: Когда система определяет, что ответ на запрос лучше всего представить в виде списка релевантных личностей, или когда пользователь явно выбирает поиск по людям.
Условия дисамбигуации: Активируется, когда система обнаруживает, что одно Person Name связано с двумя или более различными, непересекающимися Classification Clusters.
Пороговые значения: Применяется порог достоверности для идентификации имен и пороги частотности (TF/NF) для выбора Classification Terms.

Пошаговый алгоритм

Процесс А: Идентификация и Дисамбигуация (Офлайн/Индексирование)

Сканирование и Идентификация Имен: Поиск потенциальных имен (например, по капитализации). Вычисление вероятностной оценки. Если оценка выше порога, имя сохраняется в Name Index.
Идентификация и Оценка Classification Terms: Поиск уникальных идентификаторов (email, должности, локации). Расчет TF и NF. Выбор терминов, которые достаточно уникальны (низкий TF) и часто встречаются рядом с именами (высокий NF).
Индексирование Ассоциаций: Сохранение связей между Classification Term, ресурсом и именем, находящимся вблизи термина, с учетом расстояния (proximity).
Построение Кластеров: Группировка ресурсов в Classification Clusters на основе общих или связанных Classification Terms.
Определение Идентичностей: Для конкретного Person Name анализируются связанные с ним кластеры. Если существуют группы кластеров, которые связаны между собой, но не связаны (не пересекаются) с другими группами кластеров, каждая такая группа определяется как отдельная Person Identity.

Процесс Б: Обработка Запроса и Ранжирование (Онлайн)

Получение запроса и ресурсов: Идентификация ресурсов, удовлетворяющих запросу.
Извлечение и Оценка Имен: Идентификация имен людей в этих ресурсах. Расчет оценки релевантности для каждого имени (на основе частоты, близости к терминам запроса, качества ресурса).
Выбор Топовых Имен: Выбор подмножества имен с наивысшими оценками.
Применение Дисамбигуации: Для выбранных имен извлекаются предопределенные Person Identities (из Процесса А).
Генерация Выдачи: Создание финального списка. Если у имени несколько идентичностей, они показываются отдельно (дисамбигуированный список), каждая со своим набором релевантных ресурсов.

Какие данные и как использует

Данные на входе

Система использует следующие типы данных из ресурсов:

Контентные факторы: Текст ресурсов. Анализируется регистр букв (капитализация) для идентификации имен. Анализируется контекст вокруг имен для поиска Classification Terms. Заголовки и URL также могут влиять на оценку релевантности имени запросу.
Структурные факторы: Физическое расположение текста. Измеряется близость (proximity) между именами и терминами.
Специфические идентификаторы (Classification Terms): Патент явно упоминает использование следующих категорий данных для классификации:
- Email адреса.
- URL.
- Географические названия (Geographical name).
- Должности (Title).

Какие метрики используются и как они считаются

Probability Score (Оценка вероятности имени): Вероятность того, что набор слов является именем человека. Используется порог для сохранения в Name Index и фильтрации ложных срабатываний.
Relevance Score (Оценка релевантности имени запросу): Метрика для ранжирования имен по отношению к исходному запросу. Учитывает частоту имени, близость к терминам запроса и качество ресурса.
Term Frequency (TF) и Name Frequency (NF): Используются для расчета "относительной уникальности" и полезности Classification Term. Слишком частые термины исключаются.
Proximity Score (Оценка близости): Метрика, основанная на расстоянии между Person Name и Classification Term в тексте. Чем ближе термин к имени, тем выше оценка ассоциации.
Cluster Distinctness (Различие кластеров): Метрика, оценивающая степень непересечения между Classification Clusters. Используется для финального определения разных Person Identities.

Контекст определяет Идентичность (Identity): Ключевой вывод — Google определяет, кем является человек, путем кластеризации контента вокруг уникальных контекстных идентификаторов (Classification Terms), найденных рядом с его именем.
Уникальность идентификаторов критична: Система отфильтровывает общие термины (например, "Университет" или название крупного города) при дисамбигуации. Для определения идентичности используются более уникальные термины (конкретные должности, email-адреса, названия небольших организаций).
Близость (Proximity) является сильным сигналом связи: Ассоциация между именем и Classification Term значительно усиливается, если они находятся близко друг к другу в тексте. Это напрямую влияет на структурирование контента и биографий.
Точность распознавания имен: Система использует вероятностные модели и строгие пороговые значения для идентификации имен, стремясь минимизировать ошибки и не путать обычные слова с именами.
Дисамбигуация основана на отсутствии пересечений: Разные Person Identities определяются, когда имя ассоциируется с разными наборами Classification Clusters, которые не пересекаются между собой. Это подчеркивает необходимость последовательного и четкого контекста для каждой личности.

Best practices (это мы делаем)

Четкая и последовательная идентификация экспертов (для E-E-A-T): Убедитесь, что имена авторов и ключевых экспертов представлены последовательно на всем сайте и во внешних источниках. Это помогает системе корректно агрегировать сигналы и формировать Person Identity.
Использование уникальных контекстных идентификаторов (Classification Terms): При упоминании экспертов (особенно в авторских биографиях и на странице "О нас") включайте уникальные идентификаторы: конкретную должность (например, "Vice Provost" вместо "Professor"), название организации, конкретное географическое местоположение, профессиональный email, ссылки на авторитетные профили (URL).
Оптимизация близости (Proximity): Размещайте ключевые Classification Terms в непосредственной близости от имени человека. Например: "John Doe, Vice Provost at XYZ University", а не разделяйте имя и должность несколькими абзацами текста.
Построение четких ассоциаций (Clustering): Работайте над тем, чтобы ваш эксперт четко ассоциировался с определенным набором тем и идентификаторов. Это помогает системе сформировать устойчивый Classification Cluster для его идентичности, укрепляя E-E-A-T. Использование микроразметки Schema.org/Person поддерживает этот процесс.

Worst practices (это делать не надо)

Использование общих идентификаторов: Использование слишком общих терминов (например, "Писатель", "Эксперт", "Москва") для описания автора не помогает системе в дисамбигуации, так как эти термины не являются уникальными Classification Terms и могут быть отфильтрованы.
Непоследовательное упоминание: Использование разных вариантов имени или разных наборов идентификаторов в разных контекстах может затруднить системе определение единой Person Identity или привести к ее фрагментации.
Разделение имени и контекста: Размещение имени автора в начале статьи, а его регалий и идентификаторов – далеко внизу страницы или на отдельной странице. Это ослабляет связь из-за потери близости (proximity).
Игнорирование неоднозначности имен: Если у автора распространенное имя, не предпринимать активных шагов по его дисамбигуации (через уникальные идентификаторы) рискованно, так как его авторитет может быть неверно атрибутирован.

Стратегическое значение

Этот патент подтверждает критическую важность управления сущностями (Entity Management) для SEO и E-E-A-T. Авторитет привязан к корректно идентифицированной и дисамбигуированной личности (Person Identity). Стратегия должна фокусироваться на том, чтобы сделать процесс идентификации и классификации экспертов максимально простым для поисковой системы, предоставляя четкие, последовательные и уникальные контекстные сигналы (Classification Terms).

Практические примеры

Сценарий: Оптимизация биографии автора с распространенным именем для E-E-A-T

Задача: Убедиться, что Google корректно идентифицирует автора "James Smith", врача-кардиолога, и не путает его с другими людьми с таким же именем.

Плохая реализация (Минимум контекста):
Автор: James Smith. Джеймс – врач и эксперт по здоровью, живет в Калифорнии.

(Проблема: Термины "врач", "эксперт по здоровью", "Калифорния" слишком общие и не пройдут порог уникальности для Classification Terms).

Оптимизированная реализация (Использование уникальных Classification Terms вблизи имени):
Автор: Dr. James A. Smith, MD.
Dr. Smith является Ведущим хирургом-кардиологом (Title/Classification Term) в Cedars-Sinai Medical Center (Organization/Unique Name) в Лос-Анджелесе. Контакт: j.a.smith.md@cedars-sinai.org (Email address/Classification Term). [Далее следует биография].

(Результат: Система с высокой вероятностью использует эти уникальные термины для формирования отдельного Classification Cluster. Близость этих терминов к имени создает сильную ассоциацию и обеспечивает корректную дисамбигуацию и атрибуцию E-E-A-T).

Что такое «Classification Term» и почему он важен для SEO?

Это уникальный контекстный идентификатор (не имя человека), который система использует для понимания контекста вокруг имени. Примеры: конкретные должности, названия организаций, email адреса. Для SEO это критически важно, так как правильные Classification Terms помогают Google однозначно идентифицировать ваших авторов и экспертов (E-E-A-T) и не путать их с другими людьми с тем же именем.

Как система определяет, какие термины использовать для классификации?

Система оценивает термины по их уникальности (низкая общая частотность в вебе – TF) и полезности (высокая частота появления рядом с именами – NF). Слишком общие термины, такие как названия крупных городов или общие должности, отфильтровываются, так как они не помогают в различении личностей. Предпочтение отдается специфичным идентификаторам.

Насколько важна близость имени к контекстным идентификаторам в тексте?

Близость (Proximity) критически важна. Патент указывает, что ассоциация между именем и Classification Term усиливается, если они находятся близко друг к другу в тексте; более близкое расположение получает более высокую оценку. Это означает, что ключевые регалии должны быть расположены непосредственно рядом с именем автора, например, в первом предложении биографии.

Что такое «Classification Cluster» и как он формируется?

Это группа документов, объединенных наличием одного или нескольких связанных Classification Terms. Например, кластер может сформироваться вокруг терминов "Chicago Bulls" и "NBA". Если имя часто встречается в документах этого кластера, система ассоциирует это имя с данным контекстом.

Как именно происходит дисамбигуация (различение людей)?

Дисамбигуация происходит, когда система обнаруживает, что одно и то же имя связано с двумя или более разными наборами Classification Clusters, которые не пересекаются между собой. Например, если "Michael Jordan" связан с кластером {Chicago Bulls, NBA} и отдельно с кластером {Berkeley, Computer Science}, система определит две разные Person Identities.

Что делать, если у моего автора очень распространенное имя?

Необходимо активно использовать уникальные Classification Terms в непосредственной близости от его имени. Используйте полные имена с инициалами, указывайте конкретные и уникальные должности, аффилиации с организациями, научные степени и профессиональные контактные данные. Чем уникальнее и консистентнее контекст, тем легче системе провести дисамбигуацию.

Как этот патент связан с E-E-A-T и Knowledge Graph?

Он напрямую связан. Чтобы оценить авторитетность автора (E-E-A-T), Google должен сначала его идентифицировать. Этот патент описывает механизм идентификации и верификации людей. Этот же процесс является фундаментальным для наполнения и уточнения данных о сущностях (людях) в Knowledge Graph.

Как система определяет, что строка текста является именем человека?

Система использует вероятностные методы (probabilistic determination). Она ищет паттерны (например, капитализация, структура имя+фамилия) и оценивает вероятность. Имя сохраняется в Name Index только в том случае, если эта вероятность превышает строгий порог, что помогает избежать ложных срабатываний и ошибок.

Помогает ли структурированная разметка (Schema) в этом процессе?

Хотя патент описывает извлечение данных из текста, использование разметки Schema.org/Person идеально дополняет этот механизм. Она позволяет явно указать Person Names и связанные с ними Classification Terms (jobTitle, worksFor) в машиночитаемом формате, что значительно упрощает процесс точной идентификации и кластеризации.

Как система ранжирует людей, если запрос не является именем (например, "лучшие игроки Lakers")?

Система сначала находит релевантные документы. Затем она извлекает имена из этих документов и оценивает их релевантность запросу. Оценка учитывает, как часто имя упоминается, насколько близко оно расположено к терминам запроса в тексте, упоминается ли в заголовках, а также общую авторитетность и релевантность самого документа.

Как Google ранжирует сущности (например, людей с одинаковыми именами) с помощью кластеризации, контекстной авторитетности и персонализации

Google использует систему двухуровневого ранжирования для обработки неоднозначных запросов (например, имен людей). Сначала ресурсы группируются в кластеры, представляющие разные сущности. Ресурсы внутри кластера ранжируются на основе их качества и авторитетности внутри этого кластера. Затем сами кластеры ранжируются с учетом релевантности запросу и сильной персонализации (социальные связи и местоположение пользователя).

US8645393B1
2014-02-04

Персонализация
Семантика и интент
SERP

Как Google анализирует историю поисковых запросов для устранения неоднозначности имен и генерации контекстных подсказок

Google использует систему для устранения неоднозначности имен людей. Анализируя исторические данные о том, какие запросы (как включающие имя, так и нет) приводили пользователей на одни и те же ресурсы, система кластеризует различные контексты имени (например, разные люди с одним именем). Для каждого контекста выбирается лучший уточняющий термин, который затем предлагается пользователю в качестве поисковой подсказки.

US9830379B2
2017-11-28

Семантика и интент

Как Google использует метаданные для поиска дубликатов, объединения версий документов и консолидации сигналов ранжирования

Патент описывает, как Google идентифицирует различные версии одного и того же документа (например, научных статей) путем генерации, нормализации и сравнения нескольких идентификаторов на основе метаданных (автор, название, дата). Это позволяет Google объединять дубликаты в кластеры и консолидировать сигналы ранжирования, такие как общее количество цитирований.

US8316292B1
2012-11-20

Индексация
Техническое SEO

Как Google итеративно распознает сущности на страницах и рассчитывает их важность с помощью PageRank

Google использует итеративный процесс для распознавания и устранения неоднозначности сущностей (людей, мест, понятий) в документах. Система начинает с известных фактов, находит упоминающие сущность документы, анализирует сопутствующие термины для уточнения модели распознавания и автоматически обнаруживает новые признаки. Патент также описывает расчет важности сущности путем суммирования PageRank ссылающихся документов, взвешенного на вероятность ссылки.

US8122026B1
2012-02-21

Семантика и интент
Ссылки
Knowledge Graph

Как Google использует кластеризацию контента и результаты поиска для определения авторства и формирования профилей сущностей

Google использует механизм для точной ассоциации контента (статей, веб-страниц) с конкретными сущностями (авторами, людьми). Система предварительно группирует похожий контент в кластеры. При запросе имени автора система ранжирует эти кластеры, сравнивая их содержимое с результатами поиска по этому имени. Это позволяет разрешать неоднозначность авторов, формировать точные профили (например, в Google Scholar или Knowledge Graph) и автоматически их обновлять.

US9400789B2
2016-07-26

Knowledge Graph
Семантика и интент
SERP

Как Google ранжирует комментарии и UGC, используя объективное качество и субъективную персонализацию

Google использует двухфакторную модель для ранжирования пользовательского контента (комментариев, отзывов). Система вычисляет объективную оценку качества (репутация автора, грамотность, длина, рейтинги) и субъективную оценку персонализации (является ли автор другом или предпочтительным автором, соответствует ли контент интересам и истории поиска пользователя). Итоговый рейтинг объединяет обе оценки для показа наиболее релевантного и качественного UGC.

US8321463B2
2012-11-27

Персонализация
EEAT и качество
Поведенческие сигналы

Как Google использует модифицированный PageRank (Personalized PageRank) для персонализации выдачи на основе истории и предпочтений пользователя

Патент Google, описывающий механизм персонализации поиска путем модификации алгоритма PageRank. Система определяет "точку зрения" пользователя (Point-of-View Data) на основе его истории посещений, закладок или указанных категорий. Затем стандартный расчет PageRank изменяется так, чтобы авторитет (Reset Probability) концентрировался только на этих персональных источниках, повышая в выдаче сайты, которые близки к интересам пользователя.

US7296016B1
2007-11-13

Персонализация
Поведенческие сигналы
SERP

Как Google генерирует блок "Похожие вопросы" (People Also Ask) на основе анализа кликов и поведения пользователей

Google анализирует топовые результаты по исходному запросу и определяет "Тематические запросы" (Topic Sets) — прошлые запросы, по которым пользователи кликали на эти результаты. Затем система ищет популярные вопросы, соответствующие этим темам, фильтрует дубликаты на основе общности кликов и показывает их в блоке PAA для дальнейшего исследования темы.

US9213748B1
2015-12-15

SERP
Семантика и интент
Поведенческие сигналы

Как Google запоминает вопросы без авторитетного ответа и автономно сообщает его позже через Ассистента

Патент Google описывает механизм для обработки запросов, на которые в момент поиска нет качественного или авторитетного ответа. Система запоминает информационную потребность и продолжает мониторинг. Когда появляется информация, удовлетворяющая критериям качества (например, в Knowledge Graph), Google автономно доставляет ответ пользователю, часто встраивая его в следующий диалог с Google Assistant, даже если этот диалог не связан с исходным вопросом.

US11238116B2
2022-02-01

Knowledge Graph
Семантика и интент
EEAT и качество

Как Google определяет, когда показывать обогащенный результат для сущности, и использует консенсус веба для исправления данных

Google использует механизм для определения того, когда запрос явно относится к конкретной сущности (например, книге). Если один результат значительно доминирует над другими по релевантности, система активирует «обогащенный результат». Этот результат агрегирует данные из разных источников (структурированные данные, веб-страницы, каталоги товаров) и использует наиболее популярные варианты данных из интернета для проверки и исправления информации о сущности.

US8577897B2
2013-11-05

SERP
Семантика и интент
EEAT и качество

Как Google проактивно уведомляет пользователей об изменении цен или доступности товаров на основе их предполагаемого намерения покупки

Google анализирует действия пользователя (поисковые запросы, посещения сайтов), чтобы выявить намерение в отношении сущностей (например, продуктов или авиабилетов). Если намерение сильное и происходит значительное изменение (падение цены или изменение доступности), Google проактивно отправляет уведомление со ссылками для завершения действия (например, покупки).

US20180357238A1
2018-12-13

Семантика и интент
Поведенческие сигналы
Персонализация

Как Google определяет интент запроса, анализируя классификацию контента, который кликают пользователи

Google использует данные о поведении пользователей для классификации запросов. Система определяет, какой контент пользователи считают наиболее релевантным для запроса (на основе кликов и времени пребывания). Затем она анализирует классификацию этого контента (например, «продукт», «новости», «взрослый контент») и присваивает доминирующую классификацию самому запросу. Это позволяет уточнить интент и скорректировать ранжирование.

US8838587B1
2014-09-16

Семантика и интент
Поведенческие сигналы
SERP

Как Google использует социальный граф и активность друзей для персонализации и переранжирования результатов поиска

Google использует данные из социального графа пользователя и активность его контактов (лайки, шеры, комментарии, плейлисты) для изменения ранжирования результатов поиска. Контент, одобренный социальным окружением, повышается в выдаче и сопровождается аннотациями, объясняющими причину повышения и указывающими на свежесть социального действия.

US8959083B1
2015-02-17

Персонализация
Поведенческие сигналы
SERP

Как Google определяет ключевую тематику зданий и адресов, используя клики пользователей для показа релевантной рекламы

Google использует этот механизм для понимания основного назначения физического местоположения (адреса или здания). Система анализирует все бизнесы в этой локации и определяет, какие поисковые запросы чаще всего приводят к кликам по их листингам. Самый популярный запрос используется как доминирующее ключевое слово для выбора релевантной рекламы, когда пользователи ищут этот адрес или взаимодействуют с ним на Картах или в Street View.

US20120278171A1
2012-11-01

Local SEO
Семантика и интент
Поведенческие сигналы

Как Google персонализирует поисковую выдачу, анализируя историю кликов и поведение пользователя на сайте

Google использует механизм для персонализации поисковой выдачи на основе истории взаимодействия пользователя с результатами поиска. Система отслеживает, какие сайты пользователь выбирает, как долго он на них остается (Dwell Time), частоту и контекст выбора. Основываясь на этих данных, предпочитаемые пользователем ресурсы повышаются в ранжировании при его последующих запросах.

US9037581B1
2015-05-19

Персонализация
Поведенческие сигналы
SERP