Как Google определяет, является ли ответ на вопрос «Кто...?» именем человека или названием организации, и переранжирует выдачу

DETECTING NAME-TRIGGERING QUERIES (Обнаружение запросов, требующих имени в ответе)

US9063983B1
Google LLC
2013-03-12
2015-06-23

Google использует статистический анализ языка для разрешения неоднозначности в запросах (например, начинающихся с «Кто»). Система анализирует, как часто глагол и объект из запроса встречаются в корпусе текстов с субъектом-человеком по сравнению с субъектом-организацией. На основе этой вероятности Google переранжирует результаты, повышая или понижая позиции сущностей (людей или организаций) в зависимости от того, какой тип ответа ожидается.

Какую проблему решает

Патент решает проблему неоднозначности интента в поисковых и диалоговых системах, особенно для запросов, начинающихся с «Кто» (Who). Задача — определить, ожидает ли пользователь в ответ имя человека (Person) или название организации/объекта (Organization/Object). Например, на запрос «Кто выиграл French Open?» ответ — человек, а на запрос «Кто выиграл Super Bowl?» ответ — организация (команда). Система улучшает точность ответов (особенно прямых ответов и голосового поиска), гарантируя возврат правильного типа сущности.

Что запатентовано

Запатентована система для обнаружения «запросов, требующих имени» (name-triggering queries). Система использует предварительно рассчитанную статистическую базу данных, основанную на анализе отношений Субъект-Глагол-Объект (S-V-O Relations) в большом корпусе документов. При получении запроса система вычисляет оценку уверенности (confidence score), что ответ должен быть именем человека, и использует эту оценку для активного переранжирования результатов поиска.

Как это работает

Система работает в двух режимах:

Офлайн (Анализ корпуса): Система анализирует документы, извлекает отношения (Relations) в формате Субъект-Глагол-Объект и определяет, является ли Субъект именем человека. Эта статистика агрегируется.
Онлайн (Обработка запроса): При получении потенциального запроса, требующего имени (например, «Кто выиграл X?»), система извлекает Глагол («выиграл») и Объект («X»).
Вычисление оценки: Система проверяет агрегированную статистику: как часто комбинация этого Глагола и Объекта (и связанных с ним терминов) встречалась с Субъектом-человеком (Affirmative instance) по сравнению с Субъектом-нечеловеком (Negative instance). Вычисляется name-triggering score с использованием взвешенной модели.
Переранжирование: Если оценка превышает порог (ожидается человек), результаты, являющиеся именами людей, повышаются в ранжировании. Если оценка ниже другого порога (ожидается не человек), результаты-имена могут быть понижены.

Актуальность для SEO

Высокая. Понимание типа ожидаемой сущности критически важно для современных поисковых систем, особенно в контексте голосового поиска, прямых ответов (Featured Snippets) и работы с Графом Знаний (Knowledge Graph). Способность различать типы сущностей (Человек vs Организация) напрямую влияет на качество ответов на фактические запросы.

Важность для SEO

Патент имеет значительное влияние (7/10) на SEO, особенно в области оптимизации под Граф Знаний и блоки с ответами. Он демонстрирует механизм, с помощью которого Google активно переранжирует результаты, основываясь на предполагаемом типе сущности в ответе. Если система ожидает имя человека, а ваш контент фокусируется на организации (или наоборот), этот механизм будет работать против вас для данного типа запросов. Ключевое значение имеет точность представления сущностей и ясность структуры контента.

Термины и определения

Affirmative instance (Подтверждающий пример): Случай в корпусе документов, когда комбинация Глагола и Объекта (или связанного термина) встречается в отношении, где Субъект является именем человека.
Confidence Score / Name-triggering score (Оценка уверенности): Вероятностная оценка, указывающая на то, что ответ на запрос должен содержать имя человека. Вычисляется на основе статистики Affirmative и Negative instances.
Document term (Термин документа): Термин (Объект), который был непосредственно извлечен из отношения в документе во время офлайн-анализа.
Name-triggering query (Запрос, требующий имени): Запрос, ответ на который должен включать имя человека.
Negative instance (Отрицающий пример): Случай в корпусе документов, когда комбинация Глагола и Объекта (или связанного термина) встречается в отношении, где Субъект НЕ является именем человека (например, организация).
Potential name-triggering query (Потенциальный запрос, требующий имени): Запрос, который содержит определенные триггерные слова (например, «Who», «Whom», «Person»), сигнализирующие о возможном поиске имени человека.
Related term (Связанный термин): Термин, семантически связанный с Объектом запроса (например, синоним, гипероним). Используется для расширения анализа.
Relation (Отношение): Структурированное представление информации, извлеченное из предложения, в формате Субъект-Глагол-Объект (Subject-Verb-Object, S-V-O).

Ключевые утверждения (Анализ Claims)

Claim 1 (Независимый пункт): Описывает основной метод обработки запроса.

Система получает поисковый запрос.
Определяется, что запрос классифицируется как Potential name-triggering query.
На основе этого из запроса извлекаются Глагол (Verb) и Объект (Object).
Система идентифицирует набор предварительно сохраненных структур данных (статистики), которые ссылаются на форму этого Глагола.
Из этого набора выделяется подмножество структур, которые ссылаются на Объект ИЛИ на связанный с ним термин (Related term).
Вычисляется name-triggering score на основе этого подмножества (учитывая количество случаев, когда Объект был связан с именем человека в корпусе ресурсов).
Идентифицируется набор ресурсов, релевантных запросу.
Проверяется, удовлетворяет ли name-triggering score пороговому значению.
Если ДА, система идентифицирует ресурсы в выдаче, которые связаны с именами людей.
Выбирается конкретный ресурс и выводится информация о нем.

Claim 2 (Зависимый от 1): Детализирует механизм расчета name-triggering score, который включает три компонента (согласно определению в Claim 2):

Первая оценка (S1): Основана на статистике по Объекту И статистике по Связанным терминам (Комбинированная).
Вторая оценка (S2): Основана ТОЛЬКО на статистике по Объекту (игнорируя Связанные термины).
Третья оценка (S3): Основана ТОЛЬКО на статистике по Связанным терминам (игнорируя Объект).
Финальный name-triggering score является комбинацией S1, S2 и S3.

Claim 3 и 4 (Зависимые от 2): Уточняют, что комбинация является взвешенным средним (weighted average), и определяют приоритет весов.

Вес S2 (Только Объект) > Вес S1 (Объект + Связанные) > Вес S3 (Только Связанные). Это означает, что прямое совпадение с Объектом запроса является наиболее сильным и доверенным сигналом.

Claim 5 и 6 (Зависимые): Описывают механизм переранжирования.

Определяются оценки ранжирования (resource scores) для релевантных ресурсов.
Если name-triggering score удовлетворяет порогу (Claim 6 уточняет: определено, что ответ должен включать имя человека), то resource scores ресурсов, связанных с именами людей, корректируются (увеличиваются).
Выбор финального ресурса основывается на скорректированных оценках.

Claim 8 (Зависимый от 5): Описывает корректировку, если имя не требуется.

Если name-triggering score удовлетворяет порогу (определено, что ответ НЕ должен включать имя человека). Примечание: В тексте Claim 8 указано "increasing" (увеличение) оценок для имен людей, что противоречит логике изобретения и описанию (Description/FIG. 12), где в этом случае предполагается понижение (decreasing). При анализе мы учитываем эту особенность текста патента, но опираемся на общую логику изобретения.

Где и как применяется

Изобретение затрагивает несколько этапов поиска, интегрируя офлайн-анализ данных и онлайн-обработку запросов.

INDEXING – Индексирование и извлечение признаков
На этом этапе происходит основной офлайн-анализ (Document Analysis Server). Система сканирует корпус документов, выполняет синтаксический разбор предложений, извлекает отношения (Relations: S-V-O) и распознает сущности (определяет, является ли Субъект человеком). Результаты сохраняются в Name-triggering information repository.

QUNDERSTANDING – Понимание Запросов
Онлайн-этап (Result Generation Server). Система получает запрос и классифицирует его (определяет как Potential name-triggering query). Из запроса извлекаются Глагол и Объект. Система обращается к данным, созданным на этапе INDEXING, чтобы рассчитать name-triggering score в реальном времени.

RANKING – Ранжирование
На этом этапе генерируется стандартный набор релевантных результатов (ресурсов) с их базовыми оценками ранжирования (resource scores).

RERANKING – Переранжирование
Финальный этап применения патента. Система сравнивает name-triggering score с порогами. Если пороги достигнуты, система корректирует базовые resource scores результатов в зависимости от того, являются ли они именами людей и каков ожидаемый тип ответа.

На что влияет

Специфические запросы: Наибольшее влияние оказывается на информационные, фактические запросы, особенно начинающиеся с «Кто», «Кого», «Чей».
Типы контента: Влияет на страницы, содержащие именованные сущности — биографии людей, страницы компаний, истории событий, спортивные результаты.
Форматы выдачи: Критически важно для формирования блоков с ответами (Featured Snippets) и прямых ответов в голосовом поиске, где необходимо выдать единственно верный ответ правильного типа.

Когда применяется

Триггеры активации: Алгоритм активируется, когда модуль идентификации запросов определяет запрос как Potential name-triggering query. Это происходит при наличии в запросе определенных слов: «who», «whom», «whose», «person», «guy», «man», «woman», «name» и т.д.
Пороговые значения: Механизм переранжирования активируется только тогда, когда name-triggering score превышает первый порог (высокая уверенность, что ответ — имя) ИЛИ оказывается ниже второго порога (высокая уверенность, что ответ — НЕ имя). Если оценка находится между порогами (неопределенность), модификация оценок не производится (Block 1235).

Пошаговый алгоритм

Процесс А: Офлайн-генерация базы знаний (Name-Triggering Information)

Идентификация документа: Выбор документа из корпуса.
Парсинг предложений: Разбор документа для идентификации предложений.
Извлечение отношений: Из предложений извлекаются отношения (Relations) в формате Субъект-Глагол-Объект (S-V-O).
Идентификация типа Субъекта: Система определяет, является ли Субъект отношения именем человека (используя Name repository).
Идентификация связанных терминов: Для Объекта отношения определяются связанные термины (Related terms).
Сохранение статистики: Информация (Глагол, Объект, Связанные термины, Индикатор типа Субъекта) сохраняется и агрегируется. Увеличиваются счетчики подтверждающих (Affirmative - A) или отрицающих (Negative - N) примеров.

Процесс Б: Онлайн-обработка запроса и Ранжирование

Получение запроса: Система получает запрос от пользователя.
Классификация запроса: Определяется, является ли запрос Potential name-triggering query.
Извлечение Глагола и Объекта: Если запрос классифицирован положительно, из него извлекаются Глагол и Объект.
Поиск статистики: Система ищет в репозитории структуры данных, соответствующие Глаголу, Объекту и его Связанным терминам.
Расчет оценок (Scoring - согласно Claim 2):
1. Вычисляется Первая оценка (S1) на основе A и N для Объекта И Связанных терминов. (Например, по формуле $A/(A+N)$ ).
2. Вычисляется Вторая оценка (S2) на основе A и N ТОЛЬКО для Объекта (Document terms).
3. Вычисляется Третья оценка (S3) на основе A и N ТОЛЬКО для Связанных терминов (Related terms).
Генерация итоговой оценки: Вычисляется Name-triggering confidence score путем взвешенного усреднения S1, S2 и S3. Приоритет весов (согласно Claim 4): S2 > S1 > S3.
Идентификация результатов: Система получает стандартный набор релевантных результатов поиска и их оценки (result scores).
Принятие решения о переранжировании:
1. Если Confidence score > Порог 1 (Ответ — Имя): Перейти к шагу 9.
2. Если Confidence score < Порог 2 (Ответ — НЕ Имя): Перейти к шагу 10.
3. Иначе (Неопределенность): Пропустить модификацию оценок.
Повышение (Boosting): Увеличить result scores для результатов, которые идентифицированы как имена людей.
Понижение (Demoting): Уменьшить result scores для результатов, которые идентифицированы как имена людей.
Вывод результатов: Вывод результатов на основе финальных (скорректированных) result scores.

Какие данные и как использует

Данные на входе

Контентные факторы: Текст документов в корпусе используется для офлайн-анализа и извлечения отношений (S-V-O).
Структурные факторы (Лингвистические): Синтаксическая структура предложений используется для извлечения Субъекта, Глагола, Объекта.
Данные о Сущностях (Entity Data): Name repository — база данных имен людей. Используется для определения типа Субъекта в отношениях.
Семантические данные: Related terms repository — база данных, связывающая термины (синонимы, гиперонимы). Используется для расширения анализа Объекта.

Какие метрики используются и как они считаются

Система использует статистические метрики, основанные на частоте совместной встречаемости (co-occurrence).

Affirmative Instances (A) и Negative Instances (N): Счетчики случаев, когда Субъект был (A) или не был (N) человеком для данной пары Глагол-Объект.
Базовые Оценки (S1, S2, S3): Рассчитываются на основе A и N. В патенте упоминается формула вида $A/(A+N)$ $A / (A + N)$ , но могут использоваться и другие.
- S1: Учитывает статистику по Объекту и Связанным терминам.
- S2: Учитывает статистику только по Объекту.
- S3: Учитывает статистику только по Связанным терминам.
Name-triggering confidence score: Взвешенное среднее оценок S1, S2, S3. Формула вида: $(a*S1 + b*S2 + c*S3)/d$ .
Весовые коэффициенты: Веса (a, b, c) настроены так, что прямое совпадение Объекта имеет наибольшее влияние (Вес S2 > Вес S1 > Вес S3).
Пороги переранжирования (Thresholds 1 и 2): Предопределенные значения для принятия решения о бустинге или демотинге результатов.

Разрешение неоднозначности через статистический NLP: Патент демонстрирует, как Google использует анализ больших данных (частота совместной встречаемости сущностей и глаголов) для разрешения неоднозначности интента. Система учится понимать ожидания пользователя на основе языковых паттернов, а не жестких правил.
Определение типа сущности как фактор ранжирования: Система активно определяет ожидаемый ТИП ответа (Человек vs. Организация/Объект) и использует это как сильный сигнал для переранжирования (Reranking). Соответствие типу может перевесить стандартные сигналы релевантности.
Критичность извлечения отношений (S-V-O): Эффективность всего механизма зависит от способности Google корректно извлекать отношения Субъект-Глагол-Объект из текста на этапе индексирования.
Сложная модель уверенности с приоритетом точности: Использование взвешенной модели (S1, S2, S3) позволяет учитывать семантический контекст (Related Terms), но приоритет отдается статистике, связанной с точным Объектом запроса (Вес S2 наибольший).
Обработка неопределенности: Система использует два порога. Корректировка ранжирования происходит только при высокой уверенности (очень высокий или очень низкий Confidence Score). В "серой зоне" система предпочитает не вмешиваться в стандартное ранжирование.

Best practices (это мы делаем)

Используйте четкую структуру предложений (S-V-O): Пишите контент с ясной лингвистической структурой (Кто -> Сделал -> Что). Это помогает системам извлечения отношений (Relation Extraction) корректно интерпретировать ваш контент. Предпочитайте активный залог («Иван изобрел X») пассивному («X был изобретен Иваном»).
Четкое определение сущностей (Schema.org): Обеспечьте точное распознавание ключевых сущностей. Используйте микроразметку (Schema.org/Person для людей, Schema.org/Organization или SportsTeam для организаций/команд). Это помогает Google правильно классифицировать контент и применять нужную логику переранжирования.
Соответствуйте ожидаемому типу ответа: Анализируйте запросы типа "Кто". Если контекст подразумевает организацию, убедитесь, что ваш ответ фокусируется на названии компании. Если контекст подразумевает человека, сфокусируйтесь на имени. Соответствие типу сущности критично для Featured Snippets и голосового поиска.
Построение тематического авторитета: Создание широкого охвата темы помогает Google собирать данные о «Связанных терминах» (Related terms). Это улучшает способность системы правильно интерпретировать контекст Объекта в запросе (влияние на S1 и S3).

Worst practices (это делать не надо)

Неоднозначное использование имен и названий: Использование имен людей в качестве названий брендов (или наоборот) без четкого разграничения контекста может привести к ошибкам классификации типа сущности.
Игнорирование структуры контента: Написание текстов, из которых сложно извлечь четкие отношения Субъект-Глагол-Объект (например, из-за сложных конструкций или отсутствия явного субъекта), затрудняет анализ контента.
Манипуляция с именами (Name Stuffing): Добавление имен известных людей в контент, где они не являются основным ответом. Если система определит, что запрос НЕ является name-triggering (низкий Confidence Score), ваш контент может быть понижен в ранжировании именно из-за наличия имен.

Стратегическое значение

Патент подтверждает стратегический сдвиг от ключевых слов к сущностям (Entities) и отношениям (Relations). Google стремится не просто найти релевантную информацию, но и предоставить её в ожидаемом формате (правильный тип сущности). Для долгосрочной SEO-стратегии это означает, что точность, ясность изложения фактов и структурирование контента (как семантическое, так и синтаксическое) становятся критически важными факторами для ранжирования по информационным запросам.

Практические примеры

Сценарий 1: Оптимизация для ответа-человека (Name-Triggering)

Запрос: «Кто выиграл French Open?»
Анализ Google: Глагол («выиграл»), Объект («French Open»). Статистика показывает, что Субъект почти всегда человек. Name-triggering score высокий.
Действие Google: Система повышает результаты, являющиеся именами людей (например, Рафаэль Надаль).
Действие SEO: Убедиться, что на странице есть четкое предложение в формате S-V-O: «Рафаэль Надаль выиграл French Open в [Год]». Использовать разметку Person для имени.

Сценарий 2: Оптимизация для ответа-организации (Не Name-Triggering)

Запрос: «Кто выиграл Super Bowl в 1992?»
Анализ Google: Глагол («выиграл»), Объект («Super Bowl»). Статистика показывает, что Субъект чаще всего команда (Организация). Name-triggering score низкий.
Действие Google: Система понижает результаты, фокусирующиеся на именах людей (например, имя MVP игрока), и повышает результаты с названиями команд (например, The Washington Redskins).
Действие SEO: Убедиться, что основной ответ сфокусирован на команде: «The Washington Redskins выиграли Super Bowl в 1992 году». Использовать разметку SportsTeam или Organization.

Что такое "Relation" (Отношение) S-V-O и почему это важно для этого патента?

S-V-O (Subject-Verb-Object) — это структура данных, извлеченная из предложения: Субъект (Кто/Что), Глагол (Действие) и Объект (Над кем/чем совершено действие). Например, «Надаль (S) выиграл (V) турнир (O)». В этом патенте S-V-O является основой всего анализа. Google анализирует миллионы таких отношений офлайн, чтобы понять, какие комбинации Глагол-Объект обычно связаны с Субъектом-человеком.

Как этот патент влияет на оптимизацию под Featured Snippets (Блоки готовых ответов)?

Влияние критическое. Featured Snippets часто отвечают на вопросы типа "Кто". Чтобы попасть в этот блок, ваш контент должен соответствовать ожидаемому типу ответа. Если Confidence Score высокий (ожидается человек), а ваш сниппет предлагает организацию, он не будет выбран, и наоборот. Точность типа сущности становится фактором ранжирования для Featured Snippets.

Как рассчитывается итоговая оценка уверенности (Confidence Score)?

Она рассчитывается как взвешенное среднее трех вспомогательных оценок (S1, S2, S3), основанных на статистике подтверждающих (A) и отрицающих (N) примеров. S1 учитывает Объект и Связанные термины, S2 — только Объект, S3 — только Связанные термины. При этом наибольший вес имеет S2, что означает приоритет статистики по точному Объекту запроса.

Что происходит, если Confidence Score высокий?

Если оценка превышает верхний порог, система считает, что пользователь ищет имя человека. Алгоритм переранжирования увеличивает оценки ранжирования (Result scores) тех документов в выдаче, которые содержат имена людей. Это гарантирует, что ответ нужного типа появится выше в результатах поиска.

Что происходит, если Confidence Score низкий?

Если оценка ниже нижнего порога, система считает, что пользователь НЕ ищет имя человека (например, ищет название команды). В этом случае алгоритм уменьшает оценки ранжирования документов, содержащих имена людей. Это помогает избежать неверных ответов, например, показа имени игрока вместо названия команды.

Что происходит, если система не уверена (Confidence Score средний)?

Если Confidence Score находится между двумя порогами (состояние неопределенности), система воздерживается от модификации оценок ранжирования (Block 1235). В этом случае будет применено стандартное ранжирование, основанное на других факторах релевантности.

Влияет ли этот алгоритм на все запросы?

Нет. Он активируется только для запросов, классифицированных как Potential name-triggering queries. Обычно это запросы, содержащие слова типа "Кто", "Кому", "Имя". Для общих или транзакционных запросов этот механизм не применяется.

Как я могу повлиять на этот механизм как SEO-специалист?

Основной способ влияния — это ясность, структура и точность вашего контента. Используйте четкие грамматические конструкции (S-V-O), чтобы помочь Google правильно извлекать отношения. Используйте микроразметку (Person/Organization), чтобы помочь идентифицировать тип сущности. Самое важное — убедитесь, что ваш ответ точно соответствует ожидаемому типу сущности для целевого запроса.

Как система определяет «Связанные термины» (Related terms)?

Патент указывает на использование Related terms repository. Это хранилище семантических связей (синонимы, гиперонимы, например, «Турнир» для «French Open»). На практике это может быть реализовано через анализ совместной встречаемости терминов или данные из Knowledge Graph.

Как система определяет, является ли Субъект в предложении именем человека?

На этапе офлайн-анализа система использует Name repository (репозиторий имен). Это может включать базы данных известных личностей и алгоритмы распознавания именованных сущностей (NER), чтобы определить, соответствует ли текст Субъекта паттернам имени человека или известной сущности типа Person.

Как Google находит ответы на фактологические вопросы, анализируя консенсус сущностей в топе поисковой выдачи

Google использует этот механизм для автоматического ответа на фактологические вопросы путем анализа неструктурированного текста топовых результатов поиска. Система определяет, какая сущность (например, человек, место) чаще всего упоминается на авторитетных страницах. Эта наиболее часто упоминаемая сущность, с учетом нормализации частоты и веса источника, выбирается в качестве ответа.

US9477759B2
2016-10-25

Семантика и интент
Индексация
Knowledge Graph

Как Google идентифицирует и ранжирует людей, связанных с запросом, и различает однофамильцев с помощью контекста

Google использует механизм для определения людей, наиболее релевантных поисковому запросу. Система анализирует контекст вокруг имен в документах, используя «термины классификации» (например, должности, локации, email), чтобы сгруппировать упоминания и различить людей с одинаковыми именами (дисамбигуация). Это позволяет точно идентифицировать сущности и организовать выдачу вокруг них.

US9245022B2
2016-01-26

Семантика и интент
Индексация
SERP

Как Google итеративно распознает сущности на страницах и рассчитывает их важность с помощью PageRank

Google использует итеративный процесс для распознавания и устранения неоднозначности сущностей (людей, мест, понятий) в документах. Система начинает с известных фактов, находит упоминающие сущность документы, анализирует сопутствующие термины для уточнения модели распознавания и автоматически обнаруживает новые признаки. Патент также описывает расчет важности сущности путем суммирования PageRank ссылающихся документов, взвешенного на вероятность ссылки.

US8122026B1
2012-02-21

Семантика и интент
Ссылки
Knowledge Graph

Как Google автоматически определяет язык, страну и тип устройства по структуре URL и переранжирует выдачу под пользователя

Google анализирует шаблоны в структуре URL сайта (например, поддомены или папки) и сопоставляет их с фактическим контентом страниц. Система вычисляет вероятность того, что определенный шаблон указывает на язык, страну или тип устройства. При поиске эти данные используются для расчета оценки соответствия (Alignment Score) и повышения в ранжировании той версии страницы, которая лучше всего подходит пользователю, при одновременном понижении дубликатов.

US8600993B1
2013-12-03

Структура сайта
Персонализация
Техническое SEO

Как Google анализирует историю поисковых запросов для устранения неоднозначности имен и генерации контекстных подсказок

Google использует систему для устранения неоднозначности имен людей. Анализируя исторические данные о том, какие запросы (как включающие имя, так и нет) приводили пользователей на одни и те же ресурсы, система кластеризует различные контексты имени (например, разные люди с одним именем). Для каждого контекста выбирается лучший уточняющий термин, который затем предлагается пользователю в качестве поисковой подсказки.

US9830379B2
2017-11-28

Семантика и интент

Как Google ранжирует сущности (например, людей с одинаковыми именами) с помощью кластеризации, контекстной авторитетности и персонализации

Google использует систему двухуровневого ранжирования для обработки неоднозначных запросов (например, имен людей). Сначала ресурсы группируются в кластеры, представляющие разные сущности. Ресурсы внутри кластера ранжируются на основе их качества и авторитетности внутри этого кластера. Затем сами кластеры ранжируются с учетом релевантности запросу и сильной персонализации (социальные связи и местоположение пользователя).

US8645393B1
2014-02-04

Персонализация
Семантика и интент
SERP

Как Google динамически перестраивает выдачу, если пользователь игнорирует результаты, связанные с определенной сущностью

Google использует механизм уточнения интента пользователя в реальном времени при обработке неоднозначных запросов. Система группирует результаты поиска по связанным сущностям. Если пользователь демонстрирует отсутствие интереса к одной из групп (например, прокручивает или смахивает результаты), система динамически модифицирует выдачу, понижая или удаляя все результаты, связанные с этой отклоненной сущностью.

US9348945B2
2016-05-24

Семантика и интент
SERP
Поведенческие сигналы

Как Google использует анализ многословных фраз для улучшения подбора синонимов с учетом грамматического согласования

Google анализирует, как пользователи одновременно меняют несколько слов в запросе (например, при изменении числа или рода). Подтверждая, что каждое измененное слово является лексическим или семантическим вариантом оригинала, Google идентифицирует «синонимы с N-граммным согласованием». Это позволяет системе улучшить понимание синонимов отдельных слов, даже если эти слова редко меняются поодиночке в определенных контекстах.

US7925498B1
2011-04-12

Семантика и интент
Поведенческие сигналы

Как Google использует погоду, время и местоположение для понимания истинного намерения пользователя и адаптации поисковой выдачи

Google анализирует, как физическое окружение (погода, время, местоположение) влияет на то, что ищут пользователи. Система выявляет корреляции между средой и поведением пользователей в прошлом (включая длительность кликов), чтобы лучше понять текущий интент многозначных запросов. Затем она переранжирует выдачу или переписывает запрос для предоставления наиболее релевантных результатов и рекламы.

US8898148B1
2014-11-25

Семантика и интент
Поведенческие сигналы
Персонализация

Как Google рассчитывает тематический авторитет сайта для кастомизации поиска с помощью Topic-Sensitive PageRank

Патент Google, описывающий механизм кастомизации результатов поиска, инициированного со стороннего сайта (например, Google Custom Search). Система использует «профиль сайта» для повышения результатов, соответствующих его тематике. Ключевая ценность патента — детальное описание расчета тематической авторитетности (Topic Boosts) путем анализа ссылок с эталонных сайтов (Start Sites), что является реализацией Topic-Sensitive PageRank.

US7565630B1
2009-07-21

Персонализация
SERP
Ссылки

Как Google использует историю поиска и браузинга пользователя для персонализации и изменения результатов выдачи

Google записывает историю поиска и просмотров пользователя для последующей персонализации выдачи. Система может повышать в ранжировании ранее посещенные сайты, добавлять в текущую выдачу релевантные результаты из прошлых похожих запросов, а также понижать сайты, которые пользователь ранее видел, но проигнорировал. Патент также описывает создание "предпочитаемых локаций" на основе частоты посещений и времени пребывания на сайте.

US9256685B2
2016-02-09

Персонализация
Поведенческие сигналы
SERP

Как Google использует данные из Local Search и Google Maps для распознавания географических названий в основном поиске

Google анализирует поведение пользователей в интерфейсах с отдельными полями ввода "Что?" и "Где?" (например, в Google Maps). На основе этой статистики система определяет, является ли термин однозначным названием местоположения ("Нью-Йорк") или нет ("Пицца"). Это позволяет поиску отличать локальные запросы от общих и формировать "черные списки" для терминов, которые похожи на города, но ими не являются (например, "Орландо Блум").

US8782030B1
2014-07-15

Local SEO
Семантика и интент
Поведенческие сигналы

Как Google использует контент вокруг ссылок (вне анкора) для генерации «Синтетического Описательного Текста» и ранжирования вашего сайта

Google может генерировать «Синтетический Описательный Текст» для страницы, анализируя контент и структуру сайтов, которые на нее ссылаются. Система создает структурные шаблоны для извлечения релевантного текста (например, заголовков или абзацев рядом со ссылкой), который затем используется как мощный сигнал ранжирования. Этот механизм позволяет лучше понять содержание страницы, особенно если традиционный анкорный текст низкого качества или отсутствует.

US9208233B1
2015-12-08

Ссылки
Семантика и интент
Индексация

Как Google консолидирует сигналы ранжирования между мобильными и десктопными версиями страниц, используя десктопный авторитет для мобильного поиска

Патент Google описывает механизм для решения проблемы недостатка сигналов ранжирования в мобильном вебе. Система идентифицирует корреляцию между мобильной страницей и её десктопным аналогом. Если мобильная версия недостаточно популярна сама по себе, она наследует сигналы ранжирования (например, обратные ссылки и PageRank) от авторитетной десктопной версии, улучшая её позиции в мобильном поиске.

US8996514B1
2015-03-31

Техническое SEO
Ссылки

Как Google использует клики по изображениям для определения схожести запросов и картинок (Поведенческая схожесть)

Google анализирует поведение пользователей в поиске по картинкам, чтобы определить схожесть двух запросов (или двух изображений). Если пользователи часто кликают на одни и те же изображения в ответ на разные запросы, эти запросы считаются похожими. Этот механизм (Коллаборативная фильтрация) позволяет находить связи независимо от языка или типа запроса (текст/изображение) и используется для генерации рекомендаций.

US8280881B1
2012-10-02

Поведенческие сигналы
Семантика и интент
Мультимедиа