Как Google использует краудсорсинг для понимания фактологических запросов и создания шаблонов ответов

FACTUAL QUERY PATTERN LEARNING (Обучение паттернам фактологических запросов)

US9037568B1
Google LLC
2013-03-15
2015-05-19

Google использует метод масштабирования понимания фактологических запросов. Система показывает пользователям факт (например, «Рост Барака Обамы 6'1"») и просит их предложить запросы, которые ведут к этому факту. Полученные запросы нормализуются, фильтруются и обобщаются в шаблоны (например, «какой рост у [Person]»). Эти шаблоны связываются с базой знаний, позволяя системе отвечать на аналогичные вопросы о других сущностях.

Какую проблему решает

Патент решает проблему масштабируемого понимания естественного языка для фактологических запросов (запросов, ищущих конкретный атрибут сущности). Система должна уметь интерпретировать разнообразные формулировки вопросов и связывать их с конкретными данными в базе знаний (data store), особенно для запросов, которые она ранее не встречала (длинный хвост). Цель — эффективно обучить систему распознавать шаблоны (query patterns), по которым пользователи ищут факты.

Что запатентовано

Запатентован метод обучения паттернам запросов с использованием краудсорсинга или автоматизированных систем. Суть изобретения заключается в том, чтобы предоставить пользователям утверждение (statement), содержащее факт (например, «Рост Барака Обамы 6'1"»), и собрать от них варианты запросов, которыми они бы искали эту информацию. Затем эти запросы обрабатываются, обобщаются в шаблоны (generalized query patterns) путем замены конкретной сущности на категорию (например, «какой рост у [Person]») и связываются с соответствующими атрибутами в базе знаний.

Как это работает

Система работает в несколько этапов:

Генерация утверждений: Система выбирает факт (комбинацию сущности и атрибута) из базы знаний и формирует утверждение (statement).
Сбор данных (Краудсорсинг): Утверждение предоставляется пользователям, которые в ответ предлагают запросы (queries) для получения этого факта.
Фильтрация и Нормализация: Полученные запросы фильтруются (например, по частоте или рейтингам пользователей) и нормализуются (удаление пунктуации, стоп-слов) в паттерны запросов (query patterns).
Обобщение: Конкретная сущность (Topic) или атрибут (Attribute) в паттерне заменяется на идентификатор категории (identifier), например, /Person/ или /Height/, создавая обобщенный паттерн (generalized query pattern).
Ассоциация: Обобщенный паттерн связывается с соответствующим атрибутом в базе знаний для всех сущностей данной категории.

При получении нового запроса система сопоставляет его с этими шаблонами для извлечения ответа.

Актуальность для SEO

Высокая. Понимание фактологических запросов и предоставление прямых ответов (Direct Answers, Knowledge Panels, Featured Snippets) является ключевым элементом современного поиска. Описанный механизм лежит в основе того, как Google интерпретирует вопросы и связывает их с Knowledge Graph. Методы обучения на основе шаблонов остаются актуальными для обработки огромного объема запросов.

Важность для SEO

Влияние на SEO значительно (85/100). Патент описывает фундаментальный механизм того, как Google учится понимать связь между формулировками запросов и конкретными фактами о сущностях. Понимание этих механизмов критически важно для оптимизации контента под голосовой поиск, прямые ответы и попадание в блоки с ответами. Это подчеркивает важность структурирования данных и четкого представления фактов о сущностях на сайте.

Термины и определения

Attribute (Атрибут): Конкретный факт, свойство или характеристика сущности (Topic). Например, «Рост» (Height) или «Дата рождения».
Data Store (Хранилище данных): База данных, хранящая сущности, их атрибуты и связи между ними (граф знаний). Используется для определения категорий сущностей и хранения значений атрибутов.
Generalized Query Pattern (Обобщенный паттерн запроса): Шаблон запроса, созданный путем замены конкретной сущности или атрибута на идентификатор категории. Например, [how tall is /Person/]. Используется для сопоставления с новыми запросами.
Identifier (Идентификатор): Метка категории, используемая для замены конкретных терминов в процессе обобщения. Например, /Person/, /President/, /Attribute/, /Modifier/.
Query Pattern (Паттерн запроса): Нормализованная версия запроса, полученного от пользователя. Например, запрос «How tall is Barack Obama?» превращается в паттерн [how tall is barack obama].
Statement (Утверждение): Факт, предоставляемый системой пользователям для инициации сбора данных. Содержит сущность и значение атрибута. Например, «Barack Obama is 6'1"».
Topic (Сущность/Топик): Конкретный человек, место или предмет, о котором запрашивается информация. Например, «Барак Обама».

Ключевые утверждения (Анализ Claims)

Claim 1 (Независимый пункт): Описывает основной метод обучения паттернам запросов.

Система предоставляет множеству пользователей поисковой системы утверждение (statement), которое ссылается на конкретный атрибут (particular attribute) конкретной сущности (particular topic).
В ответ на это система получает от пользователей набор кандидатов в паттерны запросов (collection of candidate query patterns). Пользователи указывают, что эти термины полезны для получения значения данного атрибута для данной сущности.
Система выбирает подмножество из этих кандидатов (фильтрация).
Система обобщает один или несколько выбранных паттернов для создания обобщенных паттернов (generalized query patterns), которые полезны для получения значения того же атрибута, но для других сущностей.
Система ассоциирует эти обобщенные паттерны с исходной сущностью, а также с другими сущностями (one or more other topics), которые имеют этот же атрибут.

Claim 2 (Зависимый от 1): Описывает применение обученных паттернов.

Система получает запрос от пользователя.
Определяет, что часть запроса соответствует конкретному обобщенному паттерну.
На основании этого соответствия система извлекает значение конкретного атрибута для другой сущности, на которую ссылается запрос.

(Это означает, что если система обучила шаблон [how tall is /Person/] и получила запрос «How tall is Abraham Lincoln», она использует шаблон для извлечения роста Линкольна).

Claim 4 (Зависимый от 3): Уточняет процесс фильтрации.

Полученные запросы фильтруются для удаления тех, частота встречаемости которых не удовлетворяет пороговому значению (predetermined threshold).

Claim 5 (Зависимый от 1): Уточняет процесс обобщения.

Обобщение включает замену части паттерна запроса, соответствующей конкретной сущности (particular topic), на один или несколько идентификаторов (identifiers).

Claim 6 (Зависимый от 1): Уточняет выбор исходного утверждения.

Утверждение (statement) выбирается специально для того, чтобы вызвать получение паттернов запросов, включающих конкретный атрибут, для которого системе необходимы ассоциации с обобщенными паттернами. (Система активно ищет пробелы в своем понимании и запрашивает данные для их заполнения).

Где и как применяется

Изобретение в первую очередь относится к этапу понимания запросов и использует данные, хранящиеся в индексе (базе знаний).

INDEXING – Индексирование и извлечение признаков
На этом этапе функционирует Data Store (Knowledge Graph), который хранит сущности (Topics), их атрибуты (Attributes) и связи. Эта структура данных используется для определения категорий сущностей (например, что Барак Обама — это Person) и для хранения значений атрибутов.

QUNDERSTANDING – Понимание Запросов
Это основной этап применения патента. Процесс обучения паттернам происходит офлайн или в фоновом режиме:

Обучение (Offline): Система использует краудсорсинг для сбора query patterns, обобщает их в generalized query patterns и сохраняет эти шаблоны. Это формирует базу знаний о том, как пользователи задают вопросы.
Применение (Real-time): Когда пользователь вводит запрос, система нормализует его и пытается сопоставить с сохраненными generalized query patterns. Если соответствие найдено, система понимает интент запроса как поиск конкретного факта (атрибута) о конкретной сущности.

RANKING / METASEARCH
Если запрос успешно интерпретирован как фактологический с помощью generalized query pattern, система может инициировать поиск в Data Store (Knowledge Graph) для извлечения точного ответа. Этот ответ затем может быть представлен в виде специального элемента выдачи (Direct Answer, Knowledge Panel).

Входные данные:

Утверждение (Statement) (на этапе обучения).
Запросы от пользователей (Queries) (на этапе обучения).
Структура Data Store (связи и категории сущностей).
Запрос пользователя (на этапе применения).

Выходные данные:

Обобщенные паттерны запросов (Generalized Query Patterns) (на этапе обучения).
Интерпретация запроса пользователя (идентифицированная сущность и атрибут) (на этапе применения).
Значение атрибута (ответ на вопрос) (на этапе применения).

На что влияет

Специфические запросы: Наибольшее влияние на информационные запросы, сформулированные как вопросы (Кто, Что, Где, Когда, Сколько), ищущие конкретные факты.
Конкретные типы контента: Влияет на контент, содержащий четкие факты и данные о сущностях (справочники, энциклопедии, базы данных, страницы продуктов с характеристиками).
Форматы контента: Способствует выделению кратких, точных ответов (Featured Snippets, Direct Answers).
Голосовой поиск: Механизм критичен для голосового поиска, где запросы часто формулируются как естественные вопросы, требующие точного ответа.

Когда применяется

Триггеры активации (Обучение): Когда система определяет нехватку generalized query patterns для определенного атрибута или категории сущностей (Claim 6).
Триггеры активации (Применение): Когда входящий запрос пользователя соответствует одному из ранее изученных generalized query patterns.
Временные рамки: Обучение происходит периодически или непрерывно в фоновом режиме. Применение происходит в реальном времени при обработке запроса.

Пошаговый алгоритм

Процесс А: Обучение паттернам (Offline/Background)

Идентификация потребности: Система определяет атрибут, для которого не хватает обобщенных паттернов запросов.
Генерация утверждения: Выбирается сущность, имеющая данный атрибут, и формируется утверждение (Statement) (например, «Барак Обама 6'1"»).
Сбор данных (Краудсорсинг): Утверждение предоставляется множеству пользователей.
Получение запросов: Система собирает предложенные пользователями запросы (например, «Какой рост у Обамы?»).
Фильтрация: Запросы фильтруются. Удаляются запросы с низкой частотой встречаемости (ниже порога) или низкими рейтингами от других пользователей.
Нормализация: Оставшиеся запросы нормализуются в Query Patterns (например, [какой рост у обамы]).
Обобщение: Система идентифицирует сущность («обама») и/или атрибут («рост») в паттерне. Используя Data Store, она определяет категорию сущности (например, Person). Конкретные термины заменяются на идентификаторы (Identifiers), создавая Generalized Query Pattern (например, [какой рост у /Person/]). Этот процесс может быть итеративным.
Ассоциация и хранение: Обобщенный паттерн ассоциируется с атрибутом (Height) для всех сущностей категории (Person) в Data Store.

Процесс Б: Применение паттернов (Real-time)

Получение запроса: Система получает новый запрос (например, «Какой рост у Шакила О'Нила?»).
Нормализация запроса: Запрос преобразуется в нормализованный вид ([какой рост у шакила онила]).
Сопоставление с шаблонами: Система сравнивает нормализованный запрос с базой Generalized Query Patterns.
Идентификация соответствия: Обнаруживается соответствие с шаблоном [какой рост у /Person/].
Интерпретация: Система интерпретирует запрос как поиск атрибута «Рост» для сущности «Шакил О'Нил» (категория Person).
Извлечение ответа: Система обращается к Data Store и извлекает значение атрибута «Рост» для данной сущности.
Предоставление ответа: Ответ (например, 7'1") предоставляется пользователю.

Какие данные и как использует

Данные на входе

Патент фокусируется на обработке запросов и использовании структуры базы знаний. Он не детализирует факторы ранжирования веб-страниц.

Пользовательские факторы (Краудсорсинг): Данные, генерируемые пользователями в ответ на утверждения (Statements). Это включает предложенные запросы и, возможно, рейтинги запросов друг друга.
Структурные данные (Data Store/Knowledge Graph): Информация о сущностях, их атрибутах и, что критически важно, их категориях и иерархии (например, X является Президентом, Президент является Политиком, Политик является Человеком). Эти данные используются для процесса обобщения.
Временные факторы (Модификаторы): Патент упоминает возможность обработки модификаторов (Modifier) в запросах, таких как даты (например, «Кто был президентом США в 1943 году?»), что требует использования временных данных для ограничения ответа.

Какие метрики используются и как они считаются

Частота встречаемости запроса (Frequency of occurrence): Метрика, используемая на этапе фильтрации. Запросы, которые предлагаются слишком редко в ответ на утверждение, отбрасываются.
Пороговое значение (Predetermined threshold): Порог для частоты встречаемости, необходимый для того, чтобы запрос прошел фильтрацию.
Рейтинги пользователей (Ratings): В одном из вариантов реализации пользователи могут оценивать предложенные запросы по качеству (грамматика, естественность, соответствие факту). Эти рейтинги могут использоваться для фильтрации.
Соответствие шаблону (Pattern Match): Метрика, определяющая, соответствует ли нормализованный входящий запрос одному из сохраненных Generalized Query Patterns.

Масштабирование понимания через шаблоны: Основная цель патента — не полагаться на ручное кодирование правил для каждого фактологического вопроса, а автоматически (через краудсорсинг) изучать и обобщать шаблоны запросов (Generalized Query Patterns).
Краудсорсинг как источник обучающих данных: Google может активно использовать пользователей для сбора данных о том, как естественно формулируются вопросы о конкретных фактах. Система предоставляет факт и собирает вопросы к нему.
Критическая роль категоризации сущностей: Процесс обобщения напрямую зависит от того, насколько точно сущности категоризированы в Data Store (Knowledge Graph). Замена «Барак Обама» на /Person/ возможна только если система знает, что он принадлежит к этой категории.
Итеративное обобщение: Обобщение может быть итеративным. Паттерн может быть сначала обобщен до [какой рост у /President/], а затем до [какой рост у /Person/], увеличивая охват.
Активное обучение: Система не просто пассивно собирает данные, она может активно идентифицировать пробелы в своих знаниях (атрибуты без достаточного количества шаблонов) и целенаправленно запрашивать данные для этих атрибутов (Claim 6).
Фильтрация качества данных: Сбор данных включает этап контроля качества, использующий частоту встречаемости или рейтинги пользователей для отсеивания неестественных или некорректных формулировок.

Best practices (это мы делаем)

Укрепление связи с Knowledge Graph: Убедитесь, что ваша организация, продукты или ключевые сущности корректно представлены и категоризированы в Knowledge Graph. Это основа для того, чтобы система могла применить к ним изученные Generalized Query Patterns. Используйте разметку Schema.org (особенно @type и sameAs).
Оптимизация под вопросы и ответы (FAQ): Создавайте контент, который прямо отвечает на фактологические вопросы о ваших сущностях. Используйте естественные формулировки вопросов, которые пользователи могут использовать (например, в заголовках или блоках FAQ). Это повышает вероятность того, что ваш контент будет использован для ответа, извлеченного с помощью этих шаблонов.
Структурирование данных на странице: Представляйте факты и атрибуты в структурированном виде (таблицы характеристик, списки определений, семантическая верстка). Это помогает поисковой системе извлекать значения атрибутов, когда запрос интерпретирован через шаблон.
Оптимизация под голосовой поиск: Поскольку механизм направлен на понимание естественных вопросов, оптимизация контента под разговорный стиль и предоставление кратких, четких ответов становится приоритетом для голосового поиска.

Worst practices (это делать не надо)

Скрытие фактов в неструктурированном тексте: Представление ключевых характеристик или фактов исключительно в виде длинных абзацев текста затрудняет их извлечение и использование в качестве прямых ответов.
Использование неоднозначных терминов для атрибутов: Использование нестандартных или жаргонных названий для общепринятых атрибутов (например, использование «длина» вместо «рост» для человека) может помешать системе сопоставить контент с изученными шаблонами.
Игнорирование микроразметки: Отсутствие Schema.org снижает способность Google точно идентифицировать и категоризировать ваши сущности и их атрибуты, что является необходимым условием для работы описанного механизма.

Стратегическое значение

Патент подтверждает стратегическую важность Knowledge Graph и понимания сущностей (Entity-First Indexing). Способность Google понимать фактологические запросы на уровне шаблонов означает, что система может предоставлять ответы напрямую, минуя традиционное ранжирование веб-страниц. Для SEO это означает сдвиг фокуса с оптимизации под ключевые слова на оптимизацию под сущности и их атрибуты, а также на предоставление структурированных, достоверных фактов, которые могут быть легко извлечены и использованы в качестве прямых ответов.

Практические примеры

Сценарий: Оптимизация страницы продукта E-commerce

Цель: Обеспечить видимость характеристик товара в прямых ответах на фактологические запросы.

Анализ шаблонов: SEO-специалист предполагает, что для атрибута «вес» существуют шаблоны типа [сколько весит /Product/] или [вес /Product/].
Идентификация сущности: Убедиться, что страница четко идентифицирует продукт (например, «iPhone 16 Pro Max») с помощью заголовка H1 и разметки Schema.org/Product.
Структурирование атрибутов: Разместить характеристики в четкой таблице или списке определений (<dl>). Использовать стандартные названия атрибутов («Вес», «Размеры», «Емкость батареи»).
Добавление FAQ: Включить блок FAQ с вопросами, соответствующими ожидаемым шаблонам: «Сколько весит iPhone 16 Pro Max?», «Какая емкость батареи у iPhone 16 Pro Max?».
Ожидаемый результат: Когда пользователь спрашивает у Google «Сколько весит iPhone 16 Pro Max?», система использует Generalized Query Pattern для интерпретации запроса и с большей вероятностью извлечет точный вес со страницы продукта для прямого ответа.

Является ли этот патент доказательством того, что Google использует краудсорсинг для ранжирования?

Нет, этот патент не связан напрямую с ранжированием веб-документов. Он описывает использование краудсорсинга (получение данных от множества пользователей) для обучения системы пониманию фактологических запросов. Пользователи помогают генерировать и валидировать шаблоны вопросов (Generalized Query Patterns), а не оценивают качество сайтов для ранжирования.

Как система решает, какую категорию использовать для обобщения (например, /President/ или /Person/)?

Патент указывает, что процесс обобщения может быть итеративным, двигаясь от менее общих категорий к более общим (Президент -> Политик -> Человек). Система использует структуру Data Store (Knowledge Graph) для определения иерархии категорий. Вероятно, система стремится создать шаблоны на разных уровнях обобщения для обеспечения гибкости в понимании запросов.

Что такое «Statement» и как он используется?

Statement (Утверждение) — это инициирующее событие для сбора данных. Это факт, который система показывает пользователю (например, «Рост Барака Обамы 6'1"»). Цель — попросить пользователя предложить естественные запросы, которые привели бы к этому факту. Это позволяет собрать обучающие данные, связывающие факт и способы его запроса.

Как этот патент связан с Featured Snippets или Direct Answers?

Связь прямая. Чтобы предоставить Featured Snippet или Direct Answer на фактологический вопрос, Google должен сначала понять, о какой сущности и каком атрибуте спрашивает пользователь. Описанный механизм обучения Generalized Query Patterns решает именно эту задачу — интерпретацию запроса и его привязку к конкретному факту в базе знаний.

Как SEO-специалист может повлиять на процесс обобщения паттернов?

Напрямую повлиять на процесс обучения Google нельзя. Однако можно обеспечить необходимые условия для того, чтобы ваши сущности были правильно интерпретированы. Это достигается за счет корректной категоризации ваших сущностей с помощью Schema.org и обеспечения их присутствия в Knowledge Graph. Чем точнее Google знает категорию вашей сущности, тем эффективнее он сможет применить к ней изученные шаблоны.

Что произойдет, если пользователи предложат некачественные или спамные запросы в ответ на Statement?

Патент предусматривает механизм фильтрации. Запросы могут фильтроваться по частоте встречаемости (если запрос предложил только один человек, он может быть отброшен) или по рейтингам, которые пользователи выставляют друг другу. Это гарантирует, что в обучение попадут только наиболее релевантные и естественные формулировки.

Влияет ли этот механизм на обработку коммерческих запросов?

Да, влияет. Хотя примеры в патенте информационные, механизм применим к любым фактам. Коммерческие запросы часто содержат фактологический интент, например, поиск характеристик товара («емкость батареи iphone 16»), цен или наличия. Система может изучать шаблоны и для этих атрибутов, например, [цена /Product/] или [характеристики /Product/].

Что такое «Modifier», упомянутый в патенте?

Modifier (Модификатор) — это уточнение в запросе, которое ограничивает ответ. В примере «Кто был президентом США в 1943 году?», «в 1943 году» является модификатором. Патент указывает, что система может обобщать и эти части запроса, создавая шаблоны типа [Кто был /Political Position/ в /Country/ в /Modifier/]. Это важно для понимания контекста и временных рамок.

Может ли система генерировать эти паттерны без участия людей?

Хотя патент акцентирует внимание на краудсорсинге (Claims 1, 8, 15 явно упоминают получение данных от пользователей), в описании также упоминается возможность предоставления Statement автоматизированной системе. Эта система может генерировать паттерны, например, анализируя логи предыдущих запросов, которые соответствуют части утверждения.

Как этот патент влияет на стратегию работы с семантическим ядром?

Он смещает акцент с отдельных ключевых слов на понимание интентов и шаблонов запросов. При сборе семантики необходимо фокусироваться на выявлении фактологических вопросов, связанных с вашими сущностями, и группировать их по атрибутам (цена, вес, размер, дата). Стратегия должна включать создание контента, оптимизированного под эти шаблоны вопросов.

Как Google использует машинное обучение для извлечения фактов из текста и перевода вопросов на естественном языке в пути Графа Знаний

Анализ патента Google, описывающего два ключевых механизма: автоматическое расширение Графа Знаний путем анализа текста и ответы на вопросы на естественном языке. Система использует машинное обучение для определения надежных путей (связей) в графе. Эти пути используются как для вывода новых фактов из веб-документов, так и для интерпретации запросов пользователей и поиска прямых ответов.

US10810193B1
2020-10-20

Knowledge Graph
Семантика и интент

Как Google находит ответы на фактологические вопросы, анализируя консенсус сущностей в топе поисковой выдачи

Google использует этот механизм для автоматического ответа на фактологические вопросы путем анализа неструктурированного текста топовых результатов поиска. Система определяет, какая сущность (например, человек, место) чаще всего упоминается на авторитетных страницах. Эта наиболее часто упоминаемая сущность, с учетом нормализации частоты и веса источника, выбирается в качестве ответа.

US9477759B2
2016-10-25

Семантика и интент
Индексация
Knowledge Graph

Как Google определяет сущности (например, болезни) по списку признаков (например, симптомов) в запросе пользователя

Google использует различные методы для ответа на запросы, содержащие список признаков (атрибутов), но не называющие саму сущность. Система определяет, какой тип сущности ищет пользователь (например, медицинское состояние по симптомам), и идентифицирует наиболее релевантные сущности. Для этого анализируется частота упоминания сущностей в результатах поиска по исходному запросу или используются специально сгенерированные комбинированные запросы.

US8843466B1
2014-09-23

Семантика и интент
Knowledge Graph
Индексация

Как Google использует иерархию запросов для точной идентификации сущностей (товаров, статей), даже при наличии ошибок в данных

Google использует метод "Поиска известного элемента" для надежной идентификации конкретных сущностей (например, научных статей или товаров), даже если исходный запрос содержит ошибки. Система создает несколько запросов с разными комбинациями атрибутов и выполняет их иерархически — от самых точных (например, по DOI/GTIN) к менее точным (по названию/автору). Это позволяет находить нужный объект, игнорируя ошибки в отдельных атрибутах, и используется для сверки данных и каноникализации сущностей.

US9886475B1
2018-02-06

Семантика и интент

Как Google определяет сущности (например, болезни) по их атрибутам (например, симптомам), анализируя результаты поиска и аннотации индекса

Google использует систему для ответа на запросы, которые перечисляют атрибуты (например, симптомы), но ищут сущность (например, болезнь). Система определяет связь между ними, используя несколько методов: предварительное аннотирование индекса связями сущностей, анализ частоты упоминания сущностей в топе выдачи или генерацию комбинированных запросов. Также система предлагает дополнительные атрибуты для уточнения.

US8856099B1
2014-10-07

Индексация
Семантика и интент
SERP

Как Google выбирает предлагаемые запросы, анализируя вероятность завершения поиска и коммерческую ценность

Google использует графовую модель для анализа поисковых сессий пользователей. Система определяет, какие уточняющие запросы чаще всего приводят к завершению поиска (становятся «финальным пунктом назначения»). Эти запросы считаются обладающими наибольшей «полезностью» (Utility) и предлагаются пользователю в качестве подсказок или связанных запросов. Система также учитывает коммерческий потенциал этих запросов и может показывать для них релевантные рекламные блоки.

US8751520B1
2014-06-10

SERP
Поведенческие сигналы
Семантика и интент

Как Google использует социальные связи для обнаружения ссылочного спама и накрутки кликов

Google может анализировать связи между владельцами сайтов в социальных сетях, чтобы оценить независимость ссылок между их ресурсами. Если владельцы тесно связаны (например, друзья), ссылки между их сайтами могут получить меньший вес в ранжировании, а клики по рекламе могут быть классифицированы как спам (накрутка).

US8060405B1
2011-11-15

Антиспам
Ссылки
SERP

Как Google использует данные о реальных повторных посещениях (Quality Visit Measure) и социальных взаимодействиях для ранжирования локального бизнеса

Google использует данные о физических посещениях пользователей для оценки качества локального бизнеса. Система рассчитывает «Quality Visit Measure», придавая значительно больший вес местам, куда люди возвращаются повторно, приводят друзей или посещают по рекомендации. Этот показатель используется как сильный сигнал качества для ранжирования в локальном поиске и Google Maps, снижая зависимость от онлайн-отзывов.

US10366422B2
2019-07-30

Поведенческие сигналы
Local SEO

Как Google использует данные о кликах пользователей (CTR и Click Ratio) для определения официального сайта по навигационным запросам

Google анализирует журналы запросов, чтобы определить, какой результат пользователи подавляюще предпочитают по конкретному запросу. Если результат демонстрирует исключительно высокий CTR и/или Click Ratio по популярному запросу, система помечает его как «авторитетную страницу». Затем этот результат может отображаться на выдаче с особым выделением, потенциально переопределяя стандартное ранжирование.

US8788477B1
2014-07-22

Поведенческие сигналы
EEAT и качество
SERP

Как Google определяет основной контент страницы, анализируя визуальную структуру и характеристики разделов

Google использует систему для идентификации основного контента веб-страницы путем её разделения на логические разделы на основе визуального макета. Система оценивает характеристики каждого раздела (соотношение ссылок к тексту, количество слов, изображения, расположение) относительно характеристик всей страницы, чтобы выделить наиболее значимый контент и отделить его от навигации и шаблонов.

US20140372873A1
2014-12-18

Структура сайта
Техническое SEO
Ссылки

Как Google рассчитывает тематическую популярность (Topical Authority) документов на основе поведения пользователей

Google использует данные о посещаемости и навигации пользователей для расчета популярности документов. Система классифицирует документы и запросы по темам, а затем вычисляет популярность документа внутри каждой конкретной темы (Per-Topic Popularity). Эта метрика используется как сигнал ранжирования, когда тема запроса пользователя соответствует теме документа.

US8595225B1
2013-11-26

Поведенческие сигналы
Семантика и интент
SERP

Как Google нормализует поведенческие сигналы (Dwell Time), калибруя показатели «короткого» и «длинного» клика для разных категорий сайтов

Google использует механизм для устранения предвзятости в поведенческих сигналах, таких как продолжительность клика (Dwell Time). Поскольку пользователи взаимодействуют с разными типами контента по-разному, система определяет, что считать «коротким кликом» и «длинным кликом» отдельно для каждой категории (например, Новости, Недвижимость, Словари). Это позволяет более точно оценивать качество ресурса, сравнивая его показатели с нормами его конкретной ниши.

US8868565B1
2014-10-21

Поведенческие сигналы
SERP

Как Google автоматически генерирует блоки "Связанные ссылки" и "Похожие запросы", анализируя контент страницы при загрузке

Патент описывает систему для динамической генерации виджетов связанных ссылок. При загрузке страницы система извлекает текст (заголовок, контент, запрос из реферера), определяет наиболее важные ключевые слова с помощью глобального репозитория (Keyword Repository), выполняет поиск по этим словам (часто в пределах того же домена) и отображает топовые результаты для улучшения навигации.

US9129009B2
2015-09-08

Ссылки
Семантика и интент
Техническое SEO

Как Google автоматически определяет важность различных частей веб-страницы (DOM-узлов) для ранжирования

Google анализирует коллекции похожих структурированных документов (например, товарных карточек) и создает общую модель (DOM). Затем система изучает логи запросов и кликов, чтобы понять, какие части структуры (заголовки, основной контент, реклама) чаще всего содержат ключевые слова из успешных запросов. Этим частям присваивается больший вес при расчете релевантности.

US8538989B1
2013-09-17

Семантика и интент
Индексация
Структура сайта

Как Google динамически изменяет вес синонимов в ранжировании на основе поведения пользователей

Google не присваивает фиксированный вес синонимам (замещающим терминам) при ранжировании. Вес синонима динамически корректируется для каждого документа в зависимости от того, насколько релевантен исходный термин запроса этому документу. Эта релевантность определяется на основе поведенческих данных (клики, время просмотра), что позволяет точнее интерпретировать значение синонимов в контексте конкретной страницы.

US9116957B1
2015-08-25

Поведенческие сигналы
Семантика и интент
SERP