Как Google использует результаты веб-поиска для выбора правильного ответа на неоднозначные фактические запросы

DETERMINING QUESTION AND ANSWER ALTERNATIVES (Определение альтернатив вопросов и ответов)

US9336269B1
Google LLC
2013-03-14
2016-05-10

Google использует этот механизм для разрешения неоднозначности в запросах (например, «возраст Вашингтона»). Система генерирует несколько потенциальных ответов из Knowledge Graph, а затем проверяет, какой из них лучше всего подтверждается топовыми результатами органического поиска. Оценка кандидата зависит от того, насколько часто и уверенно Сущность (Topic) и Ответ (Answer) упоминаются (аннотируются) на страницах в топе выдачи.

Какую проблему решает

Патент решает проблему интерпретации неоднозначных (ambiguous) или расплывчатых (vague) поисковых запросов, подразумевающих поиск фактического ответа (Q&A). Когда пользователь вводит запрос вроде «длительность Гарри Поттера», система должна определить, имеется ли в виду книга или фильм, выбрать правильную сущность и предоставить корректный факт. Изобретение предлагает механизм для ранжирования различных интерпретаций запроса и выбора наиболее вероятного ответа.

Что запатентовано

Запатентована система для выбора фактического ответа на запрос путем валидации данных из базы знаний (Knowledge Base) с помощью результатов веб-поиска. Система генерирует пары «Кандидат-Сущность + Ответ» (Candidate Topic-Answer Pair) и оценивает их. Оценка основывается на том, насколько часто Сущность и Ответ встречаются в аннотациях (annotations) ресурсов, которые высоко ранжируются по исходному запросу.

Как это работает

Ключевой механизм заключается в использовании результатов органического поиска для валидации и ранжирования фактов из Knowledge Base:

Идентификация кандидатов: Система определяет возможные сущности (Candidate Topics), релевантные запросу.
Генерация ответов: Для каждой сущности извлекается соответствующий факт (Answer) из Knowledge Base. Формируются пары.
Получение результатов поиска: Выполняется стандартный поиск по исходному запросу.
Анализ аннотаций: Система анализирует ресурсы в топе выдачи. Эти ресурсы предварительно аннотированы (связаны с сущностями из Knowledge Base).
Скоринг: Пара «Сущность+Ответ» получает высокий балл, если и Сущность, и Ответ часто встречаются в аннотациях (или контенте) высокоранжированных результатов. При этом учитывается релевантность результата (Query Relevance Score) и уверенность самой аннотации (Confidence Measure).
Выбор ответа: Система выбирает ответ с наивысшим баллом, если он превышает порог уверенности.

Актуальность для SEO

Высокая. Механизм напрямую связан с работой систем ответов на вопросы (Q&A), формированием Featured Snippets и Knowledge Panels. Точность выбора правильной сущности и факта критически важна для Google. Опора на консенсус топовых веб-результатов для валидации Knowledge Graph остается фундаментальным подходом в поиске.

Важность для SEO

Патент имеет высокое значение для SEO (8/10), особенно для стратегий, направленных на попадание в блоки с ответами. Он показывает, что Google использует топовые результаты поиска для валидации фактов. Чтобы ваш контент способствовал формированию правильного ответа, он должен высоко ранжироваться (быть релевантным запросу) и содержать четкие упоминания Сущности и Ответа, которые Google сможет распознать и уверенно аннотировать.

Термины и определения

Annotated Resource (Аннотированный ресурс): Ресурс (например, веб-страница), который на основе автоматической оценки его контента был ассоциирован с аннотацией, идентифицирующей одну или несколько вероятных тем (сущностей), связанных с этим ресурсом.
Annotation (Аннотация): Связь между ресурсом и сущностью (Topic) из базы знаний. Указывает на то, что данный ресурс, вероятно, обсуждает данную сущность.
Annotator (Аннотатор): Компонент системы (упомянутый в описании, но не в Claims), который автоматически оценивает контент ресурсов и создает аннотации.
Answer Generator (Генератор ответов): Компонент системы, который извлекает факты (Answers) из Knowledge Base для Candidate Topics и формирует Candidate Topic-Answer Pairs.
Candidate Topic (Кандидат-Сущность / Тема): Сущность из Knowledge Base, идентифицированная как возможная интерпретация предмета запроса.
Candidate Topic-Answer Pair (Пара Кандидат-Сущность + Ответ): Структура данных, включающая Candidate Topic и соответствующий ему Answer на запрос.
Confidence Measure / Confidence Score (Мера уверенности аннотации): Метрика, указывающая, насколько вероятно, что ресурс действительно связан с сущностью, указанной в аннотации.
Knowledge Base (База знаний): Хранилище фактов и информации о сущностях, часто структурированное в виде графа (Data Graph), где узлы — это сущности (Topics), а ребра — отношения или атрибуты.
Mapping Module (Модуль сопоставления): Компонент, который интерпретирует запрос и идентифицирует Candidate Topics в Knowledge Base.
Query Relevance Score (Оценка релевантности запросу): Метрика, присваиваемая результату поиска и указывающая, насколько он релевантен исходному запросу (часто коррелирует с позицией в ранжировании).
Scoring Module (Модуль оценки): Компонент, рассчитывающий оценку (Score) для каждой Candidate Topic-Answer Pair на основе анализа результатов поиска и аннотаций.

Ключевые утверждения (Анализ Claims)

Claim 1 (Независимый пункт): Описывает основной метод определения ответа на запрос.

Система идентифицирует одну или несколько Candidate Topics на основе запроса.
Для каждого кандидата генерируется Candidate Topic-Answer Pair (Сущность + Ответ).
Система получает результаты поиска по запросу. Ключевое условие: один или несколько результатов ссылаются на Annotated Resource.
Для каждой пары рассчитывается Score. Расчет основан на двух критериях:
1. (i) Появление Candidate Topic в аннотациях ресурсов из результатов поиска.
2. (ii) Появление Answer в аннотациях ИЛИ непосредственно в контенте (in the resources) этих ресурсов.
На основе этих оценок система определяет, следует ли отвечать на запрос одним или несколькими ответами из сгенерированных пар.

Claim 2 (Зависимый от 1): Уточняет механизм принятия решения.

Определение того, нужно ли отвечать, включает сравнение оценок с предопределенным порогом (predetermined threshold). Если порог превышен, система выбирает ответ(ы).

Claim 10 (Зависимый от 1): Уточняет механизм скоринга.

Оценка (Score) для пары дополнительно основывается на Query Relevance Score (оценке релевантности) тех результатов поиска, которые подтверждают пару. Подтверждение факта на более релевантной (и высокоранжирующейся) странице имеет больший вес.

Claim 11 (Зависимый от 1): Уточняет механизм скоринга.

Оценка (Score) для пары дополнительно основывается на Confidence Measure (мере уверенности) самих аннотаций, в которых были найдены Candidate Topic или Answer. Если система уверена в аннотации, это подтверждение имеет больший вес.

Где и как применяется

Изобретение интегрирует данные из индекса и базы знаний, затрагивая несколько этапов поиска для формирования финального ответа.

INDEXING – Индексирование и извлечение признаков
На этом этапе происходит критически важная предварительная работа. Annotator анализирует контент ресурсов и связывает их с сущностями из Knowledge Base (создает Annotations). Также рассчитывается Confidence Measure для каждой аннотации. Эти данные сохраняются.

QUNDERSTANDING – Понимание Запросов
Mapping Module анализирует запрос, определяет его как поиск факта и идентифицирует Candidate Topics в Knowledge Base.

RANKING – Ранжирование
Search Engine выполняет стандартный поиск по запросу и генерирует набор результатов с их Query Relevance Scores.

METASEARCH – Метапоиск и Смешивание (Q&A System)
Основное применение патента. Это механизм выбора контента для Прямого Ответа (например, Featured Snippet или Knowledge Panel).

Генерация пар: Answer Generator создает Candidate Topic-Answer Pairs.
Валидация и Скоринг: Scoring Module анализирует топовые результаты поиска (из RANKING) и их аннотации (из INDEXING). Рассчитываются оценки для пар.
Выбор ответа: Система определяет, превышают ли оценки порог, и выбирает лучший ответ для показа пользователю.

Входные данные:

Исходный запрос пользователя.
Данные из Knowledge Base (сущности, факты).
Результаты поиска по запросу и их Query Relevance Scores.
Аннотации ресурсов из результатов поиска и их Confidence Measures.

Выходные данные:

Решение о том, показывать ли прямой ответ.
Выбранная пара «Сущность + Ответ» для показа пользователю.

На что влияет

Специфические запросы: В первую очередь влияет на информационные запросы, подразумевающие фактический ответ (Кто, Что, Когда, Сколько). Особенно сильно влияет на неоднозначные запросы, где предмет запроса может относиться к разным сущностям (например, «высота Обамы», «длительность Гарри Поттера»).
Конкретные типы контента: Влияет на контент, содержащий четкие факты и упоминания известных сущностей. Система предпочитает ресурсы, которые она может уверенно аннотировать.

Когда применяется

Алгоритм применяется, когда система распознает запрос как поиск факта.

Условия активации: Наличие запроса и возможность сгенерировать хотя бы одну Candidate Topic-Answer Pair из Knowledge Base.
Триггеры для показа ответа: Оценка (Score) лучшей пары должна превысить предопределенный порог (predetermined threshold). Если уверенность низкая (ни одна оценка не достигает порога), прямой ответ не показывается.

Пошаговый алгоритм

Процесс А: Предварительная обработка (Офлайн / Индексирование)

Сканирование ресурсов: Crawling Module собирает контент ресурсов.
Аннотирование ресурсов: Annotator анализирует контент, определяет вероятные сущности (Topics) из Knowledge Base и создает аннотации (Annotations).
Расчет уверенности: Для каждой аннотации рассчитывается Confidence Measure.
Индексирование: Данные о ресурсах и их аннотациях сохраняются.

Процесс Б: Обработка запроса (Онлайн)

Получение запроса: Система получает запрос от пользователя.
Идентификация Кандидатов-Сущностей: Mapping Module анализирует запрос и находит релевантные Candidate Topics в Knowledge Base.
Генерация Пар: Answer Generator определяет нужный атрибут (Ответ) для каждой Сущности и формирует Candidate Topic-Answer Pairs.
Получение результатов поиска: Search Engine выполняет поиск по исходному запросу и возвращает список результатов с их Query Relevance Scores.
Скоринг Пар: Scoring Module анализирует ресурсы, на которые ссылаются результаты поиска. Для каждой Пары рассчитывается Score на основе:
- Наличия Topic в аннотациях ресурсов.
- Наличия Answer в аннотациях или контенте ресурсов.
- Взвешивания по Query Relevance Scores этих ресурсов.
- Взвешивания по Confidence Measures этих аннотаций.
Принятие решения и Выбор: Система сравнивает полученные Scores с порогом (threshold). Если порог превышен, выбирается пара с наивысшим Score.
Предоставление ответа: Выбранный ответ показывается пользователю.

Какие данные и как использует

Данные на входе

Патент фокусируется на процессе выбора ответа и использует следующие типы данных:

Структурированные данные (Knowledge Base): Сущности (Topics), их атрибуты и значения атрибутов (Answers). Патент упоминает, что данные могут быть представлены в виде графа взаимосвязанных узлов.
Контентные факторы: Текст ресурсов используется двояко: (i) на этапе индексирования для создания аннотаций; (ii) на этапе скоринга для поиска прямого вхождения Ответа (Answer), если он не найден в аннотациях.
Системные данные (Индекс): Предварительно рассчитанные аннотации (Annotations) для ресурсов и меры уверенности (Confidence Measures) этих аннотаций.
Системные данные (Ранжирование): Результаты поиска и их оценки релевантности (Query Relevance Scores).

Какие метрики используются и как они считаются

Система вычисляет финальную оценку (Score) для каждой Candidate Topic-Answer Pair. Конкретная формула агрегации не приводится, но указаны ключевые компоненты расчета:

Topic Occurrence (Встречаемость Сущности): Частота появления Candidate Topic в аннотациях ресурсов из результатов поиска.
Answer Occurrence (Встречаемость Ответа): Частота появления Answer в аннотациях или непосредственно в контенте ресурсов из результатов поиска.
Query Relevance Score (Вес результата): Оценки релевантности результатов поиска. Используются как весовой коэффициент: подтверждение факта на более релевантном ресурсе увеличивает итоговый Score сильнее.
Confidence Measure (Вес аннотации): Меры уверенности аннотаций. Используются как весовой коэффициент: подтверждение факта через аннотацию с высокой уверенностью увеличивает итоговый Score сильнее.
Predetermined Threshold (Порог): Минимальное значение Score, необходимое для показа ответа пользователю.

Валидация Knowledge Graph через веб-поиск: Патент описывает конкретный механизм, как Google использует консенсус топовых результатов веб-поиска для проверки, ранжирования и разрешения неоднозначностей фактов из своей базы знаний (Knowledge Base).
Критичность аннотирования ресурсов: Система полагается на способность Google точно связывать веб-страницы с сущностями (Annotated Resources). Если страница не аннотирована или аннотирована с низкой уверенностью (Confidence Measure), она не внесет существенный вклад в процесс выбора ответа.
Важность ко-оккурентности Сущности и Ответа: Для подтверждения факта необходимо, чтобы и Topic (Сущность), и Answer (Ответ) присутствовали (в аннотациях или контенте) на одних и тех же высокоранжированных страницах.
Ранжирование имеет прямое значение для Q&A: Вес подтверждения зависит от релевантности страницы (Query Relevance Score). Только топовые результаты поиска эффективно участвуют в процессе валидации фактов.
Пороговые значения для точности: Google использует пороги (thresholds) для принятия решения о показе ответа. Если система не уверена в интерпретации запроса (все Scores низкие), она предпочтет не давать прямой ответ.

Best practices (это мы делаем)

Обеспечение точного распознавания сущностей: Структурируйте контент так, чтобы помочь Google правильно аннотировать вашу страницу. Используйте четкие и однозначные упоминания основных сущностей. Применение семантической разметки (Schema.org) может способствовать повышению Confidence Measure аннотаций.
Совместное упоминание Сущности и Факта: При оптимизации под фактические запросы убедитесь, что на странице четко присутствуют и Сущность (Topic), и Ответ (Answer). Например, на странице биографии должны быть Имя персоны и Дата рождения. Это напрямую соответствует критериям скоринга в патенте.
Достижение высоких позиций по целевым запросам: Поскольку Query Relevance Score используется как весовой коэффициент при скоринге ответов, необходимо занимать высокие позиции в поиске. Только высокоранжированные страницы эффективно участвуют в валидации ответов.
Повышение авторитетности контента: Чем авторитетнее и понятнее контент, тем выше вероятность, что Google будет уверен в своих аннотациях для этой страницы (высокий Confidence Measure), что увеличит ее вес при скоринге ответов.

Worst practices (это делать не надо)

Неоднозначное упоминание сущностей: Использование местоимений или сокращений вместо полных названий сущностей может помешать процессу аннотирования или снизить Confidence Measure, уменьшая ценность страницы для Q&A системы.
Разделение Сущности и Ответа: Размещение названия сущности на одной странице, а фактов о ней (ответов) на другой. Система ищет ко-оккурентность на одном ресурсе для подтверждения пары.
Фокус на фактах без достижения релевантности: Создание страниц с наборами фактов, которые при этом плохо ранжируются по целевым запросам. Если страницы нет в топе выдачи, она не будет использована для валидации ответов.

Стратегическое значение

Патент подтверждает стратегическую важность интеграции между органическим поиском и Knowledge Graph. Он демонстрирует, что органическая выдача служит системой контроля качества и разрешения неоднозначностей для данных из базы знаний. Для SEO это означает, что работа над семантикой (оптимизация под сущности), структурой контента и достижением высоких позиций напрямую влияет на то, как Google формирует фактические ответы.

Практические примеры

Сценарий: Оптимизация страницы фильма для Q&A системы

Целевой запрос: «Длительность Гарри Поттер и Философский камень».

Действие: Создать авторитетную страницу о фильме «Гарри Поттер и Философский камень».
Реализация (Контент и Разметка): Убедиться, что на странице четко указано полное название фильма (Сущность) и его длительность, например, «152 минуты» (Ответ). Использовать разметку Schema.org/Movie с атрибутом duration.
Реализация (SEO): Оптимизировать страницу для достижения высоких позиций (высокий Query Relevance Score) по целевому и смежным запросам.
Ожидаемый результат (по патенту):
- На этапе Индексирования Google аннотирует страницу с сущностью «Гарри Поттер и Философский камень (Фильм)» с высокой Confidence Measure.
- При обработке запроса система генерирует пару: Фильм + 152 минуты.
- Система видит, что ваша страница находится в топе результатов поиска.
- Scoring Module обнаруживает на вашей странице (через аннотацию и контент/разметку) и Сущность, и Ответ.
- Пара получает высокий Score, и ваша страница способствует валидации этого факта, повышая шансы стать источником для блока с ответом.

Что такое «Аннотированный ресурс» (Annotated Resource) и как им стать?

Аннотированный ресурс — это страница, которую Google автоматически связал с одной или несколькими сущностями из Knowledge Graph. Чтобы стать таким ресурсом, необходимо создавать качественный контент с четким и однозначным упоминанием известных сущностей (людей, мест, организаций и т.д.). Использование структурированных данных (Schema.org) и авторитетность ресурса помогают системе точнее провести аннотирование.

Как этот патент связан с Featured Snippets?

Патент описывает базовый механизм, который Google может использовать для выбора контента и источника для Featured Snippets, особенно когда речь идет о фактических ответах на неоднозначные запросы. Система валидирует ответ, проверяя, подтверждается ли он топовыми результатами поиска. Если ваш сайт находится в топе и содержит четко сформулированный факт (Сущность + Ответ), он соответствует механизму выбора, описанному в патенте.

Влияет ли позиция в поиске на этот механизм?

Да, напрямую и критически. Патент указывает, что оценка ответа взвешивается по Query Relevance Score результатов поиска, которые его подтверждают. Чем выше релевантность (и, как правило, позиция) страницы, тем больший вес она имеет в процессе валидации ответа. Страницы за пределами топа оказывают минимальное влияние.

Что такое «Мера уверенности» (Confidence Measure) аннотации и как на нее повлиять?

Это внутренняя метрика Google, показывающая, насколько система уверена, что страница действительно связана с определенной сущностью. Чтобы повысить эту уверенность, контент должен быть сфокусирован на теме, авторитетен, использовать микроразметку и не содержать противоречивой или неоднозначной информации о сущности. Чем четче и авторитетнее контент, тем выше уверенность аннотации.

Почему важно, чтобы и Сущность, и Ответ были на одной странице?

Механизм скоринга основан на подтверждении пары (ко-оккурентности). Система проверяет, сколько высокоранжированных ресурсов подтверждают И Сущность (Topic), И Ответ (Answer). Если на странице есть только одно из двух, она не может служить полным подтверждением факта для этой системы валидации.

Работает ли система, если Ответ не является сущностью в Knowledge Graph?

Да. Патент специально оговаривает (Claim 1), что Ответ (например, число, дата, длительность) может не быть сущностью, которую можно аннотировать. В этом случае система ищет появление Ответа не только в аннотациях, но и непосредственно в контенте (тексте) ресурсов из результатов поиска.

Как система обрабатывает неоднозначные запросы, например, «Высота Вашингтона»?

Она сгенерирует несколько пар: (Джордж Вашингтон + Рост), (Дензел Вашингтон + Рост), (Штат Вашингтон + Высота горы). Затем она проверит результаты поиска по запросу «Высота Вашингтона». Если большинство топовых сайтов говорят о Джордже Вашингтоне и его росте (и аннотированы соответствующе), эта пара получит наивысший балл и будет выбрана в качестве ответа.

Что произойдет, если Knowledge Graph и топовые результаты поиска противоречат друг другу?

В контексте этого патента, если факт из Knowledge Graph (Ответ) не подтверждается топовыми результатами поиска (не встречается в их аннотациях или контенте), то Candidate Topic-Answer Pair получит низкий Score. Система, скорее всего, решит не показывать этот ответ, так как он не пройдет порог уверенности.

Что происходит, если ни один ответ не набирает достаточного количества баллов?

Если ни одна из оценок (Scores) не превышает предопределенный порог (predetermined threshold), система принимает решение не давать прямой ответ на запрос (Claim 2, 3). Пользователь увидит только стандартные результаты поиска.

Как использовать этот патент для оптимизации интернет-магазина?

Убедитесь, что страницы товаров четко аннотированы как продукты (используя Schema.org/Product). Характеристики (размеры, вес, цвет — это Answers) должны быть четко указаны в тексте и разметке. Если страница хорошо ранжируется по запросу о характеристике, и данные четко распознаны, они могут попасть в Прямой Ответ или блок спецификаций в выдаче.

Как Google определяет истинный смысл неоднозначных запросов, сравнивая результаты поисковой выдачи

Google использует механизм для разрешения неоднозначности запросов. Система генерирует несколько возможных интерпретаций (интентов) и создает уточненные (модифицированные) запросы для каждой из них. Затем она сравнивает, насколько результаты поиска по уточненным запросам похожи на результаты по исходному запросу. Интерпретация, чьи результаты наиболее схожи, признается наиболее вероятным намерением пользователя.

US10353964B2
2019-07-16

Семантика и интент
SERP

Как Google использует базу данных сущностей (Knowledge Graph) для формирования прямых ответов на вопросы о фактах

Google использует систему для идентификации запросов, направленных на получение фактов о конкретной сущности (Entity-Triggering Questions). Система анализирует топовые результаты поиска, определяет, какие сущности чаще всего ассоциируются с этими документами, и выбирает наиболее релевантную сущность. Затем система извлекает запрошенный атрибут (например, адрес, дату рождения) из своей базы данных сущностей или находит лучший сниппет, содержащий этот факт, чтобы предоставить прямой ответ пользователю.

US9081814B1
2015-07-14

Knowledge Graph
Семантика и интент
SERP

Как Google использует консенсус источников для выбора и валидации фактов в Knowledge Graph и прямых ответах

Система Google для выбора наилучшего ответа на фактические запросы. Она оценивает потенциальные ответы из разных источников и вычисляет «Оценку Поддержки» (Supported Score) на основе их согласованности. Факт отображается, только если он значительно превосходит противоречащие и несвязанные данные, обеспечивая высокую точность ответа.

US7953720B1
2011-05-31

Knowledge Graph
EEAT и качество
Семантика и интент

Как Google ранжирует сущности (книги, фильмы, людей), анализируя тематичность и авторитетность их упоминаний в вебе

Google использует механизм для оценки значимости конкретных сущностей (например, изданий книг или фильмов). Система анализирует, как эти сущности упоминаются на релевантных веб-страницах, учитывая уверенность распознавания (Confidence) и то, насколько страница посвящена именно этой сущности (Topicality). Эти сигналы агрегируются с учетом авторитетности и релевантности страниц для расчета итоговой оценки сущности, которая затем корректирует ее ранжирование в поиске.

US20150161127A1
2015-06-11

Семантика и интент
EEAT и качество
SERP

Как Google находит ответы на фактологические вопросы, анализируя консенсус сущностей в топе поисковой выдачи

Google использует этот механизм для автоматического ответа на фактологические вопросы путем анализа неструктурированного текста топовых результатов поиска. Система определяет, какая сущность (например, человек, место) чаще всего упоминается на авторитетных страницах. Эта наиболее часто упоминаемая сущность, с учетом нормализации частоты и веса источника, выбирается в качестве ответа.

US9477759B2
2016-10-25

Семантика и интент
Индексация
Knowledge Graph

Как Google запоминает вопросы без авторитетного ответа и автономно сообщает его позже через Ассистента

Патент Google описывает механизм для обработки запросов, на которые в момент поиска нет качественного или авторитетного ответа. Система запоминает информационную потребность и продолжает мониторинг. Когда появляется информация, удовлетворяющая критериям качества (например, в Knowledge Graph), Google автономно доставляет ответ пользователю, часто встраивая его в следующий диалог с Google Assistant, даже если этот диалог не связан с исходным вопросом.

US11238116B2
2022-02-01

Knowledge Graph
Семантика и интент
EEAT и качество

Как Google использует клики пользователей в Поиске по Картинкам для определения реального содержания изображений

Google использует данные о поведении пользователей для автоматической идентификации содержания изображений. Если пользователи вводят определенный запрос (Идею) и массово кликают на конкретное изображение в результатах поиска, система ассоциирует это изображение с Концептом, производным от запроса. Это позволяет Google понимать, что изображено на картинке, не полагаясь исключительно на метаданные или сложный визуальный анализ, и улучшает релевантность ранжирования в Image Search.

US8065611B1
2011-11-22

Поведенческие сигналы
Семантика и интент
Мультимедиа

Как Google использует анкорный текст входящих ссылок для определения синонимов и псевдонимов сущностей в Knowledge Graph

Google автоматически определяет синонимы и псевдонимы для сущностей (например, людей, компаний) в своем хранилище фактов (Knowledge Graph). Система анализирует анкорный текст ссылок, ведущих на исходные документы, из которых были извлечены факты о сущности. Это позволяет системе понять, что, например, "Биг Блю" и "IBM" относятся к одной и той же компании.

US8738643B1
2014-05-27

Knowledge Graph
Семантика и интент
Ссылки

Как Google использует клики (CTR) и время на сайте (Click Duration) для выявления спама и корректировки ранжирования в тематических выдачах

Google использует итеративный процесс для улучшения классификации контента и выявления спама, анализируя поведенческие сигналы (CTR и продолжительность клика). Если пользователи быстро покидают документ или игнорируют его в выдаче, он помечается как спам или нерелевантный теме. Эти данные затем используются для переобучения классификатора и корректировки ранжирования для будущих тематических запросов.

US7769751B1
2010-08-03

Поведенческие сигналы
Антиспам
SERP

Как Google предсказывает намерения пользователя и выполняет поиск до ввода запроса (Predictive Search)

Google использует механизм для прогнозирования тем, интересующих пользователя в конкретный момент времени, основываясь на его истории и контексте. При обнаружении сигнала о намерении начать поиск (например, открытие страницы поиска), система проактивно выполняет запрос по предсказанной теме и мгновенно показывает результаты или перенаправляет пользователя на релевантный ресурс.

US8510285B1
2013-08-13

Семантика и интент
Персонализация
Поведенческие сигналы

Как Google ранжирует сущности (например, фильмы или книги), используя популярность связанных веб-страниц и поисковых запросов в качестве прокси-сигнала

Google использует механизм для определения популярности контентных сущностей (таких как фильмы, телешоу, книги), когда прямые данные о потреблении недоступны. Система идентифицирует авторитетные «эталонные веб-страницы» (например, страницы Википедии) и связанные поисковые запросы. Затем она измеряет популярность сущности, анализируя объем трафика на эти эталонные страницы и частоту связанных запросов в поиске, используя эти данные как прокси-сигнал для ранжирования сущности.

US9098551B1
2015-08-04

EEAT и качество
Поведенческие сигналы
SERP

Как Google комбинирует визуальное сходство и поведение пользователей для переранжирования поиска по картинкам

Google использует механизм для перекрестной проверки релевантности изображений, объединяя поведенческие сигналы (клики) с визуальным анализом. Если изображение часто кликают и оно визуально похоже на другие релевантные изображения по запросу (совместная релевантность), его рейтинг агрессивно повышается. Если оно редко кликается и визуально отличается (совместная нерелевантность), его рейтинг понижается. Это защищает выдачу от кликбейта.

US8209330B1
2012-06-26

Поведенческие сигналы
SERP
Мультимедиа

Как Google снижает ценность ссылок между аффилированными сайтами для борьбы с линк-схемами

Google использует модификацию алгоритмов расчета качества (типа PageRank), которая учитывает аффилированность между ссылающимися документами. Если система определяет, что сайты связаны (например, принадлежат одному владельцу, находятся в одной сети или имеют схожие паттерны трафика), ценность ссылок между ними агрессивно снижается. Вместо суммирования веса всех ссылок система учитывает только максимальный вклад от аффилированной группы, нейтрализуя эффект линк-ферм и PBN.

US7783639B1
2010-08-24

Ссылки
Антиспам
EEAT и качество

Как Google использует связанные запросы и временный «бустинг» для обнаружения и тестирования релевантных документов, которые ранжируются низко

Патент описывает механизм улучшения поиска путем перемещения документов на более высокие позиции. Google идентифицирует документы, которые высоко ранжируются по связанным запросам (например, с синонимами, уточнениями или исправленными ошибками), но низко по исходному запросу, и повышает их. Цель — протестировать истинную релевантность этих документов и собрать пользовательский отклик (клики) для улучшения будущего ранжирования.

US8521725B1
2013-08-27

Поведенческие сигналы
SERP
Семантика и интент

Как Google определяет скрытый локальный интент в запросах для повышения релевантности местных результатов

Google использует механизм для определения того, подразумевает ли запрос (например, «ресторан») поиск локальной информации, даже если местоположение не указано. Система анализирует агрегированное поведение пользователей для расчета «степени неявной локальной релевантности» запроса. Если этот показатель высок, Google повышает в ранжировании результаты, соответствующие местоположению пользователя.

US8200694B1
2012-06-12

Local SEO
Поведенческие сигналы
Семантика и интент