Как Google объединяет автодополнение и перевод для показа подсказок с определениями на разных языках

DICTIONARY SUGGESTIONS FOR PARTIAL USER ENTRIES (Словарные подсказки для частично введенных пользовательских данных)

US8312032B2
Google LLC
2008-07-10
2012-11-13

Мультиязычность

Google использует механизм для улучшения работы словарных и переводческих сервисов. Когда пользователь вводит частичный запрос на одном языке, система предсказывает полные варианты запроса на основе исторических данных поиска. Одновременно система получает переводы этих предсказаний на другой язык и показывает пользователю список автодополнения, где рядом с каждым вариантом сразу отображается его перевод или краткое определение.

Какую проблему решает

Патент решает проблему неэффективности традиционных онлайн-словарей и переводчиков, которые обычно требуют ввода полного слова или фразы перед предоставлением перевода. Это улучшает пользовательский опыт, ускоряя процесс поиска нужного термина и предоставляя мгновенный контекст (перевод) еще на этапе ввода запроса.

Что запатентовано

Запатентована система предоставления поисковых подсказок (автодополнения), которая одновременно показывает и предсказанный полный запрос, и его перевод. Система получает частичный запрос, прогнозирует полные запросы на основе исторических данных поиска (previously submitted complete queries) на том же языке, получает переводы этих предсказаний на другой язык и возвращает оба набора данных клиенту для одновременного отображения.

Как это работает

Механизм работает следующим образом:

Ввод данных: Пользователь вводит частичный запрос (partial search query) в интерфейсе (например, сервиса перевода).
Передача на сервер: Клиентское приложение (Prediction Assistant) отправляет частичный запрос на сервер.
Прогнозирование и перевод: Сервер использует Prediction Server для прогнозирования полных запросов. Это делается путем сопоставления частичного запроса с заранее подготовленной базой данных (Prediction Database), состоящей из Chunk Table (для частичных запросов) и Token Table (для полных запросов, их частотности и кратких переводов).
Определение языковой пары: Система определяет или прогнозирует языковую пару (например, Английский -> Корейский).
Возврат данных: Сервер отправляет обратно список предсказанных полных запросов и соответствующие им переводы.
Отображение: Клиент одновременно отображает подсказки и их переводы в выпадающем списке.

Актуальность для SEO

Высокая. Описанный механизм является стандартом де-факто для современных сервисов перевода, таких как Google Translate. Автодополнение с мгновенным показом перевода значительно улучшает UX. Технологии прогнозирования запросов на основе исторических данных остаются фундаментальными для всех систем автодополнения Google.

Важность для SEO

Влияние на SEO – среднее (6/10). Патент не описывает алгоритмы ранжирования, но критически важен для понимания того, как работает Автодополнение (Autocomplete/Query Suggestions), особенно в международном контексте. Автодополнение формирует поисковое поведение пользователей. Понимание того, что подсказки основаны на реальных исторических запросах и их частотности, помогает SEO-специалистам определять приоритетные и популярные формулировки запросов в разных языках.

Термины и определения

Chunk Table (Таблица фрагментов): Структура данных, которая хранит частичные запросы (partial queries) и указатели (pointers) на соответствующие записи в Token Table. Используется для быстрого поиска предсказаний по мере ввода текста пользователем.
Dictionary Database (Словарная база данных): База данных, содержащая термины и их переводы или определения. Используется для генерации Token Table и для предоставления полных результатов поиска.
Historical Query Log (Журнал исторических запросов): Лог, содержащий запросы, ранее отправленные сообществом пользователей. Используется для определения того, какие термины включать в Token Table и для расчета их частотности (Frequency).
Mapping Function (Функция сопоставления): Функция, которая принимает частичный запрос и идентифицирует соответствующую запись в Chunk Table.
Partial Search Query (Частичный поисковый запрос): Неполный ввод пользователя до того, как он сигнализирует о завершении ввода (например, нажмет Enter или кнопку поиска).
Predicted Complete Queries (Предсказанные полные запросы): Предполагаемые полные запросы, которые система прогнозирует на основе частичного ввода. Они основаны на исторических данных поиска.
Prediction Assistant (Ассистент прогнозирования): Компонент на стороне клиента (например, JavaScript в веб-странице), который отслеживает ввод пользователя, отправляет частичные запросы на сервер и отображает полученные предсказания.
Prediction Database (База данных прогнозирования): База данных, содержащая Chunk Table и Token Table, оптимизированная для быстрого предоставления подсказок.
Short Definition / Translation (Краткое определение / Перевод): Краткий перевод или определение предсказанного запроса на другом языке, хранящийся в Token Table и отображаемый вместе с подсказкой. Также может включать синонимы или полные формы аббревиатур.
Token Table (Таблица токенов): Структура данных, содержащая полные запросы (Terms), их частотность (Frequency) и краткие определения/переводы (Short Definition). Генерируется на основе Historical Query Log и Dictionary Database.

Ключевые утверждения (Анализ Claims)

Claim 1 (Независимый пункт): Описывает основной метод на стороне сервера.

До того как пользователь сигнализирует о завершении запроса, сервер получает частичный поисковый запрос от клиентского устройства.
Система прогнозирует набор полных запросов, релевантных частичному. Эти предсказания основаны на запросах, ранее отправленных сообществом пользователей. Частичный и полные запросы на одном (первом) языке.
После прогнозирования система получает переводы для подмножества предсказанных запросов. Переводы на втором языке, отличном от первого.
Первый и второй языки прогнозируются, по крайней мере частично, на основе частичного поискового запроса.
Система передает клиенту и набор предсказанных запросов, и соответствующие переводы для одновременного отображения.

Claim 14 (Зависимый от 1): Детализирует механизм прогнозирования.

Прогнозирование включает сопоставление частичного запроса с записью в Chunk Table. Chunk Table содержит указатели на записи в Token Table. Token Table содержит записи с запросами и соответствующими переводами.

Claim 15 (Зависимый от 1): Описывает обработку аббревиатур.

Если предсказанный запрос является аббревиатурой или сокращенным термином, система получает его завершение (полную форму) или синоним. При этом и предсказанный запрос, и его полная форма/синоним находятся на одном языке.

Claim 18 (Независимый пункт): Описывает основной метод на стороне клиента.

До того как пользователь сигнализирует о завершении запроса, клиент получает частичный ввод от пользователя.
Клиент получает с удаленного сервера набор предсказанных полных запросов (на первом языке) и их переводы (на втором языке). Предсказания основаны на исторических запросах сообщества. Языковая пара прогнозируется на основе частичного запроса.
Клиент одновременно отображает два или более полных запроса из набора и, по крайней мере, части их переводов.

Где и как применяется

Изобретение применяется в основном на этапе понимания запроса и использует данные, подготовленные на этапе индексирования.

INDEXING – Индексирование и извлечение признаков
На этом этапе происходит предварительная обработка данных (офлайн) для создания Prediction Database. Система анализирует Historical Query Log и Dictionary Database. Применяются фильтры для удаления нежелательных терминов или терминов без перевода. Создаются Token Table (с терминами, частотностью и краткими переводами) и Chunk Table (с частичными запросами и указателями на Token Table).

QUNDERSTANDING – Понимание Запросов
Это основной этап применения патента в реальном времени (компонент Автодополнения). Когда пользователь вводит запрос в сервисе (например, Google Translate):

Обработка частичного ввода: Prediction Assistant на клиенте фиксирует ввод и отправляет его на сервер.
Прогнозирование языковой пары: Сервер определяет языки ввода и перевода (на основе выбора пользователя или автоматически, например, по IP-адресу или символам Юникода запроса).
Генерация подсказок: Prediction Server использует Mapping Function для быстрого поиска в Chunk Table и извлечения указателей на Token Table.
Извлечение данных: Из Token Table извлекаются полные запросы и их переводы.
Форматирование ответа: Результаты упорядочиваются (например, лексикографически или по частотности) и форматируются для отправки клиенту.

Входные данные:

Частичный поисковый запрос пользователя.
Информация о языковой паре (выбранная или спрогнозированная).
Prediction Database (Chunk Table, Token Table).

Выходные данные:

Набор предсказанных полных запросов.
Соответствующие переводы (Short Definitions) для этих запросов.
Опционально: исправления орфографии или полные формы аббревиатур.

На что влияет

Специфические запросы: Влияет на запросы, вводимые в интерфейсе, поддерживающем данную функцию (словари, переводчики).
Конкретные типы контента: Влияет на отображение подсказок для слов, фраз, терминов и аббревиатур.
Языковые и географические ограничения: Механизм специально разработан для работы с разными языковыми парами. Эффективность зависит от наличия достаточного объема исторических данных и словарного покрытия для конкретной пары языков. Патент также упоминает обработку ошибок ввода, связанных с разными раскладками (например, романизация).

Когда применяется

Условия работы: Алгоритм активируется в реальном времени при вводе пользователем символов в поле поиска поддерживаемого сервиса (например, Google Translate).
Триггеры активации: Ввод или удаление символов в текстовом поле до момента завершения ввода (нажатия Enter или кнопки поиска).
Временные рамки: Процесс получения частичного запроса, прогнозирования и отправки ответа часто выполняется в рамках одной транзакции (например, один HTTP-запрос и ответ) для обеспечения быстрого отклика.

Пошаговый алгоритм

Процесс А: Офлайн-генерация базы данных прогнозирования (Prediction Database Builder)

Сбор данных: Система собирает данные из Historical Query Log и Dictionary Database.
Фильтрация: Применяются фильтры для удаления запросов из лога, которых нет в словаре, а также для удаления нежелательных (objectionable) терминов.
Создание Token Table: Отфильтрованные запросы становятся терминами в Token Table. Для каждого термина рассчитывается частотность (Frequency) на основе логов и извлекается краткое определение/перевод (Short Definition) из словаря.
Парсинг терминов: Каждый термин из Token Table разбирается на составляющие частичные запросы (например, "bank" -> "b", "ba", "ban", "bank").
Создание Chunk Table: Chunk Table Builder создает Chunk Table, где каждый частичный запрос связывается указателями с соответствующими полными терминами в Token Table.
Обработка раскладок (Опционально): Система может генерировать романизированные версии частичных запросов (например, для корейского языка), чтобы обрабатывать ошибки ввода раскладки клавиатуры, и добавлять их в Chunk Table.

Процесс Б: Обработка запроса в реальном времени (Client-Server Interaction)

Мониторинг ввода (Клиент): Prediction Assistant отслеживает ввод пользователя в текстовом поле.
Отправка частичного запроса (Клиент): При обнаружении частичного запроса он отправляется на сервер.
Получение запроса (Сервер): Сервер получает частичный запрос.
Определение языковой пары (Сервер): Система определяет или прогнозирует языковую пару.
Поиск предсказаний (Сервер): Mapping Function используется для поиска соответствующей записи в Chunk Table.
Извлечение токенов (Сервер): Система следует по указателям из Chunk Table к записям в Token Table.
Фильтрация и Выборка (Сервер): Предсказания могут быть дополнительно отфильтрованы. Выбирается N лучших предсказаний (например, на основе частотности).
Упорядочивание (Сервер): Набор упорядочивается (лексикографически или по релевантности/частотности). Если частичный запрос является полным запросом, он может быть помещен наверх списка.
Форматирование и Отправка (Сервер): Предсказанные полные запросы и их переводы форматируются (включая опциональные исправления орфографии) и отправляются клиенту.
Отображение (Клиент): Prediction Assistant получает данные и отображает их пользователю в виде списка подсказок с переводами.

Какие данные и как использует

Данные на входе

Патент фокусируется на использовании данных о поведении пользователей и словарных данных.

Поведенческие факторы: Historical Query Log является критически важным источником. Он определяет, какие запросы будут предложены и с какой вероятностью (частотностью).
Контентные факторы (Словарные): Dictionary Database используется для подтверждения существования термина и предоставления его перевода (Short Definition).
Пользовательские и Географические факторы: Языковая пара может быть определена на основе выбора пользователя, IP-адреса клиента или анализа символов Юникода в частичном запросе.

Какие метрики используются и как они считаются

Frequency (Частотность): Метрика, хранящаяся в Token Table. Рассчитывается как количество или нормализованное количество появлений полного запроса в Historical Query Log. Используется для ранжирования и выбора наиболее популярных подсказок.
Ranking Criteria (Критерии ранжирования подсказок): Патент упоминает несколько вариантов упорядочивания подсказок:
- Лексикографический (алфавитный) порядок.
- Частотность (популярность) запросов.
- Персонализация (на основе предыдущих запросов пользователя или интересов группы).
Фильтрация: Используются предопределенные списки для исключения нежелательных терминов (objectionable terms) или терминов, отсутствующих в словаре.

Автодополнение основано на реальном поведении пользователей: Фундаментальный вывод заключается в том, что предсказанные запросы (Predicted Complete Queries) генерируются не только на основе словаря, но и фильтруются и взвешиваются с использованием Historical Query Log. Это означает, что Google предлагает то, что люди реально ищут.
Частотность определяет приоритет подсказок: Частота (Frequency), с которой запрос ранее вводился пользователями, является ключевым фактором для определения того, какие подсказки будут показаны и в каком порядке.
Интеграция данных из разных источников: Система эффективно объединяет поведенческие данные (логи запросов) и структурированные лингвистические данные (словари) для создания улучшенного пользовательского опыта (показ перевода вместе с подсказкой).
Эффективность инфраструктуры: Использование специализированных структур данных (Chunk Table и Token Table) позволяет системе быстро обрабатывать частичные запросы в реальном времени, несмотря на огромный объем данных. Большая часть работы выполняется офлайн.
Обработка многоязычности и контекста: Система разработана с учетом многоязычности, включая автоматическое прогнозирование языковых пар и обработку потенциальных ошибок ввода (например, неправильная раскладка клавиатуры).
Расширение функционала подсказок: Патент описывает возможность показа не только переводов, но и синонимов или полных форм аббревиатур на том же языке, что расширяет понимание запроса пользователя еще до его завершения.

Best practices (это мы делаем)

Хотя патент описывает инфраструктуру словарных сервисов, он дает важные инсайты о том, как Google использует данные о запросах (Autocomplete), что применимо к SEO-стратегии.

Исследование ключевых слов через Автодополнение: Активно используйте Google Autocomplete (в поиске и Google Translate) для исследования популярных формулировок запросов. Поскольку подсказки основаны на Historical Query Log, они отражают реальный спрос и частотность.
Анализ международного спроса (Международное SEO): Используйте Google Translate с функцией автодополнения для анализа того, как термины вашей ниши ищутся на разных языках. Обращайте внимание на то, какие переводы предлагает система в первую очередь, так как это может указывать на наиболее распространенное и популярное значение термина в данном регионе.
Оптимизация под популярные формулировки: При создании контента отдавайте приоритет тем формулировкам и терминам, которые появляются в автодополнении, так как они имеют высокую историческую частотность (Frequency).
Использование полных форм аббревиатур: Учитывая, что система может показывать полные формы аббревиатур в подсказках, убедитесь, что ваш контент четко определяет используемые аббревиатуры и содержит их полные формы, чтобы соответствовать различным интентам пользователей.

Worst practices (это делать не надо)

Игнорирование подсказок Автодополнения: Разработка семантического ядра без учета данных из Autocomplete приведет к потере видимости по наиболее часто используемым формулировкам запросов.
Манипуляции с Автодополнением (Чёрное SEO): Попытки искусственно накрутить частотность запросов для попадания в Autocomplete (например, с помощью ботов). Хотя патент напрямую не описывает защиту от этого, такие действия нарушают правила Google и могут привести к санкциям. Система полагается на естественные данные Historical Query Log.
Фокус на редких или неестественных формулировках: Оптимизация контента под запросы с очень низкой частотностью или синтаксически странные запросы, которые не появляются в автодополнении, вряд ли принесет значительный трафик.

Стратегическое значение

Патент подтверждает стратегию Google по использованию агрегированных данных о поведении пользователей для формирования поисковой выдачи и подсказок. Для SEO это означает, что соответствие реальному языку и спросу пользователей (отраженному в исторических логах) имеет первостепенное значение. В контексте международного SEO патент показывает, как Google связывает запросы между языками, что подчеркивает важность точной и последовательной терминологии при локализации контента.

Практические примеры

Сценарий: Исследование запросов для интернет-магазина электроники, выходящего на рынок Кореи.

Задача: Понять, как корейские пользователи ищут "mobile phone".
Действие: Зайти в Google Translate, выбрать пару Английский -> Корейский. Начать вводить "mobile".
Наблюдение (на основе патента): Система автодополнения покажет "mobile phone" и его корейский перевод (например, "휴대폰"). Также могут быть показаны связанные термины типа "mobile game" и их переводы.
Инсайт: Пользователь видит, что "휴대폰" является стандартным переводом, и система распознает эту связь на основе Dictionary Database. Популярность этого варианта в подсказках подтверждается Historical Query Log.
Применение в SEO: Использовать термин "휴대폰" в качестве основного ключевого слова для оптимизации страниц категорий и товаров на корейской версии сайта, так как он подтвержден как частотный и корректный.

На чем основаны предсказания в этом патенте?

Предсказания основаны на комбинации двух ключевых источников данных. Во-первых, это Historical Query Log – реальные запросы, которые пользователи вводили ранее. Это определяет популярность и частотность (Frequency) подсказки. Во-вторых, это Dictionary Database, которая подтверждает существование термина и предоставляет его краткий перевод или определение (Short Definition).

Описывает ли этот патент работу основного Google Search Autocomplete?

Патент описывает работу автодополнения конкретно в контексте словарных или переводческих сервисов (например, Google Translate), где ключевой особенностью является одновременный показ перевода подсказки. Однако базовые механизмы – использование исторических логов запросов, расчет частотности и применение эффективных структур данных (Chunk Table, Token Table) для быстрого поиска подсказок – являются общими и для стандартного Google Search Autocomplete.

Как система определяет, в каком порядке показывать подсказки?

Патент предлагает несколько методов упорядочивания. Основными являются упорядочивание по частотности (Frequency), то есть наиболее популярные исторические запросы показываются выше. Также упоминается лексикографический (алфавитный) порядок. Дополнительно может использоваться персонализация, основанная на предыдущем поведении пользователя.

Что такое Chunk Table и Token Table?

Это две взаимосвязанные структуры данных для быстрого поиска подсказок. Token Table хранит полные запросы, их частотность и переводы. Chunk Table хранит все возможные частичные запросы (фрагменты) и содержит указатели на соответствующие полные запросы в Token Table. Это позволяет системе мгновенно находить все релевантные полные запросы для любого введенного фрагмента.

Как система обрабатывает аббревиатуры?

Патент предусматривает специальную обработку аббревиатур и сокращенных терминов. Вместо перевода или в дополнение к нему система может показать полную форму (completion) или синоним аббревиатуры на том же языке. Например, для ввода "USA" система может показать в подсказке "United States of America".

Как система определяет язык ввода и язык перевода?

Языковая пара может быть явно выбрана пользователем (например, через выпадающее меню). Однако патент также описывает возможность автоматического прогнозирования языковой пары. Это может быть сделано на основе анализа символов Юникода в частичном запросе, IP-адреса клиента или статистики по ранее отправленным запросам.

Может ли этот механизм помочь в международном SEO?

Да, он очень полезен для исследования ключевых слов в международном SEO. Используя Google Translate с этой функцией, можно быстро увидеть, какие формулировки наиболее популярны (основаны на исторических данных) на целевом языке и как Google интерпретирует (переводит) ключевые термины вашей ниши. Это помогает в выборе правильных терминов для локализации.

Происходит ли генерация подсказок в реальном времени?

Сама генерация базы данных подсказок (Prediction Database) происходит офлайн путем анализа логов и словарей. Однако процесс поиска релевантных подсказок по частичному вводу пользователя происходит в реальном времени. Система оптимизирована так, чтобы запрос и ответ часто укладывались в одну транзакцию между клиентом и сервером.

Удаляет ли Google какие-либо термины из подсказок?

Да, патент явно упоминает процесс фильтрации. На этапе создания Token Table система удаляет запросы, которых нет в Dictionary Database. Также предусмотрено удаление предопределенного набора терминов, например, слов, которые могут считаться нежелательными (objectionable).

Что происходит, если пользователь вводит текст в неправильной раскладке?

Патент описывает механизм для обработки таких ситуаций. Chunk Table Builder может заранее генерировать романизированные версии частичных запросов (например, для корейского языка). Если пользователь вводит текст, соответствующий нажатиям клавиш на другом языке, но в английской раскладке, система все равно сможет найти соответствующие подсказки, используя эти романизированные версии.

Как Google использует частичные запросы, логи и профили пользователей для формирования подсказок (Autocomplete) и предварительной загрузки результатов

Патент описывает технологию Google Autocomplete (Suggest). Система предсказывает финальный запрос на основе частично введенного текста, используя словари, составленные из популярных запросов сообщества. Предсказания ранжируются по популярности и персонализируются с учетом профиля пользователя. Система также может заранее кэшировать результаты для наиболее вероятных подсказок, чтобы ускорить выдачу.

US7836044B2
2010-11-16

Персонализация
Семантика и интент

Как Google переписывает частичные запросы для улучшения подсказок Autocomplete, если стандартных вариантов недостаточно

Патент описывает механизм работы Google Autocomplete для сложных или редких запросов. Если система не находит достаточно качественных или популярных подсказок для введенного текста, она переписывает частичный запрос. Это включает классификацию терминов на обязательные и опциональные, удаление менее важных слов или замену слов на синонимы. Это позволяет предложить пользователю релевантные и популярные полные запросы, даже если они не идеально соответствуют тому, что было введено изначально.

US9235654B1
2016-01-12

Семантика и интент

Как Google объединяет контекстные ответы и персональные уведомления с поисковыми подсказками в реальном времени

Google патентует механизм отображения контекстной информации прямо в выпадающем списке поисковых подсказок (Autocomplete). Система объединяет стандартные предсказания запросов с двумя типами данных: персональными уведомлениями (погода, встречи, новости для локации пользователя) и прямыми ответами на вводимый запрос (определения, факты, часы работы). Это ускоряет доступ к информации еще до перехода на страницу результатов поиска.

US20150039582A1
2015-02-05

Персонализация
Семантика и интент

Как Google формирует и ранжирует подсказки в Autocomplete на основе исторических данных о запросах пользователей

Google использует систему, которая анализирует логи исторических запросов пользователей для предсказания полного запроса при вводе частичного. Система генерирует упорядоченный набор вероятных завершений, ранжируя их по популярности (частоте использования) или другим критериям. Это позволяет пользователям быстрее находить информацию и показывает, какие формулировки запросов наиболее распространены в сообществе.

US7487145B1
2009-02-03

Как Google объединяет персональную историю поиска и популярные запросы для формирования подсказок (Autocomplete)

Google формирует поисковые подсказки (Autocomplete), комбинируя два источника данных: запросы, которые пользователь вводил ранее (персональная история), и запросы, популярные среди сообщества пользователей. Система ранжирует эти подсказки, учитывая частоту и новизну персональных запросов, и визуально выделяет персональные подсказки от общих.

US8639679B1
2014-01-28

Персонализация
Поведенческие сигналы

Как Google группирует похожие запросы и поисковые подсказки, определяя интент пользователя через анализ сессий и кликов

Google использует графовую модель (Марковскую цепь) для кластеризации поисковых подсказок и связанных запросов. Система анализирует, какие запросы пользователи вводят в одной сессии и на какие документы они кликают. Это позволяет сгруппировать запросы, ведущие к схожему контенту, и предложить пользователю разнообразный набор подсказок, отражающих разные интенты.

US8423538B1
2013-04-16

Семантика и интент
Поведенческие сигналы
SERP

Как Google использует модель предвзятости представления (Presentation Bias), чтобы отделить клики по релевантности от кликов по позиции

Google использует механизм для интерпретации поведения пользователей (CTR), который учитывает, как именно представлены результаты поиска. Система рассчитывает ожидаемый CTR для конкретной позиции и визуального оформления (сниппет, выделение). Чтобы получить буст от поведенческих факторов, реальный CTR документа должен значительно превышать этот ожидаемый уровень. Это позволяет отфильтровать клики, обусловленные высокой позицией или привлекательным сниппетом, и выделить сигналы истинной релевантности.

US8938463B1
2015-01-20

Поведенческие сигналы
SERP

Как Google итеративно распознает сущности на страницах и рассчитывает их важность с помощью PageRank

Google использует итеративный процесс для распознавания и устранения неоднозначности сущностей (людей, мест, понятий) в документах. Система начинает с известных фактов, находит упоминающие сущность документы, анализирует сопутствующие термины для уточнения модели распознавания и автоматически обнаруживает новые признаки. Патент также описывает расчет важности сущности путем суммирования PageRank ссылающихся документов, взвешенного на вероятность ссылки.

US8122026B1
2012-02-21

Семантика и интент
Ссылки
Knowledge Graph

Как Google использует вовлеченность пользователей на связанных страницах (Reachability Score) для ранжирования основного документа

Google рассчитывает «Оценку Достижимости» (Reachability Score), анализируя, как пользователи взаимодействуют со страницами, на которые ссылается основной документ (внутренние и исходящие ссылки). Если пользователи активно переходят по этим ссылкам (высокий CTR) и проводят время на целевых страницах (высокое время доступа), основной документ получает повышение в ранжировании. Этот механизм измеряет потенциальную глубину и качество пользовательской сессии.

US8307005B1
2012-11-06

Поведенческие сигналы
Ссылки
SERP

Как Google создает и использует базу «идеальных» ответов (Canonical Content Items) для ответов на вопросы пользователей

Google использует систему для идентификации и создания «канонических элементов контента» — образцовых объяснений тем, часто в формате вопрос-ответ. Система анализирует огромные массивы существующего контента, кластеризует похожие вопросы и ответы и выбирает или синтезирует идеальную версию. Когда пользователь задает вопрос, система сопоставляет его с этой базой данных, чтобы мгновенно предоставить высококачественный, модельный ответ.

US9396263B1
2016-07-19

Семантика и интент
EEAT и качество

Как Google рассчитывает тематический авторитет сайта для кастомизации поиска с помощью Topic-Sensitive PageRank

Патент Google, описывающий механизм кастомизации результатов поиска, инициированного со стороннего сайта (например, Google Custom Search). Система использует «профиль сайта» для повышения результатов, соответствующих его тематике. Ключевая ценность патента — детальное описание расчета тематической авторитетности (Topic Boosts) путем анализа ссылок с эталонных сайтов (Start Sites), что является реализацией Topic-Sensitive PageRank.

US7565630B1
2009-07-21

Персонализация
SERP
Ссылки

Как Google планировал использовать социальные связи, сети доверия и экспертизу для персонализации и переранжирования поисковой выдачи

Google запатентовал метод использования данных из социальных сетей («member networks») для влияния на ранжирование. Пользователи могли явно одобрять («endorse») результаты поиска. Эти одобрения показывались другим связанным пользователям (друзьям или людям, ищущим экспертное мнение) и использовались для переранжирования выдачи, добавляя персонализированный слой доверия.

US8825639B2
2014-09-02

Персонализация
EEAT и качество
Поведенческие сигналы

Как Google динамически переоценивает значимость факторов ранжирования, основываясь на их надежности в контексте конкретной выдачи

Google использует механизм для повышения качества ранжирования путем анализа надежности (Trustworthiness) различных факторов, влияющих на позицию документа. Если система обнаруживает значительную разницу в надежности сигналов среди результатов поиска, она снижает влияние менее достоверных факторов. Это гарантирует, что документы, получившие высокие оценки за счет ненадежных или легко манипулируемых сигналов, не будут ранжироваться выше документов с более достоверными показателями качества и релевантности.

US9623119B1
2017-04-18

EEAT и качество
Поведенческие сигналы
SERP

Как Google использует интерактивные визуальные цитаты для генерации и уточнения ответов в мультимодальном поиске (SGE/Lens)

Google использует механизм для улучшения точности ответов, генерируемых LLM в ответ на мультимодальные запросы (изображение + текст). Система находит визуально похожие изображения, извлекает текст из их источников и генерирует ответ. Этот ответ сопровождается «визуальными цитатами» (исходными изображениями). Если пользователь видит, что цитата визуально не соответствует запросу, он может её отклонить. Система удалит текст этого источника и перегенерирует ответ, повышая его точность.

US20240378237A1
2024-11-14

Мультимедиа
EEAT и качество
Семантика и интент

Как Google использует клики и пропуски пользователей для оценки и корректировки правил близости терминов (Proximity Rules)

Google анализирует поведение пользователей для оценки эффективности правил близости (Proximity Rules), которые влияют на ранжирование в зависимости от расстояния между ключевыми словами на странице. Система отслеживает, кликают ли пользователи на результаты, где термины расположены далеко друг от друга, или пропускают их. На основе этих данных (Click Count, Skip Count) вычисляется оценка качества правила, что позволяет Google динамически адаптировать важность фактора близости.

US9146966B1
2015-09-29

Поведенческие сигналы
SERP