Как Google персонализирует подсказки Autocomplete, анализируя запросы похожих пользователей и обновляя локальный кэш устройства

PROVIDING CUSTOMIZED AUTOCOMPLETE DATA (Предоставление кастомизированных данных для автозаполнения)

US8868592B1
Google LLC
2012-05-18
2014-10-21

Google персонализирует подсказки Autocomplete (Search Suggest), анализируя поведение пользователей со схожими профилями (местоположение, интересы, история поиска). Система генерирует кастомизированное обновление для локального кэша устройства на основе запросов, введенных этими похожими пользователями. Это означает, что разные пользователи видят разные подсказки для одного и того же ввода.

Какую проблему решает

Патент решает проблему низкой релевантности стандартных (неперсонализированных) подсказок автозаполнения (Autocomplete). Поскольку пользователи имеют разные интересы и контекст, они часто вводят разные запросы, начиная с одного и того же префикса (например, один пользователь вводит "ba", имея в виду "baseball scores", а другой — "bargain footwear"). Изобретение улучшает пользовательский опыт, предоставляя подсказки, адаптированные под индивидуальный профиль и предполагаемое намерение пользователя. Также решается техническая задача снижения задержек за счет локального кэширования.

Что запатентовано

Запатентована система для генерации и доставки кастомизированных обновлений для локального кэша автозаполнения (Autocomplete Cache) на устройстве пользователя. Суть изобретения заключается в использовании коллективных данных: система идентифицирует других пользователей, которые похожи на целевого пользователя (на основе Profile Data), и анализирует запросы, которые вводили эти похожие пользователи. Эти данные используются для прогнозирования того, что целевой пользователь, вероятно, будет искать.

Как это работает

Система работает по принципу коллаборативной фильтрации:

Сбор профилей: Собираются данные профиля (Profile Data) целевого пользователя (User A) и данные профилей других пользователей (Users B), которые ранее отправляли запросы.
Расчет схожести: Вычисляются оценки схожести (Similarity Scores) между User A и Users B на основе их профилей (местоположение, история поиска, интересы и т.д.).
Выборка запросов: Отбирается подмножество запросов, которые были отправлены пользователями, чья оценка схожести превышает определенный порог (т.е. наиболее похожими на User A).
Генерация обновления: Анализируется частота использования слов и фраз в этом отобранном подмножестве запросов. На основе этого анализа генерируется обновление кэша (Cache Update).
Доставка: Обновление отправляется на устройство User A и применяется к локальному Autocomplete Cache.

Актуальность для SEO

Высокая. Персонализация поиска, локализация и улучшение пользовательского опыта (особенно на мобильных устройствах) остаются ключевыми направлениями развития Google. Описанный механизм, позволяющий предоставлять высокорелевантные подсказки с низкой задержкой за счет локального кэширования и профилирования пользователей, полностью соответствует современным тенденциям.

Важность для SEO

Патент имеет значительное влияние на SEO (70/100), хотя и не касается напрямую ранжирования веб-страниц. Он критически важен для понимания того, как формируется поисковый спрос. Autocomplete — это первый шаг пользователя к выдаче, и он направляет его выбор запроса. Патент подтверждает, что подсказки глубоко фрагментированы и персонализированы. Это усложняет исследование ключевых слов и требует глубокого понимания поведения и характеристик целевой аудитории.

Термины и определения

Autocomplete Cache (Кэш автозаполнения): Локальное хранилище данных на устройстве пользователя. Содержит слова, фразы и соответствующие им статистические данные об использовании (usage statistics). Используется для быстрого предоставления подсказок при вводе текста без сетевых задержек.
Cache Update (Обновление кэша): Пакет данных, генерируемый сервером и отправляемый на устройство пользователя для обновления локального Autocomplete Cache. Содержит кастомизированные данные.
Profile Data (Данные профиля): Информация, связанная с пользователем. Может включать географическое положение, демографические данные (demographic information), историю поисковых запросов (search query histories), историю просмотров веб-страниц, тип пользователя (user type) и интересы пользователя (Interests).
Similarity Score (Оценка схожести): Метрика, указывающая на степень сходства между двумя пользователями, рассчитанная на основе их Profile Data.
Threshold Similarity Score (Пороговая оценка схожести): Минимальное значение Similarity Score, необходимое для того, чтобы запросы пользователя были включены в анализ для генерации обновления.
Usage Score (Оценка использования): Метрика, присваиваемая словам и фразам в кэше, основанная на частоте их появления в отобранном наборе запросов. Влияет на вероятность показа фразы в качестве подсказки.

Ключевые утверждения (Анализ Claims)

Claim 1 (Независимый пункт): Описывает основной метод предоставления кастомизированных данных автозаполнения.

Система получает первые данные профиля (first profile data) для первого пользователя (User A).
Система получает вторые данные профиля (second profile data) для вторых пользователей (Users B), которые отправляли поисковые запросы.
На основе сравнения данных профиля вычисляются Similarity Scores, указывающие на степень сходства между User A и Users B.
На основе Similarity Scores выбирается надлежащее подмножество (proper subset) поисковых запросов (т.е. запросы от похожих пользователей).
Используя это подмножество запросов, генерируется обновление для Autocomplete Cache устройства User A.
Обновление предоставляется устройству User A.

Claim 3 (Зависимый от 1): Уточняет механизм выбора подмножества запросов.

Выборка осуществляется путем определения того, превышает ли Similarity Score для пользователя, отправившего запрос, пороговое значение (threshold similarity score). Если да, запрос включается в подмножество.

Claim 5 (Зависимый от 1): Уточняет использование контекста при расчете схожести.

Данные профиля могут включать информацию о контексте (например, текущий контекст User A и контексты, в которых Users B отправляли свои запросы). Similarity Scores могут рассчитываться на основе сходства этих контекстов.

Claim 7 (Зависимый от 1): Уточняет использование географического положения.

Данные профиля включают географические положения. Similarity Scores определяются на основе расстояний между положением User A и положениями, из которых Users B отправляли запросы.

Claim 11 (Зависимый от 1): Уточняет использование истории поиска.

Данные профиля включают истории поиска (search query histories). Similarity Scores определяются на основе общности (commonalities) между историей поиска User A и историями поиска Users B.

Где и как применяется

Этот патент не относится к стандартным процессам ранжирования веб-контента. Он фокусируется на инфраструктуре сбора данных и этапе взаимодействия с пользователем при вводе запроса.

CRAWLING / INDEXING (Сбор данных)
На этом этапе система собирает и индексирует данные, необходимые для работы механизма: журналы поисковых запросов (Query Data) и связанные с ними Profile Data пользователей (история поиска, местоположение, интересы).

QUNDERSTANDING – Понимание Запросов (Офлайн-анализ)
Основная часть работы алгоритма происходит на сервере (офлайн или в фоновом режиме). Система анализирует собранные данные для вычисления Similarity Scores и генерации кастомизированных обновлений кэша (Cache Updates). Это процесс анализа поведения и кластеризации пользователей.

Взаимодействие с пользователем (Client Side / Pre-Query)
Конечный результат работы системы применяется локально на устройстве пользователя. Когда пользователь начинает вводить текст, устройство использует локальный Autocomplete Cache для генерации подсказок в реальном времени.

Входные данные:

Profile Data целевого пользователя (интересы, текущее местоположение, история поиска, демография).
Логи поисковых запросов других пользователей.
Profile Data других пользователей, включая контекст отправки запросов (например, местоположение в момент запроса).

Выходные данные:

Cache Update: набор персонализированных слов и фраз с соответствующими весами (Usage Scores), предназначенный для отправки на устройство пользователя.

На что влияет

Специфические запросы: Наибольшее влияние на неоднозначные префиксы, где намерение сильно зависит от интересов пользователя (например, префикс "Java" для программиста и туриста).
Локальный поиск: Местоположение является ключевым фактором для определения схожести пользователей (Location Score). Это сильно влияет на подсказки по локальным запросам (услуги, места, события рядом).
Ниши и тематики: Влияет на ниши, связанные с хобби, профессиональными интересами и текущими событиями, где интересы пользователей сильно сегментированы.

Когда применяется

Генерация обновлений (Сервер): Происходит периодически (ежедневно, несколько раз в день) для отражения актуальных трендов или при изменении контекста пользователя (например, смена местоположения).
Доставка обновлений: Обновления могут доставляться по расписанию (push) или в ответ на взаимодействие устройства с сервером (pull).
Использование кэша (Клиент): Каждый раз, когда пользователь вводит текст на своем устройстве в поле, поддерживающем автозаполнение.

Пошаговый алгоритм

Процесс генерации кастомизированного обновления кэша (Серверная сторона)

Получение профиля целевого пользователя: Система получает актуальные Profile Data для первого пользователя (User A), включая текущее местоположение, интересы и историю поиска.
Получение данных о других пользователях: Система анализирует логи запросов, отправленных вторыми пользователями (Users B). Для каждого запроса извлекаются Profile Data пользователя, отправившего запрос (включая контекст на момент отправки).
Вычисление схожести: Для каждой пары (User A, User B) или для каждого запроса от User B вычисляется Similarity Score. Расчет может включать комбинацию оценок по разным критериям (например, сложение Location Score и Interest Score).
Фильтрация пользователей/запросов: Система определяет, превышает ли Similarity Score установленный порог (Threshold Similarity Score).
Выбор подмножества запросов: Формируется подмножество запросов (proper subset), отправленных только теми пользователями, которые признаны достаточно похожими на User A.
Анализ использования фраз: Система анализирует частоту использования слов и фраз в этом подмножестве запросов.
Генерация обновления: Создается Cache Update. Он содержит идентификацию слов/фраз и соответствующие им Usage Scores, рассчитанные на основе частоты в подмножестве. Запросы вне подмножества игнорируются или имеют меньший вес.
Доставка обновления: Обновление отправляется на устройство User A.
Применение обновления (На устройстве): Устройство обновляет локальный Autocomplete Cache.

Какие данные и как использует

Данные на входе

Система использует исключительно профильные и поведенческие данные для определения схожести пользователей.

Пользовательские факторы:
- История поиска (Search query history): Анализируются совпадения в истории запросов между пользователями (Claim 11).
- Интересы (Interests): Явно указанные или выведенные интересы пользователя.
- Демографическая информация (Demographic information): Возраст, пол, язык, профессия и т.д. (Claim 10).
- Тип пользователя (User type): Классификация пользователей по предопределенным типам (Claim 9).
- История браузера (Web browsing history): Посещенные страницы или домены.
Географические факторы:
- Текущее местоположение (Current location): Локация устройства в реальном времени (Claim 8).
- Контекстуальное местоположение: Локация, из которой другие пользователи отправляли свои запросы (Claim 7).
Поведенческие факторы:
- Логи запросов (Search query data): Тексты запросов, отправленных другими пользователями.

Какие метрики используются и как они считаются

Similarity Score (Оценка схожести): Ключевая метрика, определяющая степень сходства между двумя пользователями. Рассчитывается путем анализа общности (commonalities) в профильных данных. Может быть агрегацией нескольких подоценок:
- Location Score: Оценка схожести на основе расстояния между географическими локациями пользователей. Чем меньше расстояние, тем выше оценка.
- Interest Score: Оценка на основе количества совпадающих интересов.
- History Score: Оценка на основе пересечения слов/фраз или тем в истории поиска или браузера.
Threshold Similarity Score: Пороговое значение для фильтрации пользователей.
Usage Score (Оценка использования): Метрика, определяющая вес конкретной фразы в Autocomplete Cache. Рассчитывается на основе частоты (frequency of occurrence) этой фразы в выбранном подмножестве запросов (т.е. в запросах от похожих пользователей).

Автозаполнение глубоко персонализировано и сегментировано: Патент подтверждает, что подсказки автозаполнения не являются просто списком глобально популярных запросов. Они активно кастомизируются на основе кластеризации пользователей по схожим признакам.
Механизм "Look-alike" для подсказок: Система использует подход, аналогичный таргетингу по похожим аудиториям (Collaborative Filtering). Если пользователь похож на группу людей, которые часто ищут X, система предложит ему X в качестве подсказки.
Ключевые оси персонализации: Местоположение (Geographical Location) и История Поиска/Интересы (Search History/Interests) являются основными факторами для определения схожести пользователей.
Важность контекста: Система может сравнивать текущий контекст пользователя с историческим контекстом других пользователей (например, их местоположением на момент отправки запроса).
Локальный кэш и офлайн-работа: Персонализация происходит путем обновления локального Autocomplete Cache на устройстве, что позволяет системе работать быстро и даже без подключения к сети.
Фрагментация спроса: Для SEO это означает, что путь пользователя к контенту (Query Journey) может сильно различаться в зависимости от его профиля. Это требует более глубокого анализа аудитории вместо поверхностного анализа ключевых слов.

Best practices (это мы делаем)

Глубокое профилирование и сегментация ЦА: Необходимо четко понимать демографию, интересы, географию и типичное поисковое поведение целевой аудитории. Эти факторы определяют, какие подсказки Autocomplete они увидят. Стратегия должна строиться вокруг реального поведения этих сегментов.
Анализ подсказок с учетом контекста и локации: При исследовании ключевых слов через Autocomplete критически важно учитывать персонализацию. Используйте инструменты для эмуляции местоположения и анализируйте подсказки для профилей, соответствующих вашей ЦА, чтобы увидеть вариации для разных сегментов.
Усиление локального SEO (Local SEO): Поскольку географическая близость является сильным фактором схожести (Location Score), критически важно отслеживать локальные тренды и оптимизировать контент под запросы, популярные в конкретной области.
Стимулирование брендового и тематического спроса внутри кластера: Работайте над повышением узнаваемости бренда среди целевого сегмента. Чем больше пользователей в этом сегменте ищут ваш бренд или связанные термины, тем чаще эти запросы будут попадать в Autocomplete Cache других похожих пользователей.

Worst practices (это делать не надо)

Предположение об универсальности Autocomplete: Ошибка считать, что подсказки, которые вы видите, видят все пользователи. Построение семантического ядра только на основе одного сеанса проверки Google Suggest неэффективно.
Манипуляции с подсказками (Black Hat ACO / Накрутка): Попытки искусственно "накрутить" появление ключевого слова в подсказках становятся менее эффективными. Поскольку подсказки генерируются на основе запросов пользователей с высоким Similarity Score, система ориентируется на естественное поведение схожих пользователей, а не на глобальную популярность запроса, вызванную ботами.
Игнорирование контекстного и локального интента: Недооценка влияния местоположения и текущих интересов пользователя на формирование его запроса при создании контент-стратегии.

Стратегическое значение

Патент подтверждает стратегический переход Google от анализа "ключевых слов" к анализу "аудиторий" и "контекстов". Google активно влияет на то, что и как ищут пользователи, еще до того, как они отправят запрос. Для долгосрочной SEO-стратегии критически важно соответствовать реальному поисковому поведению и интересам целевой демографической группы, так как это напрямую влияет на видимость бренда на самом раннем этапе взаимодействия пользователя с поиском — этапе формирования запроса.

Практические примеры

Сценарий: Персонализация подсказок для разных профилей пользователей (Пример "Java")

Пользователи вводят префикс "Java".

Пользователь А (Профиль: Программист):
- Profile Data: История поиска включает "Python tutorial", "IDE". Интересы: "Software Development".
- Анализ системы: Система находит похожих пользователей (других программистов) и анализирует их запросы, начинающиеся с "Java".
- Результат (Autocomplete Suggestions): "java download", "java runtime environment", "java vs javascript".
Пользователь Б (Профиль: Путешественник):
- Profile Data: История поиска включает "flights to Bali". Местоположение: Аэропорт. Интересы: "Travel".
- Анализ системы: Система находит похожих пользователей (путешественников).
- Результат (Autocomplete Suggestions): "java island", "java indonesia weather", "java travel restrictions".
Пользователь В (Профиль: Любитель кофе):
- Profile Data: История поиска включает "best espresso machine". Интересы: "Coffee".
- Анализ системы: Система находит похожих пользователей (любителей кофе).
- Результат (Autocomplete Suggestions): "java coffee", "java blend beans", "java house menu".

Вывод для SEO: Если вы продаете кофе, ваша цель — появиться в подсказках Пользователя В. Для этого ваш контент и стратегия должны резонировать с интересами и поисковым поведением этого сегмента аудитории.

Влияет ли этот патент на ранжирование сайтов?

Напрямую нет. Патент описывает механизм формирования поисковых подсказок (Autocomplete), а не ранжирования результатов поиска. Однако он оказывает сильное косвенное влияние, так как подсказки направляют пользователя и влияют на финальную формулировку запроса, по которому уже происходит ранжирование.

Как система определяет, похожи ли пользователи друг на друга?

Система анализирует Profile Data пользователей и рассчитывает Similarity Score. В патенте явно указаны ключевые факторы для сравнения: географическое местоположение (включая текущее и контекстуальное), история поисковых запросов, демографические данные, а также интересы пользователя и тип пользователя.

Означает ли это, что все пользователи видят разные подсказки Autocomplete?

Да, именно это и подразумевает патент. Если профили пользователей (Profile Data) различаются, система относит их к разным кластерам и генерирует для них разные обновления Autocomplete Cache на основе поведения разных групп похожих пользователей. Для одного и того же префикса подсказки будут отличаться.

Как этот патент меняет подход к исследованию ключевых слов?

Он делает стандартный подход (ввод ключа и просмотр подсказок) недостаточным. SEO-специалисты должны понимать, что видимые им подсказки персонализированы. Необходимо анализировать аудиторию, понимать ее интересы и поведение, а также использовать инструменты для эмуляции разных контекстов (например, местоположения) при сборе данных из Autocomplete.

Насколько важна история поиска пользователя для этого механизма?

Она критически важна. В патенте указано (Claim 11), что история поиска используется для расчета Similarity Score между пользователями. Если два пользователя часто ищут похожие вещи, система считает их похожими и начинает предлагать им подсказки на основе запросов друг друга.

Как это влияет на локальный поиск?

Влияние очень сильное. Географическое местоположение указано как ключевой фактор расчета сходства (Claim 7). Система будет активно предлагать подсказки, основанные на том, что ищут люди поблизости. Это подчеркивает важность отслеживания локальных трендов и формулировок запросов для бизнеса, ориентированного на конкретный регион.

Где хранятся эти персонализированные подсказки?

Патент описывает генерацию обновления для Autocomplete Cache, который хранится локально на устройстве пользователя. Google рассчитывает эти данные на своих серверах и затем отправляет обновление на устройство. Это позволяет подсказкам работать быстро, без задержек сети при каждом нажатии клавиши.

Как часто обновляются эти персонализированные подсказки?

Патент предполагает, что обновления (Cache Updates) могут предоставляться периодически, например, еженедельно, ежедневно или даже несколько раз в день. Это позволяет отражать актуальные тренды и изменения в поведении пользователей, похожих на вас.

Учитывает ли система контекст при персонализации?

Да, это важный аспект (Claim 5). Система может сравнивать текущий контекст пользователя (например, его текущее местоположение) с контекстом других пользователей в момент, когда они вводили свои запросы. Это позволяет давать подсказки, релевантные текущей ситуации.

Что делать, если я хочу, чтобы мой бренд или формулировка попали в эти персонализированные подсказки?

Необходимо повышать популярность нужной формулировки запроса среди целевого кластера пользователей. Это достигается через медийную активность, PR, контент-маркетинг и создание устойчивой ассоциации между вашим продуктом и интересами этого кластера. Если достаточное количество похожих пользователей начнет использовать эту формулировку, система включит ее в их персонализированный Autocomplete Cache.

Как Google персонализирует поисковые подсказки (Autocomplete) используя ваш социальный граф

Google использует данные из социального графа пользователя для персонализации и ранжирования поисковых подсказок (Autocomplete). Система учитывает, что искали ваши контакты, на какие результаты они кликали и какие ресурсы они одобряли (Endorsements). Подсказки, популярные среди близких контактов, ранжируются выше.

US9305092B1
2016-04-05

Персонализация
Поведенческие сигналы

Как Google использует личную историю поиска и профиль интересов для персонализации подсказок Autocomplete

Google персонализирует поисковые подсказки (Autocomplete), используя профиль интересов пользователя, созданный на основе его прошлых запросов и кликов. Система сравнивает тематику потенциальных подсказок с интересами пользователя и повышает в списке те варианты, которые соответствуют его предпочтениям, с учетом актуальности этих интересов.

US20140108445A1
2014-04-17

Персонализация
Поведенческие сигналы
Семантика и интент

Как Google объединяет персональную историю поиска и популярные запросы для формирования подсказок (Autocomplete)

Google формирует поисковые подсказки (Autocomplete), комбинируя два источника данных: запросы, которые пользователь вводил ранее (персональная история), и запросы, популярные среди сообщества пользователей. Система ранжирует эти подсказки, учитывая частоту и новизну персональных запросов, и визуально выделяет персональные подсказки от общих.

US8639679B1
2014-01-28

Персонализация
Поведенческие сигналы

Как Google ускоряет автозаполнение (Autocomplete) и какие факторы ранжирования подсказок раскрывает этот механизм кэширования

Google оптимизирует производительность Autocomplete, кэшируя подсказки локально в браузере, чтобы избежать запросов к серверу при каждом вводе символа. Хотя патент фокусируется на скорости, он также подтверждает, что Google ранжирует подсказки на основе популярности запросов (частоты использования) и значимости сущностей (например, численности населения для географических объектов).

US20130054632A1
2013-02-28

Как Google формирует персонализированные поисковые подсказки (Autocomplete) на основе контента пользователя (например, в Gmail)

Google использует механизм для улучшения поисковых подсказок (Autocomplete) в таких сервисах, как Gmail. Система анализирует корпус документов пользователя, распознает сущности (например, email-адреса, имена) и предлагает их в качестве подсказок. Это помогает пользователю быстрее находить нужный контент, предлагая контекстуализированные подсказки (например, полный контакт) вместо отдельных слов.

US20140201229A1
2014-07-17

Персонализация
Индексация
Семантика и интент

Как Google использует контекст пользователя для генерации неявных поисковых запросов и проактивного показа результатов

Система Google отслеживает контекст пользователя в реальном времени (набираемый текст, открытые документы, письма). На основе этого контекста автоматически генерируются множественные неявные запросы. Система объединяет результаты из разных источников (локальных и глобальных) и проактивно показывает их пользователю, используя поведенческие данные (клики) для улучшения релевантности.

US7664734B2
2010-02-16

Поведенческие сигналы
Персонализация
Семантика и интент

Как Google автоматически добавляет текст существующих объявлений к сайтлинкам (Sitelinks) для повышения CTR

Google использует систему для автоматического улучшения сайтлинков в рекламных объявлениях. Система анализирует существующие текстовые объявления (креативы) рекламодателя и определяет их конечные целевые страницы, игнорируя параметры отслеживания. Затем она сопоставляет их с URL сайтлинков и добавляет наиболее релевантный и эффективный текст креатива к сайтлинку для повышения кликабельности (CTR).

US10650066B2
2020-05-12

Ссылки
SERP

Как Google рассчитывает тематический авторитет сайта для кастомизации поиска с помощью Topic-Sensitive PageRank

Патент Google, описывающий механизм кастомизации результатов поиска, инициированного со стороннего сайта (например, Google Custom Search). Система использует «профиль сайта» для повышения результатов, соответствующих его тематике. Ключевая ценность патента — детальное описание расчета тематической авторитетности (Topic Boosts) путем анализа ссылок с эталонных сайтов (Start Sites), что является реализацией Topic-Sensitive PageRank.

US7565630B1
2009-07-21

Персонализация
SERP
Ссылки

Как Google использует структуру сайта и анкорные тексты для извлечения Сущностей из шумных заголовков (Title)

Google использует метод для точного определения основного объекта (Сущности) веб-страницы, когда заголовок (Title) содержит лишнюю информацию (брендинг, рубрики). Система анализирует заголовки похожих страниц на том же сайте (Peer Documents) и анкорные тексты, ссылающиеся на них. Выявляя повторяющиеся шаблоны (префиксы и суффиксы) в заголовках, Google отделяет название Сущности от шума.

US7590628B2
2009-09-15

Семантика и интент
Структура сайта
Ссылки

Как Google использует данные из Local Search и Google Maps для распознавания географических названий в основном поиске

Google анализирует поведение пользователей в интерфейсах с отдельными полями ввода "Что?" и "Где?" (например, в Google Maps). На основе этой статистики система определяет, является ли термин однозначным названием местоположения ("Нью-Йорк") или нет ("Пицца"). Это позволяет поиску отличать локальные запросы от общих и формировать "черные списки" для терминов, которые похожи на города, но ими не являются (например, "Орландо Блум").

US8782030B1
2014-07-15

Local SEO
Семантика и интент
Поведенческие сигналы

Как Google использует поведение пользователей для определения синонимичности фраз в запросах, связанных с сущностями

Google анализирует поведение пользователей (клики по результатам поиска), чтобы определить, означают ли разные фразы одно и то же, когда они связаны с одним типом сущности (например, «достопримечательности в <Город>» против «места для посещения в <Город>»). Если пользователи кликают на одни и те же документы для разных фраз, система считает эти фразы эквивалентными, что помогает Google понимать синонимы и улучшать результаты поиска.

US10073882B1
2018-09-11

Семантика и интент
Поведенческие сигналы

Как Google в Автоподсказках (Suggest) предлагает искать запрос в разных вертикалях поиска (Картинки, Новости, Карты)

Патент описывает механизм "разветвления" (forking) автоподсказок Google Suggest. Система анализирует введенные символы и определяет, в каких вертикалях поиска (Корпусах) — таких как Картинки, Новости или Карты — пользователи чаще всего ищут предложенный запрос. Если корреляция с конкретной вертикалью высока (на основе Corpus Score), система предлагает пользователю искать сразу в ней, наряду со стандартным универсальным поиском.

US9317605B1
2016-04-19

Семантика и интент
SERP
Поведенческие сигналы

Как Google динамически перестраивает выдачу, если пользователь игнорирует результаты, связанные с определенной сущностью

Google использует механизм уточнения интента пользователя в реальном времени при обработке неоднозначных запросов. Система группирует результаты поиска по связанным сущностям. Если пользователь демонстрирует отсутствие интереса к одной из групп (например, прокручивает или смахивает результаты), система динамически модифицирует выдачу, понижая или удаляя все результаты, связанные с этой отклоненной сущностью.

US9348945B2
2016-05-24

Семантика и интент
SERP
Поведенческие сигналы

Как Google использует околоссылочный текст и заголовки (Web Quotes) для индексирования страниц и генерации сниппетов

Google анализирует текст на страницах, ссылающихся на целевой документ, извлекая «Web Quotes». Это не только текст абзаца, окружающего ссылку, но и текст из ближайших заголовков. Эти цитаты ранжируются по качеству ссылающегося источника (например, PageRank) и используются для индексирования целевой страницы (даже если этих слов на ней нет) и для формирования сниппета в результатах поиска.

US8495483B1
2013-07-23

Индексация
Ссылки
SERP

Как Google автоматически выбирает категории и контент для страниц сущностей, комбинируя данные о поведении пользователей и Knowledge Graph

Google использует механизм для автоматического создания страниц о сущностях (например, о фильмах или персонажах). Система определяет, какие категории (свойства) сущности наиболее интересны пользователям, сравнивая данные из Knowledge Graph с данными о том, что пользователи ищут или смотрят вместе с этой сущностью. Затем она наполняет эти категории популярным контентом.

US11036743B2
2021-06-15

Knowledge Graph
Семантика и интент
Поведенческие сигналы