SEO HARDCORE
  • Разборы патентов
    • Патенты Google
  • Скоро SEO инструменты
  • Скоро SEO аналитика
  • seohardcore
SEO HARDCORE
назад

Как Google Assistant использует контекст пользователя и активные документы для выбора источника ответа

OBTAINING RESPONSIVE INFORMATION FROM MULTIPLE CORPORA (Получение релевантной информации из нескольких корпусов документов)
  • US11017037B2
  • Google LLC
  • 2017-09-13
  • 2021-05-25
  • Семантика и интент
  • Персонализация
  • Описание
  • Разбор
  • Выводы
  • Практика
  • FAQ
  • Похожие

Google использует систему для Автоматизированных Ассистентов, которая ищет ответы не только в общем веб-индексе. Система анализирует текущий контекст пользователя (местоположение, тему диалога) и «активные документы» (открытые веб-страницы, недавно озвученный контент). Это позволяет Ассистенту понимать неоднозначные запросы, отдавая приоритет информации, непосредственно связанной с действиями пользователя, и выбирать лучший ответ из всех источников.

Описание

Какую проблему решает

Патент решает проблему ограниченности автоматизированных ассистентов (например, Google Assistant), которые традиционно полагаются только на общий веб-индекс (General Purpose Corpus). Эта ограниченность мешает системе отвечать на неоднозначные (ambiguous) или контекстно-зависимые вопросы (например, «Сколько это стоит?»), поскольку она не учитывает информацию, непосредственно релевантную текущей деятельности пользователя — например, просматриваемый документ или местоположение. Это снижает качество ответов и вынуждает систему запрашивать уточнения.

Что запатентовано

Запатентован метод, позволяющий Automated Assistant искать информацию одновременно в нескольких корпусах документов. Помимо стандартного поиска в общем веб-индексе, система ищет ответы в User-Specific Corpus (содержит «активные документы», например, открытые на устройстве) и Context-Specific Corpus (содержит документы, релевантные текущему контексту пользователя, например, его местоположению). Система сравнивает кандидатов в ответы из всех корпусов для выбора наилучшего.

Как это работает

Система работает следующим образом:

  • Получение ввода и определение контекста: Ассистент получает свободный ввод (free form input) и анализирует контекст пользователя (местоположение, тему) и Active Documents (текущая веб-страница, недавно озвученный контент).
  • Мульти-корпусный поиск: Система одновременно ищет ответы в трех источниках: General Purpose Corpus, User-Specific Corpus и Context-Specific Corpus.
  • Сравнение и выбор: Кандидаты в ответы из всех корпусов сравниваются. Система может повышать (promote) результаты из специализированных корпусов, считая их более актуальными (topical).
  • Ответ: Выбирается и предоставляется лучший ответ (часто в аудиоформате).

Актуальность для SEO

Высокая. Способность понимать непосредственный контекст пользователя, поддерживать непрерывность диалога между устройствами и разрешать неоднозначность запросов является критически важной для современных диалоговых систем (Google Assistant, Gemini) и развития контекстуального поиска.

Важность для SEO

Влияние на SEO высокое (7.5/10), но специфическое. Патент критически важен для Оптимизации под Системы Ответов (AEO) и взаимодействия с Google Assistant, а не для традиционного ранжирования веб-страниц. Он демонстрирует, что Google может предпочесть информацию из документа, который пользователь просматривает сейчас, даже если этот документ хуже ранжируется в общем поиске. Это подчеркивает важность структурирования контента для легкого извлечения информации в различных контекстах.

Детальный разбор

Термины и определения

Active Document (Активный документ)
Документ (веб-страница, PDF, видео и т.д.), с которым пользователь взаимодействует в данный момент или недавно. Включает: документы, отображаемые на экране; документы, из которых Ассистент зачитывал информацию в текущем диалоге; документы, просмотренные в текущей сессии; документы, загруженные в память устройства.
Automated Assistant (Автоматизированный ассистент)
Программное обеспечение для ведения диалога человек-компьютер (например, Google Assistant). Состоит из клиентской и облачной частей.
Context-Specific Corpus (Контекстно-зависимый корпус)
Набор документов, отобранных на основе текущего контекста пользователя (местоположение, недавняя поисковая активность, тема диалога). Документы не обязательно должны быть «активными».
Corpora Selection Engine (Механизм выбора корпусов)
Компонент системы, отвечающий за генерацию и поддержание альтернативных корпусов (User-Specific и Context-Specific).
Free Form Input (Свободный ввод)
Ввод пользователя на естественном языке (голосовой или текстовый), не ограниченный предопределенными опциями.
General Purpose Corpus (Общий корпус)
Стандартный индекс онлайн-документов (например, основной веб-индекс Google).
User-Specific Corpus (Пользовательский корпус)
Набор документов, состоящий из Active Documents, релевантных для конкретного пользователя в данный момент.

Ключевые утверждения (Анализ Claims)

Claim 1 (Независимый пункт): Описывает основной метод работы автоматизированного ассистента в рамках голосового диалога (spoken human-to-computer dialog session).

  1. Ассистент получает свободный голосовой ввод (free form speech input).
  2. Определяется текущий контекст пользователя на основе сигналов с устройства.
  3. Выполняется поиск в General Purpose Corpus (Набор 1).
  4. Выполняется поиск в User-Specific Corpus (Набор 2). Уточняется, что этот корпус включает документы, из которых Ассистент ранее зачитывал информацию в ответ на предыдущий запрос.
  5. Выполняется поиск в Context-Specific Corpus (Набор 3).
  6. Наборы 1, 2 и 3 сравниваются.
  7. Выбирается один ответ из любого набора.
  8. Ассистент предоставляет ответ в виде голосового вывода (audible natural language output).

Claim 5 и 9 (Зависимые от 1): Ключевые пункты о ранжировании. Утверждается, что Набор 2 (из User-Specific Corpus) и Набор 3 (из Context-Specific Corpus) повышаются (promoted over) по сравнению с Набором 1 (из General Purpose Corpus).

Система запрограммирована отдавать предпочтение информации, которая наиболее релевантна текущей ситуации пользователя (topical), даже если она исходит из менее авторитетного источника в общем индексе.

Claim 6 (Зависимый от 1): Описывает сценарий разрешения неоднозначности. Если запрос пользователя признан неоднозначным (ambiguous), система выполняет поиск в User-Specific Corpus, чтобы попытаться найти ответ в активных документах.

Claim 7 и 8 (Зависимые от 1): Уточняют, что контекст может определяться на основе координат местоположения (position coordinate), и Context-Specific Corpus может включать документы, идентифицированные исключительно на основе локации.

Где и как применяется

Патент описывает архитектуру Автоматизированных Ассистентов (Google Assistant) и затрагивает несколько этапов поиска.

QUNDERSTANDING – Понимание Запросов
Система анализирует free form input и определяет его потенциальную неоднозначность. Критически важным является определение текущего контекста пользователя (местоположение, история диалога, активные документы). Этот контекст используется для интерпретации запроса и для определения того, какие корпуса следует задействовать.

RANKING – Ранжирование (Retrieval)
Система инициирует поиск кандидатов параллельно в нескольких корпусах (General, User-Specific, Context-Specific). Corpora Selection Engine отвечает за формирование и доступ к этим специализированным корпусам.

METASEARCH – Метапоиск и Смешивание / RERANKING – Переранжирование
Ключевой этап. Система сравнивает кандидатов из разных корпусов. Применяются механизмы повышения (promotion) (Claims 5 и 9), которые приоритизируют контекстуальную релевантность над общей. Происходит выбор наилучшего ответа.

Входные данные:

  • Свободный ввод пользователя (текст/аудио).
  • Сигналы контекста (Position Coordinates, Search History).
  • Данные об Active Documents (URL или контент) на устройстве или в экосистеме устройств пользователя.

Выходные данные:

  • Выбранный ответ (given response), часто в аудиоформате.

На что влияет

  • Специфические запросы: Наибольшее влияние на неоднозначные запросы (например, с местоимениями «он», «это») и уточняющие вопросы в рамках диалога.
  • Типы контента: Влияет на контент, который часто потребляется с последующими вопросами: страницы товаров (E-commerce), рецепты, технические спецификации, локальная информация.
  • Мультидевайсное взаимодействие: Патент описывает применение в экосистеме устройств (coordinated ecosystem of computing devices). Активность на одном устройстве влияет на ответы на другом (FIG. 6).

Когда применяется

  • Триггеры активации: Получение запроса автоматизированным ассистентом.
  • Условие неоднозначности: Поиск в User-Specific Corpus может быть специально инициирован, если система определяет, что запрос является неоднозначным (Claim 6).
  • Приоритезация: Механизм повышения (promotion) применяется для обеспечения более высокой релевантности ответа текущей ситуации пользователя, когда доступны релевантные ответы из специализированных корпусов.

Пошаговый алгоритм

Процесс обработки запроса автоматизированным ассистентом:

  1. Получение ввода: Ассистент получает свободный ввод (например, голосовой запрос) от пользователя.
  2. Определение контекста: Система анализирует сигналы с устройства (местоположение, историю поиска, данные приложений) для определения текущего контекста.
  3. Формирование корпусов: Corpora Selection Engine обеспечивает доступ к:
    • User-Specific Corpus: Идентифицируются активные документы (открытые на экране, упомянутые ранее в диалоге, открытые на других устройствах).
    • Context-Specific Corpus: Идентифицируются документы, релевантные контексту (например, сайт магазина, в котором находится пользователь).
  4. Анализ неоднозначности (Опционально): Если запрос неоднозначен, это служит триггером для поиска в специализированных корпусах.
  5. Множественный поиск: Выполняется поиск:
    • В General Purpose Corpus (Набор 1).
    • В User-Specific Corpus (Набор 2).
    • В Context-Specific Corpus (Набор 3).
  6. Сравнение и Ранжирование: Система сравнивает Наборы 1, 2 и 3.
  7. Применение Повышения (Promotion): Ответы из Наборов 2 и 3 могут быть повышены по сравнению с Набором 1, так как они считаются более актуальными (topical).
  8. Выбор ответа: Выбирается ответ с наивысшим итоговым рейтингом.
  9. Предоставление ответа: Ассистент предоставляет ответ пользователю (часто в аудиоформате).

Какие данные и как использует

Данные на входе

Патент фокусируется на использовании контекстных и пользовательских данных для выбора источника информации.

  • Пользовательские и Контекстные факторы:
    • Местоположение: Position Coordinates (GPS) используются для определения физического контекста и формирования Context-Specific Corpus.
    • История поиска и диалога: Search History и история текущей сессии используются для определения актуальных тем и идентификации документов, упомянутых ранее.
    • Экосистема устройств: Данные об активности на всех устройствах пользователя (coordinated ecosystem).
  • Технические факторы (Состояние устройства):
    • Активные документы: Идентификаторы (URL) или содержимое документов, которые открыты, отображаются или загружены в память.
  • Контентные факторы: Содержимое документов во всех трех корпусах. Патент упоминает возможность анализа скрытого текста (например, разделов, скрытых JavaScript, но присутствующих в HTML/XML).

Какие метрики используются и как они считаются

  • Оценка релевантности: Используются стандартные оценки релевантности или ранжирования (relevance scores or rankings) для сравнения кандидатов из всех корпусов.
  • Promotion (Повышение): Ключевой механизм. Ответы из User-Specific Corpus и Context-Specific Corpus получают повышение по сравнению с General Purpose Corpus (Claims 5 и 9) для приоритизации контекстуальной релевантности.
  • Ambiguity Detection (Определение неоднозначности): Метрика для оценки того, является ли запрос неоднозначным без дополнительного контекста. Служит триггером для поиска в специализированных корпусах (Claim 6).
  • Topic Classification (Классификация тем): Упоминается использование классификаторов тем (включая машинное обучение) для определения актуальных тем на основе диалога или активности, что используется для формирования Context-Specific Corpus.

Выводы

  1. Контекст как ключевой фактор выбора источника ответа: Google Assistant активно анализирует непосредственное окружение пользователя (состояние устройства, местоположение, активные документы), чтобы разрешить неоднозначность и найти наиболее актуальный ответ, не полагаясь только на общий веб-индекс.
  2. Приоритет контекстуальных корпусов над общим индексом: Патент явно указывает (Claims 5 и 9), что информация из User-Specific и Context-Specific корпусов может повышаться (promoted). Контекстуальная релевантность может перевесить статические сигналы ранжирования в сценариях Ассистента.
  3. «Активный документ» как приоритетный источник: Документ, который пользователь просматривает или который был источником ответа ранее в диалоге, становится приоритетным источником для последующих уточняющих запросов.
  4. Поиск за пределами видимого текста: Система может искать ответы в скрытом тексте активных документов (например, в свернутых разделах, если они присутствуют в HTML/XML), чтобы найти ответы (FIG. 2, 3).
  5. Мультидевайсный поиск: Система учитывает активность в экосистеме устройств. Документ, открытый на одном устройстве, может влиять на ответы, предоставляемые другим устройством (например, умной колонкой).

Практика

Best practices (это мы делаем)

Этот патент критически важен для оптимизации под системы ответов (AEO) и взаимодействия с Google Assistant.

  • Оптимизация контента для извлечения (Extraction): Структурируйте контент так, чтобы из него можно было легко извлечь факты, спецификации и инструкции. Используйте четкую семантическую верстку (списки, таблицы) и микроразметку. Это поможет Ассистенту найти ответ на вашей странице, когда она является Active Document.
  • Улучшение технической доступности скрытого контента: Убедитесь, что контент, скрытый за вкладками или аккордеонами (например, с помощью JavaScript), присутствует в исходном HTML-коде. Ассистент может искать ответы в этом скрытом контенте.
  • Создание контента, поддерживающего диалог: Разрабатывайте контент (например, рецепты), который предвосхищает последующие вопросы. Если Ассистент зачитывает ваш контент, он должен легко находить детали (ингредиенты, время) при уточняющих вопросах пользователя.
  • Оптимизация под локальный контекст: Поддерживайте актуальность локальной информации (часы работы, наличие). Если пользователь находится рядом (Context-Specific), Ассистент может использовать ваш сайт или отзывы для ответа, сверяя данные из разных источников (FIG. 4).

Worst practices (это делать не надо)

  • Скрытие ключевой информации в изображениях или сложных для парсинга структурах: Ассистент не сможет легко извлечь этот контент, чтобы использовать его в качестве источника Active Document для последующих вопросов.
  • Полная загрузка контента только после взаимодействия (Lazy Loading без фолбэка): Если важный контент загружается динамически только после клика и не присутствует в исходном DOM, система может не увидеть его при анализе Active Document.
  • Предоставление устаревшей информации: Система может кросс-валидировать информацию из разных корпусов. Устаревшая информация на вашем сайте может проиграть актуальным данным из других источников (например, свежим отзывам).

Стратегическое значение

Патент подтверждает стратегический сдвиг в сторону контекстуального и диалогового поиска в экосистеме Ассистента. Он демонстрирует, как Google стирает границы между поиском в интернете и поиском в непосредственном окружении пользователя. Способность Google приоритизировать информацию из Active Documents снижает зависимость от традиционных факторов ранжирования в этих сценариях. Долгосрочная SEO-стратегия должна фокусироваться на обеспечении максимальной структурированности данных для машинного извлечения (AEO).

Практические примеры

Сценарий 1: Оптимизация страницы товара E-commerce (User-Specific Corpus)

  1. Ситуация: Пользователь открывает страницу товара (камеры). Эта страница становится Active Document. Пользователь спрашивает Google Assistant: «Какое время зарядки?».
  2. Действие SEO: Убедиться, что технические характеристики присутствуют на странице в HTML (даже если скрыты во вкладке) и удобны для извлечения (например, в таблице).
  3. Результат: Ассистент ищет ответ в User-Specific Corpus (на открытой странице), находит информацию и отвечает: «Время зарядки составляет два часа» (FIG. 3), минуя неоднозначный общий поиск.

Сценарий 2: Поддержка контента в диалоге (Рецепты)

  1. Ситуация: Пользователь попросил Ассистента найти рецепт. Ассистент нашел рецепт на вашем сайте и начал его зачитывать. Ваш сайт теперь в User-Specific Corpus. Пользователь переспрашивает: «Подожди, сколько яиц?».
  2. Действие SEO: Структурировать рецепты с четким списком ингредиентов (например, с помощью микроразметки Recipe).
  3. Результат: Ассистент быстро сканирует Active Document (ваш рецепт) и отвечает: «Вам нужно три яйца» (FIG. 5), удерживая пользователя на вашем контенте.

Вопросы и ответы

Что такое "Active Document" в контексте этого патента и почему это важно для SEO?

Active Document — это контент, с которым пользователь взаимодействует сейчас или недавно. Это может быть открытая веб-страница или документ, который Ассистент только что зачитал. Для SEO это критически важно, так как патент указывает (Claim 5), что информация из Active Documents может быть приоритетнее (promoted over) результатов из общего поиска. Это позволяет вашему контенту стать ответом, если пользователь уже находится на вашем сайте.

Чем отличается User-Specific Corpus от Context-Specific Corpus?

User-Specific Corpus состоит из Active Documents — того, что пользователь активно потребляет (например, открытая вкладка). Context-Specific Corpus шире и формируется на основе общего контекста, такого как местоположение или текущая тема разговора, и включает релевантные документы из интернета, даже если пользователь их не открывал. Например, если пользователь в магазине, его сайт может быть в Context-Specific Corpus.

Влияет ли этот механизм на традиционный поиск (10 синих ссылок)?

Нет. Патент сфокусирован исключительно на работе Автоматизированных Ассистентов (Automated Assistants) и диалоговых интерфейсах. Он не описывает применение этих методов для ранжирования веб-страниц в традиционном браузере. Он важен для AEO (оптимизации под системы ответов), а не для традиционного SEO.

Как система определяет "контекст" пользователя?

Система использует множество сигналов с устройства. Патент явно упоминает координаты местоположения (Position Coordinates), недавнюю историю поиска (Search History), историю текущего диалога с Ассистентом, а также данные об открытых документах. Также упоминается использование классификаторов тем (Topic Classifiers) для определения текущих интересов.

Как этот патент связан с обработкой неоднозначных запросов?

Патент описывает это как ключевой сценарий использования (Claim 6). Если пользователь задает неоднозначный вопрос (например, «Как долго это длится?»), Ассистент сначала попытается найти ответ в Active Documents или Context-Specific Corpus, чтобы понять, о чем идет речь, вместо того чтобы выдавать общие результаты или просить уточнения.

Может ли этот механизм использовать скрытый контент (например, за вкладками)?

Да. В описании патента (на примере FIG. 2 и 3) указано, что система может искать информацию в скрытом контенте (например, характеристиках, скрытых за элементом интерфейса), если страница является Active Document. Это подчеркивает важность того, чтобы весь важный контент был доступен в HTML/XML-коде страницы.

Что делать SEO-специалисту, чтобы контент лучше работал с этим механизмом?

Ключевая задача — обеспечить максимальную простоту извлечения информации. Используйте четкую структуру, отвечайте на вопросы прямо и лаконично, используйте семантическую верстку и микроразметку. Если ваш контент станет Active Document, Ассистент должен иметь возможность легко найти в нем детали для ответов на уточняющие вопросы.

Учитывает ли система активность на разных устройствах пользователя?

Да, патент явно упоминает экосистему устройств (coordinated ecosystem of computing devices). Например, если пользователь читает статью на планшете (это Active Document), а затем задает вопрос умной колонке, Ассистент на колонке может использовать статью с планшета в качестве приоритетного источника для ответа (FIG. 6).

Что произойдет, если информация в разных корпусах противоречит друг другу?

Система сравнивает кандидатов из разных корпусов. Патент приводит пример (FIG. 4), когда устаревшие часы работы на официальном сайте противоречат свежим отзывам о закрытии. Система может предоставить ответ, учитывающий это противоречие (например, «На сайте указано, что открыто, но по отзывам — закрыто»), демонстрируя способность к кросс-валидации данных.

Как этот патент влияет на оптимизацию под голосовой поиск (VSO)?

Он имеет прямое влияние. Патент описывает механизм работы голосовых ассистентов (Claim 1 упоминает free form speech input и audible output). Он подчеркивает необходимость оптимизации контента для диалоговых сценариев, где система должна быстро извлекать точные ответы из приоритетных источников для поддержания разговора.

Похожие патенты

Как Google использует контекст пользователя для генерации неявных поисковых запросов и проактивного показа результатов
Система Google отслеживает контекст пользователя в реальном времени (набираемый текст, открытые документы, письма). На основе этого контекста автоматически генерируются множественные неявные запросы. Система объединяет результаты из разных источников (локальных и глобальных) и проактивно показывает их пользователю, используя поведенческие данные (клики) для улучшения релевантности.
  • US7664734B2
  • 2010-02-16
  • Поведенческие сигналы

  • Персонализация

  • Семантика и интент

Как Google Assistant позволяет пользователям выбирать предпочтительные источники контента (и когда он может их игнорировать)
Патент описывает, как Google Assistant создает и использует "Правила параметров источника" (Source Parameter Rules), чтобы отдавать приоритет контенту из источников, указанных пользователем. Система проверяет качество и актуальность этих источников и может предложить альтернативы, если предпочтительный источник устарел или недоступен, уведомляя пользователя о соблюдении или нарушении его предпочтений.
  • US12347429B2
  • 2025-07-01
  • Персонализация

  • EEAT и качество

  • Свежесть контента

Как Google Assistant адаптирует выдачу на лету, позволяя пользователям навигировать по результатам и запоминать предпочтения по источникам и темам
Google использует механизм для диалоговых систем (например, Google Assistant), позволяющий пользователям взаимодействовать с поисковой выдачей через естественный язык. Система предоставляет результаты последовательно и адаптирует порядок выдачи в ответ на команды навигации (например, «Вернись к новости о Кафе»). Кроме того, система фиксирует отношение пользователя к атрибутам контента (например, «Не показывай новости из Источника 1») и использует эти данные для фильтрации или изменения ранжирования в текущих и будущих сессиях.
  • US10481861B2
  • 2019-11-19
  • Персонализация

  • Семантика и интент

  • Поведенческие сигналы

Как Google использует контекст пользователя в реальном времени и машинное обучение для переранжирования результатов поиска
Google использует систему для прогнозирования истинного намерения пользователя на основе его текущего контекста (местоположение, время, среда, недавние действия) и исторических данных о поведении других пользователей в аналогичных ситуациях. Система переранжирует стандартные результаты поиска, чтобы выделить информацию (особенно "Search Features"), которая наиболее соответствует прогнозируемому намерению.
  • US10909124B2
  • 2021-02-02
  • Семантика и интент

  • Персонализация

  • SERP

Как Google использует real-time анализ текста, аудио и изображений для автоматической генерации запросов и проактивного поиска
Система Google для анализа информации, захваченной из различных источников (вводимый текст, изображения документов, аудиопотоки) в реальном времени. Система автоматически распознает контент, выделяет ключевые фрагменты, формирует поисковые запросы и мгновенно предоставляет пользователю релевантный цифровой контент или связанные действия без явных запросов. Это механизм, лежащий в основе технологий визуального (Lens) и голосового поиска.
  • US8990235B2
  • 2015-03-24
  • Семантика и интент

  • Персонализация

  • Мультимедиа

Популярные патенты

Как Google использует вероятностные модели и анализ пользовательского выбора (кликов) для обучения систем ранжирования
Патент Google описывает метод эффективного ранжирования контента (видео или результатов поиска) с использованием парных сравнений. Система моделирует качество как вероятностное распределение и оптимизирует сбор данных. Этот механизм может применяться для интерпретации кликов в поисковой выдаче как сигналов предпочтения, учитывая позицию результата и доверие к пользователю.
  • US8688716B1
  • 2014-04-01
  • SERP

  • Поведенческие сигналы

Как Google использует контент, который вы смотрите (например, на ТВ), для автоматического переписывания и персонализации ваших поисковых запросов
Google может анализировать контент (фильмы, шоу, аудио), который пользователь потребляет на одном устройстве (например, ТВ), и использовать эту информацию как контекст для уточнения последующих поисковых запросов. Система распознает аудиовизуальный контекст и автоматически дополняет неоднозначные запросы пользователя, чтобы предоставить более релевантные результаты, в том числе на связанных устройствах (например, смартфоне).
  • US9244977B2
  • 2016-01-26
  • Персонализация

  • Семантика и интент

  • Поведенческие сигналы

Как Google использует "ложные пропуски" (Fake Skips) для точной оценки качества своих правил синонимов
Google анализирует поведение пользователей для оценки качества синонимов, используемых при переписывании запросов. Патент вводит метрику "Fake Skip" (Ложный пропуск). Она фиксируется, если пользователь пропустил результат с синонимом, но кликнул на результат ниже, который также содержит этот синоним и исходный термин. Это позволяет точнее калибровать систему синонимов и не пессимизировать хорошие правила из-за неоднозначного поведения пользователей.
  • US8909627B1
  • 2014-12-09
  • Поведенческие сигналы

  • Семантика и интент

  • SERP

Как Google использует анализ многословных фраз для улучшения подбора синонимов с учетом грамматического согласования
Google анализирует, как пользователи одновременно меняют несколько слов в запросе (например, при изменении числа или рода). Подтверждая, что каждое измененное слово является лексическим или семантическим вариантом оригинала, Google идентифицирует «синонимы с N-граммным согласованием». Это позволяет системе улучшить понимание синонимов отдельных слов, даже если эти слова редко меняются поодиночке в определенных контекстах.
  • US7925498B1
  • 2011-04-12
  • Семантика и интент

  • Поведенческие сигналы

Как Google снижает влияние ссылок с аффилированных сайтов и PBN для борьбы с манипуляциями в ранжировании
Патент Google описывает систему ранжирования, которая идентифицирует группы сайтов под общим контролем (аффилированные узлы или PBN). Система резко снижает вес ссылок внутри такой группы и ограничивает общее влияние группы на другие сайты, учитывая только одну, самую сильную ссылку от всей группы. Также описывается механизм "Доверенных авторитетов", чьи ссылки передают максимальный вес независимо от количества исходящих ссылок.
  • US8719276B1
  • 2014-05-06
  • Антиспам

  • Ссылки

  • Техническое SEO

Как Google использует распределение кликов в выдаче для определения брендовых (навигационных) и общих (тематических) запросов
Google анализирует поведение пользователей в поисковой выдаче для классификации интента запроса. Если клики сконцентрированы на одном результате (низкое разнообразие, высокая частота), запрос классифицируется как навигационный или брендовый (Data-Creator Targeting). Если клики распределены по разным сайтам, запрос считается общим (Content Targeting). Эта классификация используется для адаптации поисковой выдачи.
  • US20170068720A1
  • 2017-03-09
  • Семантика и интент

  • Поведенческие сигналы

  • SERP

Как Google анализирует распределение качества входящих ссылок для классификации и понижения сайтов в выдаче
Google использует систему для оценки качества ссылочного профиля сайта. Система фильтрует входящие ссылки (удаляя шаблонные и дублирующиеся с одного домена), группирует оставшиеся по качеству источника (например, Vital, Good, Bad) и вычисляет взвешенный «Link Quality Score». Если доля низкокачественных ссылок слишком велика, сайт классифицируется как низкокачественный и понижается в результатах поиска.
  • US9002832B1
  • 2015-04-07
  • Ссылки

  • Антиспам

  • SERP

Как Google персонализирует сниппеты и заголовки в выдаче на основе истории поиска и интересов пользователя
Google может динамически изменять сниппеты и заголовки (Title) результатов поиска, чтобы выделить ту часть контента на странице, которая соответствует известным интересам пользователя (история поиска, демография, недавний контекст). Это позволяет сделать представление выдачи более персонализированным, не обязательно изменяя ранжирование документов.
  • US9235626B2
  • 2016-01-12
  • Персонализация

  • SERP

  • Семантика и интент

Как Google определяет географическую зону релевантности бизнеса на основе реального поведения пользователей (Catchment Areas)
Google определяет уникальную "зону охвата" (Catchment Area) для локального бизнеса, анализируя, из каких географических точек пользователи кликали на его результаты в поиске. Эта динамическая зона заменяет фиксированный радиус и используется для фильтрации кандидатов при локальном поиске, учитывая известность бренда, категорию бизнеса и физические препятствия.
  • US8775434B1
  • 2014-07-08
  • Local SEO

  • Поведенческие сигналы

Как Google использует историю запросов в текущей сессии и статистические паттерны для переранжирования результатов
Google анализирует миллионы прошлых поисковых сессий, выявляя статистически значимые последовательности запросов («Пути Запросов»), которые заканчиваются кликом на определенный URL («Конечная Точка Контента»). Когда текущая сессия пользователя совпадает с историческим путем, Google переранжирует результаты, повышая те URL, которые исторически удовлетворяли пользователей в аналогичном контексте, пропорционально вероятности их выбора.
  • US7610282B1
  • 2009-10-27
  • Поведенческие сигналы

  • SERP

  • Семантика и интент

seohardcore