SEO HARDCORE
  • Разборы патентов
    • Патенты Google
  • Скоро SEO инструменты
  • Скоро SEO аналитика
  • seohardcore
SEO HARDCORE
назад

Как Google выбирает, синтезирует и озвучивает прямые ответы для голосового поиска с учетом контекста пользователя

VOCALIZING SHORT RESPONSES TO VOICE QUERIES (Озвучивание коротких ответов на голосовые запросы)
  • US20170235827A1
  • Google LLC
  • 2013-06-20
  • 2017-08-17
  • Семантика и интент
  • Мультимедиа
  • Персонализация
  • SERP
  • Описание
  • Разбор
  • Выводы
  • Практика
  • FAQ
  • Похожие

Google обрабатывает голосовые запросы, идентифицируя стандартный результат (ссылка и сниппет) и одновременно находя или синтезируя прямой ответ в форме законченного предложения. Этот ответ адаптируется под контекст пользователя (например, местоположение), конвертируется в аудиоформат и озвучивается вместе с отображением визуальной выдачи.

Описание

Какую проблему решает

Патент решает проблему предоставления результатов поиска пользователям, которые используют голосовой ввод (Voice Query) и могут быть не в состоянии взаимодействовать с экраном устройства (например, во время вождения). Он улучшает пользовательский опыт, предоставляя прямой, озвученный ответ, что устраняет необходимость смотреть на экран, но при этом сохраняет доступ к визуальной выдаче для дальнейшего изучения.

Что запатентовано

Запатентована система для обработки голосовых запросов, которая идентифицирует и озвучивает прямой ответ. В ответ на запрос система находит не только стандартный результат (ссылку и сниппет), но и специфический Second Set of Text (Второй набор текста), который является ответом в форме законченного предложения (Complete Sentence Form). Ключевой особенностью, согласно формуле изобретения (Claims), является то, что этот ответ должен включать контекстуальные данные пользователя (Contextual Data). Система конвертирует этот текст в аудио и предоставляет его вместе с визуальными результатами.

Как это работает

Система работает следующим образом:

  • Ввод и Контекст: Получает голосовой запрос, конвертирует его в текст (Textual Representation) и получает контекстуальные данные (например, местоположение) от устройства.
  • Поиск и Идентификация: Выполняется поиск. Идентифицируются стандартный сниппет (First Set of Text) и прямой ответ (Second Set of Text).
  • Генерация Ответа: Прямой ответ извлекается (например, из OneBox results или веб-страницы) или синтезируется, обязательно включая контекстуальные данные пользователя.
  • Генерация Аудио: Second Set of Text конвертируется в аудиоформат (Audible Version) с помощью Text-to-Speech (TTS).
  • Доставка: Все компоненты упаковываются в электронный документ (например, HTML) и отправляются на устройство для отображения и озвучивания.

Актуальность для SEO

Высокая. С ростом популярности голосовых ассистентов (Google Assistant) и умных колонок, механизмы выбора, синтеза и озвучивания контента критически важны. Описанный процесс напрямую связан с тем, как Google формирует ответы для голосовой выдачи, что часто пересекается с механизмами Featured Snippets и использованием Knowledge Graph.

Важность для SEO

Патент имеет высокое влияние на SEO (8/10), особенно в области оптимизации под голосовой поиск и Featured Snippets. Он определяет критерии выбора контента для озвучивания (законченное предложение) и подчеркивает критическую важность контекстуализации (Local SEO), как того требуют Claims. Понимание этих механизмов необходимо для попадания в голосовую выдачу, что напрямую влияет на контент-стратегию.

Детальный разбор

Термины и определения

Audible Version (Аудиоверсия)
Second Set of Text, конвертированный в звуковой формат. Это может быть аудиофайл (MP3, WAV), ссылка на сервис TTS или инструкции для синтеза речи на устройстве клиента.
Complete Sentence Form (Форма законченного предложения)
Ключевое требование к Second Set of Text. Текст должен представлять собой грамматически завершенный и самодостаточный ответ на запрос.
Contextual Data (Контекстуальные данные)
Данные, генерируемые клиентским устройством, такие как время и местоположение. Согласно Claims, эти данные должны быть включены в Second Set of Text.
First Set of Text (Первый набор текста)
Текст, извлеченный из исходного документа (веб-страницы). Обычно соответствует стандартному сниппету в SERP.
OneBox Results
Специфический тип результатов, предоставляющий прямой ответ (например, факты, погода), часто генерируемый из структурированных данных. Упоминается как возможный источник для Second Set of Text.
Second Set of Text (Второй набор текста)
Текст, который отвечает на запрос, имеет Complete Sentence Form и включает Contextual Data. Это текст, выбранный для озвучивания. Он может быть извлечен, получен из структурированных данных или синтезирован.
Textual Representation (Текстовое представление)
Результат конвертации голосового запроса в текст с помощью системы распознавания речи.
Voice Query (Голосовой запрос)
Запрос, введенный пользователем устно.

Ключевые утверждения (Анализ Claims)

Анализ основан на ключевых независимых пунктах формулы изобретения (Claims 1, 7, 13, 17), которые определяют ядро изобретения.

Claim 1 и Claim 7 (Независимые пункты): Описывают процесс на стороне поисковой системы.

  1. Система определяет результат поиска, отвечающий на текстовое представление голосового запроса.
  2. Этот результат включает: ссылку на первый документ, First Set of Text (сниппет) и Second Set of Text (ответ).
  3. Система конвертирует Second Set of Text в аудиоверсию.
  4. Генерируется второй документ (SERP), включающий все эти компоненты, и отправляется на клиентское устройство.
  5. Критическое требование: Second Set of Text ДОЛЖЕН включать контекстуальные данные (Contextual Data), сгенерированные клиентским устройством.

Ядром изобретения является не просто озвучивание сниппета, а генерация или выбор ответа, который динамически адаптирован под контекст пользователя (например, его местоположение или время). Это подразумевает синтез ответа на лету.

Claim 13 и Claim 17 (Независимые пункты): Описывают процесс на стороне клиентского устройства.

  1. Устройство получает голосовой запрос, конвертирует его в текст и отправляет в поисковую систему.
  2. Устройство получает результат, включающий ссылку, ответ в виде законченного предложения (который включает Contextual Data устройства) и его аудиоверсию.
  3. Устройство отображает визуальные компоненты и воспроизводит аудиоверсию.

Claim 5 и Claim 21 (Зависимые пункты): Уточняют источники Second Set of Text.

  • Текст может быть выбран из «обозначенного места» (designated location) документа (Claim 5).
  • Текст может быть выбран из части First Set of Text (сниппета), если он распознан как полный ответ (Claim 21).

Где и как применяется

Изобретение затрагивает несколько этапов поиска, фокусируясь на генерации контекстуализированного ответа и его доставке.

QUNDERSTANDING – Понимание Запросов
На этом этапе голосовой запрос конвертируется в текст. Система также получает и обрабатывает Contextual Data (время, местоположение) с устройства, что критически важно для выполнения требований Claims.

INDEXING / RANKING – Индексирование и Ранжирование
Система ищет релевантные документы и извлекает потенциальные ответы. Это включает поиск в веб-индексе и структурированных базах данных (для OneBox Results). Происходит извлечение признаков (Feature Extraction) для идентификации законченных предложений.

METASEARCH / RERANKING – Метапоиск и Переранжирование
Основной этап применения патента. Здесь финализируется Second Set of Text. Он может быть извлечен или синтезирован с использованием Contextual Data. Затем система выполняет конвертацию текста в аудио (TTS) и формирует финальный ответ (Second Document), упаковывая визуальные и аудио компоненты.

Входные данные:

  • Голосовой запрос (аудио или текст).
  • Contextual Data с устройства пользователя (местоположение, время).
  • Поисковые индексы (веб-индекс, структурированные данные).

Выходные данные:

  • Электронный документ (например, HTML), содержащий ссылку, First Set of Text, Second Set of Text (с учетом контекста) и Audible Version (аудиофайл, ссылка или инструкции TTS).

На что влияет

  • Специфические запросы: Информационные запросы, подразумевающие конкретный фактический ответ (Кто? Что? Где? Когда? Как?).
  • Локальные запросы: Сильное влияние из-за требования включения Contextual Data (местоположения) в ответ (Claims).
  • Типы контента: Контент, структурированный в формате Вопрос-Ответ, определения, инструкции, из которых легко извлечь или синтезировать законченное предложение.
  • Форматы контента: Влияет на формирование Featured Snippets и OneBox results, так как они служат основным источником для озвучивания.

Когда применяется

  • Триггеры активации: Механизм активируется при получении голосового запроса (Voice Query).
  • Условия: Система должна быть способна идентифицировать или синтезировать Second Set of Text, который соответствует критериям Complete Sentence Form и может корректно включать Contextual Data.

Пошаговый алгоритм

Этап 1: Ввод и предварительная обработка (Клиент/Сервер)

  1. Получение запроса: Пользователь произносит голосовой запрос.
  2. Распознавание речи: Голос конвертируется в Textual Representation (на устройстве или на сервере).
  3. Передача данных: Текстовый запрос и Contextual Data (например, местоположение) передаются в поисковую систему.

Этап 2: Поиск и генерация ответа (Сервер)

  1. Поиск: Поисковая система проводит поиск релевантных документов.
  2. Идентификация компонентов: Определяются ссылка и First Set of Text (стандартный сниппет).
  3. Выбор/Синтез Second Set of Text: Система определяет ответ в виде законченного предложения, используя один из методов:
    • Извлечение OneBox result из структурированных данных.
    • Анализ сниппета или контента страницы (включая «обозначенные места»).
    • Синтез ответа, который обязательно включает Contextual Data пользователя.

Этап 3: Формирование и доставка ответа (Сервер)

  1. Конвертация в аудио (TTS): Second Set of Text конвертируется в Audible Version. Это может быть генерация аудиофайла, формирование ссылки на TTS-сервис или добавление специальных HTML-атрибутов для TTS на клиенте.
  2. Генерация документа: Все компоненты упаковываются в электронный документ (например, HTML).
  3. Отправка: Документ отправляется на клиентское устройство.

Этап 4: Вывод результата (Клиент)

  1. Исполнение документа: Устройство обрабатывает полученный документ.
  2. Отображение: Визуальные компоненты отображаются на экране.
  3. Озвучивание: Audible Version воспроизводится через динамик (автоматически или по запросу).

Какие данные и как использует

Данные на входе

  • Контентные факторы: Текст веб-страниц и сниппеты (First Set of Text). Они анализируются для извлечения или валидации ответа.
  • Структурные факторы:
    • HTML-разметка. Патент упоминает возможность использования разметки для обозначения текста, который следует озвучивать.
    • Расположение текста на странице. Упоминается выбор текста из «обозначенного места» (designated location) (Claim 5).
    • Структурированные данные (используются для OneBox results).
  • Географические/Пользовательские факторы: Contextual Data (время и местоположение). Эти данные критически важны, так как Claims требуют их включения в озвучиваемый ответ.

Какие метрики используются и как они считаются

Патент не детализирует метрики ранжирования, но определяет критерии для Second Set of Text:

  • Complete Sentence Form: Ключевой критерий. Текст должен быть грамматически завершенным и являться прямым ответом.
  • Включение контекста: Ответ должен включать Contextual Data.

Методы идентификации/генерации ответа:

  • Анализ текста (NLP): Алгоритмический анализ сниппета на предмет наличия законченного предложения (Claim 21).
  • Анализ структуры: Анализ контента в структурно выделенных местах (Claim 5).
  • Синтез: Генерация ответа на основе переменных (слова из запроса, Contextual Data), что сильно поддерживается формулировкой Claims.

Выводы

  1. Приоритет законченных предложений для голосового ответа: Google активно ищет контент, сформулированный как законченное предложение (Complete Sentence Form). Это фундаментальное требование для выбора Second Set of Text.
  2. Критичность контекстуализации (Contextual Data): Ключевым элементом защищенного изобретения (Claims 1, 7, 13, 17) является требование, чтобы озвученный ответ включал Contextual Data пользователя. Это означает, что система не просто зачитывает статический текст, а синтезирует или выбирает ответ, динамически адаптированный под контекст (например, локализацию).
  3. Разнообразие источников и синтез ответов: Ответ для озвучивания может быть получен из разных источников: структурированных данных (OneBox), извлечен из сниппета или определенного места на странице (designated location), или синтезирован системой на лету.
  4. Важность семантической структуры: Упоминание выбора текста из «обозначенных мест» и возможность использования HTML-разметки подчеркивает важность четкой семантической структуры документа для помощи алгоритмам в идентификации ключевой информации.
  5. Комплексный пользовательский опыт: Система разработана для обеспечения удобства, предоставляя как немедленный аудиоответ, так и визуальные результаты (ссылку и сниппет) для дальнейшего изучения.

Практика

Best practices (это мы делаем)

  • Оптимизация под Featured Snippets (Блоки с ответами): Механизм выбора Second Set of Text тесно связан с Featured Snippets. Необходимо создавать краткие (40-60 слов), четкие ответы на популярные вопросы, сформулированные в виде законченного предложения.
  • Использование формата «Вопрос-Ответ»: Структурируйте контент так, чтобы сразу после вопроса (в заголовке Hx) следовал прямой ответ (в теге <p>, <li>). Это помогает системе идентифицировать Complete Sentence Response.
  • Усиление локальных сигналов (Local SEO): Учитывая требование Claims о включении Contextual Data (местоположения), критически важно иметь сильные локальные сигналы. Информация (часы работы, адрес) должна быть актуальной и легко сопоставляемой с местоположением пользователя для синтеза локализованного ответа.
  • Четкая семантическая структура и расположение контента: Размещайте ключевые определения и ответы в начале статьи или раздела («designated locations»). Используйте чистую семантическую верстку для выделения ключевых частей контента.
  • Внедрение структурированных данных (Schema.org): Используйте микроразметку для повышения вероятности использования контента в OneBox results и облегчения извлечения фактов, необходимых для синтеза контекстуализированных ответов.

Worst practices (это делать не надо)

  • Сложные и неоднозначные формулировки: Предоставление ответов, которые не сформулированы как законченное предложение или требуют значительных усилий для синтеза, минимизирует шансы на выбор контента для озвучивания.
  • Отсутствие прямых ответов в начале контента: Создание контента, который не дает прямого ответа на предполагаемый вопрос пользователя в первых абзацах.
  • Игнорирование локального контекста: Создание контента без учета возможности локальной интерпретации запроса упускает возможности, связанные с требованием патента об использовании Contextual Data.

Стратегическое значение

Патент подтверждает стратегический сдвиг в сторону предоставления прямых, контекстуализированных ответов пользователям, особенно в контексте голосового взаимодействия. Доминирование в «нулевой позиции» (Position Zero / Featured Snippets) становится ключевым элементом стратегии. Патент также подчеркивает слияние Local SEO и контент-стратегии, делая адаптацию под контекст пользователя неотъемлемой частью генерации голосового ответа.

Практические примеры

Сценарий: Оптимизация страницы локального бизнеса для голосового ответа с учетом контекста.

  1. Голосовой запрос пользователя: "До скольки работает [Название Магазина]?"
  2. Контекст устройства (Contextual Data): Сегодня пятница, местоположение пользователя — рядом с филиалом А.
  3. Реализация на сайте: Убедиться, что часы работы четко указаны (например, "Филиал по адресу [Адрес А] открыт по пятницам до 21:00") и размечены с помощью Schema.org (LocalBusiness, openingHoursSpecification).
  4. Ожидаемый результат (по патенту):
    • Google идентифицирует страницу как источник.
    • Google синтезирует Second Set of Text, используя данные сайта и контекст пользователя: "Магазин [Название Магазина] рядом с вами сегодня работает до 21:00."
    • Google конвертирует это в Audible Version и озвучивает пользователю, предоставляя ссылку на источник.

Вопросы и ответы

Что такое "Second Set of Text" и почему это важно для SEO?

Second Set of Text — это фрагмент текста, который система идентифицирует как прямой ответ на голосовой запрос в форме законченного предложения (Complete Sentence Form). Это критически важно для SEO, поскольку именно этот текст конвертируется в аудио и озвучивается пользователю. Завоевание этой позиции (часто называемой Позиция Ноль) обеспечивает максимальную видимость в голосовом поиске.

Означает ли этот патент, что Google синтезирует ответы, а не просто зачитывает текст с сайта?

Да, патент явно указывает на возможность синтеза ответа. Более того, требование Claims о включении Contextual Data пользователя (например, местоположения) в ответ подразумевает, что система часто должна синтезировать финальное предложение на лету, комбинируя извлеченные данные с контекстом пользователя, а не просто зачитывать статичный текст со страницы.

Как требование о "Contextual Data" влияет на SEO стратегию?

Это требование радикально повышает важность Local SEO и создания контента, адаптированного под локальный интент. Стратегия должна фокусироваться на предоставлении информации, которая может быть корректно синтезирована с учетом текущего местоположения и времени пользователя. Это делает адаптацию под контекст неотъемлемой частью оптимизации под голосовой поиск.

Как этот патент связан с Featured Snippets (Блоками с ответами)?

Существует прямая связь. Требования к Second Set of Text практически идентичны критериям выбора контента для Featured Snippets. Оптимизация под Featured Snippets является лучшей стратегией для попадания в голосовую выдачу, так как они часто служат источником для озвучивания.

Какие источники Google использует для генерации озвучиваемых ответов?

Патент описывает несколько источников: экстракция текста непосредственно с релевантной веб-страницы (из сниппета или «обозначенного места» - designated location), структурированные базы данных (OneBox results, Knowledge Graph), а также синтез ответа на лету с использованием контекстуальных данных.

Как оптимизировать контент, чтобы он стал источником для голосового ответа?

Необходимо фокусироваться на ясности и структуре. Формулируйте ответы в виде законченных предложений (оптимально 40-60 слов). Используйте формат Вопрос-Ответ. Размещайте ключевую информацию в начале документа (designated location) и внедряйте микроразметку Schema.org.

Упоминает ли патент конкретные HTML-атрибуты для обозначения текста для озвучивания?

Патент упоминает возможность использования предопределенных HTML-атрибутов для маркировки текста, который должен быть конвертирован в аудио. Также он упоминает, что система может выбирать текст из «обозначенных мест» (designated locations) на странице (Claim 5), что подчеркивает важность структурной оптимизации.

Как технически Google передает аудио ответ на устройство?

Патент предлагает три варианта: 1) Генерация аудиофайла (например, MP3) на сервере и его передача в HTML. 2) Передача гиперссылки на сервис, который генерирует аудио на лету (TTS-сервис). 3) Добавление специальных HTML-атрибутов к тексту, которые инструктируют браузер пользователя самостоятельно выполнить преобразование текста в речь.

Какое значение имеют структурированные данные (Schema.org) в контексте этого патента?

Структурированные данные имеют высокое значение. Они помогают системе извлекать факты и понимать контекст информации на странице. Поскольку патент упоминает OneBox results и синтез ответов, наличие разметки облегчает Google использование вашего контента для формирования точных и контекстуально релевантных голосовых ответов.

Применяется ли этот механизм только к мобильным устройствам?

Нет. Хотя мобильные устройства часто упоминаются в примерах (например, вождение), технология применима к любому устройству (client device), способному принимать голосовой ввод и воспроизводить аудио, включая ПК, планшеты и умные колонки.

Похожие патенты

Как Google встраивает поиск (ботов) напрямую в чаты и голосовые звонки с помощью триггерных слов и контекста
Система отслеживает электронные разговоры (чаты, VoIP-звонки) на наличие триггерных слов. При активации она захватывает запрос, может использовать контекст разговора для его уточнения и внедряет краткий ответ обратно в поток беседы. Патент также описывает функцию автоматического звонка по найденному номеру (Search-to-Call).
  • US9031216B1
  • 2015-05-12
  • Семантика и интент

  • SERP

Как Google определяет и предлагает следующие шаги в голосовом поиске для построения разговорного диалога
Патент Google, описывающий механизм для облегчения разговорного поиска, в первую очередь на носимых устройствах. Система анализирует исходный запрос и определяет связанные темы (ключевые слова), основываясь на популярных поисковых запросах и семантических связях. Эти ключевые слова отображаются пользователю и одновременно активируются как голосовые команды для быстрого выполнения следующего связанного поиска.
  • US9305064B1
  • 2016-04-05
  • Семантика и интент

Как Google интегрирует предсказание и выполнение поиска непосредственно в клавиатуру (Gboard) на основе контекста ввода
Google использует клавиатурное приложение (например, Gboard) для анализа текста, вводимого пользователем в реальном времени (например, в чате). Система идентифицирует поисковые сущности или триггерные фразы, автоматически генерирует релевантные поисковые запросы и предлагает их прямо в интерфейсе клавиатуры. Это позволяет пользователю мгновенно выполнить поиск и получить результаты, не покидая текущее приложение.
  • US10305828B2
  • 2019-05-28
  • Семантика и интент

  • Персонализация

Как Google Assistant адаптирует выдачу на лету, позволяя пользователям навигировать по результатам и запоминать предпочтения по источникам и темам
Google использует механизм для диалоговых систем (например, Google Assistant), позволяющий пользователям взаимодействовать с поисковой выдачей через естественный язык. Система предоставляет результаты последовательно и адаптирует порядок выдачи в ответ на команды навигации (например, «Вернись к новости о Кафе»). Кроме того, система фиксирует отношение пользователя к атрибутам контента (например, «Не показывай новости из Источника 1») и использует эти данные для фильтрации или изменения ранжирования в текущих и будущих сессиях.
  • US10481861B2
  • 2019-11-19
  • Персонализация

  • Семантика и интент

  • Поведенческие сигналы

Как Google встраивает предлагаемые альтернативные запросы прямо в сниппеты поисковой выдачи
Google может улучшать поисковый опыт, встраивая интерактивные предложения запросов прямо в текстовые сниппеты результатов поиска. Система определяет альтернативные запросы (основываясь на анализе поведения пользователей) и связывает их с конкретными словами в сниппете. Эти слова выделяются (например, подчеркиванием), и пользователь может взаимодействовать с ними, чтобы запустить новый, уточненный поиск.
  • US8595252B2
  • 2013-11-26
  • SERP

  • Семантика и интент

  • Поведенческие сигналы

Популярные патенты

Как Google автоматически определяет важность различных частей веб-страницы (DOM-узлов) для ранжирования
Google анализирует коллекции похожих структурированных документов (например, товарных карточек) и создает общую модель (DOM). Затем система изучает логи запросов и кликов, чтобы понять, какие части структуры (заголовки, основной контент, реклама) чаще всего содержат ключевые слова из успешных запросов. Этим частям присваивается больший вес при расчете релевантности.
  • US8538989B1
  • 2013-09-17
  • Семантика и интент

  • Индексация

  • Структура сайта

Как Google (YouTube) ранжирует видео, повышая те, которые начинают сессию просмотра и приводят внешний трафик ("Lead Video")
Google использует систему ранжирования для видеоплатформ, которая идентифицирует "ведущее видео" (Lead Video), инициирующее сессию просмотра. Система применяет повышающие коэффициенты (Scaling Factors) ко времени просмотра этого видео. Видео, привлекшие пользователя на платформу из внешних источников (например, из социальных сетей или поиска Google), получают значительно больший коэффициент, чем те, что были найдены через внутренние рекомендации.
  • US10346417B2
  • 2019-07-09
  • Мультимедиа

  • Поведенческие сигналы

  • SERP

Как Google использует CTR и E-E-A-T сигналы для определения контекста ссылок и оценки качества внешних упоминаний
Google использует двухэтапный механизм для анализа внешних комментариев (например, блог-постов). Сначала система определяет истинный объект обсуждения, если в комментарии несколько ссылок, анализируя CTR, длину URL и тематику. Затем она оценивает качество комментария, используя рейтинг автора, авторитетность источника, свежесть и обратную связь пользователей, чтобы отобрать наиболее релевантный контент.
  • US8656266B2
  • 2014-02-18
  • Ссылки

  • EEAT и качество

  • Свежесть контента

Как Google агрегирует поведенческие данные из похожих запросов для ранжирования редких и длиннохвостых запросов
Google использует механизм обобщения запросов для улучшения ранжирования, особенно когда исторических данных по исходному запросу недостаточно. Система создает варианты запроса (удаляя стоп-слова, используя синонимы, стемминг или частичное совпадение) и агрегирует данные о поведении пользователей (клики, dwell time) из этих вариантов. Это позволяет оценить качество документа для исходного запроса, используя статистику из семантически близких запросов.
  • US9110975B1
  • 2015-08-18
  • Поведенческие сигналы

  • Семантика и интент

  • SERP

Как Google использует историю поиска и браузинга пользователя для персонализации и изменения результатов выдачи
Google записывает историю поиска и просмотров пользователя для последующей персонализации выдачи. Система может повышать в ранжировании ранее посещенные сайты, добавлять в текущую выдачу релевантные результаты из прошлых похожих запросов, а также понижать сайты, которые пользователь ранее видел, но проигнорировал. Патент также описывает создание "предпочитаемых локаций" на основе частоты посещений и времени пребывания на сайте.
  • US9256685B2
  • 2016-02-09
  • Персонализация

  • Поведенческие сигналы

  • SERP

Как Google использует машинное обучение для прогнозирования желаемого типа контента (Web, Images, News) и формирования смешанной выдачи (Universal Search)
Google анализирует исторические журналы поиска (пользователь, запрос, клики), чтобы обучить модель машинного обучения. Эта модель предсказывает вероятность того, что пользователь хочет получить результаты из определенного репозитория (например, Картинки или Новости). Google использует эти прогнозы, чтобы решить, в каких индексах искать и как смешивать результаты на финальной странице выдачи (Universal Search).
  • US7584177B2
  • 2009-09-01
  • Семантика и интент

  • SERP

  • Персонализация

Как Google определяет географическую релевантность сайта по локали ссылающихся на него ресурсов и их аудитории
Google использует географические сигналы ссылающихся сайтов для определения локальной релевантности целевого домена. Система анализирует контент, технические данные и, что важно, географию аудитории ссылающихся ресурсов, чтобы вычислить «Link Based Locale Score». Эта оценка комбинируется с собственными сигналами сайта и используется для повышения позиций в релевантных географических регионах.
  • US8788490B1
  • 2014-07-22
  • Local SEO

  • Ссылки

  • SERP

Как Google классифицирует запросы как навигационные или исследовательские, чтобы регулировать количество показываемых результатов
Google использует систему для динамического определения количества отображаемых результатов поиска. Система классифицирует запрос как навигационный (поиск конкретного места/ресурса) или исследовательский (поиск вариантов). Классификация основана на анализе компонентов оценки релевантности (совпадение по названию vs. категории) и энтропии исторических кликов. При навигационном интенте количество результатов сокращается.
  • US9015152B1
  • 2015-04-21
  • Семантика и интент

  • Поведенческие сигналы

  • Local SEO

Как Google определяет связанность документов с использованием Co-citation, анализа текста вокруг ссылок и паттернов пользовательского доступа
Google использует методы для ограничения результатов поиска на основе заданного контекста (например, набора URL-адресов или категории). Патент детализирует, как система определяет «связанность» между документами, используя такие методы, как анализ совместного цитирования (co-citation), анализ текста, окружающего ссылки в цитирующих документах, и анализ корреляции паттернов доступа пользователей.
  • US7305380B1
  • 2007-12-04
  • Ссылки

  • SERP

  • Поведенческие сигналы

Как Google использует социальные связи для обнаружения ссылочного спама и накрутки кликов
Google может анализировать связи между владельцами сайтов в социальных сетях, чтобы оценить независимость ссылок между их ресурсами. Если владельцы тесно связаны (например, друзья), ссылки между их сайтами могут получить меньший вес в ранжировании, а клики по рекламе могут быть классифицированы как спам (накрутка).
  • US8060405B1
  • 2011-11-15
  • Антиспам

  • Ссылки

  • SERP

seohardcore