SEO HARDCORE
  • Разборы патентов
    • Патенты Google
  • Скоро SEO инструменты
  • Скоро SEO аналитика
  • seohardcore
SEO HARDCORE
назад

Как Google помогает пользователям найти релевантный контент внутри страницы после клика по результату поиска (Scroll-to-Text)

RESOURCE SEARCH OPERATIONS (Операции поиска по ресурсу)
  • US8392449B2
  • Google LLC
  • 2010-07-20
  • 2013-03-05
  • SERP
  • Описание
  • Разбор
  • Выводы
  • Практика
  • FAQ
  • Похожие

Патент описывает механизм (известный как Scroll-to-Text), который автоматически направляет пользователя к фрагменту текста на странице, наиболее релевантному его запросу. Google заранее определяет ключевые фрагменты (Resource Search Tidbits). Если после загрузки страницы эти фрагменты не видны на экране, система активирует навигацию и подсвечивает нужный текст.

Описание

Какую проблему решает

Патент решает проблему сложности поиска конкретной релевантной информации на целевой странице после перехода из результатов поиска. Часто релевантный контент находится глубоко внутри документа и не виден на первом экране (Viewport), особенно на мобильных устройствах. Пользователям приходится вручную прокручивать страницу или использовать функцию поиска браузера (Ctrl+F). Изобретение автоматизирует этот процесс.

Что запатентовано

Запатентована система для улучшения навигации внутри документа после клика на SERP. Она включает серверный компонент (Tidbit Processor), который отбирает релевантные фрагменты текста (Resource Search Tidbits или RST) по определенным правилам. Клиентский компонент (браузер) находит этот текст на загруженной странице и, если текст находится за пределами видимой области, выполняет Resource Search Operation (например, автоматическую прокрутку и выделение).

Как это работает

Система работает в двух фазах:

  • На стороне сервера: Анализируются фрагменты текста (Tidbits), релевантные запросу. Применяются правила отбора (Eligibility Rules) – например, тидбит становится RST, только если он содержит термин запроса, которого нет в заголовке (Title) или URL страницы. RST передаются клиенту вместе с результатами поиска.
  • На стороне клиента (Браузер): После клика пользователя и загрузки страницы, система ищет текст RST в документе. Проверяется пороговое условие (Threshold Condition) – виден ли этот текст в текущем Viewport. Если нет, выполняется Resource Search Operation. Это может быть автоматический скроллинг или отображение вспомогательного интерфейса (Selection Environment).

Актуальность для SEO

Высокая. Описанный механизм лежит в основе функций Google, которые автоматически прокручивают страницу и подсвечивают текст после перехода из поиска (особенно из Featured Snippets). Эта функциональность, широко известная как "Scroll-to-Text", активно используется в современных браузерах и поисковых системах для улучшения пользовательского опыта.

Важность для SEO

Влияние на SEO – умеренное (4/10). Патент описывает улучшение пользовательского опыта (UX) и пост-клик взаимодействия, а не алгоритм ранжирования. Он не влияет напрямую на позиции сайта. Однако он может косвенно влиять на поведенческие сигналы: помогая пользователю быстро найти ответ, система может снижать процент быстрого возврата в выдачу (pogo-sticking), что положительно сказывается на оценке удовлетворенности пользователя.

Детальный разбор

Термины и определения

Eligibility Rules (Правила отбора/пригодности)
Критерии, используемые на стороне сервера для определения того, может ли Tidbit стать Resource Search Tidbit. Основное правило: тидбит должен содержать хотя бы один термин запроса, который отсутствует в Resource Region.
Resource Region (Область ресурса)
Одна или несколько характеристик ресурса, используемых для сравнения с тидбитом в Eligibility Rules. Примеры: Заголовок (Title) ресурса, URL ресурса.
Resource Search Operation (RSO) (Операция поиска по ресурсу)
Действие, выполняемое на стороне клиента после загрузки страницы, если выполнены пороговые условия. Включает отображение Selection Environment, скроллинг и выделение текста.
Resource Search Tidbit (RST)
Фрагмент текста (Tidbit), который прошел проверку Eligibility Rules и был передан клиенту для потенциального выполнения Resource Search Operation.
Selection Environment (Среда выбора)
Элемент пользовательского интерфейса (например, тулбар или оверлей), который отображается на клиентском устройстве и содержит список RST. Позволяет пользователю быстро перейти к соответствующему тексту на странице.
Snippet (Сниппет)
Фрагмент текста, отображаемый в результатах поиска (SERP) для описания ресурса. Может включать один или несколько Tidbits.
Threshold Condition (Пороговое условие)
Условие на стороне клиента, которое должно быть выполнено для активации Resource Search Operation. Основное условие: текст, соответствующий RST, должен находиться за пределами текущего Viewport.
Tidbit (Тидбит/Фрагмент)
Релевантный запросу текст, извлеченный из ресурса. Кандидат для включения в Snippet и для становления Resource Search Tidbit.
Tidbit Processor (Обработчик фрагментов)
Серверный компонент, который анализирует tidbits и применяет Eligibility Rules для генерации RST.
Viewport (Область просмотра)
Видимая пользователю область веб-страницы на экране устройства.

Ключевые утверждения (Анализ Claims)

Claim 1 (Независимый пункт): Описывает общую логику системы (серверную и клиентскую).

  1. Система (сервер) получает запрос, идентифицирует ресурсы и тидбиты.
  2. Для каждого тидбита определяется его пригодность для Resource Search Operation (RSO).
  3. Подходящие тидбиты помечаются как Resource Search Tidbits (RST).
  4. Результаты поиска с RST предоставляются клиентскому устройству (причем RST не обязательно отображаются на SERP).
  5. При выборе результата (клике) клиентское устройство выполняет следующие операции:
    • Рендеринг ресурса.
    • Отбор только тех RST, соответствующий текст которых НЕ находится в Viewport при начальном рендеринге.
    • Только для отобранных RST выполняется RSO: отображение Selection Environment, содержащего опции для навигации к соответствующему тексту.

Claim 4 (Зависимый от 1): Детализирует правила отбора (Eligibility Rules).

Тидбит признается пригодным (становится RST), если в нем есть хотя бы один термин запроса, который НЕ найден в заголовке (Title) ресурса.

Claim 6 (Зависимый от 1): Расширяет правила отбора.

Тидбит признается пригодным, если в нем есть хотя бы один термин запроса, который НЕ найден ни в заголовке (Title), ни в URL ресурса.

Claim 9 (Независимый пункт): Описывает процесс на стороне клиентского устройства.

  1. Получение страницы результатов поиска, содержащей RST.
  2. Получение выбора пользователя (клика) и рендеринг ресурса.
  3. Для каждого RST: идентификация соответствующего текста в ресурсе и определение, находится ли этот текст за пределами Viewport.
  4. Только для RST, текст которых находится за пределами Viewport, выполняется RSO (отображение Selection Environment).

Claim 10 и 11 (Зависимые от 9): Описывают механизм нечеткого поиска (Fuzzy Matching).

При идентификации текста RST на странице, клиент сначала ищет точное совпадение. Если оно не найдено (например, страница изменилась с момента индексации), система идентифицирует текст, который "наиболее близко соответствует" (closest match) RST. Это определяется как текст с минимальным редакционным расстоянием (minimum edit distance).

Где и как применяется

Изобретение затрагивает этап индексирования, финальные этапы обработки запроса на сервере и, что наиболее важно, взаимодействие на стороне клиента.

INDEXING – Индексирование и извлечение признаков
На этом этапе извлекается текст, заголовки (Title) и URL. Эти данные необходимы для последующей генерации тидбитов.

RANKING / RERANKING (Серверная часть)
После того как ресурсы отобраны и ранжированы, активируется Tidbit Processor. Он анализирует контент и метаданные ресурсов (Title, URL) относительно запроса для генерации Resource Search Tidbits (RSTs), применяя Eligibility Rules. Это происходит до отправки результатов пользователю.

CLIENT-SIDE (Основное применение)
Основная логика патента реализуется в браузере пользователя после клика на результат поиска:

  1. Поиск совпадений: Браузер ищет текст RST в загруженном документе (используя точное или нечеткое совпадение).
  2. Проверка условий: Браузер определяет координаты найденного текста и сравнивает их с границами Viewport (Threshold Condition).
  3. Активация UI: Если текст не виден, активируется Resource Search Operation (например, Selection Environment).
  4. Навигация: Браузер выполняет скроллинг и подсветку текста.

Входные данные (Сервер):

  • Запрос пользователя.
  • Ресурсы, релевантные запросу.
  • Извлеченные Tidbits.
  • Метаданные ресурса (Title, URL).

Выходные данные (Сервер):

  • Страница результатов поиска (SERP), обогащенная данными RST (которые могут быть не видны пользователю, но доступны через DOM или переданы иным способом).

На что влияет

  • Конкретные типы контента: Наибольшее влияние оказывается на длинные текстовые документы (лонгриды, статьи, инструкции, документация), где ключевая информация может находиться глубоко внутри страницы.
  • Специфические запросы: Наиболее полезно для информационных запросов, подразумевающих поиск конкретного факта или инструкции внутри большого документа.
  • Устройства: Критически важно для мобильных устройств с маленьким Viewport, где большая часть контента скрыта при загрузке.

Когда применяется

Алгоритм применяется при выполнении двух наборов условий:

  1. Условия на сервере (Генерация RST): Активируется, если система находит Tidbit, который удовлетворяет Eligibility Rules. Это происходит, когда релевантный текст содержит термины запроса, которые отсутствуют в заголовке (Title) и/или URL страницы.
  2. Условия на клиенте (Активация UI): Активируется после клика, если текст, соответствующий RST, находится за пределами видимой области экрана (Viewport) при первоначальной загрузке страницы (Threshold Condition). Если ответ виден сразу, интерфейс не активируется.

Пошаговый алгоритм

Процесс А: Генерация RST (Сервер / Tidbit Processor)

  1. Получение данных: Система получает запрос, список релевантных ресурсов и извлеченные Tidbits для каждого ресурса.
  2. Инициализация проверки: Начало цикла обработки тидбитов для ресурса.
  3. Идентификация терминов в регионе: Определение терминов запроса, присутствующих в Resource Region (Title и/или URL ресурса).
  4. Сравнение (Eligibility Rule): Сравнение терминов запроса в тидбите с терминами в Resource Region.
  5. Проверка условия: Определяется, существует ли хотя бы один термин запроса в тидбите, который отсутствует в Resource Region.
    • Если ДА: Тидбит помечается как Resource Search Tidbit (RST).
    • Если НЕТ: Тидбит игнорируется для этой операции.
  6. Завершение: После обработки всех тидбитов и ресурсов, система предоставляет результаты поиска клиенту, включая сгенерированные RST.

Процесс Б: Обработка клика (Клиент / Браузер)

  1. Ассоциация (На SERP): Браузер обрабатывает DOM страницы результатов поиска, ассоциирует каждый URL с его RST и сохраняет эту ассоциацию (Claim 15).
  2. Получение клика и загрузка: Пользователь кликает на результат, браузер загружает и рендерит ресурс.
  3. Получение RST: Браузер извлекает RST, ассоциированные с данным URL.
  4. Поиск текста на странице: Браузер ищет текст RST в загруженном ресурсе. Сначала ищется точное совпадение. Если не найдено, используется нечеткий поиск (closest match, minimum edit distance).
  5. Проверка порогового условия (Threshold Condition): Для каждого найденного фрагмента текста определяется его положение на странице. Сравнивается с границами текущего Viewport.
  6. Активация RSO: Если текст находится за пределами Viewport, он добавляется в Selection Environment.
  7. Отображение UI: Если Selection Environment не пуст, он отображается пользователю (или выполняется автоматический скроллинг).
  8. Навигация: При взаимодействии пользователя браузер выполняет скроллинг к соответствующему тексту и подсвечивает его.

Какие данные и как использует

Данные на входе

  • Контентные факторы:
    • Текст ресурса: Используется для извлечения Tidbits (сервер) и поиска совпадений (клиент).
    • Заголовок страницы (Title Tag): Критически важен для Eligibility Rules. Наличие термина запроса в Title может заблокировать генерацию RST.
  • Технические факторы:
    • URL ресурса: Может использоваться в Eligibility Rules как часть Resource Region.
  • Пользовательские факторы (На стороне клиента):
    • Размер Viewport устройства: Используется для Threshold Condition (определения видимости контента).

Какие метрики используются и как они считаются

  • Eligibility Rule (Правило отбора): Булева метрика, основанная на сравнении множеств терминов. Математически это можно выразить как проверку того, что разность множеств терминов запроса в тидбите и терминов запроса в Resource Region не пуста: (TermsTidbit∖TermsRegion)≠∅(Terms_{Tidbit} \setminus Terms_{Region}) \neq \emptyset(TermsTidbit​∖TermsRegion​)=∅. Упоминается возможность использования синонимов и словоформ при этом сравнении.
  • Threshold Condition (Пороговое условие): Булева метрика, основанная на сравнении координат текста с границами Viewport.
  • Edit Distance (Редакционное расстояние): Используется на стороне клиента для нечеткого поиска текста RST (Closest Match), если точное совпадение не найдено.

Выводы

  1. Пост-клик UX как часть поиска: Google рассматривает опыт пользователя после ухода с SERP как важную часть поискового процесса и стремится его оптимизировать, сокращая время до получения ответа (Time-to-Answer).
  2. Интеллектуальная активация (Eligibility Rules): Функция активируется только тогда, когда система считает ее полезной – а именно, когда заголовок (Title) или URL страницы не полностью отражают релевантность контента запросу. Если Title идеально совпадает с запросом, система предполагает, что помощь в навигации не требуется.
  3. Условная активация (Threshold Condition): Интерфейс помощи активируется только если релевантный контент скрыт от глаз пользователя (вне Viewport).
  4. Зависимость от клиентской стороны: Реализация функции зависит от возможностей браузера по анализу структуры страницы (DOM), определению видимости контента и управлению навигацией.
  5. Устойчивость к изменениям контента: Патент предусматривает механизм обработки ситуаций, когда контент страницы изменился с момента индексации, используя нечеткий поиск (Closest Match) для нахождения наиболее похожего фрагмента.

Практика

Best practices (это мы делаем)

  • Оптимизация структуры лонгридов: Используйте четкую иерархию заголовков (Hn) для разделения контента на логические блоки. Это помогает поисковым системам легче извлекать релевантные Tidbits и может способствовать активации этой функции, улучшая навигацию для пользователей.
  • Создание четких ответов (Оптимизация под пассажи): Формулируйте абзацы так, чтобы они давали прямые и ясные ответы на конкретные запросы пользователей. Такие абзацы являются идеальными кандидатами на роль Resource Search Tidbits (RST) и часто используются в Featured Snippets, которые активируют эту технологию.
  • Обеспечение технической стабильности (Core Web Vitals): Минимизируйте сдвиги макета (CLS). Если макет сильно смещается во время загрузки, клиентский механизм может некорректно определить положение текста относительно Viewport, что приведет к сбоям в работе функции скроллинга.
  • Обеспечение глубины контента: Убедитесь, что основной контент предоставляет значительно больше деталей, чем Title. Eligibility Rules предполагают, что функция активируется, когда контент содержит важные термины запроса, отсутствующие в Title/URL.

Worst practices (это делать не надо)

  • Скрытие основного контента по умолчанию: Использование вкладок, "аккордеонов" или динамической подгрузки для скрытия основного контента может помешать как извлечению Tidbits на стороне сервера, так и корректной работе механизма поиска и скроллинга на стороне клиента.
  • Поверхностный контент (Thin Content): Создание страниц, где весь релевантный текст сосредоточен в заголовке, а тело документа не добавляет ценности. Такие страницы вряд ли сгенерируют RST, так как не будут выполнены Eligibility Rules.
  • Нестандартная реализация прокрутки: Использование нестандартных JavaScript-решений для управления прокруткой страницы может помешать браузеру корректно выполнить Resource Search Operation.

Стратегическое значение

Патент подтверждает долгосрочную стратегию Google по фокусу на удовлетворении интента пользователя на уровне отдельных пассажей (фрагментов текста). Хотя описанный механизм не является фактором ранжирования, он напрямую влияет на удовлетворенность пользователя. Оптимизация контента под подобные UX-механизмы (как Scroll-to-Text) улучшает взаимодействие с сайтом, снижает отказы и косвенно поддерживает общую SEO-стратегию, направленную на создание полезного и хорошо структурированного контента.

Практические примеры

Сценарий: Активация функции для статьи-инструкции (Контраст)

Запрос пользователя: "как очистить кэш dns в windows 10"

Вариант А (Не оптимально для RST):

  • Title: Как очистить кэш DNS в Windows 10
  • URL: /kak-ochistit-cache-dns-windows-10
  • Результат: Eligibility Rules не выполняются, так как все термины запроса есть в Title и URL. RST не генерируется. Пользователь сам ищет инструкцию на странице.

Вариант Б (Оптимально для RST):

  • Title: Полное руководство по управлению DNS в Windows
  • URL: /windows/dns-guide
  • Tidbit (в середине статьи): "...Чтобы очистить кэш DNS в Windows 10, откройте командную строку..."
  • Результат: Термины "очистить", "кэш", "10" отсутствуют в Title/URL. Eligibility Rule выполняется. Тидбит помечается как RST. Если этот текст находится вне Viewport при загрузке, пользователь увидит автоматический скроллинг или Selection Environment, ведущий к этому фрагменту.

Вопросы и ответы

Влияет ли описанный механизм напрямую на ранжирование сайта?

Нет, напрямую не влияет. Патент описывает улучшение пользовательского опыта (UX) после клика на результат поиска, а не алгоритм, определяющий позиции сайтов в выдаче. Однако улучшение навигации может положительно сказаться на поведенческих факторах (например, снижение показателя отказов), что косвенно полезно для SEO.

Что такое "Eligibility Rules" (Правила отбора) и почему они важны?

Eligibility Rules – это правила, по которым система решает, нужно ли активировать эту функцию для конкретного фрагмента текста. Основное правило: функция активируется, если фрагмент содержит ключевые слова из запроса, которых НЕТ в заголовке (Title) или URL страницы. Это важно, потому что система стремится помогать пользователю только тогда, когда релевантность контента не очевидна из его заголовка.

Является ли этот патент описанием функции Google "Scroll-to-Text"?

Да, этот патент описывает базовую механику, которая лежит в основе функции "Scroll-to-Text" и подсветки фрагментов текста после перехода из поиска (особенно из Featured Snippets). Хотя интерфейс в патенте (Selection Environment) может отличаться от текущей реализации Google, логика отбора фрагментов и условия активации идентичны.

Почему эта функция иногда не срабатывает, даже если страница релевантна?

Есть две основные причины, описанные в патенте. Первая (Eligibility Rules): если все термины запроса уже присутствуют в Title страницы, система может решить, что помощь не требуется. Вторая (Threshold Condition): если релевантный текст уже виден на первом экране (в Viewport) при загрузке страницы, функция не активируется.

Как оптимизировать контент, чтобы эта функция чаще срабатывала для моего сайта?

Необходимо создавать подробный, хорошо структурированный контент. Используйте логичные подзаголовки и формулируйте абзацы так, чтобы они давали прямые ответы на конкретные вопросы. Это облегчает извлечение Tidbits. Также убедитесь, что ваш основной контент содержит детали, которые выходят за рамки общего Title.

Что произойдет, если контент на моем сайте часто обновляется?

Патент предусматривает такую ситуацию. Если сервер отправил RST, а клиент не может найти точное совпадение текста на загруженной странице (потому что он изменился), клиент активирует режим нечеткого поиска (Closest Match). Он найдет фрагмент, который наиболее похож на исходный RST.

Может ли техническая реализация сайта помешать работе этой функции?

Да. Если ваш сайт имеет нестабильную верстку (высокий CLS), медленно рендерится или использует нестандартные механизмы прокрутки, это может помешать браузеру корректно определить положение текста и выполнить операцию скроллинга.

Обязательно ли RST должен совпадать с текстом сниппета в выдаче?

Нет, не обязательно. В патенте указано, что Resource Search Tidbit может быть независим от текста сниппета, отображаемого в SERP. Система может выбрать один фрагмент для показа в выдаче (сниппет), а другой, более подходящий по Eligibility Rules, использовать для навигации внутри страницы (RST).

Как технически реализована связь между результатом поиска и фрагментом текста на странице?

Патент предлагает (Claim 15), что когда пользователь находится на странице SERP, браузер анализирует ее структуру (DOM) и сохраняет в памяти ассоциации между URL результатов и соответствующими им RST. Когда пользователь кликает на URL, браузер использует эту сохраненную ассоциацию, чтобы знать, какой именно текст искать на загруженной странице.

Работает ли этот механизм на мобильных устройствах?

Да, и он особенно важен для мобильных устройств. Из-за маленького размера экрана (Viewport) вероятность того, что релевантный контент окажется "за кадром", значительно выше, что делает автоматический скроллинг более полезным для пользователя.

Похожие патенты

Как Google использует "искусственные анкоря" для перехода и подсветки конкретного фрагмента текста на странице (Scroll-To-Text)
Патент Google, описывающий механизм прямой навигации к релевантному фрагменту (сниппету) внутри целевой страницы после клика по результату поиска. Система добавляет к URL "искусственный анкорь", который инструктирует браузер пользователя прокрутить страницу до нужного места и выделить текст, даже если автор сайта не создавал там анкорь.
  • US8150824B2
  • 2012-04-03
  • SERP

Как Google определяет наиболее релевантную часть документа, игнорируя ключевые слова из Title и URL
Google использует механизм для определения самой важной части страницы по запросу пользователя. Система классифицирует слова запроса на «навигационные» (если они есть в Title или URL) и «информационные». При анализе контента внутри страницы вес «навигационных» слов снижается или обнуляется, позволяя точнее выделить конкретный фрагмент текста, содержащий ответ.
  • US8005825B1
  • 2011-08-23
  • Семантика и интент

Как Google использует персональные выделения контента и поведение чтения для гиперперсонализации поисковой выдачи
Google отслеживает, какой текст пользователи выделяют на веб-страницах и как они читают контент (включая скорость прокрутки и потенциально отслеживание взгляда). Эта информация используется для глубокой персонализации будущих поисковых запросов: система аннотирует знакомые результаты, использует содержание выделенного текста для подбора другого релевантного контента и автоматически возвращает пользователя к последнему просмотренному фрагменту.
  • US11514126B2
  • 2022-11-29
  • Персонализация

  • Поведенческие сигналы

  • SERP

Как Google анализирует видимый контент на экране пользователя для предоставления контекстной информации без ввода запроса (Contextual Search)
Google использует механизм для анализа контента, активно отображаемого на экране устройства (веб-страницы, приложения, чаты). По общему триггеру (например, долгое нажатие или жест) система идентифицирует ключевые сущности только в видимой области. Она определяет их важность на основе визуального представления (размер, цвет, позиция) и типа контента, причем логика определения важности адаптируется (например, в чате приоритет у недавних сообщений внизу экрана).
  • US11003667B1
  • 2021-05-11
  • Семантика и интент

  • Knowledge Graph

Как Google генерирует визуальные превью страниц в выдаче, используя "разрывы страницы" и масштабирование релевантного контента
Google использует систему для создания визуальных превью страниц (Page Previews) в результатах поиска. Система оценивает релевантность контента, учитывая близость ключевых слов и тип контента (например, пессимизируя сноски). Для показа наиболее важных, но разрозненных участков используются "разрывы страницы" (Page Tears). Ключевой контент также может отображаться в увеличенном масштабе для читаемости, помогая пользователю оценить формат страницы до клика.
  • US8954427B2
  • 2015-02-10
  • SERP

  • Семантика и интент

Популярные патенты

Как Google собирает и структурирует данные о поведении пользователей в Поиске по картинкам (включая ховеры, клики и 2D-позицию)
Патент Google описывает инфраструктуру для детального сбора данных в Поиске по картинкам. Система фильтрует общие логи, фиксируя не только клики, но и наведение курсора (ховеры), длительность взаимодействия и точное 2D-расположение (строка/столбец) изображения на выдаче. Эти данные агрегируются в Модель Запросов Изображений для оценки релевантности.
  • US8898150B1
  • 2014-11-25
  • Поведенческие сигналы

  • SERP

  • Мультимедиа

Как Google использует контекст пользователя для предоставления информации без явного запроса (Технология предиктивного поиска)
Google использует технологию предиктивного (проактивного) поиска, которая анализирует текущий контекст пользователя (местоположение, время, календарь, скорость движения, привычки) для автоматического предоставления релевантной информации. Система реагирует на «запрос без параметров» (например, открытие приложения или простое действие с устройством) и самостоятельно определяет информационные потребности пользователя.
  • US8478519B2
  • 2013-07-02
  • Персонализация

  • Семантика и интент

  • Поведенческие сигналы

Как Google перенаправляет пользователей на «идеальные» запросы (KHRQ), анализируя поведение и удовлетворенность
Google анализирует логи запросов, чтобы определить «известные высокоранжированные запросы» (KHRQ) — те, которые пользователи вводят часто и которыми остаются довольны (редко переформулируют или долго изучают результаты). Система вычисляет вероятность того, что исходный запрос пользователя лучше заменить на KHRQ, основываясь на сходстве запросов и исторических цепочках переформулировок. Это позволяет направлять пользователей к наиболее эффективным формулировкам.
  • US7870147B2
  • 2011-01-11
  • Семантика и интент

  • Поведенческие сигналы

  • SERP

Как Google использует данные о совместном посещении сайтов (Co-Visitation) для персонализации и повышения релевантности выдачи
Google использует поведенческие данные сообщества пользователей для определения тематической связи между сайтами. Если пользователи часто посещают Сайт А и Сайт Б в течение короткого промежутка времени (Co-Visitation), система создает "Вектор повышения" (Boost Vector). Этот вектор используется для повышения в выдаче тематически связанных сайтов, основываясь на истории посещений пользователя или контексте текущего сайта, улучшая персонализацию и релевантность.
  • US8874570B1
  • 2014-10-28
  • Поведенческие сигналы

  • Персонализация

  • SERP

Как Google использует историю местоположений для определения физической активности пользователя и гиперперсонализации поиска
Google анализирует историю перемещений пользователя (местоположения и скорость), чтобы определить его текущую физическую активность (например, поход, шоппинг) и способ передвижения (например, пешком, на автобусе). Эта информация используется для радикальной персонализации: система корректирует ранжирование результатов, изменяет запросы и формирует подсказки, чтобы они соответствовали контексту реальных действий пользователя.
  • US20150006290A1
  • 2015-01-01
  • Поведенческие сигналы

  • Персонализация

  • Local SEO

Как Google вычисляет тематический авторитет автора (Author Rank) на основе его вклада в контент
Google патентует систему для количественной оценки экспертности авторов по конкретным темам. Система анализирует документы, определяет их тематику (Topic) и вес этой тематики (Weight), а затем учитывает долю вклада (Authorship Percentage) каждого автора в раскрытие этой темы. На основе этих данных формируется кумулятивный «Сигнал Авторитета» (Authority Signature) автора, позволяющий идентифицировать экспертов в различных областях.
  • US8458196B1
  • 2013-06-04
  • EEAT и качество

  • Семантика и интент

Как Google использует распределение кликов по разным типам запросов для оценки общего качества сайта (Website Quality Score)
Google оценивает качество сайта не по общему CTR, а по тому, в ответ на какие запросы он получает клики. Система сегментирует пользовательский фидбек (клики, CTR) по различным параметрам запроса (например, конкурентность, длина, популярность). Сайт считается качественным, если он получает много кликов в ответ на высококонкурентные и популярные запросы, а не только на низкочастотные или нечеткие.
  • US8615514B1
  • 2013-12-24
  • Поведенческие сигналы

Как Google использует "ложные пропуски" (Fake Skips) для точной оценки качества своих правил синонимов
Google анализирует поведение пользователей для оценки качества синонимов, используемых при переписывании запросов. Патент вводит метрику "Fake Skip" (Ложный пропуск). Она фиксируется, если пользователь пропустил результат с синонимом, но кликнул на результат ниже, который также содержит этот синоним и исходный термин. Это позволяет точнее калибровать систему синонимов и не пессимизировать хорошие правила из-за неоднозначного поведения пользователей.
  • US8909627B1
  • 2014-12-09
  • Поведенческие сигналы

  • Семантика и интент

  • SERP

Как Google использует личные интересы пользователя для понимания неопределенных запросов и персонализации рекомендаций
Google использует механизм для интерпретации неопределенных запросов или команд (например, «Я голоден» или «Мне скучно»), когда контекст неясен. Если система не может определить конкретное намерение пользователя только из текущего контента (например, экрана приложения), она обращается к профилю интересов пользователя (User Attribute Data) и его местоположению, чтобы заполнить пробелы и предоставить персонализированные рекомендации или выполнить действие.
  • US10180965B2
  • 2019-01-15
  • Персонализация

  • Семантика и интент

  • Local SEO

Как Google использует контекст внешних страниц для понимания и идентификации видео и аудио контента
Google анализирует внешние веб-страницы, которые ссылаются на медиафайлы или встраивают их (например, видео YouTube). Система извлекает метаданные из контекста этих страниц — заголовков, окружающего текста, URL. Надежность данных проверяется частотой их повторения на разных сайтах. Эта информация используется для улучшения понимания содержания медиафайла и повышения эффективности систем идентификации контента (Content ID).
  • US10318543B1
  • 2019-06-11
  • Ссылки

  • Индексация

  • Мультимедиа

seohardcore