SEO HARDCORE
  • Разборы патентов
    • Патенты Google
  • Скоро SEO инструменты
  • Скоро SEO аналитика
  • seohardcore
SEO HARDCORE
назад

Как Google использует данные о показах для оценки эффективности генерации превью и сниппетов

IMPRESSIONS-WEIGHTED COVERAGE MONITORING FOR SEARCH RESULTS (Мониторинг покрытия с взвешиванием по показам для результатов поиска)
  • US8438155B1
  • Google LLC
  • 2011-11-10
  • 2013-05-07
  • SERP
  • Описание
  • Разбор
  • Выводы
  • Практика
  • FAQ
  • Похожие

Google измеряет, насколько полно сгенерированы "быстрые данные для предпросмотра" (сниппеты, превью) для страниц, которые реально показываются пользователям. Патент описывает статистический метод сэмплирования и взвешивания по показам, который позволяет эффективно оценить это "покрытие", уделяя больше внимания популярным страницам.

Описание

Какую проблему решает

Патент решает две связанные проблемы:

  1. Неэффективность распределения ресурсов: Генерация Quick Review Information (например, превью, расширенных сниппетов, визуальных снапшотов) для всех миллиардов документов в индексе ресурсозатратна. Поскольку большинство документов редко или никогда не показываются в результатах поиска, тратить ресурсы на них нецелесообразно.
  2. Точность мониторинга эффективности: Системе необходимо точно измерять, насколько хорошо она предсказывает, для каких документов нужно генерировать Quick Review Information. Из-за крайне неравномерного распределения показов (одни страницы популярны, другие нет), стандартные методы сэмплирования дают высокую дисперсию (variance) и ненадежные результаты оценки. Патент предлагает метод для стабильного и точного измерения этого показателя.

Что запатентовано

Запатентована система (Coverage Evaluator) для мониторинга эффективности генерации Quick Review Information. Суть изобретения — метод статистической оценки "покрытия" (Coverage), который использует сэмплирование и взвешивание на основе количества показов (Impressions) результатов поиска. Это позволяет эффективно и точно определить, какой процент реальных показов пользователям сопровождается предварительно сгенерированной информацией, уделяя должное внимание популярным документам.

Как это работает

Система работает как внутренний инструмент мониторинга:

  • Сбор данных: Система собирает логи активности (Activity Log), фиксируя, какие документы были показаны пользователям (Impressions).
  • Маппинг: Показы привязываются к конкретным документам.
  • Сэмплирование на основе показов: Система случайным образом выбирает подмножество документов для анализа, но вероятность выбора документа тем выше, чем больше у него было показов (Impressions-Based Sampling), используя специфическую формулу вероятности.
  • Взвешивание: Для выбранных документов рассчитываются взвешенные показы (Weighted Impressions) по специальной формуле для коррекции их значимости и компенсации вероятности попадания в выборку.
  • Расчет покрытия: Система проверяет, есть ли у этих документов Quick Review Information (статус Covered), и вычисляет итоговый показатель покрытия как отношение суммы взвешенных показов покрытых документов к общей сумме взвешенных показов в выборке.

Актуальность для SEO

Средняя. Хотя конкретные типы Quick Review Information эволюционировали (от простых превью до сложных SERP features), базовая проблема эффективного распределения ресурсов и необходимость точного мониторинга остаются критически важными для Google. Описанные статистические методы для работы с неравномерно распределенными данными (skewed data) актуальны для инфраструктуры поисковых систем.

Важность для SEO

Влияние на SEO минимальное (2/10). Патент описывает исключительно внутренние процессы мониторинга и инфраструктуру Google. Он не описывает алгоритмы ранжирования или факторы, влияющие на позицию сайта. Для SEO-специалистов он ценен тем, что подтверждает философию Google: ресурсы (включая генерацию сниппетов/превью) распределяются в первую очередь на те документы, которые реально получают показы (Impressions). Если страница невидима для пользователей, Google не будет тратить ресурсы на ее обработку.

Детальный разбор

Термины и определения

Activity Log (Журнал активности)
База данных, регистрирующая поисковые запросы и документы, выбранные для показа пользователям.
Coverage (Покрытие)
Метрика, измеряющая отношение количества результатов поиска, для которых доступна Quick Review Information, к общему количеству результатов поиска. В контексте патента рассчитывается с использованием взвешенных показов.
Coverage Evaluator (Оценщик покрытия)
Система, описанная в патенте, которая вычисляет метрику Coverage.
Coverage Generator (Генератор покрытия)
Компонент поисковой системы, который отвечает за создание Quick Review Information для выбранных документов в индексе.
Covered Portion (Покрытая часть)
Подмножество документов в индексе, для которых Coverage Generator уже создал Quick Review Information.
Impression (Показ)
Факт выбора документа из индекса для предоставления пользователю в ответ на поисковый запрос.
Impressions-Based Sampling (Сэмплирование на основе показов)
Метод выборки, при котором вероятность включения документа в выборку зависит от количества его показов (N).
N (Number of Impressions)
Переменная в формулах, обозначающая количество показов для конкретного результата.
P (Sample Factor / Коэффициент сэмплирования)
Параметр, используемый в формулах для определения вероятности включения документа в выборку и расчета весов.
Quick Review Information (Информация для быстрого обзора)
Данные, генерируемые заранее для помощи пользователю в быстрой оценке результата поиска. Примеры включают сниппеты (snippets), саммари (summaries), визуальные снапшоты (visual snapshots) документа.
Weighted Impressions (Взвешенные показы)
Метрика, полученная путем применения весового коэффициента к количеству показов документа в выборке. Используется для снижения статистической дисперсии при расчете Coverage.

Ключевые утверждения (Анализ Claims)

Патент чисто технический и описывает внутренние процессы мониторинга Google без прямых рекомендаций для SEO. Он фокусируется на статистическом методе оценки эффективности работы компонента Coverage Generator.

Claim 1 (Независимый пункт): Описывает компьютерную систему (Coverage Evaluator) для оценки покрытия результатов поиска.

  1. Система определяет результаты поиска, разделяя их на покрытые (с Quick Review Information) и непокрытые.
  2. Impressions Mapper определяет количество показов (Impressions) для этих результатов и выполняет маппинг.
  3. Impressions Based Sampler выполняет сэмплирование результатов на основе маппированных показов с использованием коэффициента P.
  4. Ключевой механизм сэмплирования: Результат поиска включается в выборку с вероятностью, рассчитываемой по формуле: 1−(1−P)N1-(1-P)^N1−(1−P)N, где N — количество показов результата за период. Это означает, что чем популярнее документ, тем выше вероятность его попадания в выборку.
  5. Weight Calculator взвешивает маппированные показы для каждого результата в выборке.
  6. Ключевой механизм взвешивания: Вес рассчитывается по формуле: (N)(P)[1−(1−P)N]\frac{(N)(P)}{[1-(1-P)^N]}[1−(1−P)N](N)(P)​. Эта формула представляет собой условное ожидаемое количество показов для данного результата в выборке.
  7. Coverage Calculator вычисляет покрытие (Coverage) как отношение покрытых взвешенных показов к общему числу взвешенных показов (включая непокрытые).

Где и как применяется

Изобретение является частью инфраструктуры мониторинга и не участвует в процессе ранжирования в реальном времени. Оно применяется для оценки эффективности работы других компонентов поисковой системы.

INDEXING – Индексирование и Извлечение признаков
На этом этапе работает Coverage Generator, который принимает решение, для каких документов генерировать Quick Review Information, и выполняет эту генерацию. Описанный в патенте Coverage Evaluator используется для оценки эффективности работы Coverage Generator.

RANKING / RERANKING (Сбор данных)
Во время этих этапов, когда результаты предоставляются пользователю, генерируются данные, которые записываются в Activity Log (какие документы были показаны и как часто). Coverage Evaluator использует эти логи как входные данные.

Офлайн-анализ (Мониторинг)
Здесь работает Coverage Evaluator (само изобретение). Он анализирует исторические данные для расчета метрик.

Входные данные:

  • Activity Log: Данные о том, какие документы и как часто показывались пользователям.
  • Index: Информация о статусе покрытия (наличие Quick Review Information) для документов.
  • Sample Factor P: Настраиваемый параметр для сэмплирования.

Выходные данные:

  • Метрика Coverage: Числовое значение (например, процент), показывающее эффективность генерации Quick Review Information для реально показанных результатов.

На что влияет

Патент описывает систему измерения, а не систему влияния на контент или ранжирование.

  • Система влияет исключительно на внутренние метрики Google и помогает инженерам понять, насколько эффективно расходуются ресурсы на генерацию превью и сниппетов.
  • Она не влияет на конкретные типы контента, запросы, ниши или языки напрямую.

Когда применяется

  • Временные рамки: Алгоритм применяется периодически (офлайн) для анализа исторических данных (Activity Log) за определенный период (например, день, неделя).
  • Триггеры активации: Запускается инженерами или автоматизированными системами мониторинга для оценки состояния системы или после внесения изменений в алгоритмы Coverage Generator.

Пошаговый алгоритм

Процесс работы Coverage Evaluator:

  1. Агрегация данных: Система агрегирует журналы активности (Activity Logs) за выбранный период для получения списка результатов поиска и соответствующих им показов.
  2. Предварительное сэмплирование (Опционально): Может быть выполнено консервативное предварительное сэмплирование для уменьшения объема данных, если исходный набор слишком велик.
  3. Маппинг показов: Выполняется привязка общего количества показов (N) к каждому уникальному документу.
  4. Инициализация сэмплирования: Система начинает итерацию по списку документов для формирования выборки.
  5. Расчет вероятности включения: Для текущего документа рассчитывается вероятность включения в выборку на основе коэффициента P и количества показов N по формуле 1−(1−P)N1-(1-P)^N1−(1−P)N.
  6. Принятие решения о включении: Генерируется псевдослучайное число. Если рассчитанная вероятность ниже этого числа, документ добавляется в выборку. В противном случае — отбрасывается.
  7. Завершение сэмплирования: Процесс повторяется для всех документов.
  8. Расчет весов: Для каждого документа в выборке рассчитывается вес (Weighted Impressions) по формуле (N)(P)[1−(1−P)N]\frac{(N)(P)}{[1-(1-P)^N]}[1−(1−P)N](N)(P)​.
  9. Расчет покрытия: Система проверяет статус покрытия каждого документа в выборке.
    • Если документ покрыт (имеет Quick Review Information), его взвешенные показы добавляются в числитель.
    • Взвешенные показы всех документов в выборке добавляются в знаменатель.
  10. Финализация: Рассчитывается итоговая метрика Coverage (Числитель / Знаменатель) и сравнивается с целевым порогом.

Какие данные и как использует

Данные на входе

Патент фокусируется на обработке логов и метаданных индекса.

  • Поведенческие факторы: Ключевыми данными являются Impressions (Показы) — как часто документ появлялся в результатах поиска, извлеченные из Activity Log.
  • Системные данные: Статус покрытия документа (Covered/Non-covered) — булево значение, указывающее, сгенерирована ли для него Quick Review Information.

Никакие контентные, ссылочные или другие SEO-факторы в этом патенте не упоминаются.

Какие метрики используются и как они считаются

  • N (Количество показов): Общее число показов конкретного документа за период.
  • P (Коэффициент сэмплирования): Заранее определенный параметр для настройки выборки.
  • Sampling Inclusion Probability (Вероятность включения в выборку): Рассчитывается по формуле: 1−(1−P)N1-(1-P)^N1−(1−P)N.
  • Weighted Impressions (Взвешенные показы): Рассчитываются по формуле: (N)(P)[1−(1−P)N]\frac{(N)(P)}{[1-(1-P)^N]}[1−(1−P)N](N)(P)​.
  • Coverage (Покрытие): Итоговая метрика. Рассчитывается как отношение суммы взвешенных показов покрытых документов к общей сумме взвешенных показов в выборке.

Выводы

Патент описывает внутренние процессы Google без прямых рекомендаций для SEO.

  1. Инфраструктурный фокус: Патент описывает внутренний механизм мониторинга, а не алгоритм ранжирования. Он предназначен для оценки эффективности работы систем генерации сниппетов и превью (Coverage Generator).
  2. Оптимизация ресурсов как приоритет: Патент подчеркивает, что Google сталкивается с огромным масштабом данных и активно оптимизирует распределение вычислительных ресурсов. Нецелесообразно обрабатывать все документы одинаково.
  3. Показы (Impressions) как драйвер приоритизации: Ключевой вывод заключается в том, что реальные показы документа в поиске являются сигналом для приоритизации ресурсов. Система мониторинга специально сфокусирована на том, чтобы оценить покрытие именно тех документов, которые видят пользователи.
  4. Сложные статистические методы для надежных измерений: Google использует сложные методы сэмплирования и взвешивания (Impressions-Based Sampling, Weighted Impressions) для получения стабильных и надежных внутренних метрик, несмотря на крайне неравномерное распределение популярности веб-страниц (skewed data).

Практика

Best practices (это мы делаем)

Хотя патент инфраструктурный, он подтверждает важность следующих стратегических направлений:

  • Фокус на видимости (Visibility) ключевых страниц: Убедитесь, что ваши важные страницы индексируются и получают показы (Impressions). Если страница не показывается в поиске, Google с меньшей вероятностью выделит ресурсы на ее полную обработку (включая рендеринг и генерацию расширенных сниппетов или превью).
  • Оптимизация краулингового и рендерингового бюджетов: Патент подтверждает, что ресурсы Google конечны. Необходимо управлять тем, как Google сканирует и рендерит сайт, направляя бота на приоритетные страницы, которые должны получать показы.
  • Мониторинг показов в GSC: Регулярно отслеживайте, какие страницы получают показы. Страницы с нулевыми показами являются кандидатами на улучшение или удаление, так как они не являются приоритетными для систем обработки Google, согласно философии оптимизации ресурсов, описанной в патенте.

Worst practices (это делать не надо)

  • Ожидание немедленной обработки контента: Не стоит предполагать, что Google немедленно выделит ресурсы на генерацию всех возможных SERP features для только что опубликованных или малопопулярных страниц. Приоритет отдается контенту, который уже доказал свою востребованность (получает показы).
  • Игнорирование технических проблем, мешающих показам: Если технические проблемы (например, неправильные канонические адреса, проблемы с индексацией) мешают страницам получать показы, это также снижает вероятность выделения ресурсов на генерацию Quick Review Information для них.
  • Фокус на "мусорных" страницах: Тратить усилия на оптимизацию тысяч страниц, которые не имеют показов (например, старые технические дубли), неэффективно. Google также не будет тратить на них свои инфраструктурные ресурсы.

Стратегическое значение

Патент имеет стратегическое значение для понимания инфраструктурных ограничений и философии Google. Он демонстрирует, что Google не обрабатывает весь интернет одинаково. Приоритизация ресурсов основана на данных о востребованности контента (Impressions). Это подтверждает важность концепций Crawl Budget и Render Budget: Google инвестирует вычислительные мощности туда, где ожидает наибольшую отдачу для пользователей. Для долгосрочной SEO-стратегии это означает, что техническое здоровье сайта и создание востребованного контента критичны не только для ранжирования, но и для обеспечения полноценной обработки страниц системами Google.

Практические примеры

Сценарий: Отсутствие расширенных сниппетов у страниц пагинации крупного E-commerce сайта

  1. Ситуация: У интернет-магазина есть тысячи страниц пагинации в категориях. Для первых страниц (1-5) Google показывает расширенные сниппеты (цены, наличие), а для дальних (например, после 20-й) — нет.
  2. Анализ через призму патента: SEO-специалист проверяет Google Search Console и видит, что страницы после 20-й практически не получают показов (Impressions).
  3. Интерпретация: В соответствии с логикой, описанной в патенте, система Coverage Generator приоритизирует ресурсы на основе популярности. Поскольку дальние страницы пагинации редко видят пользователи, Google не тратит ресурсы на генерацию Quick Review Information (расширенных сниппетов) для них.
  4. Действия: Вместо попыток "заставить" Google сгенерировать сниппеты для невостребованных страниц, следует сосредоточиться на улучшении архитектуры сайта (например, улучшение фасетной навигации), чтобы пользователи могли находить товары, не уходя глубоко в пагинацию.

Вопросы и ответы

Что такое "Quick Review Information" в контексте этого патента?

Это любая информация, которую Google генерирует заранее, чтобы помочь пользователю быстро оценить результат поиска. В патенте упоминаются сниппеты (snippets), саммари (summaries) и визуальные снапшоты (visual snapshots) или превью страницы. Сегодня это понятие шире и включает различные SERP features и расширенные сниппеты.

Влияет ли этот патент на ранжирование сайтов?

Нет, этот патент не описывает алгоритмы ранжирования. Он описывает исключительно внутреннюю систему мониторинга, которая измеряет эффективность работы других компонентов поисковой системы (а именно, Coverage Generator). Он не определяет, какие сайты должны быть выше или ниже в выдаче.

Что означает термин "Coverage" (Покрытие) в этом патенте?

Coverage — это метрика, показывающая, какой процент от общего числа показов в поиске сопровождался предварительно сгенерированной Quick Review Information. Цель Google — максимизировать эту метрику, не тратя ресурсы на генерацию данных для страниц, которые никто не видит.

Почему Google использует данные о показах (Impressions) для этого мониторинга?

Показы используются для определения того, какой контент реально видят пользователи. Google стремится обеспечить наилучший пользовательский опыт, что включает предоставление Quick Review Information для востребованных страниц. Мониторинг на основе показов позволяет сфокусироваться на эффективности системы именно в тех областях, которые важны для пользователей.

Зачем нужны сложные методы сэмплирования и взвешивания, описанные в патенте?

Они необходимы из-за крайне неравномерного распределения популярности веб-страниц (одна страница может иметь миллионы показов, другая — один). Стандартное сэмплирование привело бы к высокой дисперсии (variance) и ненадежным результатам измерений. Взвешивание по показам позволяет получить стабильную и точную оценку покрытия, корректно учитывая вклад высокопопулярных страниц.

Каков главный вывод из этого патента для SEO-специалиста?

Главный вывод — подтверждение того, что Google агрессивно экономит свои ресурсы и приоритизирует обработку контента на основе его востребованности (показов). Если ваши страницы не получают показов, они не являются приоритетом для систем Google, включая сканирование, рендеринг и генерацию расширенных сниппетов.

Означает ли высокое покрытие (High Coverage), что сайт будет лучше ранжироваться?

Нет. Высокое покрытие означает, что для большинства показов вашего сайта Google уже сгенерировал Quick Review Information. Это может положительно влиять на CTR (так как результат выглядит привлекательнее), но само по себе не является фактором ранжирования, согласно этому патенту.

Как этот патент связан с краулинговым бюджетом (Crawl Budget)?

Он тесно связан по философии. Как краулинг, так и генерация Quick Review Information требуют ресурсов. Патент показывает, что Google распределяет эти ресурсы, основываясь на популярности контента. Это подтверждает необходимость оптимизации краулингового бюджета, чтобы направить ресурсы Google на самые важные и востребованные страницы сайта.

Работает ли эта система в реальном времени?

Нет. Описанный Coverage Evaluator работает офлайн, анализируя исторические логи активности (Activity Logs). Он используется для периодического мониторинга состояния системы, а не для принятия решений в момент обработки запроса пользователя.

Что делать, если у моего сайта мало показов?

Если у сайта мало показов, это означает, что он плохо виден в поиске по релевантным запросам. В контексте этого патента, такой сайт будет иметь низкий приоритет для выделения ресурсов на генерацию Quick Review Information. Необходимо сосредоточиться на базовых принципах SEO: улучшении качества контента, его релевантности и авторитетности сайта для улучшения ранжирования и увеличения числа показов.

Похожие патенты

Как Google генерирует визуальные превью страниц в выдаче, используя "разрывы страницы" и масштабирование релевантного контента
Google использует систему для создания визуальных превью страниц (Page Previews) в результатах поиска. Система оценивает релевантность контента, учитывая близость ключевых слов и тип контента (например, пессимизируя сноски). Для показа наиболее важных, но разрозненных участков используются "разрывы страницы" (Page Tears). Ключевой контент также может отображаться в увеличенном масштабе для читаемости, помогая пользователю оценить формат страницы до клика.
  • US8954427B2
  • 2015-02-10
  • SERP

  • Семантика и интент

Как Google прогнозирует частоту обновления новых страниц для оптимизации краулингового бюджета
Google использует статистический метод для оценки того, как часто будет обновляться новый документ. Система анализирует исторические данные о частоте изменений похожих документов (например, страниц с аналогичной структурой URL или на том же домене), чтобы определить оптимальную частоту сканирования новой страницы. Это позволяет поддерживать свежесть индекса и эффективно расходовать краулинговый бюджет.
  • US20130212100A1
  • 2013-08-15
  • Краулинг

  • Индексация

  • Свежесть контента

Как Google использует данные о поведении пользователей и длительность кликов для улучшения и переписывания поисковых запросов
Google использует систему для автоматического переписывания запросов пользователей. Система анализирует миллионы прошлых поисковых сессий, чтобы определить, как пользователи уточняли свои запросы и насколько они были удовлетворены результатами (измеряя длительность кликов). На основе этого рассчитывается «Ожидаемая полезность» (Expected Utility) для предложенных вариантов запросов, что позволяет Google предлагать пользователю те формулировки, которые с наибольшей вероятностью приведут к качественному ответу.
  • US7617205B2
  • 2009-11-10
  • Поведенческие сигналы

  • Семантика и интент

  • SERP

Как Google использует данные о выделении текста пользователями (явно или неявно) для генерации сниппетов и анализа контента
Google может собирать данные о том, какие фрагменты текста пользователи выделяют на веб-страницах, используя специальные инструменты или просто выделяя текст мышью. Эти данные агрегируются для определения наиболее важных частей документа. На основе этой "популярности" Google может динамически генерировать поисковые сниппеты, включающие наиболее часто выделяемые фрагменты.
  • US8595619B1
  • 2013-11-26
  • Поведенческие сигналы

  • SERP

Как Google использует вероятностные модели и анализ пользовательского выбора (кликов) для обучения систем ранжирования
Патент Google описывает метод эффективного ранжирования контента (видео или результатов поиска) с использованием парных сравнений. Система моделирует качество как вероятностное распределение и оптимизирует сбор данных. Этот механизм может применяться для интерпретации кликов в поисковой выдаче как сигналов предпочтения, учитывая позицию результата и доверие к пользователю.
  • US8688716B1
  • 2014-04-01
  • SERP

  • Поведенческие сигналы

Популярные патенты

Как Google вычисляет важность сущностей внутри документа, используя контекст, ссылки и поведение пользователей, для улучшения ранжирования
Google использует систему для определения относительной важности сущностей (люди, места, даты) внутри документа (книги или веб-страницы) независимо от поискового запроса. Важность рассчитывается на основе того, где сущность упомянута (контекст, структура), насколько точно она определена, ссылаются ли на этот раздел внешние источники и как часто его просматривают пользователи. Эти оценки важности сущностей затем используются как сигнал для ранжирования самого документа в результатах поиска.
  • US7783644B1
  • 2010-08-24
  • Поведенческие сигналы

  • Индексация

  • Семантика и интент

Как Google интегрирует персональный и социальный контент (Email, посты друзей, календарь) в универсальную поисковую выдачу
Google использует этот механизм для глубокой персонализации поиска, интегрируя релевантный контент из личных источников пользователя (Gmail, Drive, Calendar) и от его социальных связей. Система индексирует этот контент с разрешения пользователя, ранжирует его с учетом социальных сигналов (Affinity) и адаптивно отображает в SERP, смешивая с публичными результатами.
  • US20150310100A1
  • 2015-10-29
  • Персонализация

  • Индексация

  • Поведенческие сигналы

Как Google использует позиционный CTR (Selection Rate) для ранжирования и группировки вертикалей в Универсальном поиске
Google использует механизм для структурирования поисковой выдачи путем группировки результатов по категориям (вертикалям), таким как Новости, Видео или Веб. Система определяет порядок этих категорий, основываясь на ожидаемой частоте кликов (Selection Rate/CTR) тех позиций, которые занимают результаты категории в исходном смешанном ранжировании. Это определяет структуру Универсального поиска (Universal Search).
  • US8498984B1
  • 2013-07-30
  • SERP

  • Поведенческие сигналы

Как Google комбинирует поведенческие сигналы из разных поисковых систем для улучшения ранжирования
Google использует механизм для улучшения ранжирования путем объединения данных о поведении пользователей (клики и время взаимодействия) из разных поисковых систем (например, Веб-поиск и Поиск по Видео). Если в основной системе данных недостаточно, система заимствует данные из другой, применяя весовой коэффициент и фактор сглаживания для контроля смещения и обеспечения релевантности.
  • US8832083B1
  • 2014-09-09
  • Поведенческие сигналы

  • SERP

Как Google использует «Локальный авторитет» для переранжирования документов на основе их взаимосвязей внутри конкретной выдачи
Google может улучшить ранжирование, анализируя структуру ссылок внутри начального набора результатов поиска. Документы, на которые часто ссылаются другие высокорелевантные документы по этому же запросу («локальные эксперты»), получают повышение. Этот процесс включает строгие фильтры для обеспечения независимости этих ссылок-голосов.
  • US6526440B1
  • 2003-02-25
  • Ссылки

  • Антиспам

  • SERP

Как Google динамически фильтрует и изменяет подсказки Autocomplete в реальном времени при вводе навигационного запроса
Google использует систему для оптимизации функции автозаполнения (Autocomplete). При вводе частичного запроса система определяет широкий набор потенциальных навигационных ссылок (Superset) и фильтрует его до узкого подмножества (Subset) на основе сигналов, таких как история поиска, популярность и тип документа. Интерфейс может динамически изменять отображаемые подсказки, если пользователь делает паузу при вводе.
  • US9454621B2
  • 2016-09-27
  • Семантика и интент

  • SERP

  • Поведенческие сигналы

Как Google использует фразы и тематические кластеры из истории пользователя для персонализации результатов поиска
Google может строить модель интересов пользователя, анализируя семантически значимые фразы и тематические кластеры в контенте, который пользователь потребляет (просматривает, сохраняет, печатает). При последующих запросах система повышает в ранжировании те документы, которые содержат фразы, одновременно релевантные запросу и присутствующие в профиле интересов пользователя.
  • US7580929B2
  • 2009-08-25
  • Персонализация

  • Семантика и интент

  • Поведенческие сигналы

Как Google автоматически добавляет текст существующих объявлений к сайтлинкам (Sitelinks) для повышения CTR
Google использует систему для автоматического улучшения сайтлинков в рекламных объявлениях. Система анализирует существующие текстовые объявления (креативы) рекламодателя и определяет их конечные целевые страницы, игнорируя параметры отслеживания. Затем она сопоставляет их с URL сайтлинков и добавляет наиболее релевантный и эффективный текст креатива к сайтлинку для повышения кликабельности (CTR).
  • US10650066B2
  • 2020-05-12
  • Ссылки

  • SERP

Как Google использует контекст пользователя для предложения запросов до начала ввода текста (Zero-Input Queries)
Google анализирует историю поисковых запросов, группируя их в «контекстные кластеры» на основе схожести темы и обстоятельств ввода (время, местоположение, интересы). Когда пользователь открывает строку поиска, система оценивает его текущий контекст и мгновенно предлагает релевантные категории запросов (например, «Кино» или «Рестораны»), предсказывая намерение еще до ввода символов.
  • US10146829B2
  • 2018-12-04
  • Семантика и интент

  • Персонализация

  • Поведенческие сигналы

Как Google использует данные веб-поиска и клики пользователей для классификации бизнесов и построения иерархии категорий
Google анализирует логи веб-поиска (введенные ключевые слова и последующие клики по результатам), чтобы понять, как пользователи интуитивно классифицируют бизнесы. Эти данные используются для автоматического построения динамической иерархической структуры категорий. Эта структура затем применяется для улучшения точности поиска, в частности, для оптимизации моделей распознавания речи в голосовых системах.
  • US7840407B2
  • 2010-11-23
  • Поведенческие сигналы

  • Семантика и интент

  • Структура сайта

seohardcore