SEO HARDCORE
  • Разборы патентов
    • Патенты Google
  • Скоро SEO инструменты
  • Скоро SEO аналитика
  • seohardcore
SEO HARDCORE
назад

Как Google в реальном времени перестраивает поисковые подсказки (Autocomplete) на основе прямых эфиров и трансляций

USING LIVE INFORMATION SOURCES TO RANK QUERY SUGGESTIONS (Использование живых источников информации для ранжирования поисковых подсказок)
  • US20150149482A1
  • Google LLC
  • 2013-03-14
  • 2015-05-28
  • Свежесть контента
  • Семантика и интент
  • Мультимедиа
  • SERP
  • Описание
  • Разбор
  • Выводы
  • Практика
  • FAQ
  • Похожие

Google отслеживает прямые эфиры (ТВ, радио, стримы) и извлекает из них ключевые темы и сущности. Система использует эту информацию для повышения в реальном времени релевантных поисковых подсказок (Autocomplete), адаптируя их под текущие события. Это также помогает валидировать всплески поискового интереса (query spikes).

Описание

Какую проблему решает

Патент решает проблему неактуальности стандартных поисковых подсказок (Autocomplete/Google Suggest) во время значимых живых событий. Стандартные подсказки обычно основаны на исторической популярности запросов и не могут быстро адаптироваться к внезапному всплеску интереса, вызванному событиями в прямом эфире (например, спортивные матчи, ТВ-шоу, экстренные новости). Изобретение улучшает пользовательский опыт (особенно поведение «второго экрана»), предлагая более релевантные и актуальные подсказки в реальном времени.

Что запатентовано

Запатентована система для динамического ранжирования поисковых подсказок (query suggestions) на основе анализа "живых источников информации" (live information sources), таких как ТВ, радио и стримы. Система в реальном времени извлекает "репрезентативные признаки" (representative features) из прямых эфиров и повышает в ранжировании те подсказки, которые схожи с этими признаками.

Как это работает

Система работает следующим образом:

  • Мониторинг: Live Source Processing Engine непрерывно отслеживает живые источники информации.
  • Извлечение признаков: Система анализирует контент в реальном времени, используя различные методы: анализ субтитров (closed captioning), фонетический анализ аудио (распознавание речи), распознавание образов в видео или метаданные трансляции.
  • Идентификация сущностей: Извлеченные признаки могут быть сопоставлены с Entity Database для понимания контекста и связанных тем.
  • Обработка запроса: Когда пользователь вводит частичный запрос, Query Suggestion Processing Engine сравнивает стандартные подсказки с извлеченными признаками.
  • Динамическое ранжирование: Подсказки, имеющие высокую схожесть (similarity) с актуальными признаками живого эфира, получают повышение (boost).
  • Модификаторы: Ранжирование корректируется с учетом популярности эфира и времени, прошедшего с момента трансляции (Time Decay).

Актуальность для SEO

Высокая. Адаптация к трендам и событиям в реальном времени критически важна для поисковых систем. Поведение пользователей, ищущих информацию о том, что они смотрят в данный момент («второй экран»), является распространенным. Этот механизм напрямую поддерживает актуальность в поисковых подсказках.

Важность для SEO

Влияние на SEO среднее-высокое (7/10). Патент не описывает механизмы ранжирования органической выдачи. Однако он критически влияет на то, какие именно запросы пользователи выберут во время живых событий. Это напрямую определяет направление поискового трафика в моменте и имеет большое значение для новостных сайтов, управления репутацией брендов и стратегий маркетинга в реальном времени (RTM).

Детальный разбор

Термины и определения

Associated Information (Связанная информация)
Дополнительные данные о живом источнике, которые не могут быть идентифицированы напрямую из его контента. Примеры: популярность (popularity data), жанр, демография аудитории, временной интервал трансляции.
Entity Database (База данных сущностей)
Хранилище данных о сущностях (люди, места, концепции) и их свойствах (например, Knowledge Graph). Используется для обогащения извлеченных признаков и понимания контекста.
Live Feed Time (Время прямого эфира)
Временная метка, указывающая, когда источник информации транслировался в прямом эфире. Используется для расчета затухания (decay) влияния события.
Live Information Source (Живой источник информации)
Источник информации, транслируемый для аудитории в реальном времени. Примеры: телевизионная трансляция, радиоэфир, интернет-стриминг.
Live Source Processing Engine
Компонент системы, отвечающий за идентификацию живых источников, анализ их контента и извлечение репрезентативных признаков.
Query Spike (Всплеск запроса)
Резкое увеличение количества пользователей, отправляющих определенный поисковый запрос, превышающее пороговое значение.
Query Suggestion (Поисковая подсказка)
Потенциальный полный запрос, предлагаемый пользователю при вводе частичного запроса (Autocomplete).
Representative Feature (Репрезентативный признак)
Ключевой элемент (термин, фраза, свойство сущности), извлеченный из живого источника информации и характеризующий его текущее содержание.

Ключевые утверждения (Анализ Claims)

Claim 1 (Независимый пункт): Описывает основной метод адаптации подсказок.

  1. Идентификация живого источника информации (live information source).
  2. Идентификация репрезентативного признака (representative feature) этого источника.
  3. Идентификация запроса пользователя (сформулированного независимо от источника).
  4. Идентификация набора поисковых подсказок на основе этого запроса.
  5. Ранжирование подсказок. Ранжирование основано на схожести (similarity) между подсказкой и репрезентативным признаком.
  6. Выбор подсказок для предоставления пользователю.

Claim 3, 4, 5 (Зависимые): Детализируют методы извлечения признаков. Признак может быть идентифицирован через текстовую информацию (Claim 3), в частности, через поток субтитров (closed captioning feed) (Claim 4), или через распознавание образов (image recognition) видеоисточника (Claim 5).

Claim 9 (Зависимый): Уточняет, что признак может быть идентифицирован через ассоциацию контента с признаком в Entity Database. Это позволяет системе использовать свойства сущностей как признаки.

Claim 10, 11, 12 (Зависимые): Описывают использование дополнительной информации (Associated Information). Ранжирование может основываться на данных, не идентифицируемых напрямую из контента, таких как временной интервал трансляции (Claim 11) или данные о популярности (popularity data) (Claim 12).

Claim 14 и 16 (Зависимые): Вводят временной фактор (Time Decay). Идентифицируется время прямого эфира (live feed time). Ранжирование основывается на времени, прошедшем с момента эфира (time passage). Вероятность выбора подсказки уменьшается по мере увеличения прошедшего времени (Claim 16).

Claim 17 (Независимый пункт): Описывает метод валидации всплесков запросов.

  1. Идентификация потенциального всплеска поискового запроса (potential search query spike).
  2. Идентификация живого источника и его репрезентативного признака.
  3. Определение того, является ли потенциальный всплеск реальным (actual search query spike), на основе схожести между запросом и признаком.

Где и как применяется

Изобретение применяется на стыке сбора данных в реальном времени и понимания запросов для обеспечения работы функции Autocomplete.

CRAWLING – Сканирование и Сбор данных
Система осуществляет непрерывный мониторинг и обработку потоков данных от живых источников информации (ТВ, радио, стримы) в реальном времени.

INDEXING – Индексирование и извлечение признаков
Live Source Processing Engine выполняет извлечение Representative Features из потока данных. Эти признаки аннотируются и могут быть связаны с данными из Entity Database.

QUNDERSTANDING – Понимание Запросов
Это основной этап применения. Система использует извлеченные признаки для динамического ранжирования списка поисковых подсказок в ответ на частичный запрос пользователя. Также механизмы патента используются для анализа трендов и валидации Query Spikes.

Входные данные:

  • Потоки данных от живых источников (аудио, видео, текст, метаданные).
  • Частичный запрос пользователя.
  • Entity Database.
  • Associated Information Database (данные о популярности эфиров, расписании).

Выходные данные:

  • Отранжированный список поисковых подсказок, адаптированный к текущим событиям в прямом эфире.
  • Данные о валидированных всплесках запросов (актуальные тренды).

На что влияет

  • Конкретные ниши и тематики: Наибольшее влияние оказывается на ниши, связанные с событиями в реальном времени: новости, спорт, развлечения (церемонии награждения, популярные шоу), политика. Также влияет на бренды, запускающие рекламу во время крупных живых событий.
  • Специфические запросы: Влияет на подсказки по запросам, связанным с именами персон, названиями событий, продуктами и темами, которые активно обсуждаются в прямом эфире.

Когда применяется

  • Условия работы: Алгоритм активируется при наличии активного живого источника информации, который анализируется системой.
  • Триггеры активации: Идентификация значимых Representative Features в прямом эфире и получение частичного запроса от пользователя, для которого есть релевантные подсказки.
  • Пороговые значения: Система может учитывать популярность (popularity data) источника. При низкой популярности влияние на ранжирование подсказок может быть снижено.
  • Временные рамки: Бустинг применяется в основном во время трансляции и в течение определенного периода после нее (ожидаемое время просмотра аудиторией, viewing window time). Патент явно указывает на механизм затухания (Time Decay) – эффект снижается со временем (в патенте упоминается пример в 24 часа).

Пошаговый алгоритм

Процесс А: Обработка живого источника (непрерывный процесс)

  1. Сбор данных: Система идентифицирует и подключается к живым источникам информации.
  2. Извлечение контента: Live Source Processing Engine анализирует контент с использованием одного или нескольких методов: парсинг субтитров, фонетический анализ аудиопотока, распознавание образов в видеопотоке, анализ метаданных.
  3. Идентификация Репрезентативных Признаков (Прямая): Выделение ключевых терминов и фраз из контента. Может использоваться взвешивание терминов (например, на основе частоты, контекста, TF-IDF).
  4. Идентификация Репрезентативных Признаков (Через Сущности): Сопоставление извлеченного контента с Entity Database. Идентификация связанных сущностей и их свойств, которые также становятся активными признаками. (Например, извлечено имя Актера 1 -> признаком может стать имя его супруги).
  5. Сбор Связанной Информации: Получение данных из Associated Information Database (популярность эфира, время трансляции) для определения веса признаков.

Процесс Б: Обработка запроса пользователя (в реальном времени)

  1. Получение Запроса: Пользователь вводит частичный запрос.
  2. Генерация Кандидатов: Query Suggestion Engine генерирует стандартный набор подсказок.
  3. Ранжирование и Бустинг: Query Suggestion Processing Engine переранжирует кандидатов:
    1. Оценивается схожесть (Similarity) между текстом каждой подсказки и активными Репрезентативными Признаками (из Процесса А).
    2. Базовые оценки релевантности (base relevance score) подсказок модифицируются на основе этой схожести.
    3. Применяются дополнительные факторы из Associated Information (например, бустинг сильнее, если эфир популярен).
    4. Применяется временное затухание (Time Decay) в зависимости от времени, прошедшего с момента эфира (time passage from the live feed time).
  4. Вывод: Предоставление пользователю финального отранжированного списка подсказок.

Какие данные и как использует

Данные на входе

  • Мультимедиа факторы: Видео и аудио потоки живых трансляций. Используется для распознавания образов (например, лиц персон, текста в кадре) и фонетического анализа аудио (распознавание речи).
  • Контентные факторы (Трансляций): Текстовые данные: поток субтитров (closed captioning feed), метаданные интернет-трансляций (HTML/XML теги, заголовки, описания).
  • Временные факторы: Время начала и окончания трансляции (live feed time), текущее время запроса. Используются для расчета затухания эффекта.
  • Пользовательские факторы: Частичный запрос, вводимый пользователем. Также могут учитываться демографические данные пользователя, если Associated Information указывает на специфическую аудиторию эфира.
  • Поведенческие факторы: Данные о всплесках запросов (Query Spikes) используются для верификации важности репрезентативных признаков и валидации трендов.

Какие метрики используются и как они считаются

  • Similarity (Схожесть): Метрика текстовой схожести между поисковой подсказкой и репрезентативным признаком. В патенте упоминается возможность использования алгоритмов: расстояние Левенштейна (Levenshtein edit distance), расстояние Яро-Винклера (Jaro-Winkle edit distance), индекс Жаккара (Jaccard index), расстояние Маси (Masi distance) или подсчет символов.
  • Relevance Score (Оценка релевантности): Итоговая оценка подсказки. Является модификацией базовой оценки (Base Relevance Score) с учетом Similarity, данных о популярности эфира и временного затухания.
  • Time Passage (Прошедшее время): Время, прошедшее с момента прямого эфира (live feed time). Используется для расчета функции затухания (Time Decay).
  • Query Spike Threshold (Порог всплеска запросов): Пороговое значение частоты запросов, необходимое для идентификации всплеска интереса.

Выводы

  1. Адаптация Autocomplete в реальном времени: Google активно отслеживает прямые эфиры (ТВ, стримы) для динамической корректировки поисковых подсказок. Во время значимых событий приоритет в Autocomplete смещается от исторической популярности запросов к сиюминутной актуальности.
  2. Комплексный мультимодальный анализ: Система использует мультимодальный подход к анализу живого контента, извлекая признаки из субтитров, аудиодорожек (распознавание речи) и видеоряда (распознавание образов).
  3. Использование Сущностей для расширения контекста: Связь с Entity Database позволяет системе повышать не только те подсказки, которые напрямую упоминались в эфире, но и связанные с ними сущности и темы (например, упоминание актера может бустить название его нового фильма).
  4. Временное затухание (Time Decay) критично: Эффект повышения подсказок является временным. Он максимален во время события и постепенно снижается после его окончания (например, в течение 24 часов), что отражает естественное затухание интереса аудитории.
  5. Валидация трендов (Query Spikes): Патент описывает механизм использования данных из живых эфиров для подтверждения реальности всплесков поискового интереса. Это помогает отличать естественные тренды от искусственных манипуляций.
  6. Фокус на Autocomplete, а не на органическом ранжировании: Механизм влияет на то, как пользователи формулируют поиск во время живых событий, но не влияет на ранжирование результирующих веб-страниц.

Практика

Best practices (это мы делаем)

  • Real-Time Marketing (RTM) и ТВ-кампании: Если ваша компания запускает ТВ-рекламу или участвует в крупном живом событии, ожидайте, что связанные запросы (название бренда, продукта, слоган) будут повышены в Autocomplete. Убедитесь, что ваши посадочные страницы оптимизированы под эти формулировки и готовы к приему трафика в реальном времени.
  • Мониторинг Autocomplete во время событий: Отслеживайте изменения в поисковых подсказках во время ключевых событий в вашей нише. Это покажет, какие Representative Features извлекает Google, и позволит быстро адаптировать заголовки и контент под трендовые запросы.
  • Для СМИ и Новостных сайтов (Real-Time SEO): Скорость реакции критична. Во время срочных новостей или спортивных событий система будет адаптировать подсказки. Необходимо максимально быстро публиковать материалы, используя те актуальные формулировки, которые предлагает Autocomplete.
  • Оптимизация сущностей (Entity Optimization): Убедитесь, что ключевые сущности вашего бренда (люди, продукты) корректно представлены в Knowledge Graph (Entity Database). Это облегчит системе связывание упоминаний в прямом эфире с вашими сущностями.
  • Стимулирование нужных подсказок (для создателей контента/вещателей): Если вы контролируете живой источник (ведете стрим, выступаете на ТВ), четкое проговаривание ключевых фраз и предоставление качественных субтитров (closed captioning) или метаданных трансляции увеличивает вероятность того, что эти фразы станут Representative Features и попадут в бустинг.

Worst practices (это делать не надо)

  • Игнорирование RTM-возможностей: Отсутствие реакции на изменения в Autocomplete во время живых событий может привести к потере значительного объема актуального трафика.
  • Попытки искусственной манипуляции трендами (Query Spikes): Система использует данные из живых источников для валидации всплесков запросов. Искусственные всплески, не подтвержденные реальными событиями в эфире, с большей вероятностью будут проигнорированы благодаря механизму валидации (Claim 17).
  • Публикация с задержкой: Создание контента о живом событии спустя значительное время. Механизм Time Decay гарантирует, что бустинг связанных запросов к этому моменту уже снизится.

Стратегическое значение

Патент подтверждает стратегический фокус Google на понимании событий в реальном времени и адаптации поиска к текущему контексту пользователя («второй экран»). Поисковые подсказки являются важным элементом управления поведением пользователя. Контроль над Autocomplete во время пикового интереса позволяет направлять трафик. Это подчеркивает важность скорости реакции в SEO и интеграции SEO-стратегии с общими маркетинговыми активностями, включая PR и ТВ-рекламу.

Практические примеры

Сценарий 1: Запуск рекламы во время крупного спортивного события (Super Bowl).

  1. Событие: Во время трансляции Super Bowl показывается рекламный ролик нового продукта "Brand X".
  2. Действие Google: Live Source Processing Engine анализирует аудиодорожку или субтитры и идентифицирует "Brand X" как Representative Feature.
  3. Результат для пользователя: Пользователь вводит в поиске "Bra...". Система Autocomplete немедленно предлагает "Brand X" на первой позиции, даже если исторически более популярной подсказкой была "Brad Pitt".
  4. SEO-действие: Команда Brand X должна убедиться, что по запросу "Brand X" в топе выдачи находится релевантный лендинг и сайт готов к резкому притоку трафика.

Сценарий 2: Политическое выступление (State of the Union).

  1. Событие: Во время выступления спикер упоминает новую инициативу, например, "Реформа здравоохранения".
  2. Действие Google: Система извлекает термин "Реформа здравоохранения" из субтитров (Closed Captioning). Она также может связать это с сущностями политиков, присутствующих на выступлении.
  3. Результат для пользователя: Пользователь вводит "Реф...". Autocomplete повышает подсказку "Реформа здравоохранения" выше стандартных подсказок.
  4. SEO-действие: Новостные сайты должны оперативно публиковать материалы по этой теме, используя релевантные формулировки, чтобы захватить актуальный трафик.

Вопросы и ответы

Влияет ли этот патент на ранжирование веб-страниц в органической выдаче?

Нет, напрямую этот патент не влияет на ранжирование результатов поиска (10 синих ссылок). Он описывает исключительно механизм ранжирования поисковых подсказок (Autocomplete/Google Suggest). Однако он оказывает сильное косвенное влияние, поскольку определяет, какие именно запросы пользователи в итоге отправят, тем самым направляя трафик во время актуальных событий.

Какие типы живых источников Google отслеживает согласно патенту?

Патент указывает на любые источники, транслируемые в реальном времени для широкой аудитории. Конкретно упоминаются телевизионные программы (television program), радиовещание, а также интернет-стриминг (streaming Internet broadcasts). Система ориентирована на мониторинг значимых живых событий.

Как долго длится эффект повышения подсказки после живого события?

Эффект является временным и подчиняется механизму затухания (Time Decay). Он максимален во время эфира и постепенно снижается после его окончания. Длительность зависит от типа события и поведения пользователей (viewing window time) – например, система может учитывать, что некоторые шоу смотрят в записи в течение 24 часов после эфира.

Как именно Google понимает, о чем говорят в прямом эфире?

Система использует комплексный мультимодальный подход. В патенте описаны следующие методы: анализ текстовых субтитров (closed captioning feed), фонетический анализ аудиодорожки (распознавание речи), распознавание образов в видеоряде (например, идентификация лиц или текста в кадре), а также анализ метаданных трансляции.

Что такое "валидация Query Spikes" и как это влияет на SEO?

Это механизм проверки реальности всплеска поискового интереса (тренда). Система проверяет, связан ли резкий рост частоты запроса с каким-либо событием в прямом эфире. Это помогает Google отличать естественные тренды от искусственных накруток. Для SEO это означает, что попытки манипулировать трендами становятся менее эффективными.

Может ли система повысить подсказку, которая не точно совпадает с тем, что было сказано в эфире?

Да, это возможно благодаря использованию Entity Database. Если система идентифицировала сущность в эфире (например, имя актера), она может повысить подсказки, связанные с другими свойствами или ассоциированными сущностями (например, название фильма с его участием или имя его супруги), даже если они не упоминались напрямую.

Как SEO-специалисту использовать это знание для Real-Time Marketing (RTM)?

При планировании ТВ-кампаний или участии в живых событиях необходимо учитывать, что связанные запросы будут бустироваться в Autocomplete. Ключевая задача – заранее оптимизировать посадочные страницы под эти конкретные формулировки и обеспечить техническую готовность сайта к приему резкого всплеска трафика в реальном времени.

Влияет ли популярность ТВ-шоу или трансляции на силу бустинга подсказок?

Да, патент явно упоминает использование Associated Information, которая включает данные о популярности (popularity data) живого источника. Логично предположить, что подсказки, связанные с более популярными и охватными эфирами, получат более значительное повышение в ранжировании Autocomplete.

Как этот механизм влияет на работу новостных сайтов?

Влияние критически важное. Во время срочных новостей (breaking news) или крупных событий пользователи увидят подсказки, адаптированные под текущую повестку дня. Новостным сайтам необходимо обеспечивать максимальную скорость публикации контента, используя именно те актуальные формулировки запросов, которые предлагает Autocomplete, чтобы перехватить трафик.

Можно ли повлиять на то, чтобы моя тема попала в бустинг Autocomplete?

Если вы контролируете живой источник (например, ведете собственный стрим, выступаете на ТВ или конференции), то да. Четкое, акцентированное упоминание ключевых фраз, а также наличие качественных субтитров или подробных метаданных трансляции увеличивает вероятность того, что система идентифицирует эти фразы как Representative Features и использует их для бустинга.

Похожие патенты

Как Google обогащает поисковые подсказки (Autocomplete) данными в реальном времени (Live Content)
Google использует систему для улучшения поисковых подсказок путем добавления «живого контента». Когда пользователь вводит запрос, система генерирует подсказки и автоматически инициирует «живой запрос» для получения актуальных данных (например, погоды или курса акций). Эти данные отображаются прямо в списке подсказок, часто предоставляя ответ до перехода на SERP.
  • US9129012B2
  • 2015-09-08
  • Свежесть контента

Как Google использует всплески поисковых запросов для идентификации трендовых «моментов» в ТВ-трансляциях и прямых эфирах
Google анализирует всплески поисковых запросов в реальном времени и сопоставляет их с транслируемым медиаконтентом (например, телешоу или спортивными событиями). Сопоставляя термины запроса с метаданными (субтитрами) или анализируя аудио-отпечатки с устройств пользователей, Google определяет точный «момент», вызвавший интерес, и упаковывает его в автоматический «Гид по моментам».
  • US20170214954A1
  • 2017-07-27
  • Поведенческие сигналы

  • Мультимедиа

  • Семантика и интент

Как Google формирует персонализированные поисковые подсказки (Autocomplete) на основе контента пользователя (например, в Gmail)
Google использует механизм для улучшения поисковых подсказок (Autocomplete) в таких сервисах, как Gmail. Система анализирует корпус документов пользователя, распознает сущности (например, email-адреса, имена) и предлагает их в качестве подсказок. Это помогает пользователю быстрее находить нужный контент, предлагая контекстуализированные подсказки (например, полный контакт) вместо отдельных слов.
  • US20140201229A1
  • 2014-07-17
  • Персонализация

  • Индексация

  • Семантика и интент

Как Google использует погоду, время, текущие события и социальные сигналы для персонализации поисковых подсказок (Autocomplete)
Google динамически изменяет поисковые подсказки (Autocomplete и переписанные запросы), основываясь на текущем контексте пользователя. Система учитывает такие факторы, как погода, время суток, актуальные новости, рекомендации друзей в социальных сетях и их местоположение. Стандартные подсказки переоцениваются и переранжируются в реальном времени, чтобы предложить пользователю наиболее релевантный запрос в данный момент и в данном месте.
  • US20160041991A1
  • 2016-02-11
  • Персонализация

  • Свежесть контента

  • SERP

Как Google создает новые поисковые подсказки (Autocomplete), комбинируя структуры и термины из прошлых запросов
Google расширяет покрытие поисковых подсказок (Autocomplete), создавая новые, ранее не использованные запросы. Система анализирует логи, находит запросы с похожей структурой (шаблоны), определяет семантически близкие термины (используя distributional similarity) и комбинирует их. Это позволяет предлагать пользователям релевантные подсказки, даже если такой запрос никогда ранее не вводился.
  • US8521739B1
  • 2013-08-27
  • Семантика и интент

Популярные патенты

Как Google игнорирует часто меняющийся контент и ссылки в нем, определяя "временные" блоки шаблона сайта
Google использует механизм для отделения основного контента от динамического шума (реклама, виджеты, дата). Система сравнивает разные версии одной страницы, чтобы найти часто меняющийся контент. Затем она анализирует HTML-структуру (путь) этого контента и статистически определяет, является ли этот структурный блок "временным" для всего сайта. Такой контент игнорируется при индексации и таргетинге рекламы, а ссылки в нем могут не учитываться при расчете PageRank.
  • US8121991B1
  • 2012-02-21
  • Индексация

  • Техническое SEO

  • Структура сайта

Как Google идентифицирует экспертов на основе их активности и позволяет фильтровать выдачу по их контенту
Google использует систему для идентификации людей (членов социальной сети), тесно связанных с темой запроса, на основе их активности (посты, взаимодействия, репосты) и квалификации. Система отображает этих людей в специальных блоках (Display Areas) рядом с результатами поиска, позволяя пользователям просматривать их профили или фильтровать выдачу, чтобы увидеть только контент, созданный, одобренный или прокомментированный этими экспертами.
  • US9244985B1
  • 2016-01-26
  • EEAT и качество

  • Поведенческие сигналы

  • SERP

Как Google объединяет данные о ссылках и кликах для расчета авторитетности страниц (Query-Independent Score)
Google использует механизм расчета независимой от запроса оценки авторитетности (Query-Independent Score) с помощью дополненного графа ресурсов. Этот граф объединяет традиционные ссылки между страницами с данными о поведении пользователей, такими как клики по результатам поиска (CTR). Авторитетность передается не только через ссылки, но и через запросы, позволяя страницам с высоким уровнем вовлеченности пользователей набирать авторитет, даже если у них мало обратных ссылок.
  • US8386495B1
  • 2013-02-26
  • Поведенческие сигналы

  • Ссылки

  • SERP

Как Google снижает ценность ссылок между аффилированными сайтами для борьбы с линк-схемами
Google использует модификацию алгоритмов расчета качества (типа PageRank), которая учитывает аффилированность между ссылающимися документами. Если система определяет, что сайты связаны (например, принадлежат одному владельцу, находятся в одной сети или имеют схожие паттерны трафика), ценность ссылок между ними агрессивно снижается. Вместо суммирования веса всех ссылок система учитывает только максимальный вклад от аффилированной группы, нейтрализуя эффект линк-ферм и PBN.
  • US7783639B1
  • 2010-08-24
  • Ссылки

  • Антиспам

  • EEAT и качество

Как Google использует нейросетевые эмбеддинги (Two-Tower Model) для семантического поиска изображений с учетом контекста страницы
Google использует систему поиска изображений, основанную на нейронных сетях (модель "Две Башни"). Система создает векторные представления (эмбеддинги) для поисковых запросов и для пар "изображение + посадочная страница", помещая их в общее семантическое пространство. Это позволяет находить релевантные изображения не по ключевым словам, а по близости векторов, учитывая как содержание картинки, так и контекст страницы, на которой она размещена.
  • US11782998B2
  • 2023-10-10
  • Семантика и интент

  • Индексация

  • Мультимедиа

Как Google использует последовательность кликов пользователей (Co-selection) для классификации изображений и фильтрации контента (SafeSearch)
Google анализирует, какие изображения пользователи выбирают последовательно в рамках одной сессии (co-selection). Если Изображение Б часто выбирается сразу после Изображения А (с известной темой), система присваивает Изображению Б ту же тему. Этот механизм использует графовый анализ поведения для уточнения тематики изображений, что критично для повышения релевантности и работы фильтров, таких как SafeSearch.
  • US8856124B2
  • 2014-10-07
  • Безопасный поиск

  • Поведенческие сигналы

  • Семантика и интент

Как Google использует крупномасштабное машинное обучение и данные о поведении пользователей для предсказания кликов и ранжирования результатов
Google использует систему машинного обучения для создания модели ранжирования, которая предсказывает вероятность клика пользователя по документу. Модель обучается на огромных массивах данных о прошлых поисках (запросы, документы, клики). Система учитывает базовую вероятность клика (Prior Probability), основанную на позиции и предыдущей оценке документа, а затем корректирует её с помощью правил, выявляющих, какие признаки (Features) документа и запроса влияют на выбор пользователя.
  • US7231399B1
  • 2007-06-12
  • Поведенческие сигналы

Как Google использует интерактивные визуальные цитаты для генерации и уточнения ответов в мультимодальном поиске (SGE/Lens)
Google использует механизм для улучшения точности ответов, генерируемых LLM в ответ на мультимодальные запросы (изображение + текст). Система находит визуально похожие изображения, извлекает текст из их источников и генерирует ответ. Этот ответ сопровождается «визуальными цитатами» (исходными изображениями). Если пользователь видит, что цитата визуально не соответствует запросу, он может её отклонить. Система удалит текст этого источника и перегенерирует ответ, повышая его точность.
  • US20240378237A1
  • 2024-11-14
  • Мультимедиа

  • EEAT и качество

  • Семантика и интент

Как Google использует паттерны просмотра пользователей (Co-Visitation) и временную близость для определения тематики нетекстового контента (изображений и видео)
Google использует механизм для понимания контента без текста (изображения, видео), анализируя, какие другие (текстовые) страницы пользователи посещают в рамках той же сессии. Ключевые слова с этих текстовых страниц заимствуются и присваиваются нетекстовому ресурсу. Критически важным фактором является время перехода: чем быстрее пользователь перешел между ресурсами, тем больший вес получают ключевые слова.
  • US8572096B1
  • 2013-10-29
  • Поведенческие сигналы

  • Семантика и интент

  • Мультимедиа

Как Google использует анализ аномалий в показах и кликах для выявления фейковых локальных бизнес-листингов (Map Spam)
Google анализирует статистику взаимодействий (кликов) для групп связанных бизнес-листингов (Common Business). Система вычисляет статистически нормальный уровень активности и устанавливает порог (Anomaly Detection Threshold). Резкий всплеск активности выше этого порога (например, на два стандартных отклонения) сигнализирует о наличии фейковых или спамных листингов, созданных для манипуляции локальной выдачей.
  • US20150154610A1
  • 2015-06-04
  • Local SEO

  • Антиспам

  • Поведенческие сигналы

seohardcore