SEO HARDCORE
  • Разборы патентов
    • Патенты Google
  • Скоро SEO инструменты
  • Скоро SEO аналитика
  • seohardcore
SEO HARDCORE
назад

Как Google использует контекст просмотра ТВ для модификации поисковых запросов в реальном времени

SYSTEM AND METHOD FOR ENHANCING USER SEARCH RESULTS BY DETERMINING A TELEVISION PROGRAM CURRENTLY BEING DISPLAYED IN PROXIMITY TO AN ELECTRONIC DEVICE (Система и метод улучшения результатов поиска пользователя путем определения телевизионной программы, отображаемой в данный момент вблизи электронного устройства)
  • US8839303B2
  • Google LLC
  • 2011-06-30
  • 2014-09-16
  • Семантика и интент
  • Персонализация
  • SERP
  • Поведенческие сигналы
  • Описание
  • Разбор
  • Выводы
  • Практика
  • FAQ
  • Похожие

Google анализирует время, местоположение и содержание поискового запроса пользователя, сопоставляя их с данными о телепрограммах, транслируемых в данный момент. Если система предполагает, что запрос связан с просматриваемой передачей, она автоматически дополняет исходный запрос терминами из этой передачи для предоставления более релевантных результатов.

Описание

Какую проблему решает

Патент решает проблему неоднозначности или неполноты поисковых запросов, вводимых пользователями во время просмотра телевизионных программ («Second Screen» активность). Пользователи часто вводят общие термины вместо конкретных названий или моделей, увиденных на экране (например, вводят «Porsche» вместо «911 Turbo»). Это приводит к выдаче общих результатов, тогда как пользователь ищет конкретную информацию. Система улучшает релевантность выдачи, определяя контекст просмотра ТВ.

Что запатентовано

Запатентована система, которая пытается угадать (infer), какую именно телевизионную программу смотрит пользователь в данный момент. Эта догадка строится на корреляции между поисковым запросом пользователя, его местоположением, временем запроса и базой данных расписания и содержания телепередач. Если корреляция высока, система автоматически модифицирует (расширяет) исходный запрос терминами, релевантными для идентифицированной телепрограммы.

Как это работает

Система работает следующим образом:

  • Сбор контекста: При получении запроса фиксируется время и определяется местоположение пользователя (через IP или GPS).
  • Фильтрация ТВ-программ: Система определяет, какие телепрограммы транслируются в данном месте в данное время.
  • Сопоставление (Inference): Система сравнивает тематические категории (Category List) запроса с категориями доступных телепрограмм. Для этого используются заранее подготовленные профили запросов (Query Profile) и профили программ (Television Program Profile).
  • Оценка и выбор: Вычисляется оценка корреляции (Score). Программа с наивысшей оценкой считается просматриваемой пользователем.
  • Модификация запроса: Система определяет дополнительные термины, релевантные как исходному запросу, так и выбранной программе, и добавляет их к запросу.
  • Поиск: Поиск выполняется по модифицированному запросу.

Актуальность для SEO

Средняя. Концепция использования непосредственного контекста окружающей среды для понимания намерений пользователя крайне актуальна (Ambient Search). Однако конкретный метод предположения о просмотре ТВ на основе корреляции поисковых запросов, вероятно, уступил место более прямым технологиям (например, ACR в Smart TV), а также снижению роли линейного ТВ. Тем не менее, описанный механизм корреляции категорий остается валидным подходом для обработки контекста, особенно для прямых трансляций (спорт, новости).

Важность для SEO

Влияние на классическое SEO умеренное (5.5/10). Патент не описывает факторы ранжирования сайтов (E-E-A-T, ссылки, качество контента), а фокусируется исключительно на этапе понимания и модификации запроса (Query Understanding). Однако он имеет высокое стратегическое значение для медиа, рекламодателей и владельцев продуктов, часто упоминаемых на ТВ. Он демонстрирует, как Google может радикально изменить интент пользователя и, следовательно, SERP в реальном времени, основываясь на внешних событиях.

Детальный разбор

Термины и определения

Category List (Список категорий)
Структурированный набор тематических категорий (или концептуальных кластеров), связанных с запросом или телепрограммой. Каждая категория имеет вес (Weight), отражающий степень релевантности. Например, запрос «Jaguar» может иметь категории «автомобили», «млекопитающие», «спорт».
Electronic Device (Электронное устройство)
Устройство, с которого пользователь отправляет запрос (смартфон, ноутбук, планшет). В патенте (Claim 1) подчеркивается, что это устройство отлично от самого телевизора или ТВ-приставки.
Inferred Television Program (Предполагаемая телевизионная программа)
Телепрограмма, которую, по мнению системы, пользователь смотрит в момент отправки запроса. Выбирается на основе наивысшей оценки корреляции (Score).
Interesting Entities (Интересующие сущности)
Важные слова (имена людей, названия мест, продуктов), идентифицируемые с помощью NLP и используемые при генерации профилей для повышения точности и игнорирования шума.
Matching Function (Функция сопоставления)
Алгоритм, используемый для расчета степени сходства между списком категорий запроса и списком категорий телепрограммы. Результатом является оценка (Score). Может быть реализован, например, как скалярное произведение векторов.
Query Profile (Профиль запроса)
Запись в базе данных (Query Profile Database), содержащая Category List и связанные термины для конкретного поискового запроса.
Television Program Profile (Профиль телевизионной программы)
Запись в базе данных (Television Program Information Database), содержащая метаданные о программе: расписание (Show Times), канал, описание, актеры (Cast Information), жанр и Category List.
Time Window (Временное окно)
Период времени, в течение которого был получен запрос и анализируются доступные ТВ-программы.

Ключевые утверждения (Анализ Claims)

Claim 1 (Независимый пункт): Описывает основной процесс улучшения поиска.

  1. Система получает поисковый запрос от электронного устройства (не ТВ) в определенный временной промежуток (time window).
  2. Определяется местоположение устройства.
  3. Система обращается к базе данных ТВ-программ, чтобы определить, какие программы доступны в этом месте в это время.
  4. Используя запрос и данные о доступных программах, система делает вывод (infer), какая конкретная программа отображается вблизи устройства.
  5. Запрос модифицируется на основе этой предполагаемой программы.
  6. Модификация включает: определение дополнительных поисковых терминов, релевантных как предполагаемой программе, так и исходному запросу, и добавление этих терминов к запросу.

Claim 5 (Зависимый от 1): Детализирует процесс вывода (inference).

Вывод о просматриваемой программе включает генерацию оценки (Score) для каждой возможной телепрограммы, причем оценка связана с полученным поисковым запросом.

Claim 8 (Зависимый от 5): Детализирует процесс генерации оценки (Scoring).

Генерация оценки включает:

  1. Идентификацию первого набора категорий, связанных с терминами поискового запроса.
  2. Идентификацию второго набора категорий, связанных с телепрограммой.
  3. Применение функции сопоставления (matching function) к первому и второму наборам категорий.

Где и как применяется

Изобретение применяется на ранних этапах обработки запроса для уточнения интента пользователя.

INDEXING – Индексирование и извлечение признаков
На этом этапе система заранее обрабатывает данные, необходимые для работы механизма: индексирует метаданные телепрограмм (создает Television Program Information Database) и анализирует запросы для создания Query Profile Database. Для обоих наборов данных вычисляются тематические категории (Category Lists) с использованием NLP и извлечения Interesting Entities.

QUNDERSTANDING – Понимание Запросов
Основное применение патента. Система в реальном времени анализирует запрос в контексте окружающей среды (время, место, доступные ТВ-программы). Происходит интерпретация интента и, если срабатывает триггер корреляции, запрос модифицируется (переписывается) до того, как он будет передан основным системам ранжирования.

RANKING – Ранжирование
Система ранжирования получает на вход уже модифицированный (расширенный) запрос и выполняет поиск по нему.

METASEARCH – Метапоиск и Смешивание
В альтернативной реализации (описанной в патенте), система может использовать анализ запроса для генерации рекомендаций ТВ-программ, которые смешиваются в общую выдачу.

Входные данные:

  • Исходный поисковый запрос.
  • Временная метка запроса (Time Window).
  • Местоположение пользователя (IP-адрес, данные GPS).
  • Query Profile Database.
  • Television Program Information Database.

Выходные данные:

  • Модифицированный поисковый запрос (исходный запрос + дополнительные термины).
  • ИЛИ: Рекомендация ТВ-программы.

На что влияет

  • Специфические запросы: Наибольшее влияние оказывается на неоднозначные запросы или запросы, состоящие из общих терминов (бренды, имена), которые могут относиться к сущностям, часто фигурирующим в медиа.
  • Конкретные ниши или тематики: Высокое влияние в тематиках, связанных с развлечениями, спортом (особенно во время прямых трансляций), потребительскими товарами и автомобилями.

Когда применяется

  • Временные рамки: Алгоритм применяется в реальном времени в момент получения запроса.
  • Триггеры активации: Система активируется, когда оценка корреляции (Score) между поисковым запросом и одной из телепрограмм, транслируемых в данный момент в локации пользователя, превышает заданный порог уверенности.
  • Исключения: Если ни одна программа не набирает достаточного балла, поиск проводится по исходному запросу без модификации.

Пошаговый алгоритм

Процесс определения и модификации запроса:

  1. Получение запроса и контекста: Система получает запрос, фиксирует время и определяет местоположение пользователя.
  2. Идентификация доступных ТВ-программ: Обращение к Television Program Information Database для получения списка программ, транслируемых в данном месте в данное время.
  3. Извлечение категорий запроса: Идентификация первого набора категорий, связанных с запросом (используя Query Profile или динамический анализ).
  4. Извлечение категорий ТВ-программ: Для каждой доступной программы идентифицируется второй набор категорий (используя Television Program Profile).
  5. Расчет корреляции (Scoring): Применение Matching Function для сравнения первого и второго наборов категорий для каждой программы. Генерация оценки (Score).
  6. Определение просмотра (Опционально): Система определяет, смотрит ли пользователь ТВ вообще, сравнивая максимальную оценку с пороговым значением. Если порог не достигнут, выполняется стандартный поиск.
  7. Выбор предполагаемой программы (Inference): Программы упорядочиваются по оценкам. Программа с наивысшей оценкой выбирается как Inferred Television Program.
  8. Определение дополнительных терминов: Система анализирует метаданные выбранной программы для поиска терминов, которые релевантны как программе, так и исходному запросу.
  9. Модификация запроса: Дополнительные термины добавляются к исходному запросу.
  10. Выполнение поиска: Поиск выполняется с использованием модифицированного запроса, результаты отправляются пользователю.

Какие данные и как использует

Данные на входе

Система использует следующие типы данных:

  • Географические факторы: Местоположение электронного устройства (полученное через IP-адрес, GPS или из профиля пользователя). Это используется для фильтрации доступных телепрограмм и каналов.
  • Временные факторы: Точное время получения запроса (Time Window). Используется для сопоставления с расписанием трансляций (Show Times).
  • Контентные факторы (Метаданные ТВ): Система использует структурированные данные о телепрограммах: название, описание (Program Description), информация об актерах (Cast Information), жанр, связанные термины (Related Terms). Эти данные используются для определения тематических категорий программы.
  • Системные данные (Профили запросов): Предварительно рассчитанные тематические категории (Category List) и веса (Weight) для популярных поисковых запросов.

Какие метрики используются и как они считаются

  • Weight (Вес категории): Числовое значение, измеряющее релевантность между запросом/программой и определенной тематической категорией. Рассчитывается заранее (офлайн), часто с использованием NLP и анализа Interesting Entities.
  • Score (Оценка корреляции): Метрика, рассчитываемая в реальном времени с помощью Matching Function. Она определяет степень сходства между набором категорий запроса и набором категорий телепрограммы. Патент не указывает конкретную формулу, но упоминает, что это может быть любая функция, вычисляющая сходство (например, скалярное произведение векторов категорий).
  • Пороговые значения: Минимальная оценка (Score), необходимая для того, чтобы система сделала вывод, что пользователь смотрит ТВ, и активировала модификацию запроса.

Выводы

  1. Контекст окружающей среды как фактор понимания запроса: Патент демонстрирует, что Google активно использует информацию об окружающей пользователя среде (в данном случае — расписание ТВ-трансляций) для интерпретации его намерений в реальном времени. Интент определяется не только текстом запроса, но и ситуацией пользователя.
  2. Автоматическая и агрессивная модификация запроса: Если система уверена в контексте, она автоматически и незаметно для пользователя модифицирует запрос, чтобы сделать его более конкретным. Это может привести к значительному изменению поисковой выдачи.
  3. Разрешение неоднозначности через контекст: Основная цель механизма — разрешить неоднозначность или общность запроса, предполагая, что он связан с тем, что пользователь видит на экране телевизора (поведение «второго экрана»).
  4. Зависимость от структурированных данных и категоризации: Эффективность системы напрямую зависит от качества и полноты структурированных данных о медиаконтенте (метаданные, тематическая классификация) и от качества профилей запросов. Система использует модель сопоставления тематических категорий (Category Lists и Weights).
  5. Критичность локации и времени: Геолокация и время являются ключевыми фильтрами для определения релевантного контекста в данном механизме.

Практика

Best practices (это мы делаем)

  • Мониторинг медиа-событий и Real-Time SEO: Для SEO-специалистов, работающих в медиа-зависимых нишах (спорт, развлечения, потребительские товары), критически важно отслеживать крупные трансляции. Необходимо понимать, что во время этих событий SERP может быть нестабильным из-за контекстуальной модификации запросов.
  • Оптимизация под конкретные сущности (Entity Optimization): Поскольку система стремится уточнить общий запрос до конкретной сущности (например, от «машина» до «Ferrari F550»), необходимо убедиться, что контент хорошо оптимизирован под точные названия моделей, имена людей и названия локаций (Interesting Entities), которые могут фигурировать на ТВ.
  • Стратегии «Second Screen»: Разрабатывайте контент, который может служить дополнением к популярным телепрограммам или прямым трансляциям. Если ваш сайт предоставляет качественную информацию по теме передачи, он имеет высокие шансы ранжироваться по модифицированным запросам зрителей. Синхронизируйте онлайн-активность с ТВ-кампаниями.
  • (Для медиа-компаний и брендов) Обеспечение полноты метаданных: Если вы являетесь поставщиком контента или рекламодателем на ТВ, убедитесь, что метаданные о вашем контенте/продукте точны, детальны и содержат богатый набор ключевых слов и сущностей. Это поможет системе корректно идентифицировать контекст.

Worst practices (это делать не надо)

  • Игнорирование контекста реального времени: Полагаться исключительно на статические данные о частотности ключевых слов без учета текущего медиа-контекста. Это может привести к неверной оценке трафика и интента во время пиковых событий.
  • Оптимизация только под общие запросы: Создание контента, оптимизированного только под высокочастотные общие запросы, без проработки конкретных сущностей. Система может модифицировать эти запросы, уводя пользователя на сайты, лучше отвечающие уточненному интенту.

Стратегическое значение

Этот патент является ранним индикатором развития Google в сторону контекстного и «окружающего» поиска (Ambient Search). Он подтверждает стратегию Google по интерпретации намерений пользователя, выходя за рамки введенного текста. Для SEO это означает, что понимание ситуации пользователя (время, место, активность, окружающая среда) становится не менее важным, чем анализ самого запроса. Стратегия должна учитывать, как контент вписывается в различные сценарии использования.

Практические примеры

Сценарий: Поиск продукта во время просмотра обзора

  1. Ситуация: Пользователь смотрит автомобильное шоу «Top Gear» в Лондоне в 20:00. В шоу идет обзор модели Ferrari F550.
  2. Исходный запрос: Пользователь вводит на смартфоне запрос «F550».
  3. Анализ контекста: Система определяет время (20:00) и место (Лондон). Она видит, что в это время транслируется «Top Gear».
  4. Корреляция: Система сравнивает категории запроса «F550» (может включать автомобили, камеры, грузовики) с категориями «Top Gear» (автомобили, спорткары, обзоры). Корреляция высока.
  5. Inference: Система предполагает, что пользователь смотрит «Top Gear».
  6. Модификация: Система анализирует метаданные текущего эпизода «Top Gear» и видит упоминание «Ferrari». Она определяет, что «Ferrari» является релевантным дополнительным термином. Запрос модифицируется в «F550 Ferrari».
  7. Результат: Пользователь получает выдачу о Ferrari F550, а не о грузовике Ford F-550 или камере Fujifilm F550.

Вопросы и ответы

Влияет ли этот патент на ранжирование моего сайта?

Напрямую нет. Патент не описывает сигналы ранжирования, такие как качество сайта или ссылочный профиль. Он описывает механизм понимания и модификации поискового запроса до того, как он попадет в основную систему ранжирования. Однако, изменив запрос, система радикально меняет набор сайтов, которые будут конкурировать в выдаче.

Означает ли этот патент, что Google слушает звук телевизора через микрофон моего устройства (ACR)?

Нет. Этот патент не описывает использование аудио-фингерпринтинга (Automatic Content Recognition - ACR) или прослушивания. Система делает вывод (infer) исключительно путем логической корреляции текста поискового запроса с расписанием и метаданными телепередач, без анализа самого аудио- или видеоконтента.

Что такое «Category List» и как он формируется?

Category List — это набор тематических категорий с весами, характеризующий запрос или телепрограмму. Например, для запроса «гольф» это могут быть «спорт» (вес 0.9) и «товары для спорта» (вес 0.6). Патент предполагает, что эти списки формируются заранее с помощью процессов анализа данных (например, NLP, извлечения Interesting Entities или кластеризации) и хранятся в профилях запросов и программ.

Насколько актуален этот патент, учитывая популярность стриминговых сервисов и просмотра по запросу?

Актуальность конкретной реализации для линейного ТВ снизилась, так как она зависит от точного расписания. Однако концепция использования непосредственного контекста для уточнения запроса остается крайне важной, особенно для прямых трансляций (спорт, новости). Подобные механизмы могут применяться для корреляции с другим контекстом (музыка, местоположение), если у Google есть доступ к этим данным.

Как SEO-специалист может использовать знание этого патента на практике?

Основное применение — это разработка стратегий «Second Screen». Если вы знаете, что продукт или тема будут освещаться на ТВ, подготовьте высокорелевантный контент, оптимизированный под конкретные сущности (названия моделей, имена). Отслеживайте SERP в реальном времени во время трансляции, чтобы понять, как меняется интент и какие модификации запросов происходят.

Что произойдет, если система неправильно угадает телепередачу?

Если система сделает неверный вывод (Inference), запрос будет модифицирован некорректно, что приведет к нерелевантной выдаче. Для предотвращения этого патент предусматривает использование пороговых значений (thresholds). Модификация происходит только в том случае, если оценка корреляции (Score) достаточно высока.

Отличается ли этот механизм от Google Trends?

Да, кардинально. Google Trends показывает агрегированные данные о популярности запросов в макро масштабе. Описанный механизм работает на микро уровне, анализируя контекст отдельного пользователя в реальном времени для модификации его конкретного запроса, даже если глобального тренда нет.

Как система определяет, какие термины добавить к запросу?

После того как программа идентифицирована, система ищет дополнительные термины в ее метаданных (описание, актеры, связанные сущности), которые релевантны как самой программе, так и исходному запросу. Это делается путем сравнения категорий и поиска пересечений, чтобы убедиться, что добавленный термин уточняет исходный интент.

Патент также упоминает рекомендации ТВ-программ на основе поиска. Как это работает?

Это вторичный механизм, описанный в патенте. Система может работать в обратном направлении: анализировать поисковый запрос пользователя, определять его интересы (категории) и рекомендовать доступные в данный момент телепрограммы, соответствующие этим интересам. Это используется для вовлечения пользователя в просмотр ТВ.

Применяется ли этот механизм только к коротким, неоднозначным запросам?

Наибольший эффект достигается именно на коротких или широких запросах (например, название бренда), так как они требуют контекстуального уточнения. Если пользователь вводит длинный и специфический запрос, необходимость в его модификации на основе ТВ-контекста снижается, так как интент уже достаточно ясен из самого запроса.

Похожие патенты

Как Google связывает всплески поисковых запросов с ТВ-трансляциями для показа контекстной информации в реальном времени
Google отслеживает внезапные всплески частоты поисковых запросов и сопоставляет их с субтитрами (или аудиодорожкой) транслируемых в этот момент телепрограмм. Это позволяет системе понять, какой именно момент в эфире вызвал интерес пользователей, и проактивно предоставить связанную информацию зрителям через «вторые экраны» (например, смартфоны).
  • US9578358B1
  • 2017-02-21
  • Свежесть контента

  • Семантика и интент

  • Персонализация

Как Google использует контент, который вы смотрите (например, на ТВ), для автоматического переписывания и персонализации ваших поисковых запросов
Google может анализировать контент (фильмы, шоу, аудио), который пользователь потребляет на одном устройстве (например, ТВ), и использовать эту информацию как контекст для уточнения последующих поисковых запросов. Система распознает аудиовизуальный контекст и автоматически дополняет неоднозначные запросы пользователя, чтобы предоставить более релевантные результаты, в том числе на связанных устройствах (например, смартфоне).
  • US9244977B2
  • 2016-01-26
  • Персонализация

  • Семантика и интент

  • Поведенческие сигналы

Как Google синхронизирует онлайн-новости с телевизионным эфиром, используя кластеризацию статей, TF-IDF и анализ субтитров
Патент описывает технологию Google для "второго экрана", которая идентифицирует просматриваемую телепередачу и в реальном времени находит соответствующие ей онлайн-новости. Система агрегирует новостные статьи, кластеризует их по темам, извлекает ключевые слова (используя TF-IDF) и сопоставляет их с потоком субтитров телеканала. Это демонстрирует механизмы Google по обработке, кластеризации и ранжированию новостного контента по свежести и популярности.
  • US9544650B1
  • 2017-01-10
  • Свежесть контента

  • Мультимедиа

  • Семантика и интент

Как Google автоматически определяет ключевые темы в медиапотоках (ТВ, аудио, текст) и использует механизм "Boosting" для поиска релевантного контента
Система анализирует мультимедийные потоки (например, ТВ-трансляции) в реальном времени, преобразует их в текст и автоматически генерирует поисковые запросы. Используются классические методы IR (TF-IDF, стемминг, анализ контекста). Ключевой особенностью является механизм пост-обработки "Boosting", который переранжирует результаты поиска на основе дополнительного контекста, не вошедшего в исходный запрос.
  • US8868543B1
  • 2014-10-21
  • Мультимедиа

  • Семантика и интент

  • SERP

Как Google использует всплески поисковых запросов для идентификации трендовых «моментов» в ТВ-трансляциях и прямых эфирах
Google анализирует всплески поисковых запросов в реальном времени и сопоставляет их с транслируемым медиаконтентом (например, телешоу или спортивными событиями). Сопоставляя термины запроса с метаданными (субтитрами) или анализируя аудио-отпечатки с устройств пользователей, Google определяет точный «момент», вызвавший интерес, и упаковывает его в автоматический «Гид по моментам».
  • US20170214954A1
  • 2017-07-27
  • Поведенческие сигналы

  • Мультимедиа

  • Семантика и интент

Популярные патенты

Как Google использует временной распад и анализ трендов кликов для корректировки ранжирования и борьбы со стагнацией выдачи
Google применяет механизмы для предотвращения «залипания» устаревших результатов в топе выдачи. Система анализирует возраст пользовательских кликов и снижает вес старых данных (временной распад), отдавая приоритет свежим сигналам. Кроме того, система выявляет документы с ускоряющимся трендом кликов по сравнению с фоном и повышает их в выдаче, улучшая актуальность результатов.
  • US9092510B1
  • 2015-07-28
  • Свежесть контента

  • Поведенческие сигналы

  • SERP

Как Google использует данные о кликах и пропусках для валидации и удаления неэффективных синонимов в поиске
Google постоянно тестирует правила подстановки (синонимы) для расширения запросов. Этот патент описывает механизм оценки эффективности этих правил с помощью анализа поведения пользователей (клики и пропуски результатов). Если пользователи часто пропускают результаты, содержащие подставленный термин, система автоматически удаляет это правило, очищая понимание запросов от нерелевантных синонимов.
  • US8965875B1
  • 2015-02-24
  • Поведенческие сигналы

  • Семантика и интент

  • EEAT и качество

Как Google использует поведение пользователей для определения синонимичности фраз в запросах, связанных с сущностями
Google анализирует поведение пользователей (клики по результатам поиска), чтобы определить, означают ли разные фразы одно и то же, когда они связаны с одним типом сущности (например, «достопримечательности в <Город>» против «места для посещения в <Город>»). Если пользователи кликают на одни и те же документы для разных фраз, система считает эти фразы эквивалентными, что помогает Google понимать синонимы и улучшать результаты поиска.
  • US10073882B1
  • 2018-09-11
  • Семантика и интент

  • Поведенческие сигналы

Как Google извлекает, обрабатывает и индексирует анкорный текст, контекст и атрибуты входящих ссылок для ранжирования целевых страниц
Фундаментальный патент, описывающий инфраструктуру Google для обработки ссылок. Система извлекает анкорный текст, окружающий контекст и атрибуты форматирования (аннотации) из исходных страниц и инвертирует эти данные в структуру "Sorted Anchor Map". Это позволяет индексировать целевую страницу по тексту ссылок, указывающих на нее, используя эту внешнюю информацию как сигнал релевантности.
  • US7308643B1
  • 2007-12-11
  • Ссылки

  • Индексация

  • Техническое SEO

Как Google использует генеративный ИИ для создания чата с конкретным сайтом прямо в поисковой выдаче и предоставления глубинных ссылок
Google патентует механизм, позволяющий пользователям взаимодействовать с конкретным результатом поиска через интерфейс чата (prompt input interface) прямо на странице выдачи. Искусственный интеллект анализирует запрос пользователя и его последующий промпт, определяет намерение (поиск информации, действие или навигация) и предоставляет глубинные ссылки (deep links) на конкретные внутренние страницы этого же домена в виде conversational response.
  • US12353458B2
  • 2025-07-08
  • Ссылки

  • Семантика и интент

  • SERP

Как Google использует историю навигации и клики по рекламе для генерации ключевых слов, гео-таргетинга и выявления MFA-сайтов
Патент Google, описывающий три механизма, основанных на анализе поведения пользователей (selection data). Система использует путь навигации пользователя для генерации новых ключевых слов для рекламы, улучшает гео-таргетинг объявлений на основе предпочтений пользователей, а также выявляет низкокачественные сайты (MFA/манипулятивные) по аномально высокому CTR рекламных блоков.
  • US8005716B1
  • 2011-08-23
  • Поведенческие сигналы

  • Семантика и интент

  • Антиспам

Как Google автоматически добавляет текст существующих объявлений к сайтлинкам (Sitelinks) для повышения CTR
Google использует систему для автоматического улучшения сайтлинков в рекламных объявлениях. Система анализирует существующие текстовые объявления (креативы) рекламодателя и определяет их конечные целевые страницы, игнорируя параметры отслеживания. Затем она сопоставляет их с URL сайтлинков и добавляет наиболее релевантный и эффективный текст креатива к сайтлинку для повышения кликабельности (CTR).
  • US10650066B2
  • 2020-05-12
  • Ссылки

  • SERP

Как Google использует данные о совместном посещении сайтов (Co-Visitation) для персонализации и повышения релевантности выдачи
Google использует поведенческие данные сообщества пользователей для определения тематической связи между сайтами. Если пользователи часто посещают Сайт А и Сайт Б в течение короткого промежутка времени (Co-Visitation), система создает "Вектор повышения" (Boost Vector). Этот вектор используется для повышения в выдаче тематически связанных сайтов, основываясь на истории посещений пользователя или контексте текущего сайта, улучшая персонализацию и релевантность.
  • US8874570B1
  • 2014-10-28
  • Поведенческие сигналы

  • Персонализация

  • SERP

Как Google рассчитывает тематический авторитет сайта для кастомизации поиска с помощью Topic-Sensitive PageRank
Патент Google, описывающий механизм кастомизации результатов поиска, инициированного со стороннего сайта (например, Google Custom Search). Система использует «профиль сайта» для повышения результатов, соответствующих его тематике. Ключевая ценность патента — детальное описание расчета тематической авторитетности (Topic Boosts) путем анализа ссылок с эталонных сайтов (Start Sites), что является реализацией Topic-Sensitive PageRank.
  • US7565630B1
  • 2009-07-21
  • Персонализация

  • SERP

  • Ссылки

Как Google использует визуальные цитаты и обратную связь для генерации и уточнения ответов в мультимодальном поиске
Google генерирует ответы на мультимодальные запросы (изображение + текст), находя визуально похожие изображения в интернете и используя текст с их исходных страниц как основу для LLM. Система показывает эти изображения как «визуальные цитаты» для подтверждения ответа и позволяет пользователям исключать нерелевантные источники, чтобы мгновенно уточнить сгенерированный результат.
  • US20240378236A1
  • 2024-11-14
  • Мультимедиа

  • EEAT и качество

  • Ссылки

seohardcore