SEO HARDCORE
  • Разборы патентов
    • Патенты Google
  • Скоро SEO инструменты
  • Скоро SEO аналитика
  • seohardcore
SEO HARDCORE
назад

Как Google выявляет новые временные связи между ключевыми словами и сущностями на основе текущих событий

TEMPORAL CONTENT SELECTION (Временной отбор контента)
  • US9146980B1
  • Google LLC
  • 2013-06-24
  • 2015-09-29
  • Свежесть контента
  • Семантика и интент
  • SERP
  • Описание
  • Разбор
  • Выводы
  • Практика
  • FAQ
  • Похожие

Google использует систему для выявления новых, временных ассоциаций между ключевыми словами, анализируя недавние онлайн-документы (новости, социальные сети) и сравнивая их с историческими данными. Если обнаруживается новая значимая связь («временная ссылка»), система использует её для отбора релевантного контента, даже если ключевые слова традиционно не были связаны. Это позволяет поиску быстро адаптироваться к меняющемуся контексту и текущим событиям.

Описание

Какую проблему решает

Патент решает проблему статичности систем отбора контента, которые полагаются преимущественно на исторические, устоявшиеся связи между ключевыми словами или сущностями. В реальности социальный контекст (changing social context) и ассоциации терминов постоянно меняются из-за текущих событий (новости, тренды). Существующие системы могут упускать эти новые, краткосрочные связи. Изобретение улучшает релевантность, позволяя системе быстро адаптироваться к временному значению (temporal meaning) терминов.

Что запатентовано

Запатентована система для динамического выявления и использования временных связей между ключевыми словами (включая концепции и сущности). Система анализирует два набора данных: исторические документы (для понимания стандартных ассоциаций) и свежие документы (новости, социальные сети). Путем сравнения этих наборов система идентифицирует новые пары ключевых слов, которые стали часто встречаться вместе (co-occurrences), но не имеют исторической связи. Между этими словами создается «временная ссылка» (temporal link), которая используется для отбора контента в течение ограниченного периода времени.

Как это работает

Система работает в несколько этапов:

  • Исторический анализ: Анализируется первый набор документов (например, энциклопедии, словари) для создания первой структуры данных (First Data Structure), содержащей исторические совместные упоминания ключевых слов (historical keyword co-occurrences).
  • Анализ свежести: Анализируется второй набор свежих документов (например, новостные потоки, социальные сети), используя временные метки (publish time stamp).
  • Идентификация новизны: Создается вторая структура данных (Second Data Structure), включающая только те совместные упоминания, которых нет в исторической структуре.
  • Валидация и связывание: Если новая пара слов встречается достаточно часто (превышает порог частоты), система (Keyword Linker) создает временную ссылку (temporal link) между ними.
  • Применение: Эта временная ссылка передается на сервер отбора контента (Content Selection Server) для использования в реальном времени.
  • Управление жизненным циклом: Ссылке присваивается атрибут продолжительности (duration attribute), по истечении которого она удаляется.

Актуальность для SEO

Высокая. Способность поисковых систем понимать текущие события, тренды и быстро меняющийся контекст (Query Deserves Freshness - QDF) критически важна. Этот патент описывает базовый механизм того, как Google может идентифицировать возникающие связи между сущностями и темами в режиме, близком к реальному времени, что напрямую влияет на новостной поиск, Google Discover и обработку трендовых запросов.

Важность для SEO

Патент имеет высокое значение (7.5/10) для понимания механизмов свежести и трендов в Google. Хотя он описывает передачу данных на Content Selection Server (что может использоваться в контексте рекламы или рекомендаций), лежащая в основе технология идентификации временных связей критически важна для органического поиска, особенно в нишах News SEO и QDF. Он подчеркивает необходимость быстрого реагирования на тренды и понимания того, как контент может быть временно связан с текущими событиями.

Детальный разбор

Термины и определения

Aggregator (Агрегатор)
Компонент системы (например, веб-краулер), который собирает и парсит онлайн-документы (исторические и свежие) для идентификации совместных упоминаний.
Content Selection Server (Сервер отбора контента)
Сервер, который выбирает контент (например, рекламу, статьи, результаты поиска) для отображения на основе различных факторов, включая временные ссылки.
Co-occurrence (Совместное упоминание)
Ситуация, когда два ключевых слова, концепции или сущности появляются вместе в одном документе.
Duration attribute (Атрибут продолжительности)
Атрибут, присваиваемый временной ссылке, который определяет продолжительность её существования. Может быть предопределенным или динамически корректироваться.
First Data Structure (Первая структура данных)
База данных, содержащая исторические совместные упоминания ключевых слов, полученные из анализа стабильных источников (например, энциклопедий, словарей).
Frequency of co-occurrence (Частота совместного упоминания)
Метрика, определяющая, как часто пара ключевых слов встречается вместе в наборе свежих документов за определенный период времени. Используется для валидации временной ссылки.
Historical keyword co-occurrences (Исторические совместные упоминания)
Ключевые слова, которые обычно ассоциируются друг с другом (например, «бейсбол» и «бита»).
Keyword (Ключевое слово)
В контексте патента включает термин, фразу, семантическую концепцию или сущность (entity).
Keyword Linker (Связчик ключевых слов)
Компонент, который анализирует новые совместные упоминания, проверяет их достоверность по частоте и создает temporal links.
Publish time stamp (Временная метка публикации)
Метка времени, указывающая время публикации документа. Используется для идентификации свежих документов.
Second Data Structure (Вторая структура данных)
Структура данных, содержащая новые совместные упоминания ключевых слов, которых нет в первой структуре данных. Отражает изменения в социальном контексте.
Temporal link (Временная ссылка)
Контекстуальная связь между двумя ключевыми словами, указывающая на то, что они связаны в течение короткого периода времени из-за текущих событий, но обычно не связаны друг с другом.

Ключевые утверждения (Анализ Claims)

Claim 1 (Независимый пункт): Описывает основной метод временного отбора контента.

  1. Процессор анализирует первый набор онлайн-документов (исторических) для генерации First Data Structure, содержащей historical keyword co-occurrences.
  2. Процессор анализирует второй набор онлайн-документов (свежих), отличный от первого.
  3. Генерируется Second Data Structure, содержащая совместные упоминания ключевых слов, которых НЕТ в первой структуре.
  4. Создается временная ссылка (temporally linking) между первым и вторым ключевым словом из второй структуры данных, которые совместно встречаются в подмножестве свежих документов.
  5. Связанное второе ключевое слово передается на Content Selection Server.

Claim 2 (Зависимый от 1): Уточняет источники для первой структуры данных.

Анализ исторических документов включает парсинг онлайн-энциклопедии и/или онлайн-словаря.

Claim 3 (Зависимый от 1): Уточняет метод идентификации свежих документов (второго набора).

  1. Идентификация документов происходит через онлайн новостной поток (online news stream), где каждый документ имеет publish time stamp.
  2. Сравнение временной метки каждого документа с временным порогом (temporal threshold) для определения, является ли документ свежим.

Claim 4 (Зависимый от 1): Описывает процесс валидации для создания временной ссылки.

Система оценивает подмножество свежих документов, где оба ключевых слова встречаются вместе, и определяет характеристику этого совместного упоминания. Временная ссылка создается только в том случае, если характеристика удовлетворяет предопределенному порогу. Это обеспечивает надежность связи.

Claim 5 (Зависимый от 1): Уточняет характеристику из Claim 4 как частоту совместного упоминания.

Система определяет frequency of co-occurrence для пары ключевых слов. Временная ссылка создается, если частота превышает пороговое значение (frequency of co-occurrence threshold).

Claim 8 и 9 (Зависимые от 1 и 8): Описывают управление жизненным циклом временной ссылки.

Система определяет и присваивает атрибут продолжительности (duration attribute) для временной ссылки (Claim 8). Временная ссылка удаляется, когда её продолжительность превышает присвоенный атрибут продолжительности (Claim 9).

Где и как применяется

Изобретение охватывает несколько этапов обработки данных для выявления и использования временных трендов.

CRAWLING и INDEXING – Сканирование, Сбор данных и Индексирование
Aggregator системы активно собирает и анализирует два типа источников:

  1. Исторические источники: (например, энциклопедии, словари) для построения базовой линии нормальных ассоциаций (First Data Structure).
  2. Свежие источники: (например, новостные потоки, социальные сети). Система использует publish time stamps для фильтрации контента по временному порогу.

На этапе индексирования извлекаются совместные упоминания ключевых слов (keyword co-occurrences) из обоих источников.

QUNDERSTANDING – Понимание Запросов (Офлайн или Nearline обработка)
Основная логика патента применяется здесь, как часть общего процесса понимания эволюции языка и контекста.

  1. Сравнение и фильтрация: Система сравнивает свежие совместные упоминания с историческими и фильтрует новые пары (Second Data Structure).
  2. Валидация тренда: Система оценивает частоту (frequency of co-occurrence) новых пар, чтобы убедиться в надежности тренда.
  3. Генерация ссылок: Создаются временные ссылки (temporal links) и рассчитываются их атрибуты (duration attribute).

RANKING / RERANKING или Отбор Контента
Сгенерированные временные ссылки используются в процессе отбора контента. Когда система получает запрос, связанный с Ключевым Словом А, она проверяет наличие временных ссылок. Если Ключевое Слово А временно связано с Ключевым Словом Б, Ключевое Слово Б передается на Content Selection Server. Это позволяет учитывать контент, релевантный Ключевому Слову Б, при ответе на запрос о Ключевом Слове А.

Входные данные:

  • Первый набор исторических онлайн-документов.
  • Второй набор свежих онлайн-документов с временными метками.
  • Пороги частоты и временные пороги.

Выходные данные:

  • Структура данных временных ссылок (temporal links) с атрибутами продолжительности.
  • Передача связанных ключевых слов на Content Selection Server.

На что влияет

  • Специфические запросы: Наибольшее влияние на запросы, связанные с текущими событиями, новостями, трендами (QDF). Также влияет на запросы по общим терминам, чей контекст временно изменился из-за новостей.
  • Конкретные ниши или тематики: Новости, политика, развлечения, спорт, социальные медиа – ниши, где контекст меняется быстро.
  • Конкретные типы контента: Новостные статьи, посты в блогах, контент социальных сетей.

Когда применяется

  • Триггеры активации: Активация происходит, когда система обнаруживает всплеск частоты совместного упоминания (frequency of co-occurrence) для пары ключевых слов, которые ранее не были связаны (отсутствуют в исторической базе).
  • Условия применения: Частота должна превысить установленный порог (frequency of co-occurrence threshold) в течение определенного временного окна (temporal threshold).
  • Временные рамки: Система работает непрерывно или периодически для анализа свежих данных. Временные ссылки применяются только в течение их рассчитанной продолжительности (duration attribute).

Пошаговый алгоритм

Процесс А: Генерация исторического эталона (Офлайн/Периодически)

  1. Сбор исторических данных: Анализ первого набора документов (например, энциклопедии, словари).
  2. Анализ совместных упоминаний: Идентифицируются пары ключевых слов (концепций, сущностей), которые регулярно встречаются вместе.
  3. Создание эталона: Генерация первой структуры данных (First Data Structure) с historical keyword co-occurrences.

Процесс Б: Генерация и управление временными ссылками (Близко к реальному времени)

  1. Сбор свежих данных: Идентификация и анализ второго набора документов (например, новостные потоки, социальные сети). Используются publish time stamps для фильтрации по свежести (temporal threshold).
  2. Извлечение и фильтрация новых связей: Идентификация совместных упоминаний во втором наборе. Генерация второй структуры данных (Second Data Structure), включающей только те пары, которых нет в первой структуре.
  3. Оценка характеристик новых связей: Для каждой новой пары рассчитывается frequency of co-occurrence. Система может учитывать уникальность источников (например, фильтровать множественные упоминания от одного автора или домена).
  4. Валидация связи (Триггер): Сравнение частоты с пороговым значением (Frequency Threshold). Если порог превышен, связь считается надежной.
  5. Генерация временной ссылки: Keyword Linker создает temporal link между ключевыми словами.
  6. Расчет атрибутов: Определение и присвоение duration attribute. Продолжительность может быть фиксированной или динамической (зависеть от продолжающейся частоты упоминаний или показателей эффективности, таких как CTR).
  7. Передача данных: Temporal link передается на Content Selection Server.
  8. Удаление ссылки: Мониторинг продолжительности ссылки. Удаление ссылки по истечении duration attribute.

Какие данные и как использует

Данные на входе

  • Контентные факторы: Текст онлайн-документов используется для идентификации ключевых слов, концепций или сущностей и их совместного упоминания. Упоминается возможность использования семантического анализа (probabilistic semantic analysis или probabilistic latent semantic analysis) для идентификации концепций.
  • Временные факторы: Publish time stamp документов критически важен для определения свежести контента и расчета частоты упоминаний за период времени.
  • Технические факторы (Источники данных): Система различает типы источников: стабильные (энциклопедии, словари, биографии) для исторических данных и динамические (новостные потоки, социальные сети) для свежих данных. URL или идентификаторы документов используются для оценки уникальности упоминаний.
  • Пользовательские факторы (Опционально): Упоминается возможность для поставщиков контента включать или отключать (opt-in) использование временных ссылок для своего контента.

Какие метрики используются и как они считаются

  • Keyword co-occurrence: Бинарное определение наличия двух терминов в одном документе.
  • Frequency of co-occurrence: Количество уникальных совместных упоминаний в течение определенного периода времени. Патент предполагает использование техник для определения уникальности источников.
  • Temporal Threshold: Предопределенное временное окно (например, 12, 24, 48 часов) для определения свежести документов.
  • Frequency of co-occurrence threshold: Пороговое значение частоты, необходимое для создания temporal link. Служит для валидации достоверности связи.
  • Duration Attribute: Рассчитанная продолжительность жизни временной ссылки. Может быть динамической и корректироваться на основе показателей эффективности (упоминаются CTR или Conversion Rate) или продолжающейся частоты упоминаний.

Выводы

  1. Скорость адаптации к контексту: Патент демонстрирует механизм, позволяющий Google быстро идентифицировать и использовать новые ассоциации между терминами, вызванные текущими событиями, независимо от их исторического значения.
  2. Разделение исторических и временных связей: Система явно разделяет устоявшиеся ассоциации (historical co-occurrences) и краткосрочные тренды (temporal links). Это позволяет реагировать на новости, не «загрязняя» основной граф знаний временными явлениями.
  3. Валидация трендов через частотность (Credibility Check): Новые связи не принимаются слепо. Они должны пройти валидацию через порог частоты (frequency of co-occurrence threshold) и анализ уникальности источников, чтобы отсеять совпадения и подтвердить значимость тренда.
  4. Автоматическое управление жизненным циклом тренда: Временные ссылки имеют ограниченный срок действия (duration attribute), который может корректироваться динамически. Это позволяет системе автоматически «забывать» тренды, когда они теряют актуальность.
  5. Фундамент для QDF: Это фундаментальный механизм для работы систем типа QDF (Query Deserves Freshness), позволяющий алгоритмически определять, какие темы внезапно стали актуальными и какие сущности в них вовлечены.

Практика

Best practices (это мы делаем)

  • Мониторинг трендов и Newsjacking: Активно отслеживайте новости и социальные сети для выявления новых временных ассоциаций, связанных с вашими ключевыми темами. Этот патент подтверждает, что Google алгоритмически ищет эти связи.
  • Быстрое создание контента (Agile SEO): Если возникает значимый тренд, оперативно создавайте качественный контент, который связывает вашу экспертизу с текущим событием. Это увеличивает шансы ранжирования по запросам, связанным с трендом (QDF), поскольку система ищет свежие co-occurrences.
  • Оптимизация под свежесть: Убедитесь, что временные метки публикации (publish time stamp) четко видны, точны и присутствуют в микроразметке. Это критически важно для того, чтобы система классифицировала контент как свежий (попадание во второй набор документов).
  • Четкое установление связей в контенте: При освещении трендов используйте актуальную терминологию и убедитесь, что в тексте четко прослеживается связь между ключевыми терминами или сущностями. Это увеличивает вероятность того, что система зафиксирует совместное упоминание.

Worst practices (это делать не надо)

  • Игнорирование текущих событий: Полагаться исключительно на «вечнозеленый» контент и игнорировать текущие тренды означает упускать возможности трафика, связанные с временным изменением контекста запросов.
  • Манипуляция совместными упоминаниями: Попытки искусственно создать temporal link путем публикации множества низкокачественных документов или спама в соцсетях могут быть неэффективны. Система учитывает уникальность и надежность источников при подсчете частоты.
  • Медленное реагирование: Публикация контента о событии с опозданием может привести к тому, что пик тренда уже пройдет, и Duration Attribute временной ссылки истечет.

Стратегическое значение

Патент подчеркивает стратегическую важность скорости и адаптивности в SEO. Он дает представление о том, как Google обрабатывает информацию в эпоху мгновенных новостей. Для SEO-специалистов это подтверждает, что релевантность рассматривается не как статическая характеристика, а как динамическая, зависящая от времени и контекста. Стратегии должны включать процессы для мониторинга инфополя и быстрого производства контента.

Практические примеры

Сценарий: Внезапная связь политика и образовательного проекта

  1. Исходное состояние: Политик А и Образовательный Проект Б исторически не связаны (нет в First Data Structure).
  2. Событие: Политик А делает заявление о финансировании Проекта Б.
  3. Сбор данных: Система Google анализирует новостные потоки (Second plurality of online documents) и обнаруживает множество статей, где «Политик А» и «Проект Б» встречаются вместе.
  4. Идентификация новизны: Система определяет, что это новая связь (попадает в Second Data Structure).
  5. Валидация: Частота совместного упоминания превышает порог (например, 50 статей за 24 часа от разных новостных агентств).
  6. Создание ссылки: Создается temporal link между «Политик А» и «Проект Б» с duration attribute, например, 7 дней.
  7. Применение в SEO: Когда пользователи ищут «Проект Б», система теперь временно ассоциирует этот запрос с «Политик А». Новостные статьи, освещающие заявление политика о проекте, получат приоритет (QDF). Сайт Проекта Б должен быстро опубликовать пресс-релиз о заявлении политика, чтобы извлечь выгоду из этой временной связи.

Вопросы и ответы

Как система определяет, является ли связь между словами исторической или временной?

Система поддерживает две структуры данных. Первая (First Data Structure) содержит historical keyword co-occurrences, полученные путем анализа стабильных источников (энциклопедии, словари). Вторая (Second Data Structure) содержит только те совместные упоминания, которые были найдены в свежих документах (новости, соцсети), но отсутствуют в первой структуре. Связи из второй структуры считаются временными.

Насколько быстро система может обнаружить новый тренд или связь?

Скорость обнаружения зависит от настроенных временных порогов (temporal threshold) и частоты анализа свежих данных. Патент предполагает анализ в режиме, близком к реальному времени, используя временные окна, такие как 12, 24 или 48 часов. Если новый тренд генерирует достаточное количество публикаций (превышает порог частоты), он может быть обнаружен в течение нескольких часов.

Как долго существует временная ссылка (Temporal Link)?

Ссылке присваивается атрибут продолжительности (duration attribute). Он может быть фиксированным (например, 72 часа) или динамическим. Динамическая продолжительность может корректироваться в зависимости от того, как часто новая связь продолжает упоминаться в свежем контенте или от показателей эффективности (упоминаются CTR или Conversion Rate) контента, отобранного по этой ссылке.

Может ли этот механизм использоваться для манипуляции выдачей?

Патент предусматривает защиту от манипуляций (Credibility Check). Во-первых, требуется превышение порога частоты (frequency threshold) для создания ссылки. Во-вторых, система применяет методы для определения уникальности и надежности источников. Например, 10 сообщений от одного пользователя в социальной сети или на одном домене могут быть засчитаны как одно вхождение, а не десять.

Какое значение это имеет для News SEO и QDF?

Это критически важно. Патент фактически описывает механизм для реализации QDF (Query Deserves Freshness). Он показывает, как Google идентифицирует, какие темы актуальны прямо сейчас и какие новые связи между сущностями возникли. Быстрая публикация статей о трендовых событиях с использованием релевантной терминологии напрямую соответствует логике этого патента.

Влияет ли это только на рекламу или также на органический поиск?

Патент использует термин Content Selection Server, который может относиться к рекламным системам, рекомендациям или поиску. Технология идентификации временных связей между ключевыми словами является фундаментальной для понимания контекста. Очень вероятно, что подобные механизмы используются и в органическом поиске для понимания трендовых запросов и ранжирования свежего контента (Google News, блоки «Главные новости»).

Как SEO-специалисту использовать это знание для продвижения бренда?

Необходимо наладить мониторинг информационного поля в реальном времени (Newsjacking). Если ваш бренд упоминается в контексте нового тренда или события, нужно быстро реагировать: публиковать пресс-релизы, статьи в блоге, посты в соцсетях. Это усилит ассоциацию в глазах системы и позволит извлечь выгоду из temporal link для получения дополнительного охвата и трафика.

Что важнее: количество упоминаний или качество источников?

Важны оба аспекта. Количество упоминаний (частота) необходимо для преодоления порога и создания ссылки. Однако патент указывает на использование надежных источников, таких как online news stream, и механизмы для фильтрации неуникальных упоминаний. Следовательно, упоминания в авторитетных новостных источниках будут иметь больший вес для подтверждения достоверности связи.

Как система определяет «ключевые слова» для анализа совместной встречаемости?

Патент использует термин Keyword широко, включая термины, фразы, семантические концепции или сущности. Система может использовать методы семантического анализа (в описании упоминаются probabilistic semantic analysis или probabilistic latent semantic analysis), чтобы идентифицировать концепции в документе и анализировать их совместную встречаемость.

Может ли временная ссылка стать постоянной?

Патент фокусируется на временной природе этих ссылок и механизмах их удаления по истечении duration attribute. Если совместное упоминание сохраняется в течение очень длительного периода времени, оно может в конечном итоге быть классифицировано как historical co-occurrence при последующих пересчетах первой структуры данных, хотя этот процесс в патенте детально не описан.

Похожие патенты

Как Google встраивает ленту социальных обсуждений в реальном времени прямо в результаты поиска по трендовым запросам
Google использует механизм для идентификации трендовых запросов ("active keywords"), связанных с текущими событиями. Если пользователь ищет по такому запросу, система отбирает релевантные посты из социальных сетей, созданные во время события, и отображает их в виде специальной встроенной ленты ("discussion stream") прямо на странице результатов поиска, отделяя их от более старых социальных постов.
  • US9984155B2
  • 2018-05-29
  • SERP

  • Свежесть контента

  • Персонализация

Как Google автоматически распознает сущности в тексте и связывает их в Knowledge Graph с помощью динамических поисковых ссылок
Google использует автоматизированную систему для поддержания связей между сущностями (объектами) в своем хранилище фактов (Knowledge Graph). Система сканирует текст, статистически определяет значимые фразы и сверяет их со списком известных объектов. При совпадении создается динамическая «поисковая ссылка» вместо фиксированного URL. Это позволяет Google постоянно обновлять связи по мере добавления новых знаний.
  • US8260785B2
  • 2012-09-04
  • Knowledge Graph

  • Семантика и интент

  • Ссылки

Как Google связывает документы на основе поведения пользователей, времени взаимодействия и контентной близости для персонализации поиска
Google использует систему для определения "меры ассоциации" между различными документами (статьями, веб-страницами, письмами). Ассоциация рассчитывается на основе того, насколько близко по времени пользователь взаимодействовал с этими документами, насколько похож их контент и совпадают ли метаданные (например, автор). Эти связи используются для понимания пути пользователя и персонализации последующих результатов поиска.
  • US8131754B1
  • 2012-03-06
  • Поведенческие сигналы

  • Персонализация

  • Семантика и интент

Как Google использует исторические данные о документах, ссылках и поведении пользователей для определения свежести, качества и борьбы со спамом
Фундаментальный патент Google, описывающий использование временных рядов данных для ранжирования. Система анализирует историю документа (дату создания, частоту и объем обновлений), историю ссылок (скорость появления, возраст, изменения анкоров), тренды запросов и поведение пользователей. Эти данные используются для определения свежести контента, выявления неестественной активности (спама) и оценки легитимности домена.
  • US7346839B2
  • 2008-03-18
  • Свежесть контента

  • Антиспам

  • Ссылки

Как Google использует поведенческие сигналы и совместные просмотры для генерации рекомендаций контента (например, "Похожие видео" на YouTube)
Google использует механизм коллаборативной фильтрации для определения связанности контента, анализируя логи взаимодействия пользователей. Система определяет, какой контент пользователи потребляют совместно в рамках одной сессии ("locality of time"). Учитываются только "позитивные взаимодействия" (например, длительный просмотр, высокая оценка). Это позволяет формировать рекомендации на основе реального поведения аудитории, а не только метаданных.
  • US8055655B1
  • 2011-11-08
  • Поведенческие сигналы

  • Персонализация

Популярные патенты

Как Google консолидирует сигналы ранжирования между мобильными и десктопными версиями страниц, используя десктопный авторитет для мобильного поиска
Патент Google описывает механизм для решения проблемы недостатка сигналов ранжирования в мобильном вебе. Система идентифицирует корреляцию между мобильной страницей и её десктопным аналогом. Если мобильная версия недостаточно популярна сама по себе, она наследует сигналы ранжирования (например, обратные ссылки и PageRank) от авторитетной десктопной версии, улучшая её позиции в мобильном поиске.
  • US8996514B1
  • 2015-03-31
  • Техническое SEO

  • Ссылки

Как Google динамически формирует Панели Знаний, выбирая блоки информации на основе истории поисковых запросов пользователей
Google использует гибридный подход для создания структурированных страниц о сущностях (например, Панелей Знаний). Система анализирует исторические данные о том, что пользователи чаще всего ищут об этой сущности или её классе. На основе этого анализа динамически выбираются блоки информации (например, «Награды», «Саундтрек»), которые дополняют стандартный набор данных, позволяя автоматически адаптировать выдачу под актуальные интересы аудитории.
  • US10110701B2
  • 2018-10-23
  • Knowledge Graph

  • Поведенческие сигналы

  • Персонализация

Как Google рассчитывает тематическую репутацию для выявления и наделения полномочиями экспертов-кураторов
Google описывает систему для тематических сообществ, где пользователи зарабатывают репутацию (Topical Reputation Score) на основе качества контента, которым они делятся в рамках конкретных тем. Достигнув порогового значения, пользователь «разблокирует» тему, получая права куратора и возможность управлять контентом других. Система использует механизм «Impact Scores» для оценки влияния действий кураторов на репутацию участников.
  • US9436709B1
  • 2016-09-06
  • EEAT и качество

  • Поведенческие сигналы

Как Google выбирает предлагаемые запросы, анализируя вероятность завершения поиска и коммерческую ценность
Google использует графовую модель для анализа поисковых сессий пользователей. Система определяет, какие уточняющие запросы чаще всего приводят к завершению поиска (становятся «финальным пунктом назначения»). Эти запросы считаются обладающими наибольшей «полезностью» (Utility) и предлагаются пользователю в качестве подсказок или связанных запросов. Система также учитывает коммерческий потенциал этих запросов и может показывать для них релевантные рекламные блоки.
  • US8751520B1
  • 2014-06-10
  • SERP

  • Поведенческие сигналы

  • Семантика и интент

Как Google использует модель предвзятости представления (Presentation Bias), чтобы отделить клики по релевантности от кликов по позиции
Google использует механизм для интерпретации поведения пользователей (CTR), который учитывает, как именно представлены результаты поиска. Система рассчитывает ожидаемый CTR для конкретной позиции и визуального оформления (сниппет, выделение). Чтобы получить буст от поведенческих факторов, реальный CTR документа должен значительно превышать этот ожидаемый уровень. Это позволяет отфильтровать клики, обусловленные высокой позицией или привлекательным сниппетом, и выделить сигналы истинной релевантности.
  • US8938463B1
  • 2015-01-20
  • Поведенческие сигналы

  • SERP

Как Google использует персонализированный PageRank ссылающихся страниц для переоценки значимости анкорного текста
Google может персонализировать поисковую выдачу, изменяя вес анкорного текста ссылок. Вес ссылки зависит не от глобального PageRank ссылающейся страницы, а от её "персонализированного PageRank", рассчитанного на основе предпочтений пользователя (например, любимых сайтов или тематик). Это позволяет повышать в выдаче документы, на которые ссылаются авторитетные для конкретного пользователя источники.
  • US7260573B1
  • 2007-08-21
  • Персонализация

  • Ссылки

Как Google использует машинное зрение и исторические клики для определения визуального интента и ранжирования изображений
Google использует систему, которая определяет визуальное значение текстового запроса, анализируя объекты на картинках, которые пользователи выбирали ранее по этому или похожим запросам. Система создает набор «меток контента» (визуальный профиль) для запроса и сравнивает его с объектами, распознанными на изображениях-кандидатах с помощью нейросетей. Это позволяет ранжировать изображения на основе их визуального соответствия интенту пользователя.
  • US20200159765A1
  • 2020-05-21
  • Семантика и интент

  • Мультимедиа

  • Персонализация

Как Google рассчитывает тематическую популярность (Topical Authority) документов на основе поведения пользователей
Google использует данные о посещаемости и навигации пользователей для расчета популярности документов. Система классифицирует документы и запросы по темам, а затем вычисляет популярность документа внутри каждой конкретной темы (Per-Topic Popularity). Эта метрика используется как сигнал ранжирования, когда тема запроса пользователя соответствует теме документа.
  • US8595225B1
  • 2013-11-26
  • Поведенческие сигналы

  • Семантика и интент

  • SERP

Как Google использует личную историю поиска и профиль интересов для персонализации подсказок Autocomplete
Google персонализирует поисковые подсказки (Autocomplete), используя профиль интересов пользователя, созданный на основе его прошлых запросов и кликов. Система сравнивает тематику потенциальных подсказок с интересами пользователя и повышает в списке те варианты, которые соответствуют его предпочтениям, с учетом актуальности этих интересов.
  • US20140108445A1
  • 2014-04-17
  • Персонализация

  • Поведенческие сигналы

  • Семантика и интент

Как Google генерирует "Свежие связанные запросы" на основе анализа трендов и новостного контента
Google анализирует недавние поисковые логи, чтобы выявить запросы, демонстрирующие резкий рост популярности или отклонение от ожидаемой частоты. Эти "свежие" запросы проходят обязательную валидацию: они должны возвращать достаточное количество новостных результатов и иметь хорошие показатели вовлеченности (CTR). Это позволяет Google динамически обновлять блок "Связанные поиски", отражая актуальные события и тренды.
  • US8412699B1
  • 2013-04-02
  • Свежесть контента

  • Поведенческие сигналы

  • SERP

seohardcore