SEO HARDCORE
  • Разборы патентов
    • Патенты Google
  • Скоро SEO инструменты
  • Скоро SEO аналитика
  • seohardcore
SEO HARDCORE
назад

Как Google рассчитывает тематический авторитет сайта для кастомизации поиска с помощью Topic-Sensitive PageRank

CUSTOMIZATION OF SEARCH RESULTS FOR SEARCH QUERIES RECEIVED FROM THIRD PARTY SITES (Кастомизация результатов поиска для поисковых запросов, полученных со сторонних сайтов)
  • US7565630B1
  • Google LLC
  • 2004-06-15
  • 2009-07-21
  • Персонализация
  • SERP
  • Ссылки
  • Семантика и интент
  • Описание
  • Разбор
  • Выводы
  • Практика
  • FAQ
  • Похожие

Патент Google, описывающий механизм кастомизации результатов поиска, инициированного со стороннего сайта (например, Google Custom Search). Система использует «профиль сайта» для повышения результатов, соответствующих его тематике. Ключевая ценность патента — детальное описание расчета тематической авторитетности (Topic Boosts) путем анализа ссылок с эталонных сайтов (Start Sites), что является реализацией Topic-Sensitive PageRank.

Описание

Какую проблему решает

Патент решает проблему нерелевантности результатов общего поиска (general search engine), когда он используется через интерфейс на тематическом стороннем сайте (third party website). Стандартный поиск возвращает одинаковые результаты независимо от контекста. Например, как указано в патенте, запрос «giants» на сайте о бейсболе должен возвращать результаты о команде «San Francisco Giants», а не о гигантах в целом. Изобретение позволяет адаптировать общую выдачу под тематику исходного сайта.

Что запатентовано

Запатентована система кастомизации результатов поиска для запросов со сторонних сайтов (технология, лежащая в основе Google Custom/Programmable Search Engine). Суть заключается в использовании «профиля сайта» (Site Profile) — набора тем или доменов, релевантных для этого сайта. Поисковая система использует этот профиль для переранжирования результатов, повышая те, которые соответствуют тематике профиля, используя механизм тематической авторитетности (Topic Boosts).

Как это работает

Система работает в двух режимах: офлайн-расчет авторитетности и онлайн-кастомизация.

  • Офлайн-расчет (Topic Boosts): Система заранее рассчитывает авторитетность сайтов для конкретных тем. Это делается путем анализа графа ссылок между сайтами (Site Graph), начиная с эталонных сайтов (Start Sites) для каждой темы. Этот вес называется boost value.
  • Создание профиля (Site Profile): Оператор стороннего сайта создает профиль, выбирая темы из каталога (Topical Directory) или автоматически (анализируя контент/ссылки сайта).
  • Онлайн-кастомизация: Когда пользователь инициирует поиск на стороннем сайте, запрос отправляется вместе с Site Profile.
  • Переранжирование: Если документы в результатах поиска принадлежат сайтам, авторитетным для тем из профиля, их оценка релевантности (IR score) умножается на соответствующий boost value.
  • Результат: Пользователь видит выдачу, где тематически релевантные документы ранжируются выше.

Актуальность для SEO

Средняя. Технология напрямую используется в Google Programmable Search Engine (PSE). Однако главная ценность патента для SEO заключается не в описании этого продукта, а в детальном раскрытии механизма расчета тематической авторитетности (Topic Boosts). Изобретатели патента являются ключевыми фигурами в разработке Topic-Sensitive PageRank, и этот патент описывает практическую реализацию этой концепции.

Важность для SEO

Влияние на основной органический поиск минимальное, так как патент описывает кастомизацию только для сторонних сайтов. Однако он имеет высокое стратегическое значение (60/100) для понимания того, как Google концептуально подходит к вычислению тематической авторитетности (Topical Authority) на основе ссылок. Понимание механизма расчета Boost Value критически важно для построения эффективной долгосрочной SEO-стратегии и линкбилдинга.

Детальный разбор

Термины и определения

Boost Value / Topic Boost (Значение повышения / Вес темы)
Числовой коэффициент, отражающий степень авторитетности сайта в контексте определенной темы. Используется как множитель для повышения IR score документа.
Customization Server (Сервер кастомизации)
Компонент, применяющий Topic Boosts к результатам поиска на основе Site Profile.
Degree of Influence (Степень влияния)
Параметр (0-100%), позволяющий оператору сайта регулировать, насколько агрессивно Site Profile влияет на ранжирование.
General Search Engine (Общий поисковик)
Поисковая система, выполняющая поиск по всему интернету, а не только по конкретному сайту.
IR Score (Information Retrieval Score)
Базовая оценка релевантности документа запросу.
Site Graph (Граф сайтов)
Структура данных для расчета Topic Boosts. Узлы — это сайты, а ребра взвешены на основе количества ссылок между ними.
Site Profile (Профиль сайта)
Набор интересов (темы, домены), связанных со сторонним сайтом. Используется для кастомизации поиска.
Start Sites (S0) (Эталонные сайты)
Набор высокоавторитетных сайтов для определенной темы (например, из ODP, .gov, .edu). Используются как отправная точка для расчета Topic Boosts.
Topical Directory (Тематический каталог)
Иерархия тем (например, ODP/DMOZ), используемая для определения интересов и выбора Start Sites.

Ключевые утверждения (Анализ Claims)

Claim 1 (Независимый пункт): Описывает основной метод кастомизации поиска со стороннего сайта.

  1. Система получает запрос через интерфейс на стороннем сайте (third party website).
  2. Система получает доступ к профилю кастомизации (search customization profile), определенному провайдером этого сайта, содержащему идентификатор темы (topic identifier).
  3. Идентификатор темы сопоставляется с конкретной темой.
  4. Система извлекает документы с их оценками (information retrieval score).
  5. Оценка документов, связанных с этой темой, корректируется с использованием веса (weight value), связанного с этой темой.
  6. Документы ранжируются по скорректированным оценкам и возвращаются.

Claim 4 (Зависимый): Детализирует ручное создание профиля.

Система предоставляет тематический каталог (topical directory), где темы связаны с доменами, имеющими вес. Оператор выбирает темы для генерации профиля.

Claim 8 (Зависимый): Описывает автоматическое создание профиля.

Профиль генерируется автоматически путем анализа атрибутов стороннего сайта.

Claims 9-15 (Зависимые от 8): Уточняют методы автоматического анализа.

Методы включают анализ: ключевых слов сайта (Claim 9); исходящих ссылок (Claims 10, 11); входящих ссылок (Claims 12, 13); паттернов доступа пользователей к доменам (Claim 14); предыдущих поисковых запросов на сайте (Claim 15).

Claim 16 (Зависимый): Детализирует применение весов.

Определяются темы профиля и связанные с ними веб-сайты. IR score документов с этих сайтов взвешивается на weight value этого сайта.

Claim 19 (Зависимый): Вводит концепцию контроля.

Ранжирование реагирует на степень влияния (degree of influence) профиля, позволяя регулировать уровень кастомизации.

Где и как применяется

Изобретение использует предварительные вычисления на этапе индексирования и применяет логику на этапе ранжирования для кастомизированного поиска.

INDEXING – Индексирование и извлечение признаков
На этом этапе происходят критически важные офлайн-вычисления:

  • Построение Site Graph: Анализ ссылок для построения графа связей между сайтами.
  • Расчет Topic Boosts (Topic-Sensitive PageRank): Для каждой темы определяются Start Sites (S0). Затем путем итеративного анализа Site Graph (S0->S1->S2) вычисляются Boost Values для авторитетных сайтов в этой теме.
  • Автоматическое профилирование: Анализ контента/ссылок/поведения для автоматической генерации Site Profiles.

RANKING / RERANKING – Ранжирование и Переранжирование
Применение в реальном времени для запросов со сторонних сайтов:

  1. Получение запроса и профиля: Система получает запрос и Site Profile.
  2. Базовый поиск: Расчет базовых IR scores.
  3. Кастомизация: Customization Server извлекает карты {Site -> boost} для тем из профиля.
  4. Применение Boost: IR score документа умножается на Boost Value его сайта.
  5. Интерполяция (Опционально): Корректировка результатов в соответствии с заданной degree of influence.

На что влияет

  • Специфические запросы: Влияет на любые запросы, но только если они выполняются через встроенный поисковый интерфейс на стороннем сайте (Google CSE/PSE). Не влияет на основной органический поиск Google.com. Наибольший эффект заметен на неоднозначных запросах (например, «java», «apple»).

Когда применяется

  • Триггер активации: Запрос поступает в поисковик через интерфейс на стороннем сайте.
  • Условие: Для этого сайта определен Site Profile, и в параметрах запроса присутствует site_profile или Site_ID.

Пошаговый алгоритм

Процесс А: Офлайн-расчет Topic Boosts (Ключевой механизм)

  1. Построение Site Graph: Генерируется граф связей между сайтами на основе количества ссылок.
  2. Выбор эталонов (S0): Для каждой темы в каталоге выбираются Start Sites (S0) — эталонные авторитеты (например, из ODP, .gov, .edu).
  3. Первая итерация (S1): Идентифицируются сайты S1, на которые активно ссылаются сайты из S0. Им присваивается вес.
  4. Вторая итерация (S2): Идентифицируются сайты S2, на которые активно ссылаются сайты из S1. Им также присваивается вес.
  5. Сохранение Boost Values: Рассчитанные веса для S1/S2 сохраняются как Boost Values в картах {Site -> boost} для данной темы.

Процесс Б: Обработка запроса в реальном времени

  1. Получение запроса: Система получает запрос (Q) и Site Profile со стороннего сайта.
  2. Базовый поиск: Search Engine рассчитывает базовые IR scores для документов.
  3. Извлечение Boosts: Customization Server извлекает карты {Site -> boost} для тем из Site Profile.
  4. Применение Boost: Для каждого документа проверяется его домен. Если он есть в карте, его IR score умножается на Boost Value.
  5. Обработка степени влияния (Опционально): Если задана degree of influence, итоговый скор интерполируется между базовым (0%) и полностью кастомизированным (100%) скором.
  6. Ранжирование и возврат: Документы сортируются по итоговым скорректированным оценкам.

Какие данные и как использует

Данные на входе

Ссылочные факторы (Критически важно):

  • Ссылки между сайтами: Используются для построения Site Graph и расчета Boost Values (распространение веса от S0).
  • Входящие/Исходящие ссылки стороннего сайта: Могут использоваться для автоматической генерации Site Profile (Claims 10-13).

Контентные факторы:

  • Ключевые слова на стороннем сайте: Анализ частоты, выделения (заголовки) для автоматической генерации Site Profile (Claim 9).

Поведенческие факторы:

  • Предыдущие поисковые запросы: Анализ логов запросов на стороннем сайте для генерации Site Profile (Claim 15).
  • Паттерны просмотра (Browsing patterns): Анализ того, какие домены пользователи посещают вместе со сторонним сайтом, для генерации Site Profile (Claim 14).

Системные данные:

  • Topical Directory (ODP): Источник тем и Start Sites.

Какие метрики используются и как они считаются

  • Boost Value (Topic Boost): Метрика тематической авторитетности сайта. Рассчитывается офлайн методом итеративного анализа ссылок (Topic-Sensitive PageRank), описанным в Процессе А.
  • IR Score: Базовая оценка релевантности.
  • Скорректированный IR Score: Рассчитывается путем умножения базового IR Score на Boost Value.

Выводы

  1. Отсутствие прямого влияния на основной поиск: Патент описывает механизм для Google Custom/Programmable Search Engine. Он не описывает алгоритмы ранжирования основного органического поиска Google.
  2. Детальный механизм расчета Тематического Авторитета: Ключевая ценность патента — это описание расчета Topic Boosts. Это практическая реализация Topic-Sensitive PageRank, критически важная для понимания Topical Authority и E-E-A-T.
  3. Авторитет контекстуален (Topic-Specific): Авторитет не является универсальным показателем. Он рассчитывается для каждой темы отдельно, основываясь на распространении веса от эталонных Start Sites (S0) по Site Graph.
  4. Критичность тематических ссылок с эталонов: Для получения высокого Topic Boost необходимо получать ссылки от признанных авторитетов в нише (S0) или сайтов, близких к ним (S1, S2). Ссылки вне тематического графа не влияют на этот показатель.
  5. Автоматическое определение тематики сайта: Патент раскрывает методы автоматического профилирования сайта (Claims 8-15) через анализ контента, входящих/исходящих ссылок и поведения пользователей, что подчеркивает важность четкого тематического позиционирования.

Практика

Best practices (это мы делаем)

Хотя патент описывает конкретный продукт (CSE/PSE), мы должны использовать описанные механизмы расчета тематического авторитета (Topic Boosts) для улучшения общей SEO-стратегии, предполагая, что схожие принципы (Topic-Sensitive PageRank) применяются в основном поиске.

  • Идентификация и получение ссылок от Эталонов (S0/S1): Определите сайты, которые Google может считать Start Sites в вашей нише (отраслевые организации, .edu, .gov, ведущие порталы). Сфокусируйте линкбилдинг на получении прямых ссылок с этих ресурсов или с тех, на кого они ссылаются (S1).
  • Интеграция в тематический Site Graph: Развивайте ссылочный профиль так, чтобы ваш сайт находился на небольшом расстоянии (1-2 клика) от эталонных авторитетов. Это увеличивает вероятность получения высокого Topic Boost.
  • Четкое тематическое позиционирование: Убедитесь, что контент, семантика, исходящие и входящие ссылки четко соответствуют основной тематике. Это помогает системам автоматического профилирования (описанным в патенте) корректно классифицировать сайт.
  • Стратегические исходящие ссылки: Ссылайтесь на авторитетные источники (S0/S1). Анализ исходящих ссылок используется для определения тематики сайта (Claims 10, 11).

Worst practices (это делать не надо)

  • Игнорирование тематичности ссылок: Построение ссылочного профиля на основе общих метрик (например, DR) без учета тематической релевантности донора. Патент подчеркивает, что тематический авторитет распространяется только от тематически связанных эталонных сайтов.
  • Размытие тематики сайта: Создание контента на множество не связанных тем мешает идентифицировать основную экспертизу сайта, что приводит к низким показателям Topic Boost.
  • Изоляция от авторитетов: Отсутствие входящих и исходящих ссылочных связей с признанными авторитетными ресурсами в нише препятствует интеграции сайта в тематический Site Graph.

Стратегическое значение

Этот патент является ключевым документом, подтверждающим переход от глобальной авторитетности (классический PageRank) к тематической (Topic-Sensitive PageRank). Он показывает, что авторитет рассчитывается внутри тематических графов. Долгосрочная SEO-стратегия должна быть направлена на то, чтобы стать признанным узлом (S1 или S2) в своей тематике, получая признание и ссылки от эталонных источников (S0).

Практические примеры

Сценарий: Повышение тематического авторитета медицинского сайта (используя логику Topic Boost)

  1. Задача: Улучшить Topical Authority сайта клиники в нише «Кардиология».
  2. Идентификация Start Sites (S0): Определить эталонные сайты. Согласно логике патента, это могут быть правительственные организации (nih.gov, cdc.gov) и крупные медицинские университеты (например, med.stanford.edu).
  3. Анализ S1/S2: Проанализировать, на кого ссылаются S0 (это сайты S1, например, профильные журналы) и кто ссылается на S1 (сайты S2).
  4. Разработка стратегии линкбилдинга: Сфокусировать усилия на получении ссылок с сайтов S0 (максимально эффективно) или S1/S2. Например, через публикацию исследований, которые могут заинтересовать университеты или профильные журналы.
  5. Ожидаемый результат: Улучшение позиций сайта в тематическом Site Graph, что приведет к увеличению рассчитанного Topic Boost и, как следствие, улучшению ранжирования по медицинским запросам (применяя эту логику к основному поиску).

Вопросы и ответы

Влияет ли этот патент на органическое ранжирование в основном поиске Google?

Нет, напрямую не влияет. Патент описывает систему кастомизации результатов для поиска, выполняемого через интерфейс на стороннем сайте (например, Google Custom Search). Он не изменяет ранжирование в основном поиске Google.com.

В чем тогда ценность этого патента для SEO-специалиста?

Основная ценность — в детальном описании механизма расчета тематического авторитета (Topic Boosts). Это реализация Topic-Sensitive PageRank. Понимание того, как Google идентифицирует авторитетные сайты для конкретных тем (используя Site Graph и Start Sites), критически важно для построения Topical Authority и подтверждения E-E-A-T.

Как рассчитывается «Topic Boost» (Boost Value)?

Он рассчитывается офлайн. Сначала определяются эталонные сайты (Start Sites, S0) для темы. Затем анализируется граф сайтов (Site Graph), чтобы увидеть, насколько активно на сайт ссылаются эталоны (формируя S1) или сайты, на которые ссылаются эталоны (формируя S2). Чем ближе сайт к S0 в графе, тем выше его Topic Boost.

Что такое «Start Sites» (S0) и почему они важны?

Start Sites (S0) — это набор эталонных сайтов, которые считаются безусловно авторитетными в теме (например, сайты .edu, .gov, крупные порталы). Они являются источником тематического авторитета, который распространяется по ссылкам. Получение ссылок от S0 или близких к ним сайтов (S1) крайне важно для Topical Authority.

Что это значит для стратегии линкбилдинга?

Это подчеркивает критическую важность получения ссылок от авторитетных сайтов именно в вашей нише. Для увеличения Topic Boost нужны не просто любые ссылки, а ссылки от сайтов, которые Google считает эталонными (S0/S1) в конкретной тематике. Тематичность и авторитет донора имеют решающее значение.

Как Google определяет тематику сайта автоматически?

Патент описывает несколько методов для автоматической генерации Site Profile. Google анализирует ключевые слова на сайте, тематику сайтов, связанных входящими и исходящими ссылками, а также поведение пользователей (паттерны просмотра и логи предыдущих поисковых запросов на сайте).

Актуален ли этот патент, учитывая, что ODP (DMOZ) закрыт?

Да, концептуально патент актуален. Хотя ODP использовался как пример Topical Directory и источника Start Sites, сам механизм не привязан к конкретному каталогу. Google использует другие источники (например, Knowledge Graph, Википедию) для определения тем и эталонных сайтов. Базовая концепция расчета тематической авторитетности через ссылки с эталонов остается неизменной.

Как определить, какие сайты являются эталонными (S0) в моей нише?

На практике это наиболее трастовые ресурсы: государственные порталы, крупные университетские сайты, ведущие отраслевые организации, а также сайты, которые стабильно занимают топовые позиции по самым общим запросам в нише и имеют мощный ссылочный профиль.

Что такое «Degree of Influence» (Степень влияния)?

Это настройка, позволяющая владельцу стороннего сайта контролировать, насколько агрессивно применяется кастомизация поиска. Если установлено 0%, пользователь увидит стандартные результаты. Если 100%, Topic Boosts применяются в полную силу. Это позволяет балансировать между общей релевантностью и тематической спецификой.

Может ли Google автоматически определить неправильный профиль для сайта?

Да, если сигналы сайта неоднозначны. Если контент размыт, а входящие и исходящие ссылки ведут на ресурсы разных тематик, автоматическая генерация Site Profile может привести к неточной классификации. Это подчеркивает важность четкого тематического позиционирования сайта и чистоты его ссылочного профиля.

Похожие патенты

Как Google персонализирует результаты поиска в зависимости от сайта, с которого отправлен запрос
Google анализирует совокупные поисковые запросы и последующие клики пользователей, инициирующих поиск с определенного веб-сайта. На основе этих данных создается «Профиль Веб-сайта», отражающий коллективные интересы его аудитории. Этот профиль используется для переранжирования будущих результатов: один и тот же запрос, отправленный с разных сайтов, даст разную выдачу, адаптированную под контекст источника.
  • US8078607B2
  • 2011-12-13
  • Персонализация

  • Поведенческие сигналы

  • SERP

Как Google использует персонализированный PageRank ссылающихся страниц для переоценки значимости анкорного текста
Google может персонализировать поисковую выдачу, изменяя вес анкорного текста ссылок. Вес ссылки зависит не от глобального PageRank ссылающейся страницы, а от её "персонализированного PageRank", рассчитанного на основе предпочтений пользователя (например, любимых сайтов или тематик). Это позволяет повышать в выдаче документы, на которые ссылаются авторитетные для конкретного пользователя источники.
  • US7260573B1
  • 2007-08-21
  • Персонализация

  • Ссылки

Как Google определяет тематическую авторитетность источников ("каналов") и агрессивно продвигает их свежий контент
Google идентифицирует "каналы" (сайты, блоги, разделы), которые исторически создают высококачественный контент по определенным темам. Система рассчитывает тематическую авторитетность, учитывая качество контента и сфокусированность канала. Когда авторитетный канал публикует новый контент по своей теме, Google может агрессивно повысить его в выдаче, даже если у контента еще нет ссылок или поведенческих сигналов.
  • US8874558B1
  • 2014-10-28
  • EEAT и качество

  • Свежесть контента

  • Индексация

Как Google классифицирует веб-страницы и персонализирует выдачу, используя историю запросов и поведенческие данные
Google использует итеративный метод для тематической классификации веб-страниц, не анализируя их контент напрямую. Система анализирует исторические логи запросов и данные о кликах. Классификация известных страниц переносится на запросы, в результатах которых они появляются, а затем классификация этих запросов переносится на новые страницы. Эти данные используются для построения профилей пользователей и персонализации поисковой выдачи.
  • US8185544B2
  • 2012-05-22
  • Персонализация

  • Поведенческие сигналы

  • SERP

Как Google нормализует и объединяет разнородные сигналы для ранжирования критериев таргетинга в рекламных системах
Патент Google, описывающий методы ранжирования критериев распространения контента (например, ключевых слов или мест размещения для рекламы). Система объединяет основной сигнал (например, релевантность) с вспомогательными (CTR, показы), используя математические трансформации для уменьшения искажений данных (Skewness) и гарантируя, что отсутствие данных по сигналу не пессимизирует критерий. Патент относится к AdTech, а не к органическому поиску.
  • US9501549B1
  • 2016-11-22
  • Поведенческие сигналы

Популярные патенты

Как Google комбинирует визуальное сходство и поведение пользователей для переранжирования поиска по картинкам
Google использует механизм для перекрестной проверки релевантности изображений, объединяя поведенческие сигналы (клики) с визуальным анализом. Если изображение часто кликают и оно визуально похоже на другие релевантные изображения по запросу (совместная релевантность), его рейтинг агрессивно повышается. Если оно редко кликается и визуально отличается (совместная нерелевантность), его рейтинг понижается. Это защищает выдачу от кликбейта.
  • US8209330B1
  • 2012-06-26
  • Поведенческие сигналы

  • SERP

  • Мультимедиа

Как Google динамически изменяет вес синонимов в ранжировании на основе поведения пользователей
Google не присваивает фиксированный вес синонимам (замещающим терминам) при ранжировании. Вес синонима динамически корректируется для каждого документа в зависимости от того, насколько релевантен исходный термин запроса этому документу. Эта релевантность определяется на основе поведенческих данных (клики, время просмотра), что позволяет точнее интерпретировать значение синонимов в контексте конкретной страницы.
  • US9116957B1
  • 2015-08-25
  • Поведенческие сигналы

  • Семантика и интент

  • SERP

Как Google использует обучение с подкреплением (Reinforcement Learning) для оптимизации ранжирования и переписывания запросов на основе успешности поисковых сессий
Google использует систему Reinforcement Learning для динамической адаптации поисковых процессов. Система анализирует поисковые сессии (последовательности запросов и кликов) и учится оптимизировать выдачу, чтобы пользователь быстрее находил нужный результат. Это достигается путем корректировки весов факторов ранжирования, переписывания запросов или даже обновления индекса на лету для конкретных ситуаций.
  • US11157488B2
  • 2021-10-26
  • Индексация

  • Поведенческие сигналы

  • Семантика и интент

Как Google использует историю физических перемещений пользователя для фильтрации и персонализации результатов поиска
Google может собирать и хранить историю физических перемещений пользователя (Location History). Патент описывает интерфейс, позволяющий пользователю осознанно включать свои прошлые местоположения (например, «места, где я был на прошлой неделе») в качестве фильтра для нового поискового запроса, чтобы сделать результаты более релевантными личному опыту.
  • US8874594B2
  • 2014-10-28
  • Персонализация

  • Поведенческие сигналы

  • Local SEO

Как Google использует контент вокруг ссылок (вне анкора) для генерации «Синтетического Описательного Текста» и ранжирования вашего сайта
Google может генерировать «Синтетический Описательный Текст» для страницы, анализируя контент и структуру сайтов, которые на нее ссылаются. Система создает структурные шаблоны для извлечения релевантного текста (например, заголовков или абзацев рядом со ссылкой), который затем используется как мощный сигнал ранжирования. Этот механизм позволяет лучше понять содержание страницы, особенно если традиционный анкорный текст низкого качества или отсутствует.
  • US9208233B1
  • 2015-12-08
  • Ссылки

  • Семантика и интент

  • Индексация

Как Google использует контекст пользователя и интерактивное уточнение для обучения моделей поиска
Google может инициировать поиск пассивно, основываясь на контексте действий пользователя (например, чтении статьи или телефонном звонке). Система позволяет пользователю уточнить этот поиск, выбрав один из использованных критериев (например, тапнув на сущность в тексте), чтобы повысить его значимость. Реакция пользователя на уточненные результаты используется для машинного обучения и улучшения взвешивания критериев в будущих поисковых запросах.
  • US11568003B2
  • 2023-01-31
  • Семантика и интент

  • Персонализация

  • Поведенческие сигналы

Как Google использует анализ со-цитирования (Co-citation) для группировки результатов поиска по темам
Google использует механизм кластеризации для организации поисковой выдачи, особенно при неоднозначных запросах. Система анализирует, какие внешние страницы одновременно ссылаются на несколько результатов поиска (со-цитирование). На основе этого вычисляется показатель сходства, который учитывает и нормализует популярность страниц, чтобы точно сгруппировать результаты по конкретным темам (например, отделить «Saturn» как планету от «Saturn» как автомобиль).
  • US7213198B1
  • 2007-05-01
  • Ссылки

  • SERP

Как Google определяет авторитетные сайты для конкретных тем, анализируя «гибридные запросы» пользователей
Google анализирует «гибридные запросы» (например, «back pain WebMD»), чтобы понять, какие сайты пользователи считают лучшими источниками информации по конкретным темам. Система создает карты соответствия между темами и авторитетными ресурсами. Эти данные используются для повышения релевантности авторитетных сайтов в выдаче по информационным запросам и для улучшения поисковых подсказок.
  • US9244972B1
  • 2016-01-26
  • EEAT и качество

  • Семантика и интент

  • SERP

Как Google проактивно уведомляет пользователей об изменении цен или доступности товаров на основе их предполагаемого намерения покупки
Google анализирует действия пользователя (поисковые запросы, посещения сайтов), чтобы выявить намерение в отношении сущностей (например, продуктов или авиабилетов). Если намерение сильное и происходит значительное изменение (падение цены или изменение доступности), Google проактивно отправляет уведомление со ссылками для завершения действия (например, покупки).
  • US20180357238A1
  • 2018-12-13
  • Семантика и интент

  • Поведенческие сигналы

  • Персонализация

Как Google использует клики пользователей в поиске по картинкам для понимания содержания изображений и улучшения таргетинга
Google анализирует поведение пользователей в поиске по картинкам для идентификации содержания изображений. Если пользователи ищут определенный запрос (идею) и массово кликают на конкретное изображение в результатах, система связывает это изображение с данным запросом (концепцией). Эти данные используются для улучшения ранжирования в поиске картинок и для предложения релевантных ключевых слов рекламодателям, загружающим схожие изображения.
  • US11409812B1
  • 2022-08-09
  • Поведенческие сигналы

  • Семантика и интент

  • SERP

seohardcore