SEO HARDCORE
  • Разборы патентов
    • Патенты Google
  • Скоро SEO инструменты
  • Скоро SEO аналитика
  • seohardcore
SEO HARDCORE
назад

Как Google использует тематические списки предпочтительных и нежелательных сайтов (Editorial Opinion) для корректировки ранжирования

SYSTEM AND METHOD FOR SUPPORTING EDITORIAL OPINION IN THE RANKING OF SEARCH RESULTS (Система и метод поддержки редакторского мнения при ранжировании результатов поиска)
  • US7096214B1
  • Google LLC
  • 2000-12-13
  • 2006-08-22
  • EEAT и качество
  • Антиспам
  • SERP
  • Семантика и интент
  • Описание
  • Разбор
  • Выводы
  • Практика
  • FAQ
  • Похожие

Google может заранее определять "Темы запросов" (Query Themes) и назначать для них списки "Предпочтительных" (Favored) и "Нежелательных" (Non-Favored) источников. Если запрос пользователя соответствует теме, система корректирует ранжирование: повышает предпочтительные источники и понижает нежелательные, используя "Параметр редакторского мнения" (Editorial Opinion Parameter).

Описание

Какую проблему решает

Патент решает проблему масштабирования редакторского мнения (Editorial Opinion) в поисковых системах. Вместо оценки отдельных страниц вручную (как в каталогах типа Yahoo! или DMOZ), изобретение позволяет применять редакторские суждения к целым источникам (сайтам или разделам) в контексте определенных тематик. Это направлено на улучшение качества выдачи путем продвижения авторитетного контента и борьбы с дезинформацией, спамом (“spam techniques”) или чрезмерной рекламой в масштабах всего индекса.

Что запатентовано

Запатентована система интеграции редакторского мнения в ранжирование результатов поиска. Система позволяет определять Query Themes (Темы запросов), идентифицировать для этих тем Favored Sources (Предпочтительные источники) и Non-Favored Sources (Нежелательные источники), и назначать Editorial Opinion Parameters (Параметры редакторского мнения). Эти параметры используются для автоматической корректировки (повышения или понижения) рейтинга результатов, если запрос пользователя соответствует определенной теме.

Как это работает

Система работает в двух режимах:

  • Офлайн (Подготовка): Редакторы или автоматизированные системы определяют общие темы (Query Themes) и критерии их срабатывания. Для каждой темы составляются списки предпочтительных и нежелательных источников, и определяются параметры корректировки рейтинга для них.
  • Онлайн (Обработка запроса): Когда поступает запрос, система проверяет, соответствует ли он какой-либо Query Theme. Если да, система идентифицирует результаты поиска, исходящие от Favored или Non-Favored Sources, и применяет к их Ranking Scores соответствующий Editorial Opinion Parameter, переранжировывая финальную выдачу.

Актуальность для SEO

Средняя/Высокая. Патент подан в 2000 году, и конкретные методы реализации (например, опора на Open Directory/Yahoo! и простые правила) устарели. Однако базовая концепция — идентификация авторитетных и неавторитетных источников для конкретных тем — является фундаментальной для современных концепций Google, таких как E-E-A-T и YMYL. Принцип тематически обусловленной корректировки авторитетности остается высоко актуальным, хотя теперь реализуется с помощью ML-моделей.

Важность для SEO

Влияние на SEO высокое. Патент описывает конкретный механизм, позволяющий Google систематически повышать или понижать целые сайты на основе оценки их качества/авторитетности, привязанной к конкретным тематикам. Это подчеркивает критическую важность построения признанного авторитета и репутации (E-E-A-T) в своей нише для того, чтобы быть классифицированным как Favored Source.

Детальный разбор

Термины и определения

Editorial Opinion Parameter (Параметр редакторского мнения)
Числовое значение или правило, которое количественно определяет редакторское мнение о конкретном источнике в контексте Query Theme. Используется для модификации Ranking Score результата (повышение, понижение, удаление из выдачи или перемещение наверх).
Favored Sources (Предпочтительные источники)
Набор веб-страниц, сайтов, хостов или префиксов URL, идентифицированных как источники полезного или авторитетного контента (useful or authoritative content) по определенной Query Theme.
Non-Favored Sources (Нежелательные источники)
Набор веб-страниц, сайтов, хостов или префиксов URL, идентифицированных как источники дезинформации (misinformation), чрезмерной рекламы (over-promotion) или спама по определенной Query Theme.
Query Theme (Тема запроса)
Тема или категория информации, часто встречающаяся в поисковых запросах пользователей (например, "сайты с бесплатной загрузкой ПО" или "поиск жилья").
Query Theme Criteria (Критерии темы запроса)
Правила или данные, используемые для определения того, относится ли входящий поисковый запрос к определенной теме. Могут быть выражены как булевы правила (например, наличие слов "free" AND "download") или как набор категорий из иерархического каталога.
Topic Hierarchy / Directory (Иерархический каталог)
Структурированный каталог веб-ресурсов (например, Yahoo!, Open Directory/DMOZ), используемый для классификации тем запросов и автоматической идентификации предпочтительных источников.

Ключевые утверждения (Анализ Claims)

Claim 1 (Независимый пункт): Описывает основной метод предоставления результатов поиска.

  1. Система получает поисковый запрос.
  2. Извлекаются объекты (результаты) в ответ на запрос.
  3. Система автоматически определяет, соответствует ли запрос хотя бы одной Query Theme.
  4. Определяется, относится ли какой-либо из извлеченных объектов к списку Favored или Non-Favored Sources.
  5. Объекты ранжируются на основе результата обоих определений: (а) соответствия запроса теме И (б) отношения объекта к списку источников.
  6. Ранжированные объекты предоставляются клиенту.

Claim 3 и 4 (Зависимые от 1): Детализируют механизм ранжирования и эффект параметра.

  1. Для объектов, НЕ относящихся к списку источников, оценка определяется стандартно (первая группа параметров).
  2. Для объектов, относящихся к списку источников, оценка определяется стандартно ПЛЮС Editorial Opinion Parameter (Claim 3).
  3. Editorial Opinion Parameter приводит к повышению ранга Favored Sources и понижению ранга Non-Favored Sources (Claim 4).

Claim 5 и 6 (Зависимые от 1): Описывают методы определения соответствия запроса теме.

  • Claim 5: Определение основано на соответствии запроса правилу (query rule), связанному с темой.
  • Claim 6: Определение основано на классификации запроса в набор тем (topics) и сравнении этого набора с темами, в которые была классифицирована Query Theme.

Claim 17 (Независимый пункт): Описывает процесс настройки системы (офлайн).

  1. Разработка Query Themes.
  2. Идентификация для каждой темы наборов объектов как Favored и Non-Favored.
  3. Определение Editorial Opinion Parameter для каждого объекта в наборах.
  4. Автоматическое использование этого параметра для изменения ранжирования списка объектов, полученных в ответ на запрос.

Claim 24 (Зависимый от 21): Описывает автоматический метод идентификации Favored Sources. Он включает классификацию Query Theme в набор тем из иерархического каталога и идентификацию имен хостов, перечисленных в этих темах, как предпочтительных источников.

Где и как применяется

Изобретение затрагивает несколько этапов поиска, используя данные, подготовленные заранее, и влияя на финальное ранжирование.

INDEXING / Офлайн-подготовка
Происходит разработка Query Themes, определение критериев и составление списков Favored/Non-Favored Sources. Если используется автоматическая идентификация источников (Claim 24), данные из иерархических каталогов (DMOZ, Yahoo!) должны быть проиндексированы и ассоциированы с соответствующими хостами.

QUNDERSTANDING – Понимание Запросов
На этом этапе система анализирует входящий запрос, чтобы определить, соответствует ли он какой-либо заранее определенной Query Theme, используя Query Theme Criteria (правила или классификацию).

RANKING – Ранжирование
Генерируется первоначальный набор результатов и рассчитываются их базовые Ranking Scores с использованием стандартных факторов (патент упоминает текстовое соответствие, связность, популярность).

RERANKING – Переранжирование
Основное применение патента. Если была активирована Query Theme, система проверяет источники полученных результатов. Если результат исходит от Favored или Non-Favored Source, его базовый Ranking Score корректируется с помощью Editorial Opinion Parameter. Происходит финальная сортировка.

Входные данные:

  • Поисковый запрос пользователя.
  • Первоначальный набор результатов с их Ranking Scores.
  • База данных редакторского мнения (Query Themes, Criteria, списки Sources и Parameters).

Выходные данные:

  • Переранжированный список результатов поиска с модифицированными оценками.

На что влияет

  • Конкретные ниши или тематики: Влияет только на те ниши, для которых были определены Query Themes. Учитывая упоминание редакторского труда, это, вероятно, были важные, чувствительные (потенциально YMYL) или подверженные спаму тематики (примеры в патенте: "бесплатная загрузка ПО", "поиск жилья").
  • Конкретные типы сайтов: Влияет на сайты, которые были явно идентифицированы как Favored или Non-Favored Sources для этих тем.

Когда применяется

Алгоритм применяется только при выполнении строгого набора условий:

  • Триггер активации (Тема): Входящий поисковый запрос должен удовлетворять Query Theme Criteria (соответствовать правилу или классифицироваться в определенную категорию).
  • Условие применения (Источник): Модификация ранжирования применяется только к тем результатам в выдаче, которые происходят из источников (сайтов, хостов, URL префиксов), перечисленных в списках Favored или Non-Favored Sources для этой конкретной темы.

Пошаговый алгоритм

Процесс А: Подготовка данных (Офлайн)

  1. Разработка тем запросов: Редакторы анализируют логи запросов и определяют часто встречающиеся Query Themes.
  2. Определение критериев тем: Для каждой темы устанавливаются Query Theme Criteria (булевы правила ИЛИ набор категорий из иерархического каталога).
  3. Идентификация источников: Для каждой темы определяются наборы Favored Sources и Non-Favored Sources. Это может быть сделано:
    1. Вручную редакторами (на основе авторитетности или выявления дезинформации/спама).
    2. Автоматически (например, путем выбора хостов, перечисленных в соответствующих категориях авторитетного каталога).
  4. Определение параметров мнения: Для каждого источника в списках определяется Editorial Opinion Parameter (величина повышения или понижения рейтинга).
  5. Сохранение данных: Темы, критерии, списки источников и параметры сохраняются в базе данных.

Процесс Б: Обработка запроса (Онлайн)

  1. Получение запроса: Система получает поисковый запрос от пользователя.
  2. Извлечение и оценка: Извлекаются релевантные веб-страницы и определяются их первоначальные Ranking Scores.
  3. Проверка редакторского мнения: Система определяет, существует ли Editorial Opinion для данного запроса, проверяя, соответствует ли запрос критериям какой-либо Query Theme.
    • Если НЕТ: Перейти к шагу 6.
    • Если ДА: Перейти к шагу 4.
  4. Определение затронутых сайтов: Система идентифицирует, происходят ли какие-либо из полученных результатов поиска из Favored или Non-Favored Sources, связанных с активированной темой.
  5. Обновление оценок: Для каждого результата, исходящего от затронутого источника, система вычисляет обновленный Ranking Score, применяя соответствующий Editorial Opinion Parameter.
  6. Предоставление результатов: Система предоставляет пользователю ранжированный список на основе финальных (обновленных или первоначальных) оценок.

Какие данные и как использует

Данные на входе

Патент использует следующие типы данных:

  • Контентные факторы: Текст запроса используется для сопоставления с Query Theme Criteria. Текстовое содержание страниц используется для первоначального ранжирования и для классификации запросов в темы (textual content match).
  • Технические факторы (Идентификаторы источников): Имена хостов (Host names) и префиксы URL (URL prefixes) используются для идентификации Favored и Non-Favored Sources.
  • Структурные/Внешние факторы (Каталоги): Данные из иерархических каталогов (Topic Hierarchies, например, Yahoo!, Open Directory) используются для определения Query Themes и для автоматической идентификации Favored Sources.
  • Поведенческие факторы: Логи поисковых запросов (Search query logs) используются редакторами офлайн для выявления и разработки Query Themes. Упоминается popular opinion как возможный фактор базового ранжирования.
  • Ссылочные факторы: Упоминается connectivity analysis scoring как возможная часть базового ранжирования. Также упоминается "близость в вебе" (proximity on the World Wide Web) как метод классификации страниц в темы.

Какие метрики используются и как они считаются

  • Базовые Ranking Scores: Первоначальные оценки, рассчитанные с использованием стандартных техник (текстовое соответствие, связность, популярность).
  • Editorial Opinion Parameter: Ключевая метрика патента, определяющая способ модификации базовой оценки. Варианты реализации:
    • Повышение/понижение на процент от предыдущей оценки.
    • Повышение/понижение на абсолютное значение.
    • Перемещение результата в топ списка.
    • Удаление результата из списка.
    • Выборочное влияние на один из компонентов финального рейтинга.
  • Оценка соответствия теме: Метрики для классификации запросов в темы. Система сравнивает страницы в результатах поиска со страницами, ассоциированными с категорией каталога, используя совпадение текстового контента или близость в вебе. Выбираются темы с наибольшим количеством совпадающих страниц.

Выводы

  1. Механизм редакторского вмешательства и масштабирования: Патент описывает систему для интеграции человеческих суждений (Editorial Opinion) в алгоритмическое ранжирование. Ключевое нововведение — применение мнений к источникам (сайтам, разделам), а не к отдельным страницам, что позволяет масштабировать влияние редакторов.
  2. Тематическая авторитетность (Contextual Authority): Авторитетность источника не является глобальной. Сайт может быть Favored Source для одной Query Theme и нейтральным или Non-Favored для другой. Оценка применяется только в контексте конкретной темы.
  3. Борьба со спамом и дезинформацией: Система явно предусматривает идентификацию Non-Favored Sources (источников дезинформации, спама, чрезмерной рекламы) и активное понижение или удаление их контента из выдачи по соответствующим темам.
  4. Гибридное ранжирование и гибкость корректировки: Editorial Opinion Parameter интегрируется со стандартным ранжированием, а не заменяет его. При этом система позволяет применять как мягкие корректировки, так и агрессивные меры (перемещение в топ или удаление).
  5. Использование внешних курируемых данных: Патент описывает использование внешних иерархических каталогов (типа DMOZ/Yahoo!) как для классификации запросов, так и для автоматического определения авторитетных источников (Claim 24).

Практика

Best practices (это мы делаем)

  • Построение тематического авторитета (Topical Authority): Сосредоточьтесь на том, чтобы стать признанным авторитетом в конкретной нише. Это увеличивает вероятность того, что сайт будет классифицирован как Favored Source (редакторами или, что более вероятно сегодня, алгоритмами, обученными на редакторских данных) для соответствующих Query Themes.
  • Фокус на сигналах E-E-A-T и репутации: Активно работайте над сигналами E-E-A-T. Достоверность информации и хорошая репутация являются ключевыми факторами для избежания статуса Non-Favored Source, особенно в YMYL-тематиках, которые с высокой вероятностью являются объектами Query Themes.
  • Четкое тематическое позиционирование: Убедитесь, что тематика сайта и его разделов легко идентифицируется. Это помогает системам классифицировать ваш контент и применять к нему соответствующие оценки качества источника.
  • (Современный эквивалент каталогов) Работа с Knowledge Graph и авторитетными базами данных: Хотя влияние старых каталогов (DMOZ) ушло, патент показывает логику использования структурированных, курируемых данных для идентификации авторитетных источников. Попадание в Knowledge Graph и упоминания в авторитетных отраслевых базах данных могут служить современным аналогом.

Worst practices (это делать не надо)

  • Манипуляции и спам-техники: Использование популярных ключевых слов для привлечения трафика без предоставления соответствующего контента (например, обещание "бесплатной загрузки", которой нет) является прямой причиной для классификации сайта как Non-Favored Source по данной теме.
  • Распространение дезинформации или Over-Promotion: Публикация недостоверной информации или чрезмерно агрессивный маркетинг могут привести к тому, что сайт будет помечен как нежелательный источник, что приведет к понижению или удалению из выдачи по релевантным темам.
  • Игнорирование качества источника в пользу релевантности страницы: Недостаточно иметь релевантную страницу, если весь источник считается некачественным для данной темы. Система корректирует ранжирование на уровне источника.

Стратегическое значение

Этот патент является ранним подтверждением стратегического направления Google на приоритизацию авторитетности и качества источников в контексте конкретных тем. Он предоставляет техническую основу для того, как сигналы E-E-A-T могут быть реализованы: как модификаторы ранжирования (Editorial Opinion Parameters), применяемые, когда запрос соответствует чувствительной или важной теме (Query Theme). Долгосрочная стратегия должна фокусироваться на построении реальной экспертизы и надежной репутации в своей области.

Практические примеры

Сценарий 1: Повышение авторитетного источника в YMYL-тематике (Медицина)

  1. Офлайн Настройка: Редакторы определяют Query Theme: "Лечение заболеваний". Favored Source: Сайт ВОЗ (who.int). Non-Favored Source: Сайт с альтернативной медициной без доказательной базы (bad-medicine.com).
  2. Запрос пользователя: "Симптомы кори".
  3. Обработка: Система определяет, что запрос соответствует теме "Лечение заболеваний".
  4. Ранжирование: В результатах есть страницы с who.int и bad-medicine.com.
  5. Корректировка: Система применяет Editorial Opinion Parameter. Страница who.int получает значительное повышение в рейтинге. Страница bad-medicine.com понижается или удаляется.
  6. Результат: Пользователь видит авторитетный источник выше в выдаче.

Сценарий 2: Борьба со спамом в тематике загрузок

  1. Офлайн Настройка: Query Theme: "Бесплатное ПО". Критерий: наличие слов "free" и "download". Non-Favored Source: Сайт spam-downloads.com, известный обманными практиками.
  2. Запрос пользователя: "Free antivirus download".
  3. Обработка: Запрос соответствует теме "Бесплатное ПО".
  4. Корректировка: Если spam-downloads.com появляется в выдаче, его рейтинг агрессивно понижается согласно Editorial Opinion Parameter.

Вопросы и ответы

Является ли этот патент доказательством того, что Google вручную корректирует выдачу?

Да, патент описывает систему, разработанную для того, чтобы позволить редакторам (людям) влиять на ранжирование путем определения предпочтительных и нежелательных источников для конкретных тем. Хотя система применяет эти правила автоматически в реальном времени, исходные данные (темы, списки, параметры) задаются редакторами. Однако важно помнить, что патент подан в 2000 году, и современные системы, вероятно, используют машинное обучение для имитации этого процесса в большем масштабе.

Как Google определяет "Темы запросов" (Query Themes)?

Согласно патенту, Query Themes разрабатываются редакторами на основе анализа логов поисковых запросов, чтобы выявить часто встречающиеся категории информации. Примерами служат "сайты, предоставляющие бесплатную загрузку ПО" или "сайты, помогающие найти жилье".

Как система определяет, что мой сайт является "Предпочтительным источником" (Favored Source)?

Патент предлагает два метода. Первый — ручной: редакторы идентифицируют сайт как источник полезного и авторитетного контента. Второй — автоматический (Claim 24): система классифицирует тему запроса в иерархический каталог (например, DMOZ) и считает сайты, перечисленные в соответствующей категории каталога, предпочтительными источниками.

Может ли сайт быть авторитетным для одной темы и неавторитетным для другой?

Да, абсолютно. Механизм привязывает статус Favored или Non-Favored Source к конкретной Query Theme. Сайт может быть предпочтительным источником для темы А, но нейтральным или даже нежелательным для темы Б. Это подчеркивает важность контекстуальной тематической авторитетности.

Насколько сильно может измениться рейтинг из-за "Редакторского мнения"?

Патент описывает гибкие возможности корректировки. Editorial Opinion Parameter может вызвать повышение или понижение оценки на определенный процент или абсолютное значение. В крайних случаях он может переместить результат в самый верх ранжированного списка или полностью удалить его из списка.

Как этот патент связан с E-E-A-T?

Этот патент можно рассматривать как раннюю техническую реализацию принципов E-E-A-T. Идентификация Query Themes соответствует определению чувствительных или YMYL-тем. Favored Sources соответствует поиску источников с высоким уровнем экспертизы и надежности. Editorial Opinion Parameter — это механизм применения этих оценок в ранжировании.

Что делать, если мой сайт был классифицирован как "Нежелательный источник" (Non-Favored Source)?

Необходимо провести тщательный аудит контента и репутации сайта в контексте затронутой темы. Устраните причины, которые могли привести к такой классификации: удалите дезинформацию, снизьте агрессивность рекламы (over-promotion), прекратите использование спам-техник и сосредоточьтесь на предоставлении достоверного и полезного контента.

Влияет ли этот механизм на все результаты в выдаче?

Нет. Он активируется только если запрос соответствует заранее определенной Query Theme. И даже в этом случае он корректирует только те результаты, которые исходят из явно указанных Favored или Non-Favored Sources для этой темы. Остальные результаты ранжируются стандартно.

Использует ли Google до сих пор старые каталоги типа DMOZ или Yahoo! для определения авторитетности?

Хотя патент упоминает эти каталоги как примеры Topic Hierarchies для автоматического определения Favored Sources, маловероятно, что Google полагается на них сегодня, так как они устарели. Современные системы используют более сложные структуры данных, такие как Knowledge Graph, и алгоритмы машинного обучения для оценки авторитетности.

Может ли часть сайта быть "Favored", а другая часть — "Non-Favored"?

Да. Патент указывает, что идентификация источников может происходить не только на уровне хоста, но и на уровне набора URL-префиксов (set of URL prefixes). Это позволяет более гранулярно применять корректировки к разным разделам одного и того же сайта.

Похожие патенты

Как Google позволяет пользователям настраивать ранжирование и отбор источников в агрегаторе новостей (Google News)
Патент Google, описывающий механизм персонализации новостного агрегатора (Google News). Система позволяет пользователям создавать постоянные новостные разделы на основе запросов и настраивать правила ранжирования внутри них: выбирать предпочтительные источники, блокировать нежелательные, повышать статьи по ключевым словам или авторам, а также управлять сортировкой по свежести или важности.
  • US8676837B2
  • 2014-03-18
  • Персонализация

  • Свежесть контента

Как Google анализирует контент топовых результатов, чтобы решить, какие блоки и элементы показать на странице выдачи
Google использует запатентованную систему для определения того, какие дополнительные элементы (например, блоки новостей, изображений, локальной выдачи) отображать на странице результатов поиска. Вместо того чтобы полагаться только на текст запроса, система анализирует и классифицирует сами результаты поиска (URL, заголовки, сниппеты). Доминирующая тематика топовых результатов определяет, какие элементы будут активированы, что позволяет точнее соответствовать намерению пользователя.
  • US8103676B2
  • 2012-01-24
  • SERP

  • Семантика и интент

Как Google анализирует мнения и общественное восприятие тем в интернете путем кластеризации контента и измерения тональности
Патент описывает систему для анализа общественного мнения по заданной теме. Google собирает релевантные интернет-ресурсы (статьи, блоги, отзывы), группирует их по подтемам, определяет важность каждой подтемы (используя просмотры страниц и ранг релевантности) и вычисляет оценку тональности (Sentiment Score). На основе этих данных создается аналитический отчет о восприятии продукта, услуги или события.
  • US8423551B1
  • 2013-04-16
  • Семантика и интент

Как Google определяет тематическую авторитетность источников ("каналов") и агрессивно продвигает их свежий контент
Google идентифицирует "каналы" (сайты, блоги, разделы), которые исторически создают высококачественный контент по определенным темам. Система рассчитывает тематическую авторитетность, учитывая качество контента и сфокусированность канала. Когда авторитетный канал публикует новый контент по своей теме, Google может агрессивно повысить его в выдаче, даже если у контента еще нет ссылок или поведенческих сигналов.
  • US8874558B1
  • 2014-10-28
  • EEAT и качество

  • Свежесть контента

  • Индексация

Как Google использует контент, который вы сейчас просматриваете, для фильтрации и уточнения вашей поисковой выдачи
Google анализирует контекст веб-страницы или документа, который просматривает пользователь, чтобы определить основную тему (топик). Когда пользователь вводит запрос, система фильтрует результаты поиска, отдавая предпочтение тем документам, которые соответствуют этой контекстной теме, тем самым уточняя выдачу для неоднозначных запросов.
  • US8762368B1
  • 2014-06-24
  • Семантика и интент

  • SERP

  • Персонализация

Популярные патенты

Как Google использует паттерны просмотра пользователей (Co-Visitation) и временную близость для определения тематики нетекстового контента (изображений и видео)
Google использует механизм для понимания контента без текста (изображения, видео), анализируя, какие другие (текстовые) страницы пользователи посещают в рамках той же сессии. Ключевые слова с этих текстовых страниц заимствуются и присваиваются нетекстовому ресурсу. Критически важным фактором является время перехода: чем быстрее пользователь перешел между ресурсами, тем больший вес получают ключевые слова.
  • US8572096B1
  • 2013-10-29
  • Поведенческие сигналы

  • Семантика и интент

  • Мультимедиа

Как Google использует данные о кликах пользователей (CTR и Click Ratio) для определения официального сайта по навигационным запросам
Google анализирует журналы запросов, чтобы определить, какой результат пользователи подавляюще предпочитают по конкретному запросу. Если результат демонстрирует исключительно высокий CTR и/или Click Ratio по популярному запросу, система помечает его как «авторитетную страницу». Затем этот результат может отображаться на выдаче с особым выделением, потенциально переопределяя стандартное ранжирование.
  • US8788477B1
  • 2014-07-22
  • Поведенческие сигналы

  • EEAT и качество

  • SERP

Как Google идентифицирует, связывает и индексирует концепции (фразы) для понимания тем документов
Фундаментальный патент Google, описывающий переход от индексирования слов к индексированию концепций (фраз). Система определяет «хорошие фразы» на основе частотности и их способности прогнозировать появление других фраз (Information Gain). Документы индексируются не только по содержащимся в них фразам, но и по наличию связанных фраз, что позволяет системе определять основные и второстепенные темы документа, а также контекстуально оценивать анкорный текст ссылок.
  • US7536408B2
  • 2009-05-19
  • Индексация

  • Семантика и интент

  • Ссылки

Как Google использует структурированные данные (Schema) для отслеживания вовлеченности пользователей на уровне сущностей, а не только URL
Google может отслеживать поведение пользователей (например, время пребывания на странице и клики) и связывать его с конкретными сущностями (продуктами, людьми, темами), идентифицированными через структурированные данные, а не только с URL-адресом. Это позволяет агрегировать метрики вовлеченности для определенной темы на разных страницах и сравнивать эффективность сайтов.
  • US20140280133A1
  • 2014-09-18
  • Семантика и интент

  • Поведенческие сигналы

  • Knowledge Graph

Как Google использует персонализированный PageRank ссылающихся страниц для переоценки значимости анкорного текста
Google может персонализировать поисковую выдачу, изменяя вес анкорного текста ссылок. Вес ссылки зависит не от глобального PageRank ссылающейся страницы, а от её "персонализированного PageRank", рассчитанного на основе предпочтений пользователя (например, любимых сайтов или тематик). Это позволяет повышать в выдаче документы, на которые ссылаются авторитетные для конкретного пользователя источники.
  • US7260573B1
  • 2007-08-21
  • Персонализация

  • Ссылки

Как Google динамически обновляет выдачу в реальном времени, если пользователь не кликает на результаты
Google отслеживает взаимодействие с поисковой выдачей в реальном времени. Если пользователь просматривает результаты, но не кликает на них в течение определенного времени (определяемого моделью поведения), система интерпретирует это как имплицитную отрицательную обратную связь. На основе анализа этих «отвергнутых» результатов Google автоматически пересматривает запрос (корректируя веса или заменяя термины) и динамически предоставляет новый набор результатов.
  • US20150169576A1
  • 2015-06-18
  • Поведенческие сигналы

  • SERP

  • Семантика и интент

Как Google определяет географическую зону релевантности бизнеса на основе реального поведения пользователей (Catchment Areas)
Google определяет уникальную "зону охвата" (Catchment Area) для локального бизнеса, анализируя, из каких географических точек пользователи кликали на его результаты в поиске. Эта динамическая зона заменяет фиксированный радиус и используется для фильтрации кандидатов при локальном поиске, учитывая известность бренда, категорию бизнеса и физические препятствия.
  • US8775434B1
  • 2014-07-08
  • Local SEO

  • Поведенческие сигналы

Как Google использует внутренние ссылки и структуру DOM для генерации шаблонов сайта и извлечения структурированных сниппетов
Google анализирует повторяющиеся блоки внутренних ссылок (например, списки товаров). Если текст возле ссылки на исходной странице совпадает с текстом на целевой странице, Google определяет DOM-структуру этого текста и создает шаблон домена. Этот шаблон позволяет автоматически извлекать ключевую информацию (например, цену и характеристики) для сниппетов со всех однотипных страниц сайта, даже без микроразметки.
  • US9971746B2
  • 2018-05-15
  • Структура сайта

  • SERP

  • Ссылки

Как Google использует данные о совместном посещении сайтов (Co-Visitation) для персонализации и повышения релевантности выдачи
Google использует поведенческие данные сообщества пользователей для определения тематической связи между сайтами. Если пользователи часто посещают Сайт А и Сайт Б в течение короткого промежутка времени (Co-Visitation), система создает "Вектор повышения" (Boost Vector). Этот вектор используется для повышения в выдаче тематически связанных сайтов, основываясь на истории посещений пользователя или контексте текущего сайта, улучшая персонализацию и релевантность.
  • US8874570B1
  • 2014-10-28
  • Поведенческие сигналы

  • Персонализация

  • SERP

Как Google использует визуальные цитаты и обратную связь для генерации и уточнения ответов в мультимодальном поиске
Google генерирует ответы на мультимодальные запросы (изображение + текст), находя визуально похожие изображения в интернете и используя текст с их исходных страниц как основу для LLM. Система показывает эти изображения как «визуальные цитаты» для подтверждения ответа и позволяет пользователям исключать нерелевантные источники, чтобы мгновенно уточнить сгенерированный результат.
  • US20240378236A1
  • 2024-11-14
  • Мультимедиа

  • EEAT и качество

  • Ссылки

seohardcore