SEO HARDCORE
  • Разборы патентов
    • Патенты Google
  • Скоро SEO инструменты
  • Скоро SEO аналитика
  • seohardcore
SEO HARDCORE
назад

Как Google использует анализ списков для выявления связанных, но не синонимичных терминов и предотвращения смещения темы

IDENTIFYING COMMON CO-OCCURRING ELEMENTS IN LISTS (Выявление общих совместно встречающихся элементов в списках)
  • US8037086B1
  • Google LLC
  • 2008-07-02
  • 2011-10-11
  • Семантика и интент
  • Описание
  • Разбор
  • Выводы
  • Практика
  • FAQ
  • Похожие

Google анализирует, как термины совместно встречаются в списках и таблицах на веб-страницах, чтобы выявить связанные, но не синонимичные пары (например, "кошка" и "собака"). Если пара идентифицирована как связанная, система применяет более строгие критерии (Penalty Criteria) для признания их синонимами, чтобы избежать неверного расширения запроса и смещения темы (Topic Drift).

Описание

Какую проблему решает

Патент решает проблему "topicality-drifting" (смещения темы) при автоматическом расширении запросов. Стандартные методы генерации синонимов, основанные, например, на анализе замен терминов пользователями в сессиях, часто ошибочно идентифицируют связанные, но не синонимичные термины как синонимы (например, "Январь" и "Февраль", "Армия" и "Флот"). Использование таких пар для расширения запроса приводит к нерелевантным результатам.

Что запатентовано

Запатентована система для выявления коррелирующих, но потенциально не синонимичных пар терминов. Система анализирует совместную встречаемость (co-occurrence) терминов внутри структурированных данных (списков, таблиц) в большом корпусе документов. На основе этого анализа формируется "Correlated-pair list" (список коррелирующих пар или "черный список"), который используется для ужесточения критериев валидации синонимов.

Как это работает

Механизм работает в два этапа:

  • Этап 1 (Офлайн): Генерация списка коррелирующих пар. Система сканирует веб-документы, идентифицирует списки (HTML-списки, таблицы и т.д.) и вычисляет корреляцию между терминами, которые часто встречаются вместе в этих списках. Пары с высокой корреляцией добавляются в Correlated-pair list.
  • Этап 2 (Валидация синонимов): Применение фильтра. Когда система оценивает потенциальный синоним, она проверяет, находится ли пара в Correlated-pair list. Если да, то для признания пары синонимами применяются более строгие критерии (penalty criteria). Например, требуется значительно более высокий показатель частоты замен этих терминов самими пользователями в поисковых сессиях (Session Switching Requirement).

Актуальность для SEO

Высокая. Точное понимание взаимоотношений между сущностями (являются ли они синонимами, связанными понятиями, конкурентами или разными типами одного класса) критически важно для современного семантического поиска и точного расширения запросов. Описанные механизмы помогают Google уточнять своё понимание семантики и контекста для предотвращения Topic Drift.

Важность для SEO

Патент имеет значительное влияние на SEO (7/10). Он объясняет, как Google отличает истинные синонимы от просто связанных понятий. Это подчеркивает важность точного использования языка и контекста на странице. Структурированные данные, такие как списки и таблицы, напрямую информируют алгоритмы о взаимосвязях между сущностями, и их корректное использование помогает Google правильно интерпретировать контент и избегать ошибок синонимизации.

Детальный разбор

Термины и определения

Authorship (Авторство)
Критерий для фильтрации документов в корпусе, чтобы гарантировать разнообразие источников и избежать предвзятости. Может определяться на основе IP-адресов, поддиректорий сайта или ID пользователей.
Corpus (Корпус документов)
Коллекция документов (например, веб-страниц), используемая для анализа.
Correlated-pair list (Список коррелирующих пар)
Список пар терминов, которые часто встречаются вместе в списках и идентифицированы как связанные, но Potentially Non-Synonymous (потенциально не синонимичные). Функционирует как "черный список" (blacklist) при валидации синонимов.
List (Список)
Структурированные данные, содержащие перечисление элементов. Включает HTML-списки (<OL>, <UL>, <DL>), таблицы, заголовки (<H1>-<H6>) и перечисления, разделенные специальными символами.
Penalty Criteria (Штрафные критерии)
Более строгие требования для валидации синонима, применяемые, если пара терминов находится в Correlated-pair list.
Quantity of Switches / Session Switching Requirement (Количество переключений / Требование к переключению в сессии)
Поведенческая метрика, измеряющая, как часто пользователи заменяют один термин другим в последующих запросах в рамках одной поисковой сессии. Используется как основной критерий пенализации.
Synonym Candidate (Кандидат в синонимы)
Термин, который потенциально может быть использован как синоним для исходного термина запроса.
Topicality-drifting / Topic Drift (Смещение темы)
Проблема, возникающая, когда запрос расширяется за счет связанных, но не синонимичных терминов, что приводит к изменению исходной темы поиска.

Ключевые утверждения (Анализ Claims)

Основное изобретение (как определено в Claim 1) сосредоточено на процессе использования списка потенциально несинонимичных пар для динамического ужесточения критериев синонимизации.

Claim 1 (Независимый пункт): Описывает метод фильтрации предложенных синонимов с использованием штрафных критериев.

  1. Система получает пару терминов (термин и Synonym Candidate).
  2. Определяется, что пара идентифицирована как "potentially non-synonymous" (т.е. присутствует в Correlated-pair list).
  3. Пара оценивается с использованием penalty criteria, которые применяются только к таким парам. Эта оценка включает определение "quantity of switches" (частоты переключения между запросами с этими терминами пользователями).
  4. Система динамически выбирает порог валидации:
    • Первый порог (стандартный): Выбирается, если пара удовлетворяет penalty criteria (т.е. частота переключений высокая). Этот порог такой же, как для пар, не входящих в черный список.
    • Второй порог (повышенный): Выбирается, если пара НЕ удовлетворяет penalty criteria (т.е. частота переключений низкая). Второй порог выше первого.
  5. Определяется, что термины являются синонимами, только если выбранный порог превышен.

Ядро изобретения заключается в том, что идентификация пары как коррелирующей (через анализ списков) не приводит к автоматическому отклонению синонима, а запускает дополнительную проверку поведения пользователей (Quantity of Switches). Если пользователи часто заменяют термины, штраф снимается; если нет — требования к валидации ужесточаются.

Где и как применяется

Изобретение затрагивает два ключевых этапа поиска: индексирование (для анализа данных) и понимание запросов (для применения результатов анализа).

INDEXING – Индексирование и извлечение признаков
На этом этапе происходит офлайн-процесс построения Correlated-pair list. Система анализирует Corpus документов, извлекает структурированные данные (Lists) и вычисляет корреляцию между совместно встречающимися терминами. Также на этом этапе могут применяться фильтры Authorship для обеспечения разнообразия источников.

QUNDERSTANDING – Понимание Запросов
На этом этапе система использует Correlated-pair list при обработке запроса и его потенциальном расширении (Query Expansion/Rewriting). Когда система рассматривает возможность использования Synonym Candidate, она применяет логику динамического выбора порогов, чтобы отфильтровать или пессимизировать связанные, но нежелательные термины.

Входные данные:

  • Офлайн: Corpus документов, структурные элементы (HTML-теги списков, таблиц).
  • Валидация: Пара терминов (Synonym Candidate), Correlated-pair list, данные о поведении пользователей (Session Switching rates).

Выходные данные:

  • Офлайн: Correlated-pair list (черный список).
  • Валидация: Решение о статусе синонима (валидирован или отклонен) и выбор соответствующего порога уверенности.

На что влияет

  • Специфические запросы и типы контента: Наибольшее влияние оказывается на запросы, содержащие термины, которые часто встречаются в списках: названия брендов, моделей продуктов, организаций (например, спортивных команд), категорий товаров, географических названий.
  • Конкретные ниши: E-commerce (сравнение товаров, листинги категорий), информационные сайты с рейтингами и перечислениями.

Когда применяется

  • Условия работы алгоритма: Алгоритм валидации активируется каждый раз, когда система оценивает Synonym Candidate для расширения запроса.
  • Триггеры активации пенализации: Механизм ужесточения требований (penalty criteria) активируется только тогда, когда оцениваемая пара терминов присутствует в Correlated-pair list.
  • Пороговые значения: Система использует пороговые значения для определения корреляции (при создании списка) и для определения достаточной частоты Session Switching (при валидации).

Пошаговый алгоритм

Процесс А: Офлайн-генерация списка коррелирующих пар (Blacklist)

  1. Обход корпуса и фильтрация: Система обходит Corpus документов. Применяется фильтрация для обеспечения разнообразия Authorship (разные источники/авторы).
  2. Извлечение списков: Идентификация и извлечение Lists (HTML-списки, таблицы, перечисления) из документов на основе структурных признаков.
  3. Регистрация встречаемости: Учет присутствия терминов и частоты их совместной встречаемости внутри извлеченных списков.
  4. Построение карты терминов: Определение количества уникальных списков, в которых встречается каждый термин.
  5. Вычисление корреляции: Расчет показателя ассоциации (корреляции) между парами терминов. Корреляция высока, если термины часто встречаются вместе, но общее количество списков, содержащих хотя бы один из них, относительно невелико.
  6. Генерация списка: Если корреляция превышает заданный порог, пара добавляется в Correlated-pair list.

Процесс Б: Валидация синонимов (Использование Blacklist)

  1. Получение кандидата: Система получает термин и его Synonym Candidate.
  2. Проверка по списку: Система проверяет, присутствует ли данная пара в Correlated-pair list.
  3. Применение Penalty Criteria (Если в списке): Если пара найдена, система оценивает пару по критериям пенализации. Основной критерий — Quantity of Switches (частота переключения пользователей между этими терминами в сессиях).
  4. Выбор порога валидации:
    • Если Quantity of Switches высокий (удовлетворяет критериям): Выбирается стандартный (первый) порог валидации.
    • Если Quantity of Switches низкий (не удовлетворяет критериям): Выбирается повышенный (второй, более строгий) порог валидации.
  5. Стандартная обработка (Если не в списке): Применяется стандартный (первый) порог валидации.
  6. Финальная квалификация: Система сравнивает уровень уверенности в синониме с выбранным порогом. Если уровень уверенности выше порога, кандидат принимается как синоним.

Какие данные и как использует

Данные на входе

  • Структурные факторы: Критически важные данные. Используются HTML-теги (<OL>, <UL>, <LI>, <DL>, <DT>, <H1>-<H6>), структура таблиц, разделители (запятые, табуляция) для идентификации Lists.
  • Контентные факторы: Текстовое содержимое внутри элементов списка.
  • Технические факторы: IP-адреса, структура URL (например, поддиректории) могут использоваться для определения Authorship и фильтрации корпуса.
  • Поведенческие факторы: Журналы запросов (Query Logs) и данные о сессиях пользователей. Используются для расчета Quantity of Switches (частоты переключения между запросами).

Какие метрики используются и как они считаются

  • Correlation Score (Оценка корреляции): Вычисляется для определения связанности терминов на основе их встречаемости в списках. В патенте приводится пример формулы для корреляции A→B: (Количество раз, когда A встречается с B) * log [(Общее количество уникальных списков) / (Количество уникальных списков, содержащих A)].
  • Quantity of Switches / Session Switching Probability (Вероятность переключения в сессии): Измеряет вероятность того, что пользователь перейдет от запроса с исходным термином к запросу с термином-кандидатом. Рассчитывается как отношение числа таких переключений к общему числу запросов, содержащих исходный термин.
  • Confidence Thresholds (Пороги уверенности): Предопределенные значения, используемые для валидации синонимов. Патент описывает использование стандартного порога и повышенного порога (применяемого в качестве штрафа).

Выводы

  1. Google активно отличает корреляцию от синонимии. Система специально разработана для идентификации терминов, которые просто связаны (например, принадлежат к одной категории, являются конкурентами), но не являются взаимозаменяемыми, чтобы предотвратить Topic Drift.
  2. Структура контента напрямую влияет на понимание сущностей. Использование списков и таблиц (structured data) напрямую информирует алгоритмы о взаимоотношениях между сущностями. Термины, часто перечисляемые вместе, с меньшей вероятностью будут считаться синонимами.
  3. Консервативный подход к расширению запросов. Google применяет защитный механизм (Correlated-pair list) и предпочитает не расширять запрос, если нет высокой уверенности в синонимичности терминов.
  4. Поведенческие сигналы являются финальным арбитром. Решающим фактором являются действия пользователей. Даже если термины сильно коррелируют в списках, высокий показатель Session Switching может преодолеть штраф и подтвердить их синонимичность в данном контексте.
  5. Важность разнообразия источников. При анализе списков Google учитывает Authorship, чтобы избежать предвзятости, которая может возникнуть из-за повторяющихся списков на одном сайте или от одного автора.

Практика

Best practices (это мы делаем)

  • Используйте структурированные списки и таблицы для определения взаимосвязей. Если вы хотите подчеркнуть, что сущности связаны, но различны (например, разные модели продукта, услуги разных типов, компании-конкуренты), используйте сравнительные таблицы, маркированные списки категорий и рейтинги. Это помогает Google понять, что элементы связаны на уровне категории, но не являются синонимами.
  • Используйте истинные синонимы взаимозаменяемо в тексте. Если вы хотите, чтобы Google рассматривал термины как синонимы (например, "адвокат" и "юрист"), используйте их попеременно в основном тексте (прозе) и в различных контекстах, что может способствовать высокому Session Switching у пользователей.
  • Обеспечивайте четкую дифференциацию контента. Для продуктов или услуг, которые часто путают или сравнивают (и которые, вероятно, находятся в Correlated-pair list), создавайте отдельные страницы с четким фокусом и ясной структурой, подчеркивающей различия.

Worst practices (это делать не надо)

  • Полагаться на автоматическое расширение запросов для связанных терминов. Не стоит ожидать, что Google будет автоматически рассматривать связанные сущности (например, "Nike" и "Adidas" или "iPhone 15" и "iPhone 15 Pro") как синонимы. Необходимо оптимизировать контент под каждый термин отдельно.
  • Использовать списки для перечисления синонимов. Если вы предоставите список вида "Известен как: Автомобиль, Машина, Тачка", это может парадоксальным образом увеличить вероятность того, что эти слова попадут в Correlated-pair list, что усложнит их валидацию как синонимов, если поведенческих сигналов недостаточно.

Стратегическое значение

Этот патент подтверждает, что Google использует глубокий структурный анализ контента для построения своего понимания взаимоотношений между сущностями (Entity Relationships), что является основой семантического поиска. Он демонстрирует механизм улучшения точности на этапе Понимания Запросов. Для SEO-стратегии это означает, что не только наличие ключевых слов, но и структура их представления (в тексте против списка) влияет на интерпретацию контента поисковой системой.

Практические примеры

Сценарий: Дифференциация моделей смартфонов

  1. Ситуация: Интернет-магазин продает "iPhone 15" и "iPhone 15 Pro". Эти две модели часто упоминаются вместе в сравнительных таблицах и списках характеристик по всему интернету.
  2. Действие алгоритма (Офлайн): Google анализирует эти списки и определяет высокую корреляцию между "iPhone 15" и "iPhone 15 Pro". Пара добавляется в Correlated-pair list.
  3. Действие алгоритма (Валидация): Пользователь ищет "купить iPhone 15". Система рассматривает "iPhone 15 Pro" как Synonym Candidate.
  4. Проверка: Система видит, что пара находится в Correlated-pair list. Она проверяет Session Switching. Пользователи редко заменяют "iPhone 15" на "iPhone 15 Pro" в рамках одной сессии (так как это разные продукты с разной ценой).
  5. Результат: Session Switching низкий. Применяется повышенный порог. "iPhone 15 Pro" не признается синонимом для "iPhone 15". Выдача формируется точно по исходному запросу.
  6. SEO-действие: Магазин должен иметь отдельные, хорошо оптимизированные страницы для каждой модели и использовать четкие сравнительные таблицы, чтобы помочь Google правильно классифицировать обе сущности.

Вопросы и ответы

Какова главная цель изобретения, описанного в этом патенте?

Основная цель — предотвратить "смещение темы" (topicality-drifting) при расширении поисковых запросов. Система учится отличать термины, которые являются истинными синонимами, от терминов, которые просто связаны или принадлежат к одной категории (например, "кошка" и "собака"), и избегает использования последних для автоматического расширения запроса.

Как Google определяет, что два термина коррелируют, но не являются синонимами?

Google анализирует их совместную встречаемость в структурированных данных — списках и таблицах — по всему интернету. Если два термина очень часто появляются вместе в различных списках (например, в списках брендов одежды или марок автомобилей), они считаются коррелирующими, и добавляются в Correlated-pair list.

Что такое "Correlated-pair list" и как он используется?

Это список пар терминов, идентифицированных как связанные, но потенциально не синонимичные. Он функционирует как "черный список". При оценке потенциального синонима система проверяет этот список; если пара в нем есть, к ней применяются более строгие критерии валидации (Penalty Criteria).

Если два термина попали в "черный список" (Correlated-pair list), могут ли они все равно считаться синонимами?

Да, но требования для этого значительно выше. Система потребует очень сильных поведенческих сигналов, подтверждающих, что пользователи считают эти термины взаимозаменяемыми. В частности, необходим высокий показатель Session Switching (частоты, с которой пользователи меняют один термин на другой в своих запросах).

Как этот патент влияет на SEO для сайтов, которые часто сравнивают конкурентов?

Это положительно влияет на точность поиска. Если ваш бренд и бренд конкурента часто упоминаются вместе в сравнительных таблицах или списках, Google с меньшей вероятностью будет рассматривать их как синонимы. Это гарантирует, что при поиске вашего бренда выдача не будет "загрязнена" результатами о конкуренте, и наоборот.

Какие типы HTML-элементов анализирует система для выявления корреляций?

Система анализирует структурированные перечисления. К ним относятся HTML-списки (упорядоченные <OL>, неупорядоченные <UL>, списки определений <DL>), таблицы, заголовки, а также элементы, разделенные запятыми или табуляцией.

Имеет ли значение источник списка при анализе?

Да. В патенте упоминается фильтрация по критерию Authorship (авторства). Это делается для обеспечения разнообразия источников и уменьшения влияния повторяющихся списков на одном сайте или от одного автора, что повышает точность глобальной оценки корреляции.

Как я могу гарантировать, что Google будет рассматривать мои ключевые слова как синонимы?

Чтобы повысить вероятность признания терминов синонимами, используйте их взаимозаменяемо в основном тексте (прозе) и в различных контекстах. Избегайте простого перечисления синонимов в виде списка, так как это может привести к обратному эффекту — попаданию в Correlated-pair list и усложнению валидации.

Что такое "Session Switching Requirement"?

Это поведенческая метрика (также называемая Quantity of Switches), которая измеряет, как часто пользователи вручную меняют один термин на другой в последующих поисковых запросах в рамках одной сессии. Высокий показатель свидетельствует о том, что пользователи считают эти термины взаимозаменяемыми.

Выполняется ли этот процесс в реальном времени во время поиска?

Процесс состоит из двух частей. Генерация Correlated-pair list путем анализа списков в интернете происходит офлайн (на этапе индексирования и анализа). А вот использование этого списка для проверки и валидации синонимов происходит на этапе понимания и расширения запроса пользователя (Query Understanding).

Похожие патенты

Как Google фильтрует географические синонимы, чтобы предотвратить подмену местоположений в поиске
Google использует структурированную иерархическую базу географических данных для валидации синонимов. Если исходный термин и предложенный синоним являются разными, но связанными географическими объектами (например, соседние города или город и штат), система помечает их как «Проблемные синонимы». Это предотвращает автоматическую замену одного местоположения другим при обработке запроса, повышая точность локальной выдачи и избегая географического «дрейфа темы».
  • US8041730B1
  • 2011-10-18
  • Local SEO

  • Семантика и интент

Как Google использует анализ совместной встречаемости слов для проверки синонимов и определения значимых контекстов запроса
Google анализирует, какие слова часто появляются вместе в поисковых запросах (совместная встречаемость), чтобы определить, является ли один термин хорошей заменой для другого (синонимом). Кроме того, система оценивает, насколько конкретный контекст (соседние слова) уточняет смысл запроса, и отфильтровывает неинформативные контексты для повышения точности понимания запросов.
  • US8682907B1
  • 2014-03-25
  • Семантика и интент

Как Google использует «Решающие Клики» и «Решающие Пропуски» для валидации и очистки правил синонимов
Патент Google описывает механизм валидации качества внутренних правил синонимов. Система анализирует логи запросов, чтобы изолировать влияние конкретного синонима на поведение пользователя. Если пользователь кликает на результат, содержащий ТОЛЬКО синоним (а не исходный термин), это засчитывается как «Решающий Клик». Если пропускает такой результат — как «Решающий Пропуск». На основе этих данных система вычисляет оценку уверенности для правила и удаляет неэффективные синонимы.
  • US8965882B1
  • 2015-02-24
  • Семантика и интент

  • Поведенческие сигналы

  • SERP

Как Google использует анализ совместной встречаемости слов в запросах для оценки качества синонимов и контекстов
Google оценивает, является ли один термин хорошей заменой (синонимом) для другого, анализируя, какие другие слова часто появляются рядом с ними в поисковых запросах. Система строит векторы частот совместной встречаемости для обоих терминов и сравнивает их. Высокое сходство векторов подтверждает качество замены. Этот же механизм используется для определения того, добавляет ли конкретный контекст значимое семантическое значение к правилу замены.
  • US8504562B1
  • 2013-08-06
  • Семантика и интент

Как Google динамически изменяет вес синонимов в ранжировании на основе поведения пользователей
Google не присваивает фиксированный вес синонимам (замещающим терминам) при ранжировании. Вес синонима динамически корректируется для каждого документа в зависимости от того, насколько релевантен исходный термин запроса этому документу. Эта релевантность определяется на основе поведенческих данных (клики, время просмотра), что позволяет точнее интерпретировать значение синонимов в контексте конкретной страницы.
  • US9116957B1
  • 2015-08-25
  • Поведенческие сигналы

  • Семантика и интент

  • SERP

Популярные патенты

Как Google определяет скрытый интент сессии, используя универсальные уточняющие слова, и переранжирует выдачу
Google идентифицирует универсальные слова-модификаторы (например, «фото», «отзывы», «pdf»), которые пользователи часто добавляют к разным запросам. Если такое слово появляется в сессии, система определяет скрытый интент пользователя. Затем Google переранжирует выдачу, основываясь на том, какие документы исторически предпочитали пользователи с таким же интентом, адаптируя результаты под контекст сессии.
  • US8868548B2
  • 2014-10-21
  • Семантика и интент

  • Поведенческие сигналы

  • Персонализация

Как Google использовал специальные токены в запросе (например, «+») для прямой навигации на верифицированные социальные страницы в обход SERP
Google может интерпретировать специальные токены в поисковом запросе (например, «+») как намерение пользователя найти официальную социальную страницу сущности. Если система идентифицирует верифицированный профиль, соответствующий запросу с высокой степенью уверенности, она может перенаправить пользователя прямо на эту страницу, минуя стандартную поисковую выдачу.
  • US9275421B2
  • 2016-03-01
  • Семантика и интент

  • SERP

  • Ссылки

Как Google использует контекст пользователя для предоставления информации без явного запроса (Технология предиктивного поиска)
Google использует технологию предиктивного (проактивного) поиска, которая анализирует текущий контекст пользователя (местоположение, время, календарь, скорость движения, привычки) для автоматического предоставления релевантной информации. Система реагирует на «запрос без параметров» (например, открытие приложения или простое действие с устройством) и самостоятельно определяет информационные потребности пользователя.
  • US8478519B2
  • 2013-07-02
  • Персонализация

  • Семантика и интент

  • Поведенческие сигналы

Как Google использует внешние сигналы (соцсети, новости, блоги) для верификации реальной популярности контента и фильтрации накруток
Google верифицирует популярность контента (например, видео) проверяя, упоминается ли он на внешних источниках: блогах, новостных сайтах и в социальных сетях. Это позволяет формировать списки "популярного", отражающие подлинный широкий интерес, отфильтровывая контент с искусственно завышенными просмотрами или узконишевой популярностью. Система также учитывает географическую релевантность внешних упоминаний.
  • US9465871B1
  • 2016-10-11
  • Антиспам

  • SERP

  • Ссылки

Как Google использует историю кликов пользователей для определения интента, связанного с физическим адресом, и таргетинга рекламы
Google анализирует, какие поисковые запросы исторически приводят к наибольшему количеству кликов по бизнесам, расположенным по определенному адресу. Когда пользователь ищет этот адрес (или смотрит его на карте), Google использует этот «Самый популярный поисковый термин» (Most-Popular Search Term), чтобы определить намерение пользователя и показать релевантную информацию и рекламу.
  • US20150261858A1
  • 2015-09-17
  • Local SEO

  • Семантика и интент

  • Поведенческие сигналы

Как Google использует организационные структуры (папки, ярлыки) как ссылки для расчета PageRank и ранжирования документов
Google может анализировать, как документы организованы пользователями (например, в папках, через ярлыки или закладки), и использовать эти организационные структуры для расчета рейтинга документа. Документы, концептуально сгруппированные вместе, передают друг другу ранжирующий вес (аналогично PageRank), причем более тесные связи (например, в одной папке) передают больше веса, чем более слабые связи (например, в соседних папках).
  • US8090736B1
  • 2012-01-03
  • Ссылки

  • SERP

  • Структура сайта

Как Google использует внешние данные для оценки репутации сущностей и их взаимной привлекательности в вертикальном поиске
Google использует систему для улучшения вертикального поиска (например, вакансий, недвижимости) путем оценки взаимной привлекательности двух разных типов сущностей (например, соискателя и вакансии). Система агрегирует данные из внешних источников для выявления скрытых атрибутов и расчета «Репутационной значимости» каждой сущности. На основе этих данных определяется метрика «Двухстороннего соответствия», которая используется для ранжирования.
  • US10853432B2
  • 2020-12-01
  • Семантика и интент

  • SERP

  • Поведенческие сигналы

Как Google использует позиционный CTR (Selection Rate) для ранжирования и группировки вертикалей в Универсальном поиске
Google использует механизм для структурирования поисковой выдачи путем группировки результатов по категориям (вертикалям), таким как Новости, Видео или Веб. Система определяет порядок этих категорий, основываясь на ожидаемой частоте кликов (Selection Rate/CTR) тех позиций, которые занимают результаты категории в исходном смешанном ранжировании. Это определяет структуру Универсального поиска (Universal Search).
  • US8498984B1
  • 2013-07-30
  • SERP

  • Поведенческие сигналы

Как Google использует время пребывания на странице (Dwell Time) для оценки качества и корректировки ранжирования
Google анализирует продолжительность визитов пользователей на страницы из результатов поиска (Dwell Time). Система рассчитывает метрику, сравнивающую количество «длинных кликов» (длительных визитов) с общим количеством кликов для конкретного документа по конкретному запросу. Этот показатель используется как сигнал качества, независимый от позиции в выдаче, для повышения или понижения документа в ранжировании.
  • US8661029B1
  • 2014-02-25
  • Поведенческие сигналы

  • SERP

Как Google автоматически превращает текст на странице в ссылки на результаты поиска для монетизации контента
Патент Google описывает технологию автоматического анализа контента веб-страницы для выявления ключевых тем и терминов. Система генерирует релевантные поисковые запросы и динамически встраивает гиперссылки в текст страницы. При клике пользователь перенаправляется на страницу результатов поиска (SERP). Ключевая особенность: система приоритизирует термины с высоким потенциалом дохода от рекламы.
  • US7788245B1
  • 2010-08-31
  • Ссылки

  • SERP

  • Семантика и интент

seohardcore