SEO HARDCORE
  • Разборы патентов
    • Патенты Google
  • Скоро SEO инструменты
  • Скоро SEO аналитика
  • seohardcore
SEO HARDCORE
назад

Как Google использует семантические связи внутри контента для переранжирования и повышения разнообразия выдачи

DOCUMENT RANKING USING WORD RELATIONSHIPS (Ранжирование документов с использованием взаимосвязей слов)
  • US7996379B1
  • Google LLC
  • 2008-02-01
  • 2011-08-09
  • Семантика и интент
  • Ссылки
  • SERP
  • Техническое SEO
  • Описание
  • Разбор
  • Выводы
  • Практика
  • FAQ
  • Похожие

Google использует метод для переоценки и переранжирования поисковой выдачи путем анализа семантических взаимодействий между терминами внутри документов. Система строит графы локальных и глобальных связей, а затем определяет взаимосвязи между самими документами на основе их семантического вклада (даже без гиперссылок). Это позволяет повысить разнообразие выдачи, особенно по неоднозначным запросам.

Описание

Какую проблему решает

Патент решает задачу улучшения разнообразия поисковой выдачи (diverse search results), особенно для неоднозначных запросов (ambiguous query). Цель – переупорядочить (re-arranged) результаты поиска таким образом, чтобы топовые результаты представляли более широкий спектр информации. Кроме того, система позволяет определять взаимосвязи между документами, которые не связаны друг с другом прямыми гиперссылками.

Что запатентовано

Запатентован метод оценки и переранжирования набора документов, основанный на анализе взаимосвязей терминов (word relationships) внутри них. Система анализирует локальные взаимодействия терминов, агрегирует их в глобальный граф с учетом исходного порядка документов (initial order), и на основе этого строит граф взаимосвязей между документами (document relationship graph). Финальный скоринг производится путем анализа ссылок (link analysis) на этом графе, например, с помощью алгоритмов типа PageRank.

Как это работает

Система работает по следующему алгоритму на этапе переранжирования:

  • Входные данные: Принимается упорядоченный набор документов (например, Топ-1000 результатов поиска).
  • Локальный анализ: В каждом документе идентифицируются ключевые термины и их значимость (Term Score). Определяются локальные взаимосвязи (local term relationships) на основе близости (например, в одном параграфе) и рассчитывается их вес.
  • Глобальный анализ: Локальные связи объединяются в глобальный граф (global term relationship graph). При этом учитывается исходный порядок: связи из более поздних документов добавляются, только если они сильнее существующих.
  • Анализ вклада: Вычисляется Term-Document Weight (TDW) – метрика, показывающая семантический вклад документа в понимание термина.
  • Построение графа документов: Строится направленный Document Relationship Graph. Связи основаны на общих терминах, а направление зависит от того, какой документ имеет больший суммарный TDW.
  • Скоринг и переранжирование: К графу документов применяется алгоритм анализа ссылок (например, PageRank) для расчета новых оценок и переранжирования набора.

Актуальность для SEO

Высокая. Хотя конкретные формулы, описанные в патенте (подан в 2008), могли эволюционировать с развитием нейросетевых моделей, базовые концепции анализа семантических связей, близости терминов (proximity) и использования графовых структур для определения авторитетности контента остаются фундаментальными для современного поиска и понимания Topical Authority.

Важность для SEO

Патент имеет высокое значение (8.5/10) для SEO-стратегии. Он описывает конкретный механизм оценки авторитетности и взаимосвязей документов без опоры на гиперссылки. Это подчеркивает критическую важность глубокой проработки темы, использования релевантных терминов и сущностей в тесной связке друг с другом (co-occurrence и proximity), а также важность семантической структуры контента для ранжирования.

Детальный разбор

Термины и определения

Document Relationship Graph (Граф взаимосвязей документов)
Направленный граф, где узлы – это документы, а ребра представляют семантические связи между ними, выведенные из анализа общих терминов и их TDW. Используется для финального скоринга.
Edge State Information (Информация о состоянии ребра)
Данные, связанные с ребром в глобальном графе терминов. Включают информацию о том, из какого документа пришло это ребро, его текущий вес и предыдущий вес. Используется для расчета TDW.
Global Term Relationship Graph (Глобальный граф взаимосвязей терминов)
Граф, агрегирующий local term relationships из набора документов. Отражает самые сильные взаимодействия между терминами, выбранные с учетом initial order.
Initial Order (Исходный порядок)
Предварительное упорядочивание документов (например, стандартное ранжирование по запросу), которое определяет последовательность обработки документов при построении глобального графа.
Interaction (Взаимодействие)
Событие совместного появления двух терминов в непосредственной близости (proximity), например, в одном параграфе или предложении.
Local Term Relationship (Локальная взаимосвязь терминов)
Взаимосвязь между парой терминов внутри одного документа, основанная на их взаимодействии.
Term-Document Weight (TDW) (Вес Термин-Документ)
Метрика, представляющая «новую информацию» или семантический вклад документа в понимание термина. Рассчитывается на основе вклада документа в увеличение веса ребер в глобальном графе.
Term Score (Оценка термина)
Метрика значимости термина для конкретного документа. Рассчитывается на основе частоты встречаемости и позиции первого вхождения термина.
Term Weight (Вес термина)
Метрика значимости термина в контексте всего набора документов. Рассчитывается как сумма весов всех связанных с ним ребер в глобальном графе.

Ключевые утверждения (Анализ Claims)

Claim 1 (Независимый пункт): Описывает основной метод ранжирования.

  1. Система получает множество документов, имеющих исходный порядок (initial order).
  2. Идентифицируются локальные взаимосвязи терминов (local term relationships). Это включает генерацию local term relationships graph для каждого документа.
  3. Определяются взаимосвязи между документами (document relationships) на основе локальных взаимосвязей И исходного порядка документов. Это включает:
    • Генерацию global term relationships graph на основе локальных графов.
    • Генерацию document relationships graph на основе глобального графа.
  4. Определяется оценка (score) для каждого документа на основе взаимосвязей документов.

Ядро изобретения — использование анализа внутренних текстовых связей и обязательный учет исходного порядка документов для построения графа связей между документами и их последующего переранжирования.

Claim 4 (Зависимый от 1): Уточняет критерий локальной взаимосвязи.

Локальная взаимосвязь между парой терминов существует, если оба термина расположены в одном и том же параграфе (same paragraph) внутри документа.

Claim 5 (Зависимый от 1): Уточняет расчет веса локальной связи.

Величина (magnitude) локальной взаимосвязи определяется на основе разницы позиций пары терминов в документе (близости) и/или самих позиций этих терминов (раннее появление).

Claim 8 (Зависимый от 1): Уточняет метод финального скоринга.

Финальный скоринг и упорядочивание включают выполнение анализа ссылок (link analysis) графа взаимосвязей документов.

Claim 9 (Зависимый от 1): Уточняет процесс идентификации терминов.

Идентификация локальных взаимосвязей включает определение оценки (score) для каждого термина, выбор подмножества терминов на основе их оценок и анализ взаимосвязей только среди этого подмножества.

Где и как применяется

Изобретение представляет собой механизм переранжирования, который применяется после основного этапа ранжирования.

RANKING – Ранжирование
На этом этапе система генерирует исходный набор результатов поиска, которые удовлетворяют запросу и имеют исходный порядок (initial order), основанный на стандартных оценках (например, релевантности, PageRank).

RERANKING – Переранжирование
Основное применение патента. Система принимает на вход упорядоченный набор документов (например, Топ-1000) с этапа RANKING и выполняет глубокий семантический анализ контента для переоценки их авторитетности и взаимосвязей.

  1. Семантический анализ: Идентификация терминов, расчет Term Scores, построение локальных и глобальных графов терминов.
  2. Построение графа документов: Генерация Document Relationship Graph на основе семантического вклада (TDW).
  3. Пересчет оценок: Применение link analysis к графу документов.
  4. Финальное упорядочивание: Переранжирование исходного набора для повышения разнообразия.

Входные данные:

  • Упорядоченный набор документов (Initial Order).
  • Текстовое содержимое этих документов со структурной разметкой (предложения, параграфы).

Выходные данные:

  • Переупорядоченный набор документов (score-based order).

На что влияет

  • Специфические запросы: Наибольшее влияние оказывается на неоднозначные запросы (ambiguous query), где требуется повысить разнообразие выдачи (diverse search results). Также влияет на информационные запросы, где авторитетность определяется глубиной и связностью раскрытия темы.
  • Конкретные типы контента: Влияет на любые текстовые документы (веб-страницы, PDF и т.д.). Особенно сильно влияет на контент, богатый сущностями и терминами (например, лонгриды, исследования, обзоры).

Когда применяется

  • Условия применения: Алгоритм применяется к набору документов, которые уже прошли первичный отбор и ранжирование. В патенте указано, что это может быть Топ-1000 результатов по запросу.
  • Цель применения: Активируется для улучшения разнообразия выдачи и переупорядочивания результатов так, чтобы наверху оказались документы, представляющие более широкий спектр информации.

Пошаговый алгоритм

Процесс переранжирования набора документов.

Этап 1: Подготовка и Идентификация Терминов

  1. Получение данных: Система получает упорядоченный набор документов.
  2. Идентификация и фильтрация: В каждом документе идентифицируются термины (слова, фразы, сущности). Могут отфильтровываться общие слова (например, с использованием TF-IDF).
  3. Расчет Оценки Термина (Term Score S): Для каждого термина рассчитывается его значимость для документа по формуле, учитывающей частоту и позицию первого вхождения (Формула 1).
  4. Выбор ключевых терминов: Выбирается подмножество терминов с наивысшими оценками (например, Топ-20).

Этап 2: Построение Локальных Графов Терминов

  1. Идентификация взаимодействий: Определяются взаимодействия (interactions) между выбранными терминами на основе близости (например, в одном параграфе).
  2. Построение локального графа: Для каждого документа строится Local Term Relationship Graph.
  3. Расчет веса ребер (W): Вес ребра рассчитывается по формуле, учитывающей Term Scores обоих терминов и расстояние между ними во взаимодействии (Формула 2).

Этап 3: Построение Глобального Графа Терминов

  1. Инициализация: Создается пустой Global Term Relationship Graph.
  2. Агрегация графов: Локальные графы обрабатываются последовательно, в соответствии с initial order документов.
  3. Добавление/Обновление ребер: Ребро из локального графа добавляется в глобальный. Если такое ребро уже существует, оно обновляется, только если его вес в текущем локальном графе ВЫШЕ, чем существующий вес в глобальном графе.
  4. Сохранение истории (Edge State Information): При обновлении сохраняется информация: из какого документа оно пришло, новый вес и предыдущий вес.
  5. Расчет Веса Термина (Term Weight T): Для каждого термина в глобальном графе рассчитывается его общий вес как сумма весов всех связанных с ним ребер (Формула 3).

Этап 4: Построение Графа Документов

  1. Расчет Веса Термин-Документ (TDW): Рассчитывается TDW. Это произведение Term Weight и суммы скоростей увеличения весов ребер, которые пришли из этого документа (Формула 4). TDW показывает семантический вклад («новизну») документа.
  2. Идентификация связей: Определяются пары документов, имеющие общие термины с ненулевым TDW.
  3. Построение графа документов: Строится направленный Document Relationship Graph.
  4. Определение направления ребер: Для пары документов (Dm, Dn) суммируются TDW всех общих терминов. Если Сумма TDW(Dm) > Сумма TDW(Dn), ребро направлено от Dn к Dm.

Этап 5: Скоринг и Ранжирование

  1. Анализ ссылок: К графу документов применяется алгоритм анализа ссылок (например, PageRank).
  2. Переранжирование: Документы переупорядочиваются на основе новых оценок.

Какие данные и как использует

Данные на входе

Система использует исключительно контентные и структурные факторы из предоставленного набора документов, а также их исходный порядок.

  • Контентные факторы: Текст документов используется для идентификации терминов (слов, фраз, именованных сущностей/named entity).
  • Структурные факторы: Структура документа (разделение на предложения и параграфы) используется для определения позиций терминов и их близости (proximity).
  • Системные данные: Исходный порядок (initial order) документов в наборе.

Какие метрики используются и как они считаются

В патенте описаны конкретные формулы для расчета ключевых метрик.

1. Term Score (S) (Оценка термина в документе)

Метрика значимости термина в документе (Equation 1).

Выводы

  1. Семантические связи как виртуальные ссылки: Патент предлагает механизм для построения графа авторитетности между документами, основанный исключительно на их содержании, без использования прямых гиперссылок. Связи между документами выводятся из того, насколько сильно взаимодействуют термины внутри этих документов.
  2. Критическая важность близости (Proximity) и совместной встречаемости (Co-occurrence): Ключевым элементом является «взаимодействие» терминов. Термины считаются связанными, если они появляются рядом (например, в одном параграфе или предложении). Чем ближе термины и чем они значимее (выше Term Score), тем сильнее связь (выше Edge Weight).
  3. Значимость раннего вхождения терминов: Формулы Term Score и Edge Weight придают больший вес терминам, которые появляются раньше в документе (меньший знаменатель в формулах). Это предполагает, что основная тема и ключевые сущности должны быть заявлены в начале текста.
  4. Влияние исходного ранжирования на семантику: Исходный порядок документов (Initial Order) критически важен. При построении глобального графа предпочтение отдается связям из документов, которые изначально ранжировались выше. Это значит, что базовая релевантность или авторитетность влияет на интерпретацию семантики всего набора.
  5. Авторитетность через семантический вклад (TDW): Финальный граф документов направленный. Документ получает авторитет (входящую связь), если он вносит больший семантический вклад (имеет больший суммарный TDW) по общим терминам. Это механизм выявления экспертного контента, который глубже или по-новому раскрывает взаимосвязи терминов.

Практика

Best practices (это мы делаем)

  • Укрепление семантических связей (Proximity Optimization): Необходимо гарантировать, что ключевые термины и сущности, связанные с основной темой страницы, используются в тесной близости друг к другу – в одних и тех же предложениях и параграфах. Это усиливает Local Term Relationships.
  • Приоритезация ключевых терминов в начале контента: Поскольку Term Score и Edge Weight зависят от позиции первого вхождения, важно использовать наиболее значимые термины как можно раньше в тексте (в первых предложениях/параграфах).
  • Фокус на Topical Authority и глубине контента: Создавайте контент, который не просто упоминает термины, а глубоко раскрывает взаимосвязи между ними. Документы, демонстрирующие сильные и уникальные связи между релевантными терминами, получат более высокий TDW и, как следствие, более высокий финальный скоринг.
  • Использование именованных сущностей (Named Entities): Патент упоминает, что Term Score может быть повышен для именованных сущностей. Насыщение контента релевантными сущностями и обеспечение их взаимодействия с другими терминами является важной стратегией.
  • Структурирование контента (Параграфы): Используйте четкое разделение на параграфы для группировки семантически связанных идей. Взаимодействия часто определяются на уровне параграфа (Claim 4). Параграф должен быть семантически целостным блоком.

Worst practices (это делать не надо)

  • "Разбрасывание" ключевых слов (Keyword Spraying): Простое увеличение частоты терминов без учета их взаимосвязей неэффективно. Если ключевые термины разбросаны по тексту и не взаимодействуют друг с другом в рамках одних параграфов/предложений, система не сформирует сильных связей.
  • Поверхностный или дублирующий контент: Создание контента, который повторяет связи, уже установленные лидерами выдачи, или затрагивает много тем поверхностно. Такой контент сформирует слабые глобальные связи или получит низкий TDW.
  • Откладывание сути на конец документа: Если ключевые термины и основная мысль появляются только в конце текста, их значимость (Term Score) будет занижена из-за формулы расчета, что негативно скажется на всем процессе анализа.
  • Длинные вводные абзацы без ключевых терминов: Использование "воды" или нерелевантных вступлений смещает первое вхождение ключевых терминов на более поздние позиции, ухудшая скоринг.

Стратегическое значение

Патент подтверждает стратегическую важность семантического SEO и построения Topical Authority. Он демонстрирует механизм для оценки качества и авторитетности контента путем анализа того, насколько хорошо и глубоко в нем проработаны взаимосвязи между терминами и сущностями. Долгосрочная стратегия должна фокусироваться не на наличии ключевых слов, а на создании экспертного контента, структурированного для максимизации силы семантических связей внутри текста.

Практические примеры

Сценарий: Оптимизация статьи "Уход за Хаски"

Плохая реализация (Слабые связи):

  • Вступление: Общие слова о собаках. (Первое вхождение "Хаски" – предложение №10).
  • Параграф 1: Хаски нужно много бегать.
  • Параграф 2: Хаски сильно линяют весной.
  • Параграф 3: Для вычесывания нужна фурминатор.

Результат: Термины "Хаски", "линька", "фурминатор" разнесены по разным параграфам. Взаимодействия нет. Term Score для "Хаски" низкий из-за позднего вхождения.

Хорошая реализация (Сильные связи):

  • Вступление: Уход за Сибирским Хаски требует внимания к их активности и шерсти. (Первое вхождение "Хаски" – предложение №1).
  • Параграф 1 (Фокус на шерсти): Особенность породы Хаски – интенсивная сезонная линька. Для эффективного ухода за шерстью во время линьки рекомендуется использовать фурминатор, который хорошо справляется с густым подшерстком Хаски.

Результат: Термины "Хаски", "линька", "шерсть", "фурминатор", "подшерсток" находятся в одном параграфе и часто в одном предложении. Term Score для "Хаски" высокий. Система идентифицирует сильные локальные связи (высокий Edge Weight), что увеличивает вероятность высокого финального скоринга.

Вопросы и ответы

Как этот патент связан с концепцией Topical Authority?

Патент напрямую описывает механизм, который может использоваться для измерения Topical Authority на основе контента. Система оценивает, насколько сильно и глубоко связаны различные термины внутри документа и в рамках всего набора. Документы, которые демонстрируют наиболее сильные и значимые связи между терминами в определенной теме, получат более высокий Term-Document Weight (TDW) и, как следствие, будут считаться более авторитетными.

Заменяет ли этот алгоритм PageRank?

Нет, не обязательно заменяет. Патент описывает этот механизм как способ переранжирования уже существующего набора результатов. Однако алгоритм анализа ссылок (подобный PageRank) применяется на финальном этапе, но уже не к графу гиперссылок, а к графу семантических связей документов (Document Relationship Graph), построенному на основе контента.

Что важнее согласно патенту: частота термина или его позиция?

Оба фактора важны и входят в формулу Term Score. Однако позиция первого вхождения имеет очень большое значение, так как используется в знаменателе формулы. Чем раньше термин встречается впервые (меньше номер предложения), тем выше его оценка при прочих равных. Это подчеркивает важность размещения ключевых терминов в самом начале документа.

Как система определяет, что два термина взаимодействуют?

Взаимодействие (interaction) определяется по близости (proximity). В патенте приведены примеры: нахождение в одном предложении, в одном параграфе (Claim 4) или на расстоянии предопределенного количества предложений друг от друга. Нахождение в одном параграфе является ключевым условием, упомянутым в Claims.

Почему важен исходный порядок документов (Initial Order)?

Исходный порядок критичен при построении Глобального графа терминов. Система обрабатывает документы последовательно. Связь из документа, идущего позже (ниже в рейтинге), заменит связь из документа, идущего раньше (выше в рейтинге), только если её вес выше. Это создает уклон в сторону интерпретации семантики, заданной документами, которые уже считаются авторитетными или релевантными.

Что такое TDW (Term-Document Weight) простыми словами?

TDW – это метрика, показывающая, насколько данный документ обогащает понимание конкретного термина в контексте всего набора результатов. Он учитывает общую важность термина и то, насколько сильно этот документ улучшил (усилил) связи этого термина по сравнению с предыдущими документами. Высокий TDW указывает на высокую семантическую ценность или новизну документа по данному термину.

Как оптимизировать контент под этот алгоритм?

Ключевая стратегия – оптимизация близости (Proximity Optimization). Необходимо размещать семантически связанные термины и сущности как можно ближе друг к другу (в одном предложении/параграфе) и делать это как можно раньше в тексте. Контент должен быть структурирован так, чтобы максимизировать силу и количество взаимодействий между релевантными терминами.

Влияет ли этот алгоритм на все типы запросов?

В патенте указано, что одно из преимуществ системы – улучшение разнообразия результатов для неоднозначных запросов (ambiguous query). Вероятно, он оказывает наибольшее влияние на информационные и широкие запросы, где важно определить авторитетные источники и различные аспекты темы, а не на узкие транзакционные или навигационные запросы.

Как система определяет, какие термины являются значимыми?

Система использует фильтрацию (например, TF-IDF) для удаления общих слов, а затем рассчитывает Term Score на основе частоты, позиции и типа термина (например, бонусы для именованных сущностей). Для анализа взаимосвязей выбирается только подмножество терминов с наивысшими оценками (например, Топ-20).

Как определяется направление связи в графе документов?

Направление определяется сравнением суммарного семантического вклада (TDW) общих терминов для двух документов. Если Документ А имеет больший суммарный TDW по общим терминам, чем Документ Б, то связь будет направлена от Б к А. Это означает, что Документ А считается более семантически авторитетным источником по этим терминам.

Похожие патенты

Как Google использует категоризацию контента и запросов для уточнения релевантности и ранжирования результатов
Google использует систему для улучшения ранжирования, комбинируя стандартную текстовую релевантность с оценкой соответствия категории. Система определяет, насколько сильно документ принадлежит к определенным категориям и насколько сильно запрос соответствует этим же категориям. Если и документ, и запрос сильно совпадают по категории, результат получает повышение в ранжировании. Это особенно важно для E-commerce и контента с четкой структурой.
  • US7814085B1
  • 2010-10-12
  • Семантика и интент

  • SERP

Как Google использует сеть доверия между экспертами для расчета Trust Rank и ранжирования контента
Google использует механизм для определения авторитетности контента путем анализа того, какие эксперты (сущности) доверяют друг другу и как они классифицируют (маркируют) контент в интернете. Система рассчитывает «Рейтинг Доверия» (Trust Rank) для каждой сущности и использует его для повышения в выдаче контента, отмеченного доверенными источниками, интегрируя сигналы репутации в алгоритм ранжирования.
  • US7603350B1
  • 2009-10-13
  • EEAT и качество

  • Knowledge Graph

  • SERP

Как Google связывает документы на основе поведения пользователей, времени взаимодействия и контентной близости для персонализации поиска
Google использует систему для определения "меры ассоциации" между различными документами (статьями, веб-страницами, письмами). Ассоциация рассчитывается на основе того, насколько близко по времени пользователь взаимодействовал с этими документами, насколько похож их контент и совпадают ли метаданные (например, автор). Эти связи используются для понимания пути пользователя и персонализации последующих результатов поиска.
  • US8131754B1
  • 2012-03-06
  • Поведенческие сигналы

  • Персонализация

  • Семантика и интент

Как Google использует фразы и тематические кластеры из истории пользователя для персонализации результатов поиска
Google может строить модель интересов пользователя, анализируя семантически значимые фразы и тематические кластеры в контенте, который пользователь потребляет (просматривает, сохраняет, печатает). При последующих запросах система повышает в ранжировании те документы, которые содержат фразы, одновременно релевантные запросу и присутствующие в профиле интересов пользователя.
  • US7580929B2
  • 2009-08-25
  • Персонализация

  • Семантика и интент

  • Поведенческие сигналы

Как Google определяет географическую релевантность документа, анализируя неоднозначные термины и названия мест
Google использует классификатор местоположений для определения географической привязки документа, даже если в нем нет точного адреса. Система анализирует неоднозначные термины (например, названия районов или улиц) и использует профили георелевантности (гистограммы), показывающие, где эти термины чаще всего используются. Перемножая эти профили, Google разрешает неоднозначность и вычисляет наиболее вероятное местоположение контента.
  • US7716162B2
  • 2010-05-11
  • Local SEO

  • Семантика и интент

  • Индексация

Популярные патенты

Как Google использует крупномасштабное машинное обучение и данные о поведении пользователей для предсказания кликов и ранжирования результатов
Google использует систему машинного обучения для создания модели ранжирования, которая предсказывает вероятность клика пользователя по документу. Модель обучается на огромных массивах данных о прошлых поисках (запросы, документы, клики). Система учитывает базовую вероятность клика (Prior Probability), основанную на позиции и предыдущей оценке документа, а затем корректирует её с помощью правил, выявляющих, какие признаки (Features) документа и запроса влияют на выбор пользователя.
  • US7231399B1
  • 2007-06-12
  • Поведенческие сигналы

Как Google создает мгновенные интерактивные результаты на SERP, предварительно загружая и персонализируя скрытый контент
Google использует механизм для создания интерактивных блоков ответов (Answer Boxes), таких как Погода или Панели Знаний. Система отправляет пользователю не только видимый результат, но и дополнительный скрытый контент («карточки»), выбранный на основе истории взаимодействий пользователя. При взаимодействии с блоком (свайп или клик) дополнительный контент отображается мгновенно, без отправки нового запроса на сервер.
  • US9274683B2
  • 2016-03-01
  • SERP

  • Персонализация

  • Поведенческие сигналы

Как Google использует исторические данные о кликах (CTR) по категориям для определения доминирующего интента неоднозначных запросов
Google анализирует, на какие категории результатов пользователи кликали чаще всего в прошлом (CTR) по неоднозначному запросу (например, "Pool"). Система определяет доминирующие интенты, выявляя резкие перепады в CTR между категориями или используя иерархию категорий, и повышает в ранжировании результаты, соответствующие наиболее популярным интерпретациям.
  • US8738612B1
  • 2014-05-27
  • Семантика и интент

  • Поведенческие сигналы

  • SERP

Как Google позволяет пользователям "углубиться" в контент установленного мобильного приложения прямо из веб-выдачи
Google использует этот механизм для интеграции контента из нативных приложений в веб-поиск. Если приложение установлено у пользователя и система определяет высокую релевантность его контента запросу, в выдачу добавляется специальный элемент (например, "Больше результатов из приложения X"). Клик по этому элементу запускает новый поиск, показывая множество deep links только из этого приложения, не покидая интерфейс поиска.
  • US10579687B2
  • 2020-03-03
  • SERP

  • Семантика и интент

  • Ссылки

Как Google определяет географическую релевантность веб-страницы, анализируя физическое местоположение её посетителей
Google анализирует физическое местоположение (используя GPS, IP и т.д.) пользователей, которые взаимодействуют с веб-страницей (например, совершают клик и долго её изучают). Агрегируя эти данные, система определяет географическую релевантность страницы («Центр») и область её популярности («Дисперсию»), даже если на самой странице нет адреса. Эта информация используется для повышения позиций страницы в поиске для пользователей, находящихся в этой области.
  • US9552430B1
  • 2017-01-24
  • Local SEO

  • Поведенческие сигналы

Как Google рассчитывает и показывает рейтинг легитимности сайтов и рекламодателей на основе их истории и активности
Google патентует систему для оценки и отображения «Рейтинга Легитимности» источников контента, включая сайты в органической выдаче и рекламодателей. Этот рейтинг основан на объективных данных: как долго источник взаимодействует с Google (история) и насколько активно пользователи с ним взаимодействуют (объем транзакций, клики). Цель — предоставить пользователям надежную информацию для оценки качества и надежности источника.
  • US7657520B2
  • 2010-02-02
  • SERP

  • EEAT и качество

  • Поведенческие сигналы

Как Google использует контекст пользователя в реальном времени и машинное обучение для переранжирования результатов поиска
Google использует систему для прогнозирования истинного намерения пользователя на основе его текущего контекста (местоположение, время, среда, недавние действия) и исторических данных о поведении других пользователей в аналогичных ситуациях. Система переранжирует стандартные результаты поиска, чтобы выделить информацию (особенно "Search Features"), которая наиболее соответствует прогнозируемому намерению.
  • US10909124B2
  • 2021-02-02
  • Семантика и интент

  • Персонализация

  • SERP

Как Google использует историю запросов в текущей сессии и статистические паттерны для переранжирования результатов
Google анализирует миллионы прошлых поисковых сессий, выявляя статистически значимые последовательности запросов («Пути Запросов»), которые заканчиваются кликом на определенный URL («Конечная Точка Контента»). Когда текущая сессия пользователя совпадает с историческим путем, Google переранжирует результаты, повышая те URL, которые исторически удовлетворяли пользователей в аналогичном контексте, пропорционально вероятности их выбора.
  • US7610282B1
  • 2009-10-27
  • Поведенческие сигналы

  • SERP

  • Семантика и интент

Как Google использует внутренние ссылки и структуру DOM для генерации шаблонов сайта и извлечения структурированных сниппетов
Google анализирует повторяющиеся блоки внутренних ссылок (например, списки товаров). Если текст возле ссылки на исходной странице совпадает с текстом на целевой странице, Google определяет DOM-структуру этого текста и создает шаблон домена. Этот шаблон позволяет автоматически извлекать ключевую информацию (например, цену и характеристики) для сниппетов со всех однотипных страниц сайта, даже без микроразметки.
  • US9971746B2
  • 2018-05-15
  • Структура сайта

  • SERP

  • Ссылки

Как Google собирает и структурирует данные о поведении пользователей в Поиске по картинкам (включая ховеры, клики и 2D-позицию)
Патент Google описывает инфраструктуру для детального сбора данных в Поиске по картинкам. Система фильтрует общие логи, фиксируя не только клики, но и наведение курсора (ховеры), длительность взаимодействия и точное 2D-расположение (строка/столбец) изображения на выдаче. Эти данные агрегируются в Модель Запросов Изображений для оценки релевантности.
  • US8898150B1
  • 2014-11-25
  • Поведенческие сигналы

  • SERP

  • Мультимедиа

seohardcore