SEO HARDCORE
  • Разборы патентов
    • Патенты Google
  • Скоро SEO инструменты
  • Скоро SEO аналитика
  • seohardcore
SEO HARDCORE
назад

Как Google использует графы сущностей и их топологию для семантического понимания запросов и таргетинга контента

SELECTING CONTENT USING ENTITY PROPERTIES (Выбор контента с использованием свойств сущностей)
  • US9542450B1
  • Google LLC
  • 2014-04-01
  • 2017-01-10
  • Семантика и интент
  • Knowledge Graph
  • Описание
  • Разбор
  • Выводы
  • Практика
  • FAQ
  • Похожие

Google использует механизм выбора контента (например, рекламы), основанный на свойствах сущностей, а не только на ключевых словах. Система генерирует граф запроса, отражающий сущности и их взаимосвязи из Базы Знаний. Контент выбирается, только если его критерии точно соответствуют как содержанию, так и структуре (топологии) этого графа. Это позволяет учитывать семантический контекст, даже если он не выражен текстом запроса.

Описание

Какую проблему решает

Патент решает проблему ограничений традиционного таргетинга контента (в частности, рекламы), основанного на сопоставлении ключевых слов и синонимов. Цель изобретения — повысить точность и семантическую релевантность выбора контента за счет учета свойств (properties) и отношений сущностей (entities), идентифицированных в запросе, а не только текста запроса.

Что запатентовано

Запатентована система выбора контента, которая использует графовые структуры для представления запросов и критериев таргетинга. Система генерирует Query Structure (Граф запроса) и Content Selection Criteria Structure (Граф критериев), извлекая данные из структурированной базы знаний (Knowledge Graph). Ядром изобретения является требование точного совпадения как содержания (content), так и структуры связей (topology) этих графов для выбора контента.

Как это работает

Система функционирует следующим образом:

  • Понимание запроса: Система получает запрос, идентифицирует в нем сущности и определяет Confidence Score (уверенность в семантической релевантности).
  • Генерация графа запроса: Из базы знаний извлекаются свойства и связанные сущности (даже если они не упомянуты в запросе), формируя Query Graph.
  • Генерация графа критериев: Аналогичным образом обрабатываются критерии выбора контента, формируя Content Selection Criteria Graph.
  • Сопоставление графов: Система выполняет точное сопоставление. Требуется совпадение как узлов (сущностей), так и структуры связей (топологии).
  • Оптимизация: Для ускорения поиска Query Graph может быть преобразован в Flat Data Structure (список фактов) для быстрого отбора кандидатов перед точным сравнением графов.
  • Выбор контента: При совпадении графов контент (например, реклама) выбирается для показа.

Актуальность для SEO

Высокая. Переход от "строк к вещам" (strings to things) и опора на Knowledge Graph являются фундаментальными для современного поиска. Описанные механизмы глубокого понимания запросов через графы сущностей и их топологию крайне актуальны для понимания работы поисковых систем в 2025 году.

Важность для SEO

Патент имеет высокое стратегическое значение для SEO (7.5/10). Он напрямую описывает механизмы выбора контента (вероятно, Google Ads), а не органическое ранжирование. Однако он детально раскрывает процессы Query Understanding: как Google интерпретирует запросы в виде графов сущностей и их связей. Понимание этого критически важно для оптимизации контента под семантический поиск, работы со структурированными данными и построения Topical Authority.

Детальный разбор

Термины и определения

Content Selection Criteria (Критерии выбора контента)
Условия (таргетинги), заданные поставщиком контента (рекламодателем), определяющие, при каких запросах контент может быть показан.
Content Selection Criteria Structure/Graph (Структура/Граф критериев выбора контента)
Графовое представление критериев. Включает сущности, связанные сущности и отношения между ними. Используется для сопоставления с Query Graph.
Confidence Score (Оценка уверенности)
Метрика, указывающая на семантическую релевантность идентифицированной сущности поисковому запросу. Используется для фильтрации интерпретаций.
Data Structure (Структура данных о сущностях)
База знаний (например, Knowledge Graph), хранящая структурированную информацию о сущностях и их отношениях.
Entity (Сущность)
Конкретный человек, место, вещь или концепция с уникальным идентификатором в Data Structure.
Flat Data Structure (Плоская структура данных)
Упрощенное представление графа запроса (список фактов), используемое для быстрого первичного поиска кандидатов без учета топологии.
Property (Свойство сущности)
Атрибут сущности или отношение к другой сущности (например, Сущность А → Отношение → Сущность Б).
Query Structure/Graph (Структура/Граф запроса)
Динамически генерируемый граф, представляющий семантическую интерпретацию запроса. Включает сущности запроса и связанные с ними сущности и свойства из Data Structure.
Topology (Топология)
Структура связей между узлами в графе. Ключевой элемент сопоставления.
Statistical Metric (Статистическая метрика)
Метрика (например, TF-IDF или Odds Ratio), используемая в описанном механизме генерации критериев для оценки значимости семантического признака.

Ключевые утверждения (Анализ Claims)

Claim 1 (Независимый пункт): Описывает основной метод выбора контента путем сопоставления графовых структур.

  1. Система получает Content Selection Criteria (CSC) от поставщика контента.
  2. Определяется сущность CSC и связанные сущности (related entities), которые не фигурируют в CSC, но связаны с ней в Data Structure.
  3. Генерируется Content Selection Criteria Structure (граф), включающая все эти сущности и связи.
  4. Система получает поисковый запрос (SQ).
  5. Определяется сущность SQ и связанные сущности, которые не фигурируют в SQ, но связаны с ней в Data Structure.
  6. Генерируется Query Structure (граф запроса).
  7. Определяется совпадение (match) между структурой CSC и структурой запроса. Ключевое требование: совпадение топологии и содержания (topology and content).
  8. Контент выбирается как кандидат на основе этого совпадения.

Ядро изобретения — это расширение понимания запроса и критериев за счет включения подразумеваемых (связанных) сущностей из Базы Знаний и последующее требование точного структурного (топологического) совпадения этих расширенных представлений.

Claim 2 (Зависимый от 1): Уточняет метод сопоставления. Структуры являются графами, и сравнение происходит на поузловой основе (node-by-node basis). Это подтверждает необходимость точного соответствия топологии.

Claims 3 и 4 (Зависимые от 1): Описывают механизм оптимизации (двухэтапный поиск).

  1. Свойства сущности запроса (Query Graph) транслируются в Flat Data Structure (список фактов).
  2. Эта плоская структура используется для быстрого поиска потенциальных кандидатов CSC.
  3. Затем (Claim 4) каждый кандидат точно сравнивается с исходным Query Graph для верификации совпадения (включая топологию, которая теряется в плоской структуре).

Где и как применяется

Изобретение применяется в системе выбора контента (например, Google Ads), но затрагивает фундаментальные этапы обработки поиска.

INDEXING – Индексирование и извлечение признаков
На этом этапе формируется и поддерживается Data Structure (Knowledge Graph), которая является источником данных о сущностях и связях. Также предварительно генерируются Content Selection Criteria Graphs.

QUNDERSTANDING – Понимание Запросов
Ключевой этап применения. В реальном времени система:

  • Идентифицирует сущности в запросе.
  • Вычисляет Confidence Score для интерпретаций.
  • Генерирует Query Graph, извлекая и структурируя данные из Knowledge Graph.

RANKING / METASEARCH (Слой выбора контента/рекламы)
Процесс выбора контента для показа.

  • L1 (Retrieval): Быстрый отбор кандидатов с использованием Flat Data Structure.
  • L2/L3 (Ranking/Verification): Точное топологическое сопоставление Query Graph и Content Selection Criteria Graphs.

Офлайн-процессы (Генерация критериев)
В патенте также описан (FIG 5-7) механизм помощи поставщикам контента. Система анализирует целевой контент (Target Content), используя шаблоны и Statistical Metrics (TF-IDF/Odds Ratio), чтобы предложить эффективные семантические критерии таргетинга.

На что влияет

  • Специфические запросы: Наибольшее влияние на запросы с четко выраженными сущностями (персоны, места, продукты, медиа), для которых в Knowledge Graph существует много связей.
  • Коммерческие тематики: Патент упоминает использование "коммерчески релевантного подмножества" (commercially relevant subset) данных о сущностях, что указывает на фокус на атрибутах, важных для таргетинга (например, категория, бренд, местоположение).

Когда применяется

  • Триггеры активации: Активируется, когда в запросе идентифицирована хотя бы одна сущность с достаточным Confidence Score.
  • Пороговые значения: Confidence Score используется как порог. Если уверенность в интерпретации сущности низкая, механизм семантического сопоставления может не применяться.

Пошаговый алгоритм

Процесс А: Обработка запроса и выбор контента (Real-time)

  1. Получение запроса: Система получает поисковый запрос.
  2. Идентификация сущностей: Идентифицируются сущности и рассчитываются Confidence Scores.
  3. Генерация Query Graph: Для сущностей, превысивших порог уверенности, из Data Structure извлекаются свойства и связанные сущности. Формируется Query Graph.
  4. Трансляция в Flat Data Structure (Оптимизация): Query Graph преобразуется в список фактов.
  5. Поиск кандидатов (Retrieval): Используя Flat Data Structure, система быстро находит потенциально подходящие Content Selection Criteria Graphs (CSC Graphs).
  6. Топологическое сопоставление (Matching): Каждый кандидатский CSC Graph сравнивается с Query Graph на поузловой основе (node-by-node). Проверяется точное совпадение содержания и топологии.
  7. Выбор контента: Если найдено точное совпадение, соответствующий контент выбирается как кандидат для показа.

Процесс Б: Генерация критериев (Описано в патенте, FIG 7)

  1. Получение Target Content: Система получает целевой контент (например, лендинг) от поставщика.
  2. Анализ контента: Идентифицируются сущности и их свойства в контенте.
  3. Применение шаблонов: Система подбирает Templates с Named Variables (например, $Area), соответствующие найденным свойствам.
  4. Генерация семантических критериев: Переменные заполняются конкретными сущностями из контента.
  5. Расчет Statistical Metric: Для каждого критерия вычисляется метрика (TF-IDF/Odds Ratio), оценивающая его значимость и уникальность для данного контента по сравнению с общим корпусом.
  6. Выбор кандидатов: Критерии ранжируются по метрике и предлагаются поставщику.

Какие данные и как использует

Данные на входе

  • Структурные факторы (Knowledge Graph Data): Критически важные данные. Используется Data Structure, содержащая:
    • Уникальные идентификаторы сущностей (Entity IDs).
    • Свойства (Properties) и Отношения (Relations/Predicates).
  • Контентные факторы: Текст поискового запроса (для Процесса А). Текст целевого контента (для Процесса Б).
  • Поведенческие факторы (для Процесса Б): Исторические логи запросов используются для расчета Statistical Metric (Inverse Query Frequency).

Какие метрики используются и как они считаются

  • Confidence Score: Оценка семантической релевантности сущности запросу. Используется как фильтр и порог. Формула не приведена.
  • Topological Match (Топологическое совпадение): Результат сравнения графов "узел за узлом". Проверка структурного и содержательного соответствия.
  • Statistical Metric (TF-IDF / Odds Ratio): Используется в Процессе Б. Оценивает важность семантического критерия.
    • TF (Term Frequency): Как часто критерий встречается в целевом контенте/запросах.
    • IDF (Inverse Query Frequency): Насколько редок критерий в общем корпусе запросов.

Выводы

  1. Семантическая структура приоритетнее текста: Патент демонстрирует механизм, где релевантность определяется через совпадение семантических структур (графов), а не текстовых строк. Запрос интерпретируется как Query Graph.
  2. Критичность топологии связей (Topology Matching): Ключевым требованием является точное совпадение топологии. Важно не только присутствие сущностей, но и то, как именно они связаны друг с другом (отношения/предикаты).
  3. Расширенное понимание запроса: Система включает в Query Graph связанные сущности и свойства из Knowledge Graph, даже если они не были упомянуты пользователем. Это позволяет учитывать подразумеваемый контекст.
  4. Управление точностью через Confidence Score: Идентификация сущностей фильтруется по Confidence Score, что позволяет отсеивать неоднозначные или неверные интерпретации запроса.
  5. Анализ контента через статистическую значимость (Процесс Б): Механизм генерации критериев показывает, как Google может анализировать контент для выявления ключевых семантических признаков, используя Statistical Metrics (TF-IDF). Это подчеркивает важность уникальности и глубины контента.

Практика

Best practices (это мы делаем)

Хотя патент фокусируется на выборе дополнительного контента (рекламы), его механизмы Query Understanding критически важны для органического SEO.

  • Четкое определение связей между сущностями: В контенте необходимо явно и однозначно определять отношения между сущностями. Поскольку Google ценит точность топологии графа, структура вашего контента должна четко отражать эти связи (например, "Автор X написал Книгу Y", а не просто упоминание X и Y).
  • Активное использование микроразметки (Schema.org): Внедряйте разметку для определения сущностей и, что более важно, их свойств и отношений (author, director, containedInPlace, brand). Это напрямую помогает Google понять топологию вашего контента и сопоставить ее с Query Graph.
  • Построение Topical Authority через структуру: Организуйте контент так, чтобы он отражал реальные семантические связи в вашей нише. Создавайте хабы для сущностей и линкуйте их со страницами, раскрывающими свойства. Это укрепляет понимание системы о структуре вашего сайта.
  • Оптимизация под Statistical Metric (Инсайт из Процесса Б): Создавайте контент с высокой статистической значимостью. Фокусируйтесь на глубоком раскрытии темы (высокий TF для релевантных признаков) и предоставлении уникальной информации или освещении редких аспектов (высокий IDF).

Worst practices (это делать не надо)

  • Игнорирование семантики и Keyword Stuffing: Создание контента только под текстовые вхождения без учета сущностей и их связей. Система ищет структурное совпадение графов.
  • Неоднозначное представление сущностей: Использование терминов без уточняющего контекста (например, "Ягуар" без указания на автомобиль или животное). Это снижает Confidence Score и затрудняет построение точного графа.
  • Поверхностный контент ("Вода"): Создание контента, содержащего только общеизвестные факты с низким IDF. Процесс Б показывает, что система предпочитает признаки с высокой статистической значимостью.
  • Отсутствие структуры и разметки: Публикация "стены текста", где связи между сущностями не очевидны или не размечены. Это мешает системе извлечь четкую топологию.

Стратегическое значение

Патент подтверждает стратегию Google на глубокое семантическое понимание контента и запросов через призму сущностей и их взаимосвязей (Entity-First). Для долгосрочного SEO критически важно не просто оптимизировать страницы, а строить структурированную, семантически связанную базу контента, которая максимально точно отражает структуру Knowledge Graph. Это позволяет системе эффективно сопоставлять Query Graphs пользователей с контентом сайта.

Практические примеры

Сценарий: Оптимизация страницы локального бизнеса (На основе Claim 1 и FIG 3)

Задача: Улучшить релевантность страницы отеля в Берлине для запроса "отели возле Потсдамской площади".

  1. Анализ запроса (Google): Система строит Query Graph. Идентифицируются сущности: "Отель" (EntityID_6) и "Потсдамская площадь" (EntityID_7). Система также знает, что "Потсдамская площадь" находится в (containedby) "Берлин" (EntityID_5).
  2. Действия SEO: Необходимо обеспечить соответствие топологии контента этому графу.
  3. Контент и Разметка: На странице отеля внедрить разметку Hotel (соответствует EntityID_6). Явно указать местоположение, используя свойства address и containedInPlace, ссылаясь на Берлин (EntityID_5). Использовать свойство geo или amenityFeature для указания близости к Потсдамской площади (EntityID_7).
  4. Ожидаемый результат: Топология контента страницы будет соответствовать расширенному графу запроса (Отель в Берлине, рядом с Площадью в Берлине), что повысит семантическую релевантность страницы для данного запроса.

Вопросы и ответы

Описывает ли этот патент алгоритмы органического ранжирования?

Нет, напрямую он описывает систему Content Selection, что чаще всего относится к выбору рекламы (Google Ads). Однако он детально раскрывает механизмы Query Understanding (идентификация сущностей, построение Query Graph), которые являются фундаментальными и используются во всей поисковой системе, включая органический поиск.

Что такое "Топология" графа и почему она так важна?

Топология — это структура связей между узлами (сущностями) в графе. Патент требует точного совпадения топологии (Claim 2: node-by-node basis). Это означает, что важны не просто упомянутые сущности, а конкретные отношения между ними. Например, запрос "книги автора X" требует отношения "Книга → автор → X", и он не совпадет с контентом "фильмы продюсера X".

Как этот патент связан с Knowledge Graph?

Патент напрямую зависит от него. Data Structure, упомянутая в патенте, — это и есть Knowledge Graph. Система использует его для идентификации сущностей в запросах и для извлечения их свойств и связанных сущностей при построении Query Graph.

Что означает, что система включает в граф сущности, не упомянутые в запросе?

Это ключевой аспект семантического расширения (Claim 1). Если пользователь ищет "Манхэттен", система знает, что он находится в Нью-Йорке. Связь "находится в Нью-Йорке" добавляется в Query Graph, даже если пользователь этого не писал. Это позволяет учитывать более широкий контекст запроса при выборе контента.

Что такое Confidence Score и как он используется?

Confidence Score — это оценка уверенности системы в том, что она правильно интерпретировала сущность в контексте запроса. Если оценка низкая (например, из-за неоднозначности), эта интерпретация может быть отброшена. Это фильтр качества для семантического анализа.

Как на практике обеспечить правильную топологию контента на моем сайте?

Основной инструмент — это микроразметка Schema.org. Явное определение сущностей и их свойств (связей) помогает Google понять структуру вашего контента. Также важна логичная структура текста, использование явных предикатов в предложениях (например, "X является автором Y") и продуманная внутренняя перелинковка.

Что такое Flat Data Structure и зачем она нужна?

Это оптимизация для ускорения поиска (Claims 3 и 4). Query Graph преобразуется в простой список фактов (без учета сложной структуры). Этот список используется для быстрого первичного отбора кандидатов (L1 Retrieval). Затем для отобранных кандидатов выполняется точное, но более медленное топологическое сравнение графов.

Патент описывает генерацию критериев с использованием TF-IDF (Процесс Б). Как это связано с SEO?

Этот механизм показывает, как Google может анализировать контент (например, лендинг) для выявления его ключевых семантических признаков и оценки их значимости (уникальности и важности). Это подтверждает важность создания контента, который не только релевантен теме (высокий TF), но и содержит уникальную информацию или глубокую проработку (высокий IDF).

Что такое "коммерчески релевантное подмножество" данных?

Патент упоминает, что система может фокусироваться на подмножестве свойств сущности, которые имеют коммерческое значение (например, цена, категория, местоположение), игнорируя менее важные факты. Для SEO это означает приоритет оптимизации атрибутов, важных для принятия решений в вашей нише.

Каков главный вывод для SEO-специалиста из этого патента?

Главный вывод — переход к стратегии Entity-First. Необходимо фокусироваться на построении четких, структурированных и семантически точных связей между сущностями в контенте. Успех зависит от того, насколько точно топология вашего контента соответствует тому, как Google структурирует знания в Knowledge Graph и интерпретирует запросы пользователей.

Похожие патенты

Как Google использует графы сущностей для точного семантического сопоставления запросов и контента
Google применяет семантический подход к выбору контента, строя «граф запроса» на основе сущностей в запросе и их связей в Knowledge Graph. Этот граф затем сопоставляется с «графами критериев выбора контента». Система также может автоматически генерировать эти критерии, анализируя целевой контент и выявляя статистически значимые семантические шаблоны.
  • US9501530B1
  • 2016-11-22
  • Семантика и интент

  • Knowledge Graph

Как Google использует Граф Сущностей для определения главных тем страницы и генерации релевантных рекомендаций контента
Патент Google описывает систему анализа веб-страницы для выявления ее главных тем («Центральных Сущностей») с помощью глобального Графа Сущностей, основанного на совместной встречаемости терминов. Система отфильтровывает периферийные и неоднозначные темы, генерирует на основе главных тем поисковые запросы и предлагает пользователю категоризированный дополнительный контент (новости, видео, товары).
  • US20160026727A1
  • 2016-01-28
  • Семантика и интент

  • Knowledge Graph

  • Мультимедиа

Как Google использует машинное обучение для оптимизации обхода Knowledge Graph и поиска связанных концепций
Google оптимизирует обход Knowledge Graph для эффективного поиска семантически связанных фраз. Вместо анализа всех связей сущности система использует ML-модели для выбора только тех отношений (свойств), которые вероятнее всего приведут к ценным результатам. Этот выбор основан на истории поисковых запросов и контексте пользователя, что позволяет экономить вычислительные ресурсы и повышать релевантность предложений.
  • US10140286B2
  • 2018-11-27
  • Knowledge Graph

  • Семантика и интент

  • Персонализация

Как Google автоматически выбирает категории и контент для страниц сущностей, комбинируя данные о поведении пользователей и Knowledge Graph
Google использует механизм для автоматического создания страниц о сущностях (например, о фильмах или персонажах). Система определяет, какие категории (свойства) сущности наиболее интересны пользователям, сравнивая данные из Knowledge Graph с данными о том, что пользователи ищут или смотрят вместе с этой сущностью. Затем она наполняет эти категории популярным контентом.
  • US11036743B2
  • 2021-06-15
  • Knowledge Graph

  • Семантика и интент

  • Поведенческие сигналы

Как Google использует графовое сопоставление для поиска структурированных данных внутри диаграмм и таблиц
Google патентует систему для сопоставления сложных пользовательских запросов (представленных в виде графов) с базовыми моделями данных визуального контента (например, диаграмм или таблиц) на веб-страницах. Это требует от издателей предоставлять свои данные в доступном структурированном формате («Content Metadata Sets»), чтобы поисковая система могла понять и проиндексировать сложные взаимосвязи внутри контента.
  • US9411890B2
  • 2016-08-09
  • Семантика и интент

  • Индексация

  • Техническое SEO

Популярные патенты

Как Google персонализирует сниппеты и заголовки в выдаче на основе истории поиска и интересов пользователя
Google может динамически изменять сниппеты и заголовки (Title) результатов поиска, чтобы выделить ту часть контента на странице, которая соответствует известным интересам пользователя (история поиска, демография, недавний контекст). Это позволяет сделать представление выдачи более персонализированным, не обязательно изменяя ранжирование документов.
  • US9235626B2
  • 2016-01-12
  • Персонализация

  • SERP

  • Семантика и интент

Как Google использует последовательность кликов пользователей (Co-selection) для классификации изображений и фильтрации контента (SafeSearch)
Google анализирует, какие изображения пользователи выбирают последовательно в рамках одной сессии (co-selection). Если Изображение Б часто выбирается сразу после Изображения А (с известной темой), система присваивает Изображению Б ту же тему. Этот механизм использует графовый анализ поведения для уточнения тематики изображений, что критично для повышения релевантности и работы фильтров, таких как SafeSearch.
  • US8856124B2
  • 2014-10-07
  • Безопасный поиск

  • Поведенческие сигналы

  • Семантика и интент

Как Google ранжирует комментарии и UGC, используя объективное качество и субъективную персонализацию
Google использует двухфакторную модель для ранжирования пользовательского контента (комментариев, отзывов). Система вычисляет объективную оценку качества (репутация автора, грамотность, длина, рейтинги) и субъективную оценку персонализации (является ли автор другом или предпочтительным автором, соответствует ли контент интересам и истории поиска пользователя). Итоговый рейтинг объединяет обе оценки для показа наиболее релевантного и качественного UGC.
  • US8321463B2
  • 2012-11-27
  • Персонализация

  • EEAT и качество

  • Поведенческие сигналы

Как Google проверяет работоспособность Deep Links и обратную совместимость перед индексированием контента мобильных приложений
Google использует автоматизированную систему верификации для индексирования контента мобильных приложений. Перед добавлением в индекс система эмулирует запуск приложения по Deep Link, проверяя корректность загрузки, отсутствие ошибок и соответствие контента связанной веб-странице. Также система тестирует обратную совместимость ссылок при обновлениях приложения, гарантируя, что в поиск попадают только функциональные результаты.
  • US9645980B1
  • 2017-05-09
  • Индексация

  • Ссылки

  • Техническое SEO

Как Google динамически формирует Панели Знаний, выбирая блоки информации на основе истории поисковых запросов пользователей
Google использует гибридный подход для создания структурированных страниц о сущностях (например, Панелей Знаний). Система анализирует исторические данные о том, что пользователи чаще всего ищут об этой сущности или её классе. На основе этого анализа динамически выбираются блоки информации (например, «Награды», «Саундтрек»), которые дополняют стандартный набор данных, позволяя автоматически адаптировать выдачу под актуальные интересы аудитории.
  • US10110701B2
  • 2018-10-23
  • Knowledge Graph

  • Поведенческие сигналы

  • Персонализация

Как Google переносит вес поведенческих сигналов (кликов) между связанными запросами для улучшения ранжирования
Google улучшает ранжирование по редким или новым запросам, для которых недостаточно собственных данных, используя поведенческие сигналы (Clickthrough Data) из связанных запросов. Если пользователи часто вводят запросы последовательно, система идентифицирует связь и переносит данные о кликах с одного запроса на другой, позволяя документам с высоким engagement ранжироваться выше по всему кластеру.
  • US7505964B2
  • 2009-03-17
  • Поведенческие сигналы

  • SERP

Как Google использует распределение кликов в выдаче для определения брендовых (навигационных) и общих (тематических) запросов
Google анализирует поведение пользователей в поисковой выдаче для классификации интента запроса. Если клики сконцентрированы на одном результате (низкое разнообразие, высокая частота), запрос классифицируется как навигационный или брендовый (Data-Creator Targeting). Если клики распределены по разным сайтам, запрос считается общим (Content Targeting). Эта классификация используется для адаптации поисковой выдачи.
  • US20170068720A1
  • 2017-03-09
  • Семантика и интент

  • Поведенческие сигналы

  • SERP

Как Google ранжирует контент на других языках, основываясь на поведении пользователей с одинаковыми языковыми настройками
Google использует статистику кликов (CTR), сегментированную по языковым предпочтениям пользователей, для корректировки ранжирования. Если пользователи, предпочитающие язык X, часто кликают на результат на языке Y, этот результат будет повышен в выдаче для других пользователей с предпочтением языка X. Это позволяет ранжировать контент, популярный у определенной языковой группы, независимо от языка самого контента.
  • US8375025B1
  • 2013-02-12
  • Мультиязычность

  • Поведенческие сигналы

  • Персонализация

Как Google (YouTube) анализирует трафик конкурирующих видео для рекомендации улучшений метаданных
Google использует систему для анализа конкуренции между видео на основе общих поисковых запросов и времени просмотра. Система выявляет поисковые запросы, которые приводят трафик на конкурирующие (например, производные) видео, и сравнивает их с метаданными оригинального видео. Если обнаруживаются релевантные термины, отсутствующие у оригинала, они рекомендуются автору для улучшения видимости.
  • US10318581B2
  • 2019-06-11
  • Поведенческие сигналы

  • Мультимедиа

  • Семантика и интент

Как Google динамически перестраивает SERP в реальном времени, основываясь на взаимодействии пользователя с подзадачами
Google использует специализированные AI-модели для разбивки сложных запросов (задач) на подзадачи. Система отслеживает, с какими подзадачами взаимодействует пользователь, и динамически обновляет выдачу, подгружая больше релевантного контента для этой подзадачи прямо во время скроллинга страницы. Это позволяет уточнять интент пользователя в реальном времени.
  • US20250209127A1
  • 2025-06-26
  • SERP

  • Поведенческие сигналы

  • Семантика и интент

seohardcore