Как Google ранжирует сущности в Knowledge Graph, используя адаптивные веса для метрик вклада, известности и наград

RANKING SEARCH RESULTS BASED ON ENTITY METRICS (Ранжирование результатов поиска на основе метрик сущностей)

US10235423B2
Google LLC
2012-12-12
2019-03-19

Google использует систему для ранжирования сущностей, извлеченных из Knowledge Graph. Система рассчитывает четыре ключевые метрики: связанность, значимость типа, вклад и награды. Затем она применяет весовые коэффициенты, которые адаптируются в зависимости от типа сущности (например, «Фильм» или «Человек»), чтобы определить итоговый рейтинг. Это влияет на то, какие сущности будут показаны в каруселях, панелях знаний и других функциях поиска, связанных с сущностями.

Какую проблему решает

Патент решает задачу определения релевантности и ранжирования результатов поиска, полученных из Knowledge Graph (графа знаний). Вместо использования общих методов ранжирования (таких как алфавитный порядок или простое совпадение ключевых слов), система стремится определить наиболее релевантные и значимые сущности, используя специфические для них метрики и адаптируя важность этих метрик в зависимости от типа сущности.

Что запатентовано

Запатентована система и метод для ранжирования сущностей, извлеченных из Knowledge Graph. Изобретение заключается в расчете нескольких метрик (plurality of metrics), характеризующих релевантность сущности, и применении к ним весовых коэффициентов (weights), которые зависят от типа сущности (entity type) или домена (domain). Это позволяет системе адаптировать логику ранжирования: например, для фильмов больший вес могут иметь награды, а для книг — вклад в литературу.

Как это работает

Система работает следующим образом:

Извлечение сущностей: В ответ на запрос система извлекает набор сущностей-кандидатов из Knowledge Graph.
Расчет метрик: Для каждой сущности рассчитываются четыре основные метрики:
- Relatedness metric (R): Основана на совместной встречаемости (co-occurrence) сущности и связанной с ней сущности (например, запроса) в веб-документах.
- Notable type metric (N): Учитывает глобальную популярность сущности и ранг ее типа внутри домена.
- Contribution metric (C): Основана на критических обзорах, рейтингах известности (fame rankings) и т.д. Использует взвешивание, чтобы подчеркнуть наиболее значимые вклады.
- Prize metric (P): Основана на наградах и премиях, также с взвешиванием для подчеркивания наиболее престижных наград.
Определение весов: Система определяет тип сущности и извлекает соответствующие этому типу (или домену) весовые коэффициенты (a, b, c, d).
Расчет оценки: Метрики объединяются с использованием весов для получения итоговой оценки (Score S). Например, S = (a*R) + (b*N) + (c*C) + (d*P).
Ранжирование: Результаты поиска (сущности) ранжируются на основе этой оценки.

Актуальность для SEO

Высокая. Поиск, основанный на сущностях (Entity-based search) и Knowledge Graph, является фундаментом современного Google. Способность точно ранжировать сущности критически важна для качества панелей знаний, каруселей, ответов на вопросы и других функций SERP. Описанные механизмы адаптивного взвешивания метрик остаются актуальными для оценки авторитетности и релевантности сущностей.

Важность для SEO

Патент имеет высокое значение (8/10) для стратегий, фокусирующихся на Entity SEO и оптимизации присутствия в Knowledge Graph. Хотя он напрямую не описывает ранжирование «синих ссылок», он раскрывает, как Google оценивает и ранжирует сами сущности. Понимание этих метрик (Вклад, Награды, Известность) и того, как их важность меняется в зависимости от типа сущности, критично для управления видимостью бренда, персоны или продукта в функциях поиска, связанных с сущностями.

Термины и определения

Contribution metric (C) (Метрика вклада): Показатель, основанный на критических обзорах, рейтингах известности (fame rankings) и другой информации, характеризующей популярность, производительность или качество сущности. При расчете используется взвешивание, чтобы наиболее высоко оцененные вклады вносили больший вес в итоговую метрику.
Domain (Домен): Группа или категория типов сущностей. Например, домены «Книги», «Фильмы», «Люди». Элементы домена имеют общие характеристики или свойства.
Entity (Сущность): Вещь или концепция, которая является единичной, уникальной, четко определенной и различимой. Например, человек, место, предмет, идея.
Entity Reference (Ссылка на сущность): Идентификатор (например, текст) или другая информация, которая ссылается на сущность. Абстрактная концепция, представляющая сущность в базе данных.
Entity Type (Тип сущности): Определяющая характеристика или категоризация сущности. Например, «Джордж Вашингтон» (Entity Reference) имеет тип «Президент» (Entity Type).
Knowledge Graph (Граф знаний): Структура данных, используемая в патенте, содержащая данные, организованные в виде графа с узлами (nodes) и ребрами (edges). Узлы представляют сущности, типы или литералы, а ребра представляют отношения между ними.
Notable type metric (N) (Метрика значимого типа): Показатель, рассчитываемый как глобальная метрика популярности (G), деленная на ранг значимого типа (n). Отражает популярность сущности с поправкой на важность ее типа.
Notable entity type rank (n) (Ранг значимого типа сущности): Позиция типа сущности в ранжированном списке типов внутри определенного домена. Ранжирование основано на значимости (notability), популярности или частоте встречаемости типов.
Prize metric (P) (Метрика наград): Показатель, основанный на наградах и премиях сущности. Использует взвешивание, чтобы наиболее престижные награды вносили больший вес в итоговую метрику.
Relatedness metric (R) (Метрика связанности): Показатель, определяемый на основе совместной встречаемости (co-occurrence) ссылки на сущность (E) и связанной ссылки на сущность (REj) (например, термина запроса) в корпусе текстов (например, на веб-страницах).

Ключевые утверждения (Анализ Claims)

Claim 1 (Независимый пункт): Описывает основной метод ранжирования сущностей с адаптивными весами.

Система получает поисковый запрос.
Из Knowledge Graph извлекаются первый и второй результаты поиска (сущности).
Для первого результата определяется набор первых метрик (plurality of first metrics), указывающих на релевантность. Как минимум одна метрика не зависит от запроса.
Для второго результата определяется набор вторых метрик. Как минимум одна метрика не зависит от запроса.
Определяется первый тип сущности (first entity type) для первого результата.
Определяется второй тип сущности (second entity type) для второго результата, отличный от первого типа.
Определяется первый набор весов (first weight) для каждой из первых метрик, основанный на первом типе сущности.
Определяется второй набор весов (second weight) для каждой из вторых метрик, основанный на втором типе сущности. Второй набор весов отличается от первого.
Рассчитывается первая оценка (first score) для первого результата путем модификации метрик соответствующими весами.
Рассчитывается вторая оценка (second score) для второго результата путем модификации метрик соответствующими весами.
Результаты ранжируются на основе первой и второй оценок.
На основе ранжирования выбирается пользовательский интерфейс для представления результатов.
Результаты предоставляются через выбранный интерфейс.

Ядро изобретения — это использование различных наборов весовых коэффициентов для одних и тех же метрик релевантности, причем выбор набора весов зависит от типа сущности, к которой эти метрики относятся. Это позволяет системе сравнивать разнородные сущности (например, Фильм и Актера) в рамках одной выдачи, применяя к ним разные критерии важности.

Claim 2 (Зависимый от 1): Уточняет, как определяются веса.

Определение веса включает определение домена (domain) в Knowledge Graph, связанного с типом сущности, и определение весов, связанных с этим доменом.

Claims 3-6 (Зависимые от 1): Уточняют состав метрик.

Набор метрик включает relatedness metric (Claim 3), notable type metric (Claim 4), contribution metric (Claim 5) и prize metric (Claim 6).

Claim 7 (Зависимый от 1): Уточняет формулу расчета оценки.

Оценка определяется как сумма произведений соответствующих метрик и их весов.

Где и как применяется

Изобретение применяется на нескольких этапах поиска для оценки и ранжирования сущностей.

INDEXING – Индексирование и извлечение признаков
На этом этапе происходит предварительный расчет многих метрик, которые не зависят от запроса. Система анализирует данные Knowledge Graph и внешний контент (веб-страницы) для расчета метрик вклада (C), наград (P) и популярности (G), которые затем используются для расчета метрики значимого типа (N). Также происходит анализ совместной встречаемости (co-occurrence) для метрики связанности (R).

QUNDERSTANDING – Понимание Запросов
Система может использовать этот механизм для понимания того, какие сущности наиболее релевантны запросу, особенно если запрос сам является сущностью или подразумевает список сущностей.

RANKING – Ранжирование
Основное применение патента. Когда система извлекает набор сущностей из Knowledge Graph в ответ на запрос, она применяет описанный алгоритм для их ранжирования. Система использует предварительно рассчитанные метрики (C, P, N) и, возможно, рассчитывает метрику связанности (R) относительно запроса. Затем применяются веса, специфичные для типа сущности, и рассчитывается итоговая оценка Score S.

METASEARCH – Метапоиск и Смешивание
Результаты этого ранжирования используются для формирования блоков выдачи, основанных на сущностях, таких как карусели, списки или панели знаний. Claim 1 также упоминает выбор пользовательского интерфейса на основе ранжирования.

Входные данные:

Поисковый запрос.
Набор сущностей (Search Results), извлеченных из Knowledge Graph.
Данные Knowledge Graph (связи, типы, свойства сущностей).
Данные о совместной встречаемости сущностей в веб-контенте.
Предварительно определенные веса для различных доменов/типов сущностей.
Данные о наградах, обзорах, рейтингах (для метрик C и P).

Выходные данные:

Ранжированный список сущностей (Ranked Results).
Выбранный пользовательский интерфейс для отображения результатов.

На что влияет

Типы контента: Влияет на отображение сущностей (люди, места, продукты, произведения искусства, компании) в Knowledge Graph и связанных с ним функциях поиска (SERP Features).
Специфические запросы: Наиболее сильно влияет на запросы, подразумевающие список сущностей (например, «лучшие фильмы 2024», «известные изобретатели») или запросы о конкретной сущности, где требуется выбрать наиболее релевантную информацию или связанные сущности для отображения.
Конкретные ниши: Влияет на все ниши, представленные в Knowledge Graph. Однако механизм адаптивных весов предполагает разное влияние в разных доменах (например, сильное влияние наград в киноиндустрии, сильное влияние вклада в науке).

Когда применяется

Условия работы: Алгоритм применяется, когда результаты поиска извлекаются из Knowledge Graph.
Триггеры активации: Получение запроса, который требует ранжирования набора сущностей для представления пользователю.

Пошаговый алгоритм

Процесс ранжирования сущностей (на основе FIG. 2):

Получение запроса и сущностей: Система получает запрос и извлекает набор сущностей-кандидатов из Knowledge Graph.
Определение метрики связанности (R): Для каждой сущности (E) определяется метрика связанности с другой связанной сущностью (REj, например, запросом). Это делается путем анализа совместной встречаемости E и REj в корпусе веб-документов.
Определение метрики значимого типа (N): Для каждой сущности определяется ее глобальная популярность (G) и ранг ее типа (n) внутри соответствующего домена. Рассчитывается N = G/n.
Определение метрики вклада (C): Для каждой сущности собираются данные о ее вкладах (например, обзоры, рейтинги). Данные взвешиваются так, чтобы наиболее значимые вклады имели больший вес, и агрегируются в метрику C.
Определение метрики наград (P): Для каждой сущности собираются данные о ее наградах. Данные взвешиваются так, чтобы наиболее престижные награды имели больший вес, и агрегируются в метрику P.
Определение весов: Система определяет тип или домен сущности. На основе этого типа извлекаются специфические весовые коэффициенты (a, b, c, d) для каждой из метрик (R, N, C, P).
Расчет итоговой оценки (S): Рассчитывается оценка на основе метрик и их весов. Например, S = (a*R) + (b*N) + (c*C) + (d*P).
Ранжирование и вывод: Сущности ранжируются на основе оценки S. Результаты предоставляются пользователю, возможно, через интерфейс, выбранный на основе ранжирования.

Какие данные и как использует

Данные на входе

Структурные факторы (Knowledge Graph): Данные из Knowledge Graph являются основным источником. Используются типы сущностей (Entity Types), связи между сущностями, свойства и литералы (например, даты, числа).
Контентные факторы (Веб-документы): Текст веб-страниц используется для анализа совместной встречаемости (co-occurrence) при расчете Relatedness metric (R).
Внешние данные (Обзоры и Награды): Данные из внешних источников, такие как критические обзоры (critical reviews), рейтинги известности (fame rankings), списки наград и премий, используются для расчета Contribution metric (C) и Prize metric (P). Патент упоминает использование предопределенных или автоматически идентифицированных веб-страниц (например, сайтов с обзорами фильмов).
Поведенческие факторы (Косвенно): Global popularity metric (G), используемая в расчете N, может включать данные об агрегированных выборах пользователей, количестве посещений или ссылок на результат поиска.

Какие метрики используются и как они считаются

Система использует четыре основные метрики и адаптивные веса.

1. Relatedness metric (R)

Основана на совместной встречаемости (Co-occurrence, C(E, REj)). Патент предлагает два варианта расчета:

Вариант 1 (Вероятностный):

Ранжирование сущностей адаптивно: Ключевой вывод заключается в том, что Google не использует единый статический подход к ранжированию всех сущностей. Система адаптивно изменяет весовые коэффициенты для метрик релевантности в зависимости от типа сущности (Entity Type) или домена (Domain).
Важность типа сущности (Entity Type): Тип сущности определяет, какие факторы наиболее важны для ее ранжирования. Например, Prize metric может иметь больший вес для домена «Фильмы», а Contribution metric — для домена «Книги».
Четыре столпа оценки сущностей: Патент выделяет четыре ключевых аспекта для оценки сущности: Связанность (R) с запросом/контекстом, Значимость (N) с учетом популярности и типа, Вклад (C) на основе достижений и отзывов, и Признание (P) на основе наград.
Приоритет качества вклада и наград: Формулы для Contribution metric (C) и Prize metric (P) используют экспоненциальное взвешивание (функцию затухания). Это означает, что несколько выдающихся достижений или престижных наград оказывают гораздо большее влияние на рейтинг, чем большое количество незначительных достижений. Качество преобладает над количеством.
Зависимость от внешних данных: Ранжирование сущностей сильно зависит не только от структуры Knowledge Graph, но и от внешних сигналов: совместной встречаемости в веб-документах (для R) и авторитетных оценок/отзывов/наград (для C и P).
Фокус на Knowledge Graph: Описанный механизм специфичен для ранжирования результатов, извлеченных из Knowledge Graph, что напрямую влияет на SERP features.

Best practices (это мы делаем)

Комплексная оптимизация сущностей (Entity SEO): Необходимо работать над улучшением всех четырех метрик (R, N, C, P) для ключевых сущностей (бренды, продукты, ключевые персоны). Это требует обеспечения полного и точного представления сущности в Knowledge Graph.
Акцент на выдающихся достижениях (Contribution/Prize): Поскольку система придает больший вес наиболее значимым вкладам и наградам, необходимо обеспечить видимость этих достижений в авторитетных источниках (например, Википедия, отраслевые новостные сайты, базы данных наград). Для автора важнее одна книга-бестселлер, чем десять средних книг.
Усиление связи сущности с ее типом (Relatedness): Необходимо убедиться, что сущность часто упоминается вместе с ее основным типом в веб-документах. Это улучшает Relatedness metric (R). Например, убедитесь, что «Empire State Building» часто упоминается в контексте «Skyscraper».
Использование структурированных данных для определения типа и свойств: Четко определяйте тип сущности (Schema.org) и указывайте ключевые свойства, такие как награды (award) и достижения/работы (например, worksFor, hasOccupation, alumniOf), чтобы помочь Google корректно рассчитать метрики C и P.
Стимулирование авторитетных обзоров (Contribution): Для продуктов, услуг или произведений (фильмы, книги) критически важно наличие обзоров от профессиональных критиков и авторитетных изданий, так как эти данные используются для расчета Contribution metric (C).

Worst practices (это делать не надо)

Игнорирование типа сущности: Применение одинаковой SEO-стратегии ко всем сущностям без учета их типа неэффективно, так как Google использует адаптивные веса.
Фокус на количестве вместо качества (Spamming contributions): Попытки манипулировать Contribution metric путем создания большого количества низкокачественных упоминаний, отзывов или незначительных работ будут неэффективны из-за функции взвешивания, которая отдает приоритет топовым достижениям.
Накрутка упоминаний без контекста: Увеличение количества упоминаний сущности (для G или R) без релевантного контекста или связи с ее типом не даст значительного эффекта для ранжирования в рамках этого алгоритма.

Стратегическое значение

Этот патент подтверждает, что для Google сущности являются не просто строками данных, а объектами с многофакторной оценкой релевантности и авторитетности. Стратегическое значение заключается в необходимости перехода от традиционного SEO к Entity SEO. Успех в поиске все больше зависит от того, насколько хорошо сущность определена, связана и признана в авторитетных источниках. Понимание того, что критерии оценки меняются в зависимости от домена, позволяет строить более точные и эффективные стратегии продвижения для разных типов сущностей.

Практические примеры

Сценарий: Оптимизация сущности «Автор» для повышения в карусели «Современные фантасты»

Анализ текущего состояния: Определить, какие метрики наиболее важны для домена «Литература»/типа «Автор». Вероятно, Contribution metric (C) и Notable type metric (N) имеют высокие веса.
Улучшение Contribution Metric (C):
- Обеспечить, чтобы самая успешная книга автора имела широкое признание (обзоры критиков, высокие рейтинги на авторитетных ресурсах).
- Использовать микроразметку на сайте автора, чтобы связать его с этой книгой (например, author свойство на странице книги).
- Обновить статью в Википедии, сделав акцент на влиянии этой книги.
Улучшение Prize Metric (P):
- Если автор получал престижные награды (например, Hugo Award), убедиться, что эта информация есть в Knowledge Graph (через Викиданные/Википедию) и на официальном сайте (Schema.org award).
Улучшение Relatedness (R) и Notability (N):
- Стимулировать упоминания автора в контексте его типа («фантаст», «автор») в новостях и статьях для улучшения R.
- Работать над общей популярностью автора (G) через PR и маркетинг.
Ожидаемый результат: Повышение итоговой оценки S автора за счет акцента на его самом значимом вкладе и наградах, что приведет к более высоким позициям в релевантных списках сущностей.

Применяется ли этот патент к ранжированию обычных веб-страниц («синих ссылок»)?

Патент явно указывает, что он применяется к ранжированию результатов поиска, полученных из Knowledge Graph. Это означает, что он напрямую управляет ранжированием сущностей в таких элементах, как карусели, списки и панели знаний. Хотя он не описывает основной алгоритм ранжирования веб-страниц, высокая оценка сущности, рассчитанная по этому методу, может косвенно влиять на ранжирование связанных с ней веб-сайтов, особенно в контексте E-E-A-T.

Что такое «Метрика вклада» (Contribution metric) и как ее улучшить?

Contribution metric (C) оценивает достижения сущности на основе внешних сигналов, таких как критические обзоры, рейтинги и известность. Ключевая особенность — взвешивание: лучшие достижения дают наибольший вклад. Для улучшения этой метрики необходимо фокусироваться на создании и продвижении высококачественных работ (продуктов, контента) и обеспечении их признания в авторитетных источниках (профессиональные обзоры, отраслевые рейтинги), а также четко связывать эти работы с сущностью через структурированные данные и упоминания.

Как Google определяет, какие веса использовать для разных типов сущностей?

Патент утверждает, что веса зависят от типа сущности (Entity Type) или домена (Domain). Например, для типа «Фильм» вес метрики наград (d) будет выше, чем для типа «Город». Конкретные значения весов в патенте не раскрываются, но указано, что они могут определяться экспериментально, на основе системных настроек или агрегированных пользовательских данных. SEO-специалистам следует анализировать выдачу для своего домена, чтобы понять, какие факторы приоритетны.

Что важнее для Метрики наград (Prize metric): количество наград или их престижность?

Престижность гораздо важнее. Формула расчета Prize metric (P) использует функцию взвешивания (затухания), которая придает значительно больший вес наиболее престижным наградам (например, Нобелевская премия или Оскар). Большое количество незначительных или локальных наград окажет минимальное влияние на итоговую оценку по сравнению с одной крупной международной премией.

Как работает Метрика значимого типа (Notable type metric) и что она означает?

Notable type metric (N) рассчитывается как глобальная популярность сущности (G), деленная на ранг ее типа (n). Ранг типа (n) отражает важность самого типа внутри домена (например, «Роман» важнее, чем «Рассказ»). Это означает, что сущность популярного и важного типа получит более высокую оценку N, чем сущность той же популярности (G), но менее важного типа. Это помогает продвигать сущности более значимых категорий.

Как Метрика связанности (Relatedness metric) использует данные с веб-страниц?

Relatedness metric (R) основывается на анализе совместной встречаемости (co-occurrence) двух сущностей в большом корпусе веб-документов. Система проверяет, как часто сущность E появляется рядом со связанной сущностью REj (например, термином из запроса). Чем чаще они встречаются вместе по отношению к их общей частоте встречаемости, тем выше метрика связанности R.

Как SEO-специалист может повлиять на эти метрики?

Влияние достигается через стратегию Entity SEO. Это включает обеспечение точности данных в Knowledge Graph (через Википедию, Викиданные, Google Business Profile), использование полной микроразметки Schema.org для определения типов, связей, наград и работ, а также через PR-активности, направленные на получение авторитетных обзоров, наград и упоминаний сущности в правильном контексте (для улучшения R, C и P).

Если моя компания не является известной сущностью, актуален ли этот патент для меня?

Да, актуален. Если вы стремитесь к тому, чтобы ваша компания, продукты или ключевые сотрудники стали сущностями в Knowledge Graph, этот патент описывает критерии, по которым они будут оцениваться и ранжироваться, как только попадут туда. Понимание этих метрик позволяет заложить правильный фундамент для будущего роста видимости в поиске, основанном на сущностях.

Как этот патент связан с E-E-A-T?

Патент предоставляет конкретные механизмы для оценки Авторитетности (Authority) и Достоверности (Trustworthiness) сущностей. Contribution metric (C) и Prize metric (P) являются прямыми сигналами признания и авторитета в определенной области. Notable type metric (N) также способствует оценке значимости сущности. Успешная оптимизация под эти метрики напрямую улучшает восприятие E-E-A-T сущности системой.

Что означает упоминание в Claim 1 о выборе пользовательского интерфейса на основе ранжирования?

Это указывает на то, что результаты ранжирования могут влиять не только на порядок показа сущностей, но и на формат их представления. Например, если система высоко оценила набор сущностей определенного типа (например, Фильмы), она может выбрать для их отображения интерфейс карусели. Если результаты разнородны или имеют низкие оценки, может быть выбран простой список или стандартная веб-выдача.

Как Google определяет и ранжирует наиболее важные факты о сущности на основе совместных упоминаний в интернете

Google использует механизм для определения наиболее важных свойств (фактов) о сущности в контексте ее типа. Система анализирует частоту совместного упоминания (co-occurrence) сущности и связанных с ней сущностей в интернете (Related Entity Score), агрегирует эти данные для каждого свойства (Property Score) и сортирует свойства по важности. Это определяет, какие факты будут показаны первыми в результатах поиска, например, в Панели знаний.

US9256682B1
2016-02-09

Knowledge Graph
Семантика и интент

Как Google использует Граф Знаний для выбора, группировки и ранжирования связанных сущностей в Knowledge Panel

Google использует этот механизм для определения того, какие группы связанных сущностей (например, "Фильмы", "Члены семьи", "Коллеги") показать в Панели Знаний. Система анализирует пути в Графе Знаний, группирует сущности по типу их связи (Path Type) и ранжирует эти группы по популярности и силе связи (Relationship Strength), основанной на совместном упоминании в вебе и запросах.

US9411857B1
2016-08-09

Knowledge Graph
Семантика и интент

Как Google использует Knowledge Graph для выбора формата отображения и ранжирования ответов на запросы с модификаторами (например, «лучший», «самый высокий»)

Google использует этот механизм для ответов на запросы, содержащие сущности и модификаторы (например, «самые высокие здания» или «лучшие фильмы»). Система анализирует запрос, извлекает данные из Knowledge Graph и автоматически определяет, как ранжировать результаты (например, по высоте или рейтингу) и в каком формате их представить (например, в виде списка, карты, временной шкалы или диаграммы) на основе свойств сущностей.

US9390174B2
2016-07-12

Knowledge Graph
Семантика и интент
SERP

Как Google автоматически выбирает категории и контент для страниц сущностей, комбинируя данные о поведении пользователей и Knowledge Graph

Google использует механизм для автоматического создания страниц о сущностях (например, о фильмах или персонажах). Система определяет, какие категории (свойства) сущности наиболее интересны пользователям, сравнивая данные из Knowledge Graph с данными о том, что пользователи ищут или смотрят вместе с этой сущностью. Затем она наполняет эти категории популярным контентом.

US11036743B2
2021-06-15

Knowledge Graph
Семантика и интент
Поведенческие сигналы

Как Google использует свежесть и популярность для ранжирования сущностей в блоках ответов (Answer Boxes)

Google использует систему для определения наиболее актуальных связанных сущностей при ответе на запрос. Система анализирует Граф Знаний, чтобы найти связанные сущности, а затем ранжирует их на основе оценок Свежести (насколько недавние даты связаны с сущностью) и Популярности (объем поисковых запросов, упоминаний в сети и активности в социальных сетях). Наиболее релевантные сущности отображаются в специальных блоках выдачи.

US9336311B1
2016-05-10

Свежесть контента
Knowledge Graph
SERP

Как Google использует близость цитирований (ссылок) для кластеризации результатов поиска

Google может группировать результаты поиска, анализируя, как документы ссылаются друг на друга. Система оценивает силу связи между документами, проверяя контекстуальную близость общих цитирований. Ссылки, расположенные в одном предложении (co-citation) или абзаце, имеют значительно больший вес, чем ссылки, просто присутствующие в документе. Это позволяет формировать точные тематические кластеры, отсеивая группы со слабыми связями.

US8612411B1
2013-12-17

Ссылки
SERP

Как Google использует повторные клики, прямой трафик и время на сайте для расчета оценки качества домена и корректировки ранжирования

Google анализирует поведение пользователей на уровне домена (группы ресурсов) для вычисления модификатора ранжирования. Ключевые метрики включают долю повторных кликов (Repeat Click Fraction), долю прямого трафика (Deliberate Visit Fraction) и среднюю продолжительность визита (Average Duration). Эти данные используются для корректировки исходных оценок страниц сайта, понижая ресурсы с низкими показателями пользовательской лояльности и вовлеченности.

US9684697B1
2017-06-20

Поведенческие сигналы
SERP

Как Google использует клики и пропуски пользователей для оценки и корректировки правил близости терминов (Proximity Rules)

Google анализирует поведение пользователей для оценки эффективности правил близости (Proximity Rules), которые влияют на ранжирование в зависимости от расстояния между ключевыми словами на странице. Система отслеживает, кликают ли пользователи на результаты, где термины расположены далеко друг от друга, или пропускают их. На основе этих данных (Click Count, Skip Count) вычисляется оценка качества правила, что позволяет Google динамически адаптировать важность фактора близости.

US9146966B1
2015-09-29

Поведенческие сигналы
SERP

Как Google генерирует блок "Похожие вопросы" (People Also Ask) на основе анализа кликов и поведения пользователей

Google анализирует топовые результаты по исходному запросу и определяет "Тематические запросы" (Topic Sets) — прошлые запросы, по которым пользователи кликали на эти результаты. Затем система ищет популярные вопросы, соответствующие этим темам, фильтрует дубликаты на основе общности кликов и показывает их в блоке PAA для дальнейшего исследования темы.

US9213748B1
2015-12-15

SERP
Семантика и интент
Поведенческие сигналы

Как Google использует погоду, время и местоположение для понимания истинного намерения пользователя и адаптации поисковой выдачи

Google анализирует, как физическое окружение (погода, время, местоположение) влияет на то, что ищут пользователи. Система выявляет корреляции между средой и поведением пользователей в прошлом (включая длительность кликов), чтобы лучше понять текущий интент многозначных запросов. Затем она переранжирует выдачу или переписывает запрос для предоставления наиболее релевантных результатов и рекламы.

US8898148B1
2014-11-25

Семантика и интент
Поведенческие сигналы
Персонализация

Как Google использует анализ многословных фраз для улучшения подбора синонимов с учетом грамматического согласования

Google анализирует, как пользователи одновременно меняют несколько слов в запросе (например, при изменении числа или рода). Подтверждая, что каждое измененное слово является лексическим или семантическим вариантом оригинала, Google идентифицирует «синонимы с N-граммным согласованием». Это позволяет системе улучшить понимание синонимов отдельных слов, даже если эти слова редко меняются поодиночке в определенных контекстах.

US7925498B1
2011-04-12

Семантика и интент
Поведенческие сигналы

Как Google использует время просмотра (Watch Time) и поведение пользователей для расчета независимой от запроса оценки качества видео

Google рассчитывает независимый от запроса сигнал качества (Q) для видео, анализируя корреляции между поведенческими метриками: временем просмотра, рейтингами и количеством просмотров. Система использует математические функции (Predictor и Voting) для моделирования качества и определения достоверности данных, а также активно фильтрует спам в рейтингах. Этот сигнал Q затем используется для ранжирования видео в поиске.

US8903812B1
2014-12-02

Поведенческие сигналы
SERP
Антиспам

Как Google определяет синонимы и варианты слов, анализируя категории выбранных пользователями результатов

Google использует метод стемминга, основанный на поведении пользователей и категориях сущностей. Если пользователи ищут разные слова (например, «пицца» и «пиццерия») и выбирают результаты одной категории («ресторан»), система идентифицирует эти слова как варианты одной основы (Stem Variants). Это происходит, если слова похожи по написанию ИЛИ если объем кликов статистически значим.

US9104759B1
2015-08-11

Семантика и интент
Поведенческие сигналы
Персонализация

Как Google использует социальные связи для выявления предвзятых ссылок и борьбы со ссылочными схемами и кликфродом

Google анализирует взаимоотношения между администраторами веб-сайтов (используя данные социальных сетей), чтобы определить независимость ссылок или кликов по рекламе. Если обнаружена тесная связь, это интерпретируется как предвзятость (Bias). В результате вес ссылки для ранжирования может быть снижен (борьба с Search Spamming), или клик по рекламе может быть дисконтирован (борьба с Ad Spamming).

US10402457B1
2019-09-03

Ссылки
Антиспам
Краулинг

Как Google использует визуальный анализ кликов по картинкам для понимания интента запроса и переранжирования выдачи

Google анализирует визуальное содержимое изображений, которые пользователи чаще всего выбирают в ответ на определенный запрос. На основе этого анализа (наличие лиц, текста, графиков, доминирующих цветов) система определяет категорию запроса (например, «запрос о конкретном человеке» или «запрос на определенный цвет»). Эти категории затем используются для переранжирования будущих результатов поиска, повышая изображения, которые визуально соответствуют выявленному интенту.

US9836482B2
2017-12-05

Семантика и интент
Поведенческие сигналы
SERP