Как Google оценивает отсутствующие факты для Knowledge Graph и объясняет, на чем основана эта оценка

PROVIDING AN EXPLANATION OF A MISSING FACT ESTIMATE (Предоставление объяснения оценки отсутствующего факта)

US9659056B1
Google LLC
2013-12-30
2017-05-23

Google использует статистические модели для заполнения пробелов в Knowledge Graph, когда информация о сущности отсутствует. Система вычисляет недостающий факт (например, дату рождения), анализируя связанные данные (например, возраст супруга). Чтобы повысить доверие к этой оценке, Google показывает пользователю объяснение, основанное на наиболее влиятельных фактах, использованных при расчете.

Какую проблему решает

Патент решает проблему неполноты данных в графах знаний (Data Graph), таких как Knowledge Graph. Хотя отсутствующие факты можно статистически вывести с помощью сложных моделей, пользователи склонны не доверять этим оценкам без контекста. Изобретение повышает доверие пользователей, предоставляя не только оценку (Estimate) отсутствующего факта, но и человекочитаемое объяснение того, на основе каких именно данных эта оценка была сделана.

Что запатентовано

Запатентована система, которая оценивает отсутствующие факты о сущностях, используя модели совместного распределения (Joint Distribution Models) на основе связанных данных (Features). Ключевым элементом является механизм генерации объяснений, который идентифицирует подмножество этих связанных данных, оказавших наибольшее влияние на оценку (Influential Features), и использует их для формирования краткого объяснения пользователю.

Как это работает

Система работает в нескольких фазах, часто офлайн:

Идентификация пробела: Prediction Engine определяет отсутствующий факт у сущности (например, дату рождения).
Оценка: Вычисляется Estimate с использованием Joint Distribution Model, учитывающей множество связанных Features.
Анализ влияния: Система вычисляет Contribution Score для каждого фактора, определяя, какие из них наиболее сильно повлияли на результат.
Выборка и Агрегация: Выбирается небольшое подмножество наиболее влиятельных факторов. Схожие факторы могут быть агрегированы (например, возраст всех детей).
Сохранение: Оценка и влиятельные факторы сохраняются обратно в Data Graph.
Генерация и Выдача: При получении запроса Explanation Engine формирует читаемое объяснение на основе сохраненных влиятельных факторов и показывает его вместе с оценкой в результатах поиска.

Актуальность для SEO

Высокая. Понимание сущностей, заполнение пробелов в данных и предоставление прямых ответов являются центральными элементами современного поиска. Поскольку Google все больше полагается на Граф Знаний для формирования выдачи и ответов (включая AI Overviews), способность системы достоверно выводить отсутствующую информацию и обосновывать свои выводы (Explainable AI) критически важна.

Важность для SEO

Значительное влияние (75/100). Патент не описывает ранжирование традиционных веб-результатов, но имеет критическое значение для Entity SEO и оптимизации под Knowledge Graph. Он демонстрирует, как Google использует связанные данные для построения полного профиля сущности, даже если часть данных отсутствует. Для SEO-специалистов это подчеркивает важность предоставления полных, точных и взаимосвязанных данных о сущностях, поскольку эти данные служат "топливом" для механизма оценки и вывода.

Термины и определения

Aggregate Feature (Агрегированный признак/фактор): Комбинация нескольких схожих Features (например, возраст всех детей), рассматриваемая как единый фактор при расчете вклада. Создается путем кластеризации.
Contribution Score / Contribution Value (Оценка вклада): Метрика, показывающая, насколько сильно конкретный Feature повлиял на итоговую Estimate. Рассчитывается путем сравнения оценки с признаком и без него.
Data Graph (Граф данных): База знаний (например, Knowledge Graph), хранящая информацию в виде узлов (сущностей) и ребер (отношений).
Estimate (Оценка): Предполагаемое (вычисленное) значение отсутствующего факта.
Explanation Engine (Механизм генерации объяснений): Компонент системы, который генерирует читаемое объяснение на основе Influential Features.
Features (Признаки/Факторы): Связанные факты в Data Graph, используемые моделью для вычисления оценки (например, возраст супруга при оценке возраста целевой сущности).
Influential Features (Влиятельные факторы): Подмножество Features с наивысшими Contribution Scores, которые используются для объяснения оценки.
Joint Distribution Model (Модель совместного распределения): Статистическая модель, используемая для вычисления оценки на основе вероятностных связей между различными фактами.
Prediction Engine (Механизм прогнозирования): Компонент системы, который идентифицирует пробелы и вычисляет Estimate.
Statistical Descriptor (Статистический дескриптор): Характеристика распределения признака, такая как дисперсия (variance). Может использоваться для оценки надежности признака и расчета Contribution Score.

Ключевые утверждения (Анализ Claims)

Claim 1 (Независимый): Описывает основной метод заполнения пробелов в графе данных и предоставления объяснений, с акцентом на агрегацию факторов и сохранение данных.

Система определяет отсутствие информации о сущности в Data Graph.
Вычисляется оценка (Estimate) с помощью Joint Distribution Model на основе множества факторов (Features).
Estimate добавляется в Data Graph и связывается с сущностью через отношение, указывающее, что оценка не верифицирована.
Выбирается подмножество влиятельных факторов. Этот шаг включает:
- Вычисление Contribution Value для каждого фактора.
- Идентификацию связанных факторов путем кластеризации целевой сущности с другими сущностями, имеющими схожие признаки.
- Агрегацию этих факторов в Aggregate Feature и их оценок вклада в New Contribution Score.
- Выбор этого агрегированного набора как основного подмножества.
Выбранные факторы добавляются в Data Graph и связываются с Estimate.
При получении запроса генерируется объяснение на основе связанных с Estimate факторов (используя Aggregate Feature).
Estimate и объяснение предоставляются в результатах поиска.

Claim 2 (Зависимый от 1): Уточняет метод выбора подмножества факторов на основе порогов.

Включает выбор фактора с наивысшей Contribution Value, если он превышает порог, ИЛИ выбор нескольких факторов, если их комбинированная Contribution Value превышает порог.

Claim 3 (Зависимый от 2): Определяет способ расчета Contribution Value для фактора.

Он рассчитывается как разница между двумя оценками: первой оценкой, вычисленной с использованием этого фактора, и второй оценкой, вычисленной без его использования. (Большая разница = высокое влияние).

Claim 4 (Зависимый от 2): Указывает, что Contribution Value может быть связана со Statistical Descriptor (например, дисперсией) признака.

Где и как применяется

Изобретение связывает процессы построения базы знаний и генерации ответов.

INDEXING – Индексирование и извлечение признаков
Основная работа происходит здесь, преимущественно в офлайн-режиме. Prediction Engine анализирует Data Graph, идентифицирует отсутствующие факты, вычисляет Estimates, определяет Influential Features и сохраняет эти вычисленные данные обратно в Data Graph для последующего быстрого использования.

QUNDERSTANDING – Понимание Запросов
Система может анализировать Search Records (логи запросов) офлайн, чтобы определить, какие типы фактов часто запрашиваются, но отсутствуют. Это используется для приоритизации работы Prediction Engine.

METASEARCH – Метапоиск и Смешивание
На этом этапе (онлайн) происходит использование предварительно вычисленных данных. Если запрос касается факта, для которого существует Estimate, система извлекает ее и связанные Influential Features. Explanation Engine генерирует читаемое объяснение (используя Templates) и формирует блок ответа (Knowledge Panel, Direct Answer).

Входные данные:

Data Graph (Сущности, отношения, известные факты).
Joint Distribution Models (Статистические данные о взаимосвязях фактов).
Search Records (Логи запросов).

Выходные данные:

Обогащенный Data Graph, содержащий новые узлы: Estimates (помеченные как неверифицированные) и связанные с ними Influential Features.
Сформированный блок ответа в SERP с оценкой и объяснением.

На что влияет

Конкретные типы контента: Влияет на представление фактологической информации о сущностях (люди, компании, продукты, места).
Специфические запросы: Информационные запросы, направленные на получение конкретного факта (Кто? Что? Когда? Где?).
Форматы контента: Knowledge Panels, Featured Snippets, прямые ответы (Direct Answers).

Когда применяется

Триггеры активации (Офлайн): Обнаружение отсутствующего факта в Data Graph при условии, что для него существует Joint Distribution Model и доступно достаточно связанных данных (Features) для проведения надежной оценки.
Триггеры активации (Онлайн): Когда пользователь запрашивает факт, который отсутствует в верифицированном виде, но для которого была предварительно вычислена и сохранена Estimate с объяснением.

Пошаговый алгоритм

Процесс А: Офлайн-оценка и подготовка объяснений (Prediction Engine)

Определение пробелов: Идентификация отсутствующих фактов для целевых сущностей (возможно, на основе логов запросов).
Генерация оценки: Вычисление Estimate с использованием Joint Distribution Model и множества доступных Features.
Расчет вклада: Вычисление Contribution Score для каждого Feature. (Сравнение оценки с фактором и без него, или анализ дисперсии).
Кластеризация и Агрегация: Группировка схожих Features в Aggregate Feature и расчет нового комбинированного Contribution Score.
Выбор влиятельных факторов (Логика порога):
1. Выбирается фактор (или агрегат) с наивысшим вкладом.
2. Если его оценка превышает порог, он выбирается, и процесс завершается.
3. Если нет, добавляется следующий по значимости фактор.
4. Если комбинированная оценка превышает порог, оба фактора выбираются, и процесс завершается.
5. Процесс продолжается до достижения порога или максимального количества факторов (например, 3).
Сохранение: Сохранение Estimate и выбранных Influential Features как узлов в Data Graph. Estimate помечается как неверифицированная и связывается с сущностью; факторы связываются с Estimate.

Процесс Б: Обработка запроса (Search & Explanation Engines)

Получение запроса: Получение запроса, ищущего конкретный факт.
Извлечение оценки: Если верифицированный факт отсутствует, но найдена сохраненная Estimate, система извлекает ее и связанные Influential Features.
Генерация объяснения: Формирование читаемого объяснения на основе Influential Features (например, с использованием шаблонов).
Предоставление результата: Отображение Estimate и объяснения в SERP.

Какие данные и как использует

Данные на входе

Система опирается в первую очередь на структурированные данные и статистические модели.

Структурные факторы (в контексте Data Graph): Факты, атрибуты сущностей и отношения между сущностями. Это основной источник Features для моделей оценки.
Системные данные (Models of Joint Distribution): Предварительно обученные статистические модели, которые определяют взаимосвязи между различными типами фактов (например, связь между возрастом супругов).
Поведенческие факторы (Search Records): Логи запросов используются для определения того, какие отсутствующие факты следует приоритизировать для оценки.

Какие метрики используются и как они считаются

Contribution Score (Оценка вклада): Ключевая метрика. Рассчитывается двумя основными способами:
1. Дифференциальный анализ (Claim 3): Разница между оценкой, полученной с использованием признака, и оценкой, полученной без него.
2. На основе Statistical Descriptor (Claim 4): Например, обратная зависимость от дисперсии (variance) признака. Высокая дисперсия = низкая оценка вклада.
Aggregate Contribution Score: Сумма или взвешенная сумма Contribution Scores для факторов, объединенных в кластер (Aggregate Feature).
Threshold (Порог): Минимальный уровень Contribution Score, необходимый для включения фактора(ов) в объяснение. Используется для минимизации количества факторов при сохранении надежности объяснения.

Автоматическое расширение Knowledge Graph: Google активно использует статистический вывод (inference) для заполнения пробелов в Data Graph. Граф содержит не только извлеченные факты, но и вычисленные Estimates.
Объяснимость как фактор доверия (XAI): Основная цель патента — не просто вывести факт, а объяснить его происхождение пользователю, повышая доверие к автоматически сгенерированным данным.
Критичность взаимосвязей сущностей: Качество оценки полностью зависит от наличия и точности связанных фактов (Features). Связи между сущностями являются топливом для этого механизма вывода.
Фильтрация по силе доказательств: Система использует расчет Contribution Score и пороговые значения (Threshold), чтобы выделить только самые значимые и статистически надежные факторы для объяснения.
Агрегация слабых сигналов: Механизм кластеризации и агрегации (Aggregate Feature) позволяет объединять множество слабых, но схожих сигналов, чтобы сформировать сильное доказательство.
Офлайн-процессинг и хранение в графе: Оценки и данные для объяснений рассчитываются заранее (офлайн) и сохраняются непосредственно в Data Graph (помечаясь как неверифицированные) для ускорения ответов.

Best practices (это мы делаем)

Обеспечение полноты данных о сущностях (Entity Completeness): Стремитесь к максимально полному описанию ключевых сущностей (компании, продукты, персоны) в авторитетных источниках и через микроразметку. Чем меньше пробелов, тем реже Google будет вынужден их оценивать.
Укрепление и точность связей (Relationships): Четко определяйте отношения между сущностями (основатели, дочерние компании, авторы, семья). Патент показывает, что именно эти связи (Features) используются для вывода. Убедитесь в точности атрибутов связанных сущностей (например, даты рождения связанных людей), так как они напрямую влияют на оценки.
Использование атрибутов для кластеризации: Предоставляйте атрибуты, которые позволяют Google кластеризовать вашу сущность с другими схожими (например, точная отрасль, категория продукта, география). Это помогает механизму агрегации (Aggregate Features) работать точнее.
Мониторинг Панели Знаний: Регулярно проверяйте Панель Знаний на предмет появления оценочных данных. Если оценка неверна, проанализируйте объяснение, чтобы понять, какие связанные данные (Influential Features) привели к ошибке, и скорректируйте их в источниках.

Worst practices (это делать не надо)

Игнорирование пробелов в данных: Оставлять ключевые факты о сущности незаполненными. Это вынуждает Google использовать механизм оценки, который может быть неточным.
Предоставление противоречивой информации: Наличие несогласованных данных о сущности или связанных сущностях в разных источниках. Это может привести к некорректным Features, что снизит точность Estimate или повысит ее дисперсию.
Фокус только на целевой сущности: Оптимизация информации только о главном бренде без учета связанных персон или продуктов. Точность данных о связанных сущностях критична.

Стратегическое значение

Патент подтверждает стратегическую важность Entity SEO и управления Графом Знаний. Понимание сущности в Google является целостным и зависит от всей экосистемы связанных фактов. Система готова выводить и объяснять факты, что усиливает роль поисковика как источника знаний. Долгосрочная стратегия должна быть направлена на построение точного и полного цифрового представления сущности и ее связей в сети, чтобы контролировать информацию, которую Google использует и выводит.

Практические примеры

Сценарий: Оценка даты основания компании

Отсутствующий факт: Дата основания Компании X в Knowledge Graph.
Анализ связанных фактов (Features): Google знает:
- Основатель А уволился с предыдущей работы в Январе 2020.
- Основатель Б уволился с предыдущей работы в Феврале 2020.
- Первый продукт выпущен в Октябре 2020.
Оценка и Вклад: Система оценивает дату основания как Март 2020. Даты увольнения основателей агрегируются (Aggregate Feature) и вместе с датой выпуска продукта имеют наивысший Contribution Score.
Действие SEO-специалиста: Проверить точность дат увольнения и выпуска продукта на официальном сайте и в профилях (LinkedIn, Crunchbase). Если фактическая дата основания иная, необходимо четко указать ее (например, через foundingDate в Schema.org), чтобы заменить оценку фактом.
Результат в поиске (до оптимизации): "Компания X. Лучшая оценка даты основания: Март 2020. Основано на: Основатели начали работу (2020), Выпущен продукт (Октябрь 2020)".

Как рассчитывается «Оценка вклада» (Contribution Score)?

Основной метод (Claim 3) – это дифференциальный анализ. Система генерирует оценку, используя все доступные признаки. Затем она генерирует вторую оценку, исключив один конкретный признак. Разница между двумя оценками определяет Contribution Score этого признака. Если разница велика, значит, признак оказал сильное влияние.

Означает ли этот патент, что Google придумывает факты?

Не придумывает, а вычисляет на основе статистики (Joint Distribution Models) и связанных данных. Система определяет наиболее вероятное значение отсутствующего факта, основываясь на известных шаблонах. Патент (Claim 1) указывает, что такие данные помечаются как оценочные или неверифицированные (not verified) при хранении в графе.

Что такое агрегация признаков (Aggregate Feature) и зачем она нужна?

Агрегация – это объединение нескольких похожих признаков в один. Например, если система оценивает возраст человека на основе возраста его пятерых детей, она может объединить эти пять признаков в один агрегированный. Это делается для упрощения объяснения и в случаях, когда множество слабых признаков вместе дают сильный сигнал.

Почему в объяснении используется только несколько фактов, если для оценки могли использоваться сотни?

Это делается для простоты и понятности пользователю. Система использует пороговые значения (Threshold) для Contribution Score. Если один признак превышает порог, используется только он. Если нет, система добавляет признаки по одному, пока их комбинированная оценка не превысит порог или не будет достигнут максимум (в патенте упоминается пример с тремя).

Как SEO-специалист может повлиять на этот процесс?

Ключевое влияние – это обеспечение доступности, точности и полноты исходных данных (Features), которые питают Knowledge Graph. Необходимо использовать структурированные данные (Schema.org) и авторитетные источники для четкого определения сущностей и их взаимосвязей. Чем качественнее исходные данные, тем точнее будут оценки Google.

Что делать, если Google сгенерировал неверную оценку факта о моей сущности?

Проанализируйте объяснение, предоставленное Google. Оно укажет, какие связанные факты (Influential Features) были наиболее влиятельными. Проверьте и скорректируйте эти связанные факты в авторитетных источниках (включая ваш сайт, Wikipedia, Wikidata), чтобы помочь Google пересчитать оценку корректно, и воспользуйтесь функцией обратной связи.

Происходит ли расчет оценки и объяснения в реальном времени?

Патент акцентирует внимание на офлайн-обработке. Prediction Engine периодически сканирует граф, генерирует оценки и выбирает влиятельные признаки, сохраняя их обратно в граф (Claim 1). Это значительно ускоряет ответ на запрос пользователя, так как система просто извлекает готовые данные, но возможна и онлайн-обработка.

Учитывает ли система надежность источника данных при генерации оценки?

Патент не фокусируется на надежности источников, но упоминает использование статистических дескрипторов, таких как дисперсия (variance), для оценки надежности самого признака (Claim 4). Признаки с высокой дисперсией считаются менее надежными и получают более низкий Contribution Score.

Влияет ли этот механизм на ранжирование органических результатов ("синих ссылок")?

Напрямую нет. Патент описывает механизм генерации ответов для Knowledge Graph. Однако косвенно это влияет на всю экосистему: если Google предоставляет точный оценочный ответ с объяснением, это может снизить CTR органических результатов (Zero-Click Searches) по фактоидным запросам.

Какова основная польза этого патента для SEO-стратегии?

Основная польза заключается в понимании того, насколько взаимосвязаны сущности в Графе Знаний. Нельзя оптимизировать сущность изолированно. Точность и полнота данных о связанных сущностях (сотрудники, продукты, локации, семья) напрямую влияют на то, как Google воспринимает и что он может логически вывести о вашей основной сущности.

Как Google использует Knowledge Graph для автодополнения фактов и проверки точности информации при создании контента

Система анализирует вводимый текст в редакторах (например, Google Docs или Gmail), распознает сущности и их атрибуты, автоматически запрашивает факты у поисковой системы (Knowledge Graph) и предлагает их для вставки. Также она способна проверять уже введенные факты на точность и предлагать исправления в реальном времени.

US20150324339A1
2015-11-12

Knowledge Graph
Семантика и интент
EEAT и качество

Как Google запоминает вопросы без авторитетного ответа и автономно сообщает его позже через Ассистента

Патент Google описывает механизм для обработки запросов, на которые в момент поиска нет качественного или авторитетного ответа. Система запоминает информационную потребность и продолжает мониторинг. Когда появляется информация, удовлетворяющая критериям качества (например, в Knowledge Graph), Google автономно доставляет ответ пользователю, часто встраивая его в следующий диалог с Google Assistant, даже если этот диалог не связан с исходным вопросом.

US11238116B2
2022-02-01

Knowledge Graph
Семантика и интент
EEAT и качество

Как Google учится выводить недостающие факты для Графа Знаний, анализируя текст в интернете и существующие связи

Система Google для заполнения пробелов в Графе Знаний. Если факт отсутствует (например, отношение «дедушка»), система ищет текстовые подтверждения в интернете («A — дедушка B»). Затем она анализирует существующие связи в графе (например, A — родитель C, C — родитель B) и выводит правило (Родитель + Родитель = Дедушка). Это позволяет отвечать на фактические запросы, даже если связь явно не указана в базе знаний.

US9842166B1
2017-12-12

Knowledge Graph
Семантика и интент

Как Google динамически выбирает и ранжирует факты об объектах в зависимости от запроса пользователя (Основы Knowledge Graph)

Патент описывает создание и использование репозитория фактов (предшественника Knowledge Graph). Система извлекает факты из интернета и связывает их с объектами (сущностями). При поиске Google не просто возвращает список объектов, а динамически выбирает и ранжирует наиболее релевантные факты для каждого объекта, основываясь на конкретном запросе пользователя, а также метриках достоверности и важности.

US7774328B2
2010-08-10

Knowledge Graph
Семантика и интент
SERP

Как Google использует результаты веб-поиска для выбора правильного ответа на неоднозначные фактические запросы

Google использует этот механизм для разрешения неоднозначности в запросах (например, «возраст Вашингтона»). Система генерирует несколько потенциальных ответов из Knowledge Graph, а затем проверяет, какой из них лучше всего подтверждается топовыми результатами органического поиска. Оценка кандидата зависит от того, насколько часто и уверенно Сущность (Topic) и Ответ (Answer) упоминаются (аннотируются) на страницах в топе выдачи.

US9336269B1
2016-05-10

Семантика и интент
Knowledge Graph
SERP

Как Google предсказывает следующий запрос пользователя на основе контента текущей страницы и исторических данных

Google использует машинное обучение для анализа логов поведения пользователей, чтобы понять, что они ищут после посещения определенного контента. Система создает совместное векторное пространство (joint embedding) для документов и запросов, где близость отражает семантическую связь и вероятность совместной встречаемости. Это позволяет предлагать релевантные последующие запросы (query suggestions) в реальном времени, даже если ключевые слова для этих запросов на странице отсутствуют.

US9594851B1
2017-03-14

Семантика и интент
Поведенческие сигналы
Персонализация

Как Google использует социальный граф и активность друзей для персонализации и переранжирования результатов поиска

Google использует данные из социального графа пользователя и активность его контактов (лайки, шеры, комментарии, плейлисты) для изменения ранжирования результатов поиска. Контент, одобренный социальным окружением, повышается в выдаче и сопровождается аннотациями, объясняющими причину повышения и указывающими на свежесть социального действия.

US8959083B1
2015-02-17

Персонализация
Поведенческие сигналы
SERP

Как Google использует поведение пользователей в веб-поиске для динамической категоризации локальных бизнесов

Google динамически формирует категории для бизнесов, основываясь на том, как пользователи ищут их (используемые ключевые слова и клики) в веб-поиске и голосовом поиске. Эти данные формируют иерархическое понимание типов бизнеса. Эта структура затем используется для повышения точности распознавания названий компаний в голосовых запросах.

US8041568B2
2011-10-18

Local SEO
Поведенческие сигналы
Семантика и интент

Как Google оценивает качество изображений, комбинируя визуальные характеристики, распознанный контент и социальные сигналы для ранжирования

Google использует систему для автоматического определения качества изображений, анализируя три класса характеристик: техническое качество (резкость, экспозиция), содержание (объекты, лица, ландшафты) и социальную популярность (просмотры, шеры, рейтинги). Система присваивает баллы этим характеристикам, взвешивает их (учитывая репутацию пользователей, оставивших отзывы) и формирует общий рейтинг для выбора лучших изображений.

US9858295B2
2018-01-02

Мультимедиа
Поведенческие сигналы
SERP

Как Google подменяет ссылки в выдаче, чтобы обойти медленные редиректы на мобильные версии сайтов

Google оптимизирует скорость загрузки, определяя, когда клик по результату поиска вызовет условный редирект (например, с десктопной версии на мобильную). Система заранее подменяет исходную ссылку в выдаче на конечный URL редиректа. Это позволяет устройству пользователя сразу загружать нужную страницу, минуя промежуточный запрос и экономя время.

US9342615B2
2016-05-17

Техническое SEO
SERP
Ссылки

Как Google использует данные о реальных повторных посещениях (Quality Visit Measure) и социальных взаимодействиях для ранжирования локального бизнеса

Google использует данные о физических посещениях пользователей для оценки качества локального бизнеса. Система рассчитывает «Quality Visit Measure», придавая значительно больший вес местам, куда люди возвращаются повторно, приводят друзей или посещают по рекомендации. Этот показатель используется как сильный сигнал качества для ранжирования в локальном поиске и Google Maps, снижая зависимость от онлайн-отзывов.

US10366422B2
2019-07-30

Поведенческие сигналы
Local SEO

Как Google корректирует позиционную предвзятость (Position Bias) при обучении моделей ранжирования на кликах пользователей

Google использует механизм для устранения позиционной предвзятости (Position Bias) при обучении моделей ранжирования (Learning to Rank). Система анализирует, на какой позиции находился кликнутый результат, и присваивает этому клику вес важности. Клики по нижним позициям получают больший вес, чем клики по ТОП-1. Это позволяет модели учиться определять истинную релевантность, а не просто копировать существующий порядок выдачи.

US20210125108A1
2021-04-29

Поведенческие сигналы
SERP

Как Google использует клики пользователей в поиске по картинкам для понимания содержания изображений и улучшения таргетинга

Google анализирует поведение пользователей в поиске по картинкам для идентификации содержания изображений. Если пользователи ищут определенный запрос (идею) и массово кликают на конкретное изображение в результатах, система связывает это изображение с данным запросом (концепцией). Эти данные используются для улучшения ранжирования в поиске картинок и для предложения релевантных ключевых слов рекламодателям, загружающим схожие изображения.

US11409812B1
2022-08-09

Поведенческие сигналы
Семантика и интент
SERP

Как Google ранжирует сущности (например, фильмы или книги), используя популярность связанных веб-страниц и поисковых запросов в качестве прокси-сигнала

Google использует механизм для определения популярности контентных сущностей (таких как фильмы, телешоу, книги), когда прямые данные о потреблении недоступны. Система идентифицирует авторитетные «эталонные веб-страницы» (например, страницы Википедии) и связанные поисковые запросы. Затем она измеряет популярность сущности, анализируя объем трафика на эти эталонные страницы и частоту связанных запросов в поиске, используя эти данные как прокси-сигнал для ранжирования сущности.

US9098551B1
2015-08-04

EEAT и качество
Поведенческие сигналы
SERP

Как Google использует нейросетевые эмбеддинги (Two-Tower Model) для семантического поиска изображений с учетом контекста страницы

Google использует систему поиска изображений, основанную на нейронных сетях (модель "Две Башни"). Система создает векторные представления (эмбеддинги) для поисковых запросов и для пар "изображение + посадочная страница", помещая их в общее семантическое пространство. Это позволяет находить релевантные изображения не по ключевым словам, а по близости векторов, учитывая как содержание картинки, так и контекст страницы, на которой она размещена.

US11782998B2
2023-10-10

Семантика и интент
Индексация
Мультимедиа