Как Google динамически выбирает и ранжирует факты об объектах в зависимости от запроса пользователя (Основы Knowledge Graph)

BROWSEABLE FACT REPOSITORY (Просматриваемый репозиторий фактов)

US7774328B2
Google LLC
2006-02-17
2010-08-10

Патент описывает создание и использование репозитория фактов (предшественника Knowledge Graph). Система извлекает факты из интернета и связывает их с объектами (сущностями). При поиске Google не просто возвращает список объектов, а динамически выбирает и ранжирует наиболее релевантные факты для каждого объекта, основываясь на конкретном запросе пользователя, а также метриках достоверности и важности.

Какую проблему решает

Патент решает проблему неэффективности традиционных баз знаний и поисковых систем, которые возвращают целые статьи или документы в ответ на запрос. Это перекладывает на пользователя задачу анализа всего документа для поиска конкретных фактов. Система устраняет неспособность поиска динамически реорганизовывать и выделять информацию, наиболее релевантную конкретному намерению пользователя в рамках определенной темы.

Что запатентовано

Запатентована система и метод для поиска и просмотра структурированной информации в Fact Repository. Система хранит факты как дискретные единицы (Атрибут-Значение), связанные с Objects (Сущностями). Ключевое изобретение — это механизм динамического выбора и ранжирования того, какие именно факты, связанные с объектом, должны быть показаны в результатах поиска, основываясь на их релевантности конкретному запросу пользователя.

Как это работает

Система работает в двух режимах: офлайн и онлайн.

Офлайн (Построение базы): Компоненты Importers извлекают факты из исходных документов и связывают их с Objects. Компоненты Janitors очищают, нормализуют данные (например, стандартизируют атрибуты) и объединяют дубликаты фактов и объектов. Для каждого факта рассчитываются метрики Confidence (достоверность) и Importance (важность).

Онлайн (Обработка запроса): Service Engine получает запрос и находит релевантные объекты. Оценка объекта рассчитывается на основе агрегированной релевантности его фактов. Затем система независимо оценивает факты этих объектов, используя релевантность запросу, Confidence и Importance. В результатах поиска отображаются топовые объекты вместе с динамически выбранным набором их наиболее релевантных фактов.

Актуальность для SEO

Чрезвычайно высокая. Этот патент закладывает основу для перехода Google от поиска документов к поиску сущностей (Entity Search) и является фундаментальным для работы Knowledge Graph. Механизм динамического выбора фактов на основе запроса сегодня повсеместно используется в Панелях Знаний (Knowledge Panels), расширенных сниппетах и ответах на информационные запросы.

Важность для SEO

Патент имеет критическое значение (9.5/10) для современной SEO-стратегии. Он описывает базовые механизмы того, как Google организует и представляет информацию о сущностях. Понимание того, как факты извлекаются (Importers), нормализуются (Janitors) и ранжируются (на основе Confidence и Importance), жизненно важно для оптимизации видимости бренда или сущности в Knowledge Graph и связанных функциях поиска.

Термины и определения

Attribute (Атрибут): Тип факта, связанного с объектом (например, «Население», «Дата рождения», «Автор»).
Confidence Level (Уровень уверенности/Достоверность): Метрика факта, указывающая на вероятность того, что факт верен.
Fact (Факт): Отдельная единица информации в репозитории. Состоит из Атрибута и Значения и связан с одним Объектом. Хранится независимо.
Fact Repository (Репозиторий фактов): База данных, хранящая коллекцию фактов, извлеченных из множества источников. Основа для Knowledge Graph.
Importer (Импортер): Программный модуль, который обрабатывает документы, извлекает из них факты и определяет объекты, с которыми эти факты связаны.
Importance Level (Уровень важности): Метрика факта, указывающая на релевантность факта объекту по сравнению с другими фактами того же объекта. Мера того, насколько факт важен для понимания сущности.
Janitor (Уборщик/Нормализатор): Программный модуль, обрабатывающий факты после извлечения. Выполняет очистку данных, нормализацию (стандартизацию атрибутов и значений), объединение дубликатов объектов и фактов.
Name Fact (Факт имени): Специализированный факт, который передает имя сущности, представленной Object ID.
Object (Объект/Сущность): Представление сущности реального мира (человек, место, компания и т.д.) в репозитории. Определяется набором фактов, связанных общим Object ID.
Property Fact (Факт свойства): Специализированный факт, который передает утверждение или сводную информацию об объекте (например, краткое описание).
Service Engine (Сервисный движок): Интерфейс для запросов к репозиторию. Обрабатывает запросы, оценивает соответствующие объекты и факты и возвращает результаты.
Value (Значение): Конкретное значение атрибута (например, для атрибута «Население» значением может быть «1,306,313,812»). Может содержать текст любого объема, числа или ссылки на другие объекты.

Ключевые утверждения (Анализ Claims)

Claim 1 и Claim 14 (Независимые пункты): Описывают основной метод обеспечения возможности просмотра репозитория фактов.

Система получает поисковый запрос.
В ответ на запрос извлекается множество релевантных объектов из Fact Repository (факты в котором предварительно извлечены из документов). Каждый объект включает множество фактов.
Извлеченные объекты отображаются, упорядоченные по релевантности поисковому запросу.
Для каждого извлеченного объекта отображается:
- Множество фактов (подмножество всех фактов объекта).
- Критически важно: Отображаемые факты упорядочиваются по их релевантности поисковому запросу (rank-ordered by relevance to the search query).
- Ссылка на страницу сведений об объекте (object detail page).
- Поисковая ссылка (search link), связанная с производным поисковым запросом, основанным на фактах этого объекта.

Ядром изобретения является не просто хранение фактов, а динамическое ранжирование и отображение подмножества фактов, наиболее релевантных текущему запросу пользователя, что позволяет динамически формировать представление объекта.

Claim 2 (Зависимый): Уточняет, что каждый факт хранится как отдельный элемент данных (separate item of data) в репозитории.

Claim 5 (Зависимый): Уточняет природу поисковой ссылки.

Система отображает attribute search link (поисковая ссылка по атрибуту). При выборе этой ссылки выполняется запрос на поиск других объектов, у которых есть факт с таким же атрибутом (например, найти все объекты с атрибутом «Дата рождения»).

Claim 6 (Зависимый): Уточняет другой тип поисковой ссылки.

Система отображает value search link (поисковая ссылка по значению). При выборе этой ссылки выполняется запрос на поиск других объектов, у которых есть факт с таким же значением (например, найти все объекты со значением «12 мая 1907»).

Claim 7 (Зависимый): Уточняет третий тип поисковой ссылки.

Система отображает attribute-value search link. При выборе этой ссылки выполняется запрос на поиск других объектов, у которых есть факт с таким же атрибутом И таким же значением (например, найти все объекты с атрибутом «Дата рождения» и значением «12 мая 1907»).

Где и как применяется

Изобретение затрагивает практически все этапы работы поисковой системы, формируя инфраструктуру для Entity Search.

CRAWLING – Сканирование и Сбор данных
На этом этапе собираются исходные документы (Sources), которые будут использоваться для извлечения фактов.

INDEXING – Индексирование и извлечение признаков
Это ключевой этап для создания Fact Repository.

Извлечение фактов: Importers анализируют документы для извлечения фактов и определения связанных с ними объектов.
Нормализация и Очистка: Janitors обрабатывают факты, стандартизируют атрибуты и значения, объединяют дублирующиеся факты и объекты (Entity Resolution).
Расчет метрик: Вычисляются Confidence Level и Importance Level для каждого факта.
Хранение и Индексация: Факты сохраняются в Fact Repository и индексируются (Index) для быстрого поиска по терминам в атрибутах и значениях.

RANKING / METASEARCH – Ранжирование и Метапоиск
Service Engine использует Fact Repository для ответа на запрос.

Поиск Объектов: Система ищет объекты, чьи факты релевантны запросу.
Оценка Объектов: Рассчитывается Object Score на основе совокупной релевантности фактов.
Динамический выбор Фактов: Для топовых объектов система рассчитывает индивидуальные оценки фактов (Fact Scores) на основе их релевантности запросу и метрик.
Сборка Выдачи: Результаты собираются динамически. Это проявляется в виде Knowledge Panels, обогащенных сниппетов или каруселей сущностей.

Входные данные:

Поисковый запрос пользователя.
Fact Repository (Объекты, Факты, Атрибуты, Значения).
Метрики фактов (Confidence, Importance).
Индекс фактов.

Выходные данные:

Ранжированный список объектов.
Для каждого объекта — динамически выбранный и отсортированный набор релевантных фактов.

На что влияет

Специфические запросы: Наибольшее влияние на информационные запросы и запросы, связанные с сущностями (имена людей, названия компаний, места и т.д.).
Форматы контента: Влияет на формирование блоков с прямыми ответами, Панелей Знаний (Knowledge Panels) и других элементов выдачи, основанных на структурированных данных.
Конкретные ниши: Критически важно для любых тематик, где важны факты и данные (биографии, финансы, география, медиа, продукты, локальный бизнес).

Когда применяется

Условия работы: Алгоритм применяется, когда поисковая система идентифицирует в запросе намерение найти информацию об объектах, присутствующих в Fact Repository.
Триггеры активации: Наличие терминов запроса в атрибутах или значениях фактов, хранящихся в репозитории.
Временные рамки: Процессы извлечения и нормализации работают офлайн. Процесс ранжирования и динамического выбора фактов работает в реальном времени при запросе.

Пошаговый алгоритм

Процесс А: Создание Репозитория (Офлайн)

Извлечение Фактов: Importers обрабатывают исходные документы. Извлекаются факты (пары Атрибут-Значение) и идентифицируются связанные с ними Объекты (Object IDs).
Нормализация и Очистка: Janitors обрабатывают извлеченные данные. Происходит стандартизация форматов, объединение синонимичных атрибутов (например, «День Рождения» и «Дата Рождения» становятся «Birthdate») и значений, а также слияние дублирующихся фактов и объектов.
Расчет Метрик: Система вычисляет Confidence Level (достоверность факта) и Importance Level (важность факта для понимания объекта).
Индексация: Содержимое фактов (атрибуты и значения) индексируется. Индекс связывает термины с соответствующими фактами и объектами.

Процесс Б: Обработка Запроса (Реал-тайм)

Получение Запроса: Service Engine получает запрос пользователя.
Поиск Кандидатов: Система ищет в индексе объекты, у которых есть факты, содержащие термины запроса.
Оценка Фактов (Fact Scoring): Для объектов-кандидатов система оценивает их индивидуальные факты. Оценка факта базируется на наличии терминов запроса (в атрибуте или значении), а также корректируется метриками Confidence и Importance.
Оценка Объектов (Object Scoring): Вычисляется оценка релевантности для каждого объекта. В патенте упоминается, что это может быть линейная комбинация оценок релевантности каждого из его фактов.
Ранжирование Объектов: Объекты сортируются по их итоговой оценке.
Выбор и Сортировка Фактов: Для топовых объектов выбирается N лучших фактов. Они сортируются на основе их оценки релевантности запросу.
Генерация Выдачи: Система отображает ранжированные объекты, сопровождая их выбранными и отсортированными фактами, а также генерирует ссылки для дальнейшей навигации (attribute/value search links).

Какие данные и как использует

Данные на входе

Контентные факторы: Текст из исходных документов (Source Documents), из которого извлекаются Значения (Values) фактов.
Структурные факторы: Importers могут использовать структуру документа (например, таблицы, списки, разметку) для идентификации Атрибутов и Значений.
Технические факторы: Идентификаторы источников (например, URL), используемые для отслеживания происхождения факта (Source) и потенциально для расчета Confidence.
Мультимедиа факторы: Упоминается возможность ассоциации медиа-файлов (изображения, аудио) с объектами.

Какие метрики используются и как они считаются

Система использует несколько ключевых метрик для оценки как объектов, так и фактов:

Relevance Score (Оценка Релевантности Факта): Оценка того, насколько факт соответствует запросу. Она основывается на наличии терминов запроса в Атрибуте или Значении факта.
- Term Weighting: В патенте упоминается возможность использования модели весов терминов на основе TF-IDF (более редкие термины получают более высокие оценки).
- Дополнительные факторы: Оценка корректируется на основе появления последовательных терминов запроса в факте, появления терминов в том же порядке, что и в запросе, точного совпадения всего запроса, а также появления терминов запроса в Name Fact.
Confidence Level (Уровень Уверенности): Метрика, указывающая на вероятность корректности факта. Патент не детализирует расчет, но упоминает, что при объединении дублирующихся фактов их источники объединяются.
Importance Level (Уровень Важности): Метрика, определяющая, насколько факт важен для понимания объекта по сравнению с другими фактами этого объекта.
Fact Score (Итоговая Оценка Факта): Оценка релевантности факта, скорректированная с учетом его Confidence Level и Importance Level.
Object Score (Оценка Объекта): Оценка релевантности объекта запросу. В патенте описывается как линейная комбинация оценок релевантности (Relevance Scores) его фактов.

Приоритет сущностей и фактов над документами: Патент фиксирует фундаментальный сдвиг от хранения неструктурированных статей к организации информации в виде дискретных фактов, связанных с объектами (сущностями). Это архитектурная основа для Entity-First подхода и Knowledge Graph.
Динамическая релевантность фактов: Ключевая инновация заключается в том, что набор фактов, отображаемых для объекта, не является статичным. Он динамически выбирается и ранжируется в зависимости от конкретного запроса пользователя. Объект представляется пользователю через призму его текущего интента.
Независимая оценка и хранение фактов: Факты хранятся и оцениваются независимо на основе их релевантности запросу, достоверности (Confidence) и важности (Importance). Это позволяет системе гибко собирать ответы.
Нормализация как ключевой процесс: Работа модулей Janitors по нормализации атрибутов и значений, а также объединению дубликатов (Entity Resolution) критически важна для качества репозитория. Согласованность данных в сети напрямую влияет на качество Fact Repository.
Инфраструктура для связанности данных: Механизмы поисковых ссылок (по атрибуту, значению, паре атрибут-значение) обеспечивают связанность данных в репозитории, позволяя пользователям перемещаться между связанными объектами и фактами (Pivoting).

Best practices (это мы делаем)

Обеспечение легкого извлечения фактов (для Importers): Структурируйте ключевую информацию на веб-страницах так, чтобы Importers могли легко извлекать факты. Используйте семантический HTML (таблицы для данных, списки определений DL/DT/DD для пар атрибут-значение) и микроразметку Schema.org для явного указания фактов о сущностях.
Повышение Достоверности (Confidence): Обеспечьте максимальную согласованность (консистентность) ключевых фактов о вашей сущности (Название, Адрес, Дата основания, CEO, Свойства продукта) на всех авторитетных площадках в интернете (официальный сайт, Википедия, отраслевые каталоги, СМИ). Это помогает в процессе нормализации (Janitors) и повышает Confidence Level фактов.
Расширение покрытия атрибутов: Создавайте контент, который всесторонне описывает сущность и покрывает множество её атрибутов. Поскольку система динамически выбирает факты на основе запроса, более широкое покрытие увеличивает вероятность того, что у вас будет релевантный факт для разнообразных запросов.
Повышение Важности (Importance) через E-E-A-T: Развивайте общую авторитетность сущности и её источников. Хотя механизм расчета Importance не раскрыт, факты, связанные с более авторитетными сущностями и подтвержденные экспертными источниками, с большей вероятностью будут считаться важными и достоверными.
Оптимизация сводной информации (Property Facts): Предоставляйте краткие, четкие описания сущности (например, первый абзац статьи или поле description в разметке). Они могут быть использованы как Property Fact (сводная информация) и отображаться при общих запросах о сущности.

Worst practices (это делать не надо)

Публикация противоречивой информации: Размещение разных версий фактов на разных ресурсах (например, разные даты основания компании или разные характеристики продукта). Это затрудняет работу Janitors, снижает Confidence Level и может привести к игнорированию фактов или ошибкам в Knowledge Panel.
Скрытие фактов в неструктурированном контенте: Размещение важной фактической информации внутри изображений, сложного JavaScript или длинных блоков неструктурированного текста затрудняет её извлечение Importers.
Игнорирование Entity SEO и структурированных данных: Фокусировка исключительно на традиционном keyword-based SEO без учета того, как ваша организация или контент представлены в виде объектов и фактов в Fact Repository (Knowledge Graph).
Манипуляции с фактами: Попытки внедрить ложные факты через недостоверную разметку или спам-ресурсы. Система кросс-верифицирует данные для расчета Confidence.

Стратегическое значение

Этот патент является одним из foundational-документов для стратегии Entity-First SEO. Он подтверждает, что успех в современном поиске зависит не только от контента страниц, но и от того, насколько хорошо Google понимает, извлекает и верифицирует факты о вашей сущности. Стратегия должна быть направлена на управление представлением сущности в Fact Repository (Knowledge Graph), обеспечивая точность, полноту и авторитетность связанных с ней фактов.

Практические примеры

Сценарий: Оптимизация профиля компании для динамического отображения фактов

Цель: Обеспечить, чтобы при разных запросах о компании отображались наиболее релевантные факты в Панели Знаний.
Действия (Обеспечение Extraction и Confidence):
- На официальном сайте в разделе «О нас» четко структурируется информация: используется список определений для указания Года основания, Штаб-квартиры, CEO, Отрасли. Применяется разметка Schema.org/Organization с этими же данными.
- Информация в профилях соцсетей, Википедии и бизнес-каталогах (Google Business Profile, Crunchbase) сверяется и приводится в полное соответствие с официальным сайтом.
Результат (Динамический выбор фактов):
- Запрос 1: «Кто CEO [Компания]». Система извлекает объект [Компания]. Факт «CEO: Имя Фамилия» имеет максимальную релевантность запросу и отображается.
- Запрос 2: «Где находится [Компания]». Система извлекает тот же объект. Факт «Штаб-квартира: Город, Страна» теперь имеет максимальную релевантность и отображается.
- Запрос 3: «[Компания]». Система извлекает объект. Отображаются факты с наивысшим общим Importance Level (например, Property Fact (описание), Отрасль, Цена акции).

Что такое Fact Repository, описанный в патенте, и как он связан с Knowledge Graph?

Fact Repository — это база данных, которая хранит информацию в виде дискретных фактов (Атрибут-Значение), связанных с конкретными объектами (сущностями). Этот патент описывает раннюю версию и фундаментальные принципы работы системы, которая эволюционировала в Google Knowledge Graph. Это способ организации мировой информации, выходящий за рамки простого индексирования веб-страниц.

В чем основное отличие этого подхода от традиционного поиска по ключевым словам?

В традиционном поиске система ищет документы, содержащие ключевые слова, и возвращает эти документы. Описанный подход ищет объекты в Fact Repository и динамически собирает ответ, выбирая наиболее релевантные факты этого объекта для конкретного запроса. Это позволяет Google отвечать на вопросы напрямую (например, в Knowledge Panel), а не просто давать ссылки на документы.

Что такое Importers и Janitors и как SEO-специалист может повлиять на их работу?

Importers извлекают факты из контента, а Janitors очищают и нормализуют их. SEO-специалист может помочь Importers, предоставляя информацию в четко структурированном виде (семантический HTML, Schema.org). Помочь Janitors можно, обеспечивая максимальную согласованность (консистентность) фактической информации о сущности на разных сайтах, что упрощает нормализацию и повышает достоверность данных.

Патент упоминает метрики Confidence и Importance. Что они означают для SEO?

Confidence (Достоверность) — это уверенность системы в корректности факта. Для SEO это означает необходимость верификации фактов через авторитетные и согласованные источники. Importance (Важность) — это то, насколько факт важен для понимания объекта в целом. Это связано с общей авторитетностью сущности. Оба показателя влияют на то, будет ли факт показан в выдаче.

Почему для одного и того же объекта (например, компании) в выдаче показываются разные факты?

Это ключевая особенность патента. Система не имеет статического набора фактов для отображения. Она динамически ранжирует все факты объекта на основе их релевантности конкретному запросу пользователя. Если вы ищете «размер компании», факты о сотрудниках будут более релевантны и показаны выше, чем факты о её CEO.

Как система рассчитывает оценку релевантности факта?

Оценка основывается на наличии терминов запроса в атрибуте или значении факта. Патент упоминает использование весов на основе TF-IDF (редкие слова важнее) и учет дополнительных сигналов, таких как последовательность слов, точное совпадение запроса, а также корректировку на основе Confidence и Importance факта.

Как этот патент влияет на стратегию создания контента?

Он подчеркивает важность создания всестороннего контента, который покрывает множество атрибутов и фактов о целевой сущности. Чем полнее вы опишете сущность в структурированном виде, тем больше вероятность, что Fact Repository будет содержать релевантные факты для широкого спектра пользовательских запросов.

Что делать, если Google показывает неверные факты о моей сущности в Knowledge Panel?

Это указывает на проблему на этапе извлечения (Importers) или нормализации (Janitors), возможно, из-за низкого Confidence. Необходимо найти источник неверной информации и исправить его. Также следует убедиться, что официальный сайт предоставляет верную информацию в легко извлекаемом формате (например, через Schema.org) для повышения достоверности правильных фактов.

Влияет ли этот механизм на локальный поиск?

Да, очень сильно. Локальные бизнесы являются объектами в Fact Repository, а их адрес, часы работы, телефон и услуги — это факты. Динамическое отображение этих фактов в ответ на локальные запросы (например, «часы работы [ресторан]») напрямую управляется механизмами, описанными в этом патенте.

Актуальны ли методы ранжирования (линейная комбинация, TF-IDF), упомянутые в патенте 2006 года?

Хотя базовые принципы релевантности (такие как TF-IDF) все еще играют роль, современные системы Google, вероятно, используют гораздо более сложные модели машинного обучения для оценки релевантности объектов и фактов. Однако концептуальная модель, описанная в патенте (независимая оценка фактов, учет Confidence/Importance), остается высоко актуальной.

Как Google создает, управляет и использует Репозиторий Фактов (Fact Repository) для поиска по сущностям

Патент описывает архитектуру Google для создания и использования Репозитория Фактов. Система извлекает факты из интернета, связывает их с объектами (сущностями), очищает и нормализует данные. В ответ на запрос система находит релевантные факты и возвращает их в формате структурированного фида (например, XML/RSS). Это foundational-технология для поиска по сущностям и формирования Графа Знаний.

US7454398B2
2008-11-18

Knowledge Graph
Семантика и интент
Индексация

Как Google автоматически распознает сущности в тексте и связывает их в Knowledge Graph с помощью динамических поисковых ссылок

Google использует автоматизированную систему для поддержания связей между сущностями (объектами) в своем хранилище фактов (Knowledge Graph). Система сканирует текст, статистически определяет значимые фразы и сверяет их со списком известных объектов. При совпадении создается динамическая «поисковая ссылка» вместо фиксированного URL. Это позволяет Google постоянно обновлять связи по мере добавления новых знаний.

US8260785B2
2012-09-04

Knowledge Graph
Семантика и интент
Ссылки

Как Google использует Knowledge Graph для автодополнения фактов и проверки точности информации при создании контента

Система анализирует вводимый текст в редакторах (например, Google Docs или Gmail), распознает сущности и их атрибуты, автоматически запрашивает факты у поисковой системы (Knowledge Graph) и предлагает их для вставки. Также она способна проверять уже введенные факты на точность и предлагать исправления в реальном времени.

US20150324339A1
2015-11-12

Knowledge Graph
Семантика и интент
EEAT и качество

Как Google ранжирует сущности в Knowledge Graph, используя адаптивные веса для метрик вклада, известности и наград

Google использует систему для ранжирования сущностей, извлеченных из Knowledge Graph. Система рассчитывает четыре ключевые метрики: связанность, значимость типа, вклад и награды. Затем она применяет весовые коэффициенты, которые адаптируются в зависимости от типа сущности (например, «Фильм» или «Человек»), чтобы определить итоговый рейтинг. Это влияет на то, какие сущности будут показаны в каруселях, панелях знаний и других функциях поиска, связанных с сущностями.

US10235423B2
2019-03-19

Knowledge Graph
Семантика и интент
SERP

Как Google использует Knowledge Graph для выбора формата отображения и ранжирования ответов на запросы с модификаторами (например, «лучший», «самый высокий»)

Google использует этот механизм для ответов на запросы, содержащие сущности и модификаторы (например, «самые высокие здания» или «лучшие фильмы»). Система анализирует запрос, извлекает данные из Knowledge Graph и автоматически определяет, как ранжировать результаты (например, по высоте или рейтингу) и в каком формате их представить (например, в виде списка, карты, временной шкалы или диаграммы) на основе свойств сущностей.

US9390174B2
2016-07-12

Knowledge Graph
Семантика и интент
SERP

Как Google извлекает, обрабатывает и индексирует анкорный текст, контекст и атрибуты входящих ссылок для ранжирования целевых страниц

Фундаментальный патент, описывающий инфраструктуру Google для обработки ссылок. Система извлекает анкорный текст, окружающий контекст и атрибуты форматирования (аннотации) из исходных страниц и инвертирует эти данные в структуру "Sorted Anchor Map". Это позволяет индексировать целевую страницу по тексту ссылок, указывающих на нее, используя эту внешнюю информацию как сигнал релевантности.

US7308643B1
2007-12-11

Ссылки
Индексация
Техническое SEO

Как Google использует тематические списки предпочтительных и нежелательных сайтов (Editorial Opinion) для корректировки ранжирования

Google может заранее определять "Темы запросов" (Query Themes) и назначать для них списки "Предпочтительных" (Favored) и "Нежелательных" (Non-Favored) источников. Если запрос пользователя соответствует теме, система корректирует ранжирование: повышает предпочтительные источники и понижает нежелательные, используя "Параметр редакторского мнения" (Editorial Opinion Parameter).

US7096214B1
2006-08-22

EEAT и качество
Антиспам
SERP

Как Google выявляет ссылочный спам (Link Farms и Web Rings), анализируя чувствительность PageRank к изменениям в структуре ссылок

Google использует математический метод для обнаружения искусственного завышения PageRank. Система анализирует, насколько резко меняется ранг страницы при изменении «коэффициента связи» (coupling factor/damping factor). Если ранг страницы слишком чувствителен к этим изменениям (имеет высокую производную), это сигнализирует о наличии манипулятивных структур, таких как ссылочные фермы или веб-кольца.

US7509344B1
2009-03-24

Антиспам
Ссылки
Техническое SEO

Как Google использует клики пользователей для определения составных фраз (N-грамм) в запросах

Google анализирует, какие результаты поиска выбирают пользователи, чтобы понять, являются ли последовательные слова в запросе единой фразой (например, "Нью Йорк") или отдельными терминами. Если пользователи преимущественно кликают на результаты, содержащие эту последовательность как неразрывную фразу, система определяет ее как составную (Compound) и использует это знание для улучшения ранжирования и понимания запроса.

US8086599B1
2011-12-27

Семантика и интент
Поведенческие сигналы
SERP

Как Google использует контекст внешних страниц для понимания и идентификации видео и аудио контента

Google анализирует внешние веб-страницы, которые ссылаются на медиафайлы или встраивают их (например, видео YouTube). Система извлекает метаданные из контекста этих страниц — заголовков, окружающего текста, URL. Надежность данных проверяется частотой их повторения на разных сайтах. Эта информация используется для улучшения понимания содержания медиафайла и повышения эффективности систем идентификации контента (Content ID).

US10318543B1
2019-06-11

Ссылки
Индексация
Мультимедиа

Как Google использует историю физических перемещений пользователя для фильтрации и персонализации результатов поиска

Google может собирать и хранить историю физических перемещений пользователя (Location History). Патент описывает интерфейс, позволяющий пользователю осознанно включать свои прошлые местоположения (например, «места, где я был на прошлой неделе») в качестве фильтра для нового поискового запроса, чтобы сделать результаты более релевантными личному опыту.

US8874594B2
2014-10-28

Персонализация
Поведенческие сигналы
Local SEO

Как Google запоминает прошлые уточнения поиска пользователя и автоматически перенаправляет его к конечному результату

Google использует механизм персонализации, который отслеживает, как пользователи уточняют свои поисковые запросы. Если пользователь часто вводит общий запрос, а затем выполняет ряд действий (например, меняет запрос или взаимодействует с картой), чтобы добраться до конкретного результата, система запоминает эту последовательность. В будущем, при вводе того же общего запроса, Google может сразу показать конечный результат, минуя промежуточные шаги.

US9305102B2
2016-04-05

Персонализация
Поведенческие сигналы

Как Google генерирует блок "Похожие вопросы" (People Also Ask) на основе анализа кликов и поведения пользователей

Google анализирует топовые результаты по исходному запросу и определяет "Тематические запросы" (Topic Sets) — прошлые запросы, по которым пользователи кликали на эти результаты. Затем система ищет популярные вопросы, соответствующие этим темам, фильтрует дубликаты на основе общности кликов и показывает их в блоке PAA для дальнейшего исследования темы.

US9213748B1
2015-12-15

SERP
Семантика и интент
Поведенческие сигналы

Как Google использует историю поиска и браузинга пользователя для персонализации и изменения результатов выдачи

Google записывает историю поиска и просмотров пользователя для последующей персонализации выдачи. Система может повышать в ранжировании ранее посещенные сайты, добавлять в текущую выдачу релевантные результаты из прошлых похожих запросов, а также понижать сайты, которые пользователь ранее видел, но проигнорировал. Патент также описывает создание "предпочитаемых локаций" на основе частоты посещений и времени пребывания на сайте.

US9256685B2
2016-02-09

Персонализация
Поведенческие сигналы
SERP

Как Google использует длительность кликов, Pogo-Sticking и уточнение запросов для оценки качества поиска (Click Profiles)

Google анализирует поведение пользователей после клика для оценки удовлетворенности. Система создает «Профили взаимодействия» (Click Profiles), учитывая длительность клика (Dwell Time), возврат к выдаче (Pogo-Sticking) и последующее уточнение запроса. Эти данные используются для сравнения эффективности алгоритмов ранжирования и выявления спама или кликбейта.

US9223868B2
2015-12-29

Поведенческие сигналы
SERP
Антиспам