Как Google вычисляет важность сущностей внутри документа, используя контекст, ссылки и поведение пользователей, для улучшения ранжирования

QUERY-INDEPENDENT ENTITY IMPORTANCE IN BOOKS (Независимая от запроса важность сущностей в книгах)

US7783644B1
Google LLC
2006-12-13
2010-08-24

Google использует систему для определения относительной важности сущностей (люди, места, даты) внутри документа (книги или веб-страницы) независимо от поискового запроса. Важность рассчитывается на основе того, где сущность упомянута (контекст, структура), насколько точно она определена, ссылаются ли на этот раздел внешние источники и как часто его просматривают пользователи. Эти оценки важности сущностей затем используются как сигнал для ранжирования самого документа в результатах поиска.

Какую проблему решает

Патент решает проблему определения относительной важности многочисленных сущностей (например, локаций, дат, людей), упомянутых в документе, при отсутствии явных указаний на их ранг. Это необходимо для двух ключевых задач: 1) Эффективного представления информации пользователю (например, показ только самых важных локаций на карте, чтобы избежать перегруженности). 2) Улучшения качества поиска путем использования этих оценок важности сущностей в качестве сигнала для ранжирования самого документа.

Что запатентовано

Запатентована система (Entity Importance Engine), которая вычисляет независимые от запроса оценки важности (query-independent importance scores) для сущностей в корпусе документов. Определение "книги" в патенте включает веб-страницы. Система анализирует множество факторов, включая контекст упоминания сущности, точность ее определения, внешние и внутренние ссылки на разделы, упоминающие сущность, и активность пользователей. Полученные оценки используются для ранжирования документов в результатах поиска.

Как это работает

Система работает преимущественно в офлайн-режиме (на этапе индексирования):

Идентификация сущностей: Текст документа анализируется для выявления сущностей разных типов.
Расчет важности: Для каждой сущности рассчитывается оценка важности на основе нескольких модулей:
- Book Context: Оценка места упоминания (заголовки, начало документа, метаданные).
- Precision: Оценка точности определения сущности.
- References: Анализ внешних ссылок (цитирований) на разделы, где упомянута сущность.
- User Activities: Анализ частоты доступа пользователей к этим разделам.
- Term Weighting: Анализ частоты упоминания (например, TF-IDF).
Агрегация: Отдельные оценки взвешиваются и объединяются (линейная комбинация) в финальный Importance Score.
Применение в поиске: Система поиска (Search Module) использует эти предварительно рассчитанные оценки важности сущностей как один из сигналов для ранжирования самих документов в выдаче (согласно Claims 1 и 8).

Актуальность для SEO

Высокая. Определение того, какие сущности являются центральными для документа, является фундаментальной задачей для современных алгоритмов семантического поиска (Knowledge Graph, BERT, MUM). Описанные принципы — использование структуры документа, внешних ссылок и поведения пользователей для оценки важности контента — остаются крайне актуальными для оценки релевантности и построения Topical Authority в 2025 году.

Важность для SEO

Патент имеет высокое значение для SEO (8/10). Он предоставляет детальную схему того, как Google определяет тематическую направленность и глубину документа на уровне сущностей. Критически важно, что патент прямо указывает на использование этих query-independent importance scores для ранжирования самих документов. Это подчеркивает необходимость не просто упоминать релевантные сущности, но и структурно, контекстуально и с помощью внешних сигналов демонстрировать их важность.

Термины и определения

Book (Книга): Любое письменное произведение. В патенте определение включает традиционные книги, а также газеты, журналы, веб-страницы и другие электронные документы.
Book Context Module (Модуль контекста книги): Компонент, оценивающий важность сущности на основе того, где и как она упомянута в книге (заголовки, начало текста, выделение, внутренние ссылки).
Entity (Сущность): Объект, обладающий свойствами, описанными в книге. Примеры: географическая локация (geopoint), дата/время, событие, человек, организация.
Entity Importance Engine (Механизм оценки важности сущностей): Система, которая обрабатывает корпус для генерации query-independent importance scores.
Library Classification Data (Данные библиотечной классификации): Метаданные о книге (ISBN, коды классификации, тема, автор). Аналог метаданных и микроразметки для веб-страниц.
Precision Module (Модуль точности): Компонент, повышающий оценку важности для более точно определенных сущностей (например, полный адрес важнее города). Также учитывает уверенность распознавания текста (OCR confidence).
Query-Independent Importance Score (Независимая от запроса оценка важности): Числовая метрика, определяющая важность сущности относительно других сущностей того же типа в пределах одного документа, рассчитанная на этапе индексирования.
References Module (Модуль ссылок): Компонент, анализирующий сторонние ссылки (third party references) на разделы книги. Разделы, на которые ссылаются извне, считаются более важными.
Term Weighting Module (Модуль взвешивания терминов): Компонент, использующий частоту упоминаний сущности (например, с помощью TF-IDF) для влияния на ее оценку важности.
User Activities Module (Модуль активности пользователей): Компонент, повышающий важность сущностей, упомянутых в разделах книги, которые чаще просматриваются пользователями.

Ключевые утверждения (Анализ Claims)

Патент содержит ключевые независимые пункты, которые описывают как процесс расчета важности сущностей, так и критически важное применение этих расчетов в ранжировании.

Claim 1 (Независимый пункт): Описывает систему, фокусирующуюся на внешних ссылках и ранжировании.

Система присваивает query-independent importance scores сущностям.
Используется References Module для идентификации сторонних ссылок (third party references) на разделы книги.
Значения важности (importance values) разделов, на которые ссылаются третьи стороны, повышаются.
Оценка важности сущности рассчитывается на основе значений важности разделов, в которых она упомянута.
Search Module ранжирует книги в списке результатов в порядке, основанном, по крайней мере частично, на этих query-independent importance scores.

Внешние ссылки на конкретные разделы документа повышают важность контента и сущностей в этих разделах. Эта оценка важности затем используется как сигнал для ранжирования всего документа.

Claim 8 (Независимый пункт): Описывает систему, фокусирующуюся на метаданных классификации и ранжировании.

Система присваивает query-independent importance scores.
Используется модуль классификации (library classification module), который определяет, упоминается ли сущность в данных библиотечной классификации (метаданных) книги.
Оценки важности сущностей, упомянутых в данных классификации, повышаются.
Search Module ранжирует книги в списке результатов, используя эти query-independent importance scores.

Упоминание сущности в формальных метаданных или классификации документа повышает ее важность. Эта оценка важности также используется как сигнал для ранжирования всего документа.

Claim 15 и Claim 22 (Независимые пункты): Детализируют методы расчета важности, подтверждая механизмы, описанные в Claim 1 (фокус на внешних ссылках) и Claim 8 (фокус на классификации) соответственно.

Где и как применяется

Изобретение применяется в основном на этапе индексирования для предварительных вычислений, результаты которых используются на этапе ранжирования.

INDEXING – Индексирование и извлечение признаков
Это основной этап работы Entity Importance Engine. Система работает асинхронно (офлайн).

Извлечение сущностей: Идентификация сущностей в тексте документа.
Сбор данных и анализ: Система собирает данные о структуре документа (Book Context), метаданные (Classification Data), данные о внешних ссылках (References) и агрегированные данные о поведении пользователей (User Activities).
Расчет метрик: Вычисляются query-independent importance scores для всех значимых сущностей. Эти данные сохраняются в индексе как признаки (features) документа.

RANKING – Ранжирование
На этом этапе используются результаты работы. Как явно указано в Claims 1 и 8, система ранжирования использует предварительно рассчитанные importance scores сущностей в качестве одного из сигналов для определения релевантности и ранжирования самого документа в ответ на запрос. Документы, где искомая сущность имеет высокую важность (является центральной темой), могут получить преимущество.

Входные данные:

Текст и структура документа (книги/веб-страницы).
Метаданные документа (данные классификации).
Данные о внешних ссылках и цитированиях (third-party references).
Агрегированные данные о поведении пользователей.
Данные о частотности сущностей в корпусе (для TF-IDF).

Выходные данные:

Набор сущностей, связанных с документом.
Query-independent Importance Score для каждой сущности.

На что влияет

Конкретные типы контента: Наибольшее влияние на контент, богатый именованными сущностями — информационные статьи, исследования, лонгриды, биографии, путеводители.
Оценка Topical Authority: Система позволяет оценить, насколько глубоко документ раскрывает тему, определяя, какие сущности являются центральными для повествования, а не просто упомянутыми мимоходом.
Специфические запросы: Влияет на ранжирование по запросам, связанным с сущностями.

Когда применяется

Временные рамки: Расчет важности сущностей происходит на этапе индексирования или при обновлении индекса (офлайн-процесс). Использование этих оценок происходит в реальном времени на этапе ранжирования.
Условия применения: Применяется ко всем документам в корпусе, где могут быть идентифицированы сущности.

Пошаговый алгоритм

Процесс А: Расчет важности сущностей (Офлайн / Индексирование)

Сбор данных: Формирование корпуса документов и связанных метаданных.
Идентификация сущностей: Анализ текста каждого документа для выявления сущностей с использованием NLP-техник.
Расчет факторов важности: Параллельный расчет нескольких независимых оценок для каждой сущности:
1. Оценка контекста (Book Context): Анализ расположения сущности. Повышение оценки за упоминание в важных разделах (заголовки, начало документа), в метаданных классификации, или в разделах, на которые часто ссылаются внутри документа (internal references).
2. Оценка точности (Precision): Повышение оценки за более точное определение сущности. Снижение при низкой уверенности OCR.
3. Оценка ссылок (References): Анализ внешних ссылок (third-party references). Определение важности разделов на основе частоты их цитирования извне. Повышение оценки сущностей в высоко цитируемых разделах.
4. Оценка активности пользователей (User Activities): Анализ частоты доступа к разделам. Повышение оценки сущностей в часто просматриваемых разделах.
5. Оценка веса термина (Term Weighting): Расчет TF-IDF для сущности относительно всего корпуса.
Агрегация и Нормализация: Расчет финального Importance Score путем взвешенного суммирования (линейной комбинации) отдельных оценок. Нормализация результата.
Сохранение в индексе: Сохранение оценок в индексе как признаков документа.

Процесс Б: Использование оценок (Ранжирование и Представление)

Получение запроса: Система получает запрос от пользователя.
Ранжирование документов: Система ранжирует документы, используя Importance Scores упомянутых в них сущностей как один из сигналов ранжирования (согласно Claims 1 и 8).
Представление информации: При отображении информации о документе (например, в Google Books или Knowledge Panel) система выбирает подмножество наиболее важных сущностей на основе их Importance Scores.

Какие данные и как использует

Данные на входе

Контентные факторы: Основной текст документа.
Структурные факторы: Структура документа (заголовки, главы, оглавление, сноски, подписи к изображениям). Расположение текста (начало/конец документа). Форматирование (жирный, курсив).
Ссылочные факторы:
- Внутренние ссылки (Intra-book references): Ссылки из одних разделов на другие.
- Внешние ссылки (Third-party references): Цитирования, обзоры, веб-ссылки на конкретные разделы документа.
Поведенческие факторы: Данные о частоте доступа/просмотра пользователями определенных разделов документа (User Activities).
Метаданные (Classification data): Данные библиотечной классификации (тема, жанр, автор, ISBN, коды классификации).
Технические факторы: Оценки уверенности оптического распознавания символов (OCR confidence scores).

Какие метрики используются и как они считаются

Importance Value (Значение важности раздела): Метрика, присваиваемая разделу документа. Повышается на основе структурной значимости, частоты цитирования (внутреннего и внешнего) и частоты просмотра пользователями.
Precision Score (Оценка точности): Метрика, оценивающая, насколько детально определена сущность.
TF-IDF Score: Стандартная метрика для Term Weighting. Рассчитывается как частота сущности в документе (TF) относительно ее частоты во всем корпусе (IDF).
Final Importance Score (Финальная оценка важности): Агрегированная метрика. Рассчитывается как взвешенная сумма (линейная комбинация) отдельных оценок от разных модулей.
Формула (из описания патента): $\text{Final Importance Score} = AX+BY+CZ...$

Где X, Y, Z — отдельные оценки (например, от Context, References, Precision), а A, B, C — весовые коэффициенты.
Нормализация: Финальная оценка может быть нормализована (например, от 0 до 1) путем деления на сумму весов. В патенте упоминается, что в одном из вариантов реализации Book Context и Precision получают наибольшие веса.

Важность сущностей как сигнал ранжирования документа: Самый критический вывод для SEO. Патент явно утверждает (Claims 1 и 8), что рассчитанные query-independent importance scores сущностей используются для ранжирования самих документов в результатах поиска. Это подтверждает важность Entity SEO.
Контекст и Структура (Prominence) критичны: Расположение сущности в документе имеет огромное значение. Упоминания в заголовках, в начале текста, в метаданных классификации (аналог микроразметки) имеют больший вес (Book Context).
Внешние ссылки повышают важность на уровне разделов: Внешние ссылки (third-party references), указывающие на определенный раздел документа, повышают важность этого раздела и всех сущностей в нем. Это аналог PageRank, применяемый к частям контента (deep linking).
Поведение пользователей влияет на оценку важности: Если пользователи часто взаимодействуют с определенным разделом (User Activities), система повышает важность сущностей в этом разделе.
Точность вознаграждается: Более детально и точно описанные сущности считаются более важными (Precision).
Независимость от запроса: Оценка происходит на этапе индексирования, что позволяет Google заранее понять, какие темы являются главными для документа.

Best practices (это мы делаем)

Оптимизация заметности сущностей (Entity Prominence): Размещайте ключевые сущности в стратегически важных местах: заголовках (H1-H6), введении (первые абзацы). Используйте четкую структуру документа. Это соответствует принципам Book Context.
Использование метаданных и микроразметки: Активно используйте микроразметку (Schema.org), категории и теги для определения основных сущностей страницы. Это аналог Library Classification Data, упоминание в которых напрямую повышает важность сущности (Claim 8).
Повышение точности и детализации (Precision): Описывайте сущности максимально точно. Указывайте полные адреса, точные даты, полные имена. Это повышает Importance Score, рассчитанный модулем Precision.
Стимулирование глубоких ссылок (Deep Linking): Работайте над получением внешних ссылок, которые указывают на конкретные разделы вашего контента (например, через анкорные ссылки). Согласно References Module, это значительно повышает важность сущностей в этих разделах.
Оптимизация внутренней перелинковки: Используйте внутренние ссылки и оглавления (TOC) для указания на важные разделы. Разделы, на которые чаще ссылаются внутри документа (intra-book references), считаются более важными.
Оптимизация под вовлеченность (User Engagement): Улучшайте пользовательский опыт, чтобы стимулировать дочитываемость и взаимодействие с ключевыми разделами контента. Это положительно влияет на оценку User Activities Module.

Worst practices (это делать не надо)

"Закапывание" ключевой информации: Размещение важных сущностей только в конце документа, в сносках или в футере. Система придаст им низкий Importance Score.
Спам сущностями (Entity Stuffing): Многократное повторение сущностей без контекста. Механизм Term Weighting (TF-IDF) нивелирует эффект от повторения общеупотребительных сущностей, если их частота не оправдана глубиной раскрытия темы.
Игнорирование структуры контента: Публикация "стены текста" без заголовков, разделов и внутренних связей усложняет системе определение важных разделов и сущностей.
Использование общих и неточных данных: Отсутствие конкретики при описании сущностей снижает их важность из-за низких оценок модуля Precision.

Стратегическое значение

Этот патент подтверждает стратегическую важность перехода к оптимизации под сущности (Entity SEO) и построению Topical Authority. Он показывает, что Google стремится понять контент глубоко, определяя главные объекты и темы повествования. Для успеха в SEO необходимо не просто упомянуть релевантные сущности, но и структурно, контекстуально и с помощью внешних сигналов продемонстрировать, какие из них являются центральными для документа.

Практические примеры

Сценарий: Оптимизация статьи "Руководство по уходу за Кофейным Деревом Арабика"

Цель: Повысить важность сущностей "Кофейное Дерево Арабика" (Coffea arabica), "Температура", "Влажность", "Обрезка".
Действие (Book Context): Упомянуть "Кофейное Дерево Арабика" в H1 и первом абзаце. Создать разделы H2: "Оптимальная Температура и Влажность" и "Техники Обрезки".
Действие (Precision): Указать точный диапазон температур (18-24°C) и точные сроки обрезки, а не общие рекомендации. Использовать Schema.org/HowTo.
Действие (References - Internal): Добавить оглавление (TOC) со ссылками на разделы. В разделе "Проблемы" сделать внутреннюю ссылку на раздел "Обрезка".
Действие (References - External): Добиться того, чтобы авторитетный блог о садоводстве сослался на раздел "Техники Обрезки" с помощью анкорной ссылки.
Ожидаемый результат: Система присвоит этим сущностям высокий Importance Score. Благодаря этому (согласно Claim 1), статья получит преимущество в ранжировании по запросам, связанным с этими сущностями.

Применим ли этот патент к веб-сайтам или только к Google Books?

Патент абсолютно применим к веб-сайтам. В нем дается широкое определение термина "книга" (Book), которое явно включает "веб-страницы и другие электронные документы". Фундаментальные принципы оценки важности контента на основе структуры, контекста, внешних ссылок и поведения пользователей универсальны и используются Google в основном поиске.

Как именно этот патент связан с ранжированием моего сайта?

В Claims 1 и 8 патента прямо указано, что рассчитанные query-independent importance scores сущностей используются для ранжирования самих документов в результатах поиска. Если Google считает, что ключевые сущности, релевантные запросу, имеют высокую важность в вашем документе (т.е. являются его центральной темой), это служит позитивным сигналом ранжирования.

Что важнее согласно патенту: частота упоминания сущности или ее расположение в документе?

Важна комбинация, но контекст и расположение (Book Context) часто играют решающую роль. Упоминание в заголовке, метаданных (классификации) или в разделе, на который много ссылаются, может дать больший вклад в Importance Score, чем многократное упоминание в основном тексте. Патент также упоминает, что Book Context и Precision могут иметь наибольший вес.

Как внешние ссылки повышают важность сущности?

Механизм References Module повышает важность раздела документа, если на него ссылаются внешние источники (third-party references). Все сущности, упомянутые в этом (теперь более важном) разделе, получают повышенный Importance Score. Это подчеркивает ценность получения глубоких ссылок (deep links) на конкретные части контента.

Как поведение пользователей (User Activities) влияет на оценку важности?

Если пользователи часто обращаются к определенному разделу документа (например, долго его изучают, переходят по анкорным ссылкам), система считает этот раздел более важным. Это повышает Importance Score сущностей, упомянутых в этом разделе, подтверждая важность работы над вовлеченностью и юзабилити контента.

Что подразумевается под "точностью" (Precision) сущности и как ее повысить?

Точность относится к степени детализации. Например, полный почтовый адрес точнее, чем просто название города; точная дата точнее, чем год. Для повышения точности следует предоставлять максимально полную и специфичную информацию о сущности и использовать микроразметку Schema.org для четкого определения ее свойств.

Как этот патент связан с Topical Authority?

Он напрямую связан. Topical Authority подразумевает глубокое раскрытие темы. Этот патент описывает механизм, позволяющий Google измерить эту глубину, определяя, какие сущности являются центральными для документа. Документ, в котором ключевые для темы сущности имеют высокий Importance Score, будет считаться более авторитетным.

Влияет ли внутренняя перелинковка на важность сущностей?

Да, влияет. Патент указывает, что разделы, на которые чаще ссылаются другие разделы того же документа (intra-book references), считаются более важными (в рамках Book Context). Соответственно, сущности в этих разделах также получают более высокий Importance Score. Это подчеркивает важность продуманной внутренней перелинковки и использования оглавлений (TOC).

Что такое "данные библиотечной классификации" и какой у них аналог в веб-поиске?

Это структурированные метаданные, такие как тема, жанр, коды классификации. В веб-поиске аналогами являются данные микроразметки (Schema.org), категории, теги, а также классификация страницы по тематике. Упоминание сущности в этих метаданных напрямую повышает ее важность (Claim 8).

Как система использует TF-IDF для сущностей?

Term Weighting Module применяет логику TF-IDF: если сущность очень часто встречается во всем корпусе (интернете), её базовый вес снижается. Чтобы она считалась важной в вашем документе, вы должны упоминать её значительно чаще, чем в среднем, или она должна быть упомянута в очень важных контекстах. Это означает необходимость фокусироваться на уникальном контексте и глубоком раскрытии темы.

Как Google ранжирует сущности (книги, фильмы, людей), анализируя тематичность и авторитетность их упоминаний в вебе

Google использует механизм для оценки значимости конкретных сущностей (например, изданий книг или фильмов). Система анализирует, как эти сущности упоминаются на релевантных веб-страницах, учитывая уверенность распознавания (Confidence) и то, насколько страница посвящена именно этой сущности (Topicality). Эти сигналы агрегируются с учетом авторитетности и релевантности страниц для расчета итоговой оценки сущности, которая затем корректирует ее ранжирование в поиске.

US20150161127A1
2015-06-11

Семантика и интент
EEAT и качество
SERP

Как Google использует редкость сущностей (IDF) для персонализации и повышения интересности контента

Google использует механизм для персонализации выдачи (например, в Новостях или Рекомендациях), который повышает в ранжировании документы, содержащие сущности, интересующие пользователя, если эти сущности редко встречаются в недавнем корпусе документов. Редкость измеряется с помощью Inverse Document Frequency (IDF). Система продвигает уникальные комбинации тем (группы сущностей), которые могут быть особенно интересны пользователю.

US9679018B1
2017-06-13

Персонализация
Семантика и интент
SERP

Как Google итеративно распознает сущности на страницах и рассчитывает их важность с помощью PageRank

Google использует итеративный процесс для распознавания и устранения неоднозначности сущностей (людей, мест, понятий) в документах. Система начинает с известных фактов, находит упоминающие сущность документы, анализирует сопутствующие термины для уточнения модели распознавания и автоматически обнаруживает новые признаки. Патент также описывает расчет важности сущности путем суммирования PageRank ссылающихся документов, взвешенного на вероятность ссылки.

US8122026B1
2012-02-21

Семантика и интент
Ссылки
Knowledge Graph

Как Google связывает запросы с сущностями для формирования выдачи, подсказок и определения доминирующего интента

Google использует систему для определения того, какие сущности (люди, места, объекты) подразумеваются в поисковом запросе. Система анализирует, насколько релевантны топовые документы запросу и насколько центральное место в этих документах занимает конкретная сущность. На основе этого рассчитывается оценка Entity Score, которая определяет ранжирование сущностей для запроса. Этот механизм используется для показа блоков знаний, организации поисковой выдачи и предоставления уточняющих поисковых подсказок.

US20160224621A1
2016-08-04

Семантика и интент
Knowledge Graph
SERP

Как Google динамически выбирает и ранжирует факты об объектах в зависимости от запроса пользователя (Основы Knowledge Graph)

Патент описывает создание и использование репозитория фактов (предшественника Knowledge Graph). Система извлекает факты из интернета и связывает их с объектами (сущностями). При поиске Google не просто возвращает список объектов, а динамически выбирает и ранжирует наиболее релевантные факты для каждого объекта, основываясь на конкретном запросе пользователя, а также метриках достоверности и важности.

US7774328B2
2010-08-10

Knowledge Graph
Семантика и интент
SERP

Как Google использует контекст пользователя для предложения запросов до начала ввода текста (Zero-Input Queries)

Google анализирует историю поисковых запросов, группируя их в «контекстные кластеры» на основе схожести темы и обстоятельств ввода (время, местоположение, интересы). Когда пользователь открывает строку поиска, система оценивает его текущий контекст и мгновенно предлагает релевантные категории запросов (например, «Кино» или «Рестораны»), предсказывая намерение еще до ввода символов.

US10146829B2
2018-12-04

Семантика и интент
Персонализация
Поведенческие сигналы

Как Google персонализирует подсказки Autocomplete, анализируя запросы похожих пользователей и обновляя локальный кэш устройства

Google персонализирует подсказки Autocomplete (Search Suggest), анализируя поведение пользователей со схожими профилями (местоположение, интересы, история поиска). Система генерирует кастомизированное обновление для локального кэша устройства на основе запросов, введенных этими похожими пользователями. Это означает, что разные пользователи видят разные подсказки для одного и того же ввода.

US8868592B1
2014-10-21

Персонализация
Поведенческие сигналы
Local SEO

Как Google динамически повышает порог качества для результатов поиска по «рискованным» запросам

Google оценивает «риск» поискового запроса, анализируя общее качество топовых результатов. Если запрос часто привлекает спам, кликбейт или нежелательный контент (особенно видео), система динамически повышает минимальный порог качества. Контент, не соответствующий этому повышенному стандарту, понижается в выдаче, при этом учитываются такие сигналы, как показатель просмотров (Watch Rate).

US11609949B2
2023-03-21

Антиспам
SERP
Поведенческие сигналы

Как Google рассчитывает «сигнал конкурентоспособности» (Competition Signal) страниц на основе анализа кликов, показов и времени взаимодействия

Google оценивает качество страниц, анализируя их «победы» и «поражения» в поисковой выдаче. Система сравнивает, как часто пользователи выбирают данный URL вместо других и как долго они взаимодействуют с контентом по сравнению с конкурентами (Dwell Time). На основе этих данных рассчитывается корректирующий фактор, который повышает или понижает позиции страницы, отражая её относительную конкурентоспособность и удовлетворенность пользователей.

US9020927B1
2015-04-28

Поведенческие сигналы
SERP
EEAT и качество

Как Google извлекает сущности из активности пользователя для запуска проактивных (имплицитных) поисковых запросов

Анализ патента Google, описывающего метод идентификации «именованных сущностей» (людей, тем, фраз) путем мониторинга действий пользователя, таких как электронная почта, просмотр веб-страниц и набор текста. Система использует эти сущности для проактивного запуска фоновых поисковых запросов (имплицитных запросов), релевантных текущему контексту пользователя, часто с использованием персонализированных данных.

US9009153B2
2015-04-14

Персонализация
Семантика и интент
Поведенческие сигналы

Как Google использует данные о поведении пользователей и длительность кликов для улучшения и переписывания поисковых запросов

Google использует систему для автоматического переписывания запросов пользователей. Система анализирует миллионы прошлых поисковых сессий, чтобы определить, как пользователи уточняли свои запросы и насколько они были удовлетворены результатами (измеряя длительность кликов). На основе этого рассчитывается «Ожидаемая полезность» (Expected Utility) для предложенных вариантов запросов, что позволяет Google предлагать пользователю те формулировки, которые с наибольшей вероятностью приведут к качественному ответу.

US7617205B2
2009-11-10

Поведенческие сигналы
Семантика и интент
SERP

Как Google планировал использовать социальные связи, сети доверия и экспертизу для персонализации и переранжирования поисковой выдачи

Google запатентовал метод использования данных из социальных сетей («member networks») для влияния на ранжирование. Пользователи могли явно одобрять («endorse») результаты поиска. Эти одобрения показывались другим связанным пользователям (друзьям или людям, ищущим экспертное мнение) и использовались для переранжирования выдачи, добавляя персонализированный слой доверия.

US8825639B2
2014-09-02

Персонализация
EEAT и качество
Поведенческие сигналы

Как Google выбирает Sitelinks, анализируя визуальное расположение и структуру DOM навигационных меню

Google использует механизм для генерации Sitelinks путем рендеринга страницы и анализа DOM-структуры. Система определяет визуальное расположение (координаты X, Y) гиперссылок и группирует их на основе визуальной близости и общих родительских элементов. Sitelinks выбираются исключительно из доминирующей группы (например, главного меню), а ссылки из других групп игнорируются.

US9053177B1
2015-06-09

SERP
Ссылки
Структура сайта

Как Google использует консенсус анкорных текстов для определения авторитетных источников и проверки фактов в Knowledge Graph

Google определяет, является ли веб-страница авторитетным источником о конкретной сущности (Entity), анализируя все анкорные тексты входящих ссылок. Система находит консенсусное описание (Center of Mass). Если оно совпадает с именем сущности и это имя присутствует в заголовке страницы, документ используется как эталон для проверки (Corroboration) фактов в базе знаний Google (Fact Repository).

US9208229B2
2015-12-08

Knowledge Graph
Ссылки
EEAT и качество

Как Google алгоритмически вычисляет и ранжирует экспертов по темам на основе анализа их контента

Google использует систему для автоматического определения экспертности авторов (Identities) в конкретных темах (Topics). Система анализирует корпус документов, оценивая, насколько сильно автор связан с документом (Identity Score) и насколько документ релевантен теме (Topic Score). Эти оценки перемножаются и суммируются по всем документам, формируя итоговый рейтинг экспертности автора в данной области.

US8892549B1
2014-11-18

EEAT и качество
Семантика и интент