Как Google использует популярность сущностей в Веб-поиске для ранжирования результатов в Вертикальном поиске (Музыка, Книги, Товары)

RANKING SIGNALS FOR SPARSE CORPORA (Сигналы ранжирования для разреженных корпусов)

US9779140B2
Google LLC
2012-11-16
2017-10-03

Google улучшает ранжирование в специализированных поисковых вертикалях (например, Музыка, Книги, Товары), где данных для оценки контента недостаточно (Sparse Corpora). Система использует сигналы из основного Веб-поиска (популярность запросов, CTR веб-страниц), чтобы определить авторитетность и популярность сущностей (песен, книг, товаров) и скорректировать их позиции в вертикальной выдаче.

Какую проблему решает

Патент решает проблему неоптимального ранжирования в специализированных (вертикальных) поисковых системах, таких как поиск по музыке, книгам или фильмам. Эти системы оперируют «разреженными корпусами» (sparse corpora), где часто не хватает данных по каждому отдельному элементу (например, песне или товару), чтобы эффективно отличать их друг от друга и определять их относительную важность или популярность.

Что запатентовано

Запатентован метод использования данных из основного Веб-поиска (WWW-based corpus) для создания сигналов ранжирования в отдельном, не связанном с вебом корпусе (Non-Web based corpus). Суть изобретения заключается в импорте сигналов популярности из Веб-поиска для использования их в качестве независимых от запроса оценок (Query-Independent Scores) при ранжировании элементов внутри вертикального поиска.

Как это работает

Система работает путем переноса сигналов между корпусами:

Идентификация элемента: Система идентифицирует элемент в разреженном корпусе (например, название книги).
Кросс-корпусный запрос: Название этого элемента используется как запрос к WWW-based corpus (Веб-поиску).
Извлечение сигналов: Система анализирует популярность этого запроса в Веб-поиске: объем и частоту запросов (Query Volume/Frequency), а также поведенческие метрики (CTR) для результатов веб-поиска.
Контекстуальное взвешивание: Сигналы с тематически релевантных веб-страниц получают больший вес.
Применение в вертикальном поиске: Эти данные агрегируются в Ranking Signal и используются для ранжирования элемента в разреженном корпусе, комбинируясь с его релевантностью запросу пользователя (Query-Dependent Score).

Актуальность для SEO

Высокая. Интеграция вертикального поиска (Товары, Книги, Фильмы, Local) и использование глобальной популярности сущностей (Entity Popularity) являются критически важными в современной поисковой архитектуре. Этот патент описывает фундаментальный механизм, позволяющий Google использовать данные Веб-поиска для улучшения качества всех остальных своих продуктов.

Важность для SEO

Патент имеет значительное стратегическое влияние (7/10). Хотя он не описывает ранжирование в основном Веб-поиске, он критически важен для компаний, чьи продукты или контент представлены в вертикальных системах Google. Он устанавливает прямую связь между популярностью и авторитетностью сущности в Веб-поиске и ее ранжированием в Вертикальном поиске. Для успеха в вертикалях необходима сильная и оптимизированная представленность в основном вебе.

Термины и определения

First Information Corpus / Non-Web Based Corpus / Sparse Corpus (Первый / Не-веб / Разреженный корпус): Специализированная база данных (например, музыки, книг, товаров), отделенная от основного веб-индекса. Определяется как корпус, чьи документы недоступны в World Wide Web. Характеризуется недостатком данных для ранжирования.
Second Information Corpus / WWW-Based Corpus (Второй / WWW-корпус): Основной индекс Веб-поиска, включающий все документы, доступные в Интернете.
Non-overlapping (Непересекающиеся): Условие, при котором документы из одного корпуса не могут быть найдены в другом.
Query-Dependent Score (Зависимая от запроса оценка): Оценка релевантности элемента запросу пользователя внутри специализированного корпуса.
Query-Independent Score (Независимая от запроса оценка): Оценка популярности или важности элемента, не зависящая от текущего запроса. Формируется на основе внешних сигналов (из WWW) и внутренних сигналов (например, продажи).
Ranking Signal (Сигнал ранжирования): В контексте патента — это Query-Independent Score, полученный из WWW-Based Corpus. Включает First Score Signal и Second Score Signal.
First Score Signal (Первый сигнал оценки): Часть Ranking Signal, основанная на объеме (Query Volume) и/или частоте (Query Frequency) запросов элемента в Веб-поиске.
Second Score Signal (Второй сигнал оценки): Часть Ranking Signal, основанная на метриках популярности (Popularity Metric) веб-страниц, найденных в результате поиска элемента в Веб-поиске.
Popularity Metric (Метрика популярности): Поведенческие данные для веб-страниц: Query-to-Click ratio (отношение запросов к кликам) и Clickthrough ratio (CTR).

Ключевые утверждения (Анализ Claims)

Claim 1 (Независимый пункт): Описывает основной метод кросс-корпусного ранжирования.

Система получает запрос в первом корпусе (First Information Corpus), который определен как не-веб корпус, документы которого недоступны в WWW.
Для каждого результата генерируется оценка, основанная на двух компонентах:
1. Query-Dependent Score (релевантность внутри первого корпуса).
2. Query-Independent Score. Эта оценка включает:
  - Ranking Signal, полученный путем поиска названия элемента во втором корпусе (Second Information Corpus), который определен как WWW-корпус. Первый и второй корпусы не пересекаются.
  - Ranking Signal включает First Score Signal, основанный на частоте запросов этого элемента в WWW-корпусе (Query Frequency).
  - Дополнительная оценка (Additional Score) из второго не-веб корпуса, включающая географическое положение источника запроса.
Результаты ранжируются на основе сгенерированной (комбинированной) оценки.

Claim 3 (Зависимый от 1): Уточняет, что First Score Signal также основан на общем количестве выполненных поисков (Query Volume).

Claim 4 (Зависимый от 3): Уточняет, что Ranking Signal дополнительно включает Second Score Signal. Этот сигнал основан на метриках популярности (Popularity Metric) веб-страниц, найденных в результате поиска в WWW-корпусе.

Claim 5 (Зависимый от 4): Определяет Popularity Metric как Query-to-Click ratio и/или CTR для этих веб-страниц.

Claim 6 (Зависимый от 4): Описывает механизм контекстуального взвешивания. Second Score Signal повышается (взвешивается), если найденная веб-страница тематически релевантна вертикали (например, содержит связанные с музыкой термины или является музыкальной веб-страницей). Это гарантирует использование сигналов с релевантных по тематике веб-ресурсов.

Где и как применяется

Изобретение применяется в специализированных (вертикальных) поисковых системах Google, которые используют собственные базы данных, отличные от основного веб-индекса (например, Google Music, Books, Movies, Shopping/Products).

INDEXING – Индексирование и извлечение признаков
Основная часть работы происходит на этом этапе в офлайн-режиме. Система рассчитывает и сохраняет Query-Independent Scores для элементов в разреженном корпусе.

Идентификация сущностей (Книга, Фильм, Товар) в Sparse Corpus.
Использование названия сущности как запроса к WWW Corpus.
Извлечение и анализ данных из WWW Corpus (логи запросов для Query Volume/Frequency и поведенческие данные для CTR).
Расчет Ranking Signal и сохранение его в индексе Sparse Corpus, ассоциируя с соответствующей сущностью.

RANKING – Ранжирование (внутри Вертикального поиска)
Во время выполнения запроса пользователя в вертикальном поиске система применяет рассчитанные сигналы:

Рассчитывается Query-Dependent Score (релевантность внутри вертикали).
Извлекаются предварительно рассчитанные Query-Independent Scores (включая Ranking Signal из WWW и локальные сигналы).
Оценки комбинируются для получения финального ранжирующего балла.

Входные данные (Офлайн): Элементы из Sparse Corpus; Данные WWW Corpus (логи, индекс, клики); Данные из не-веб источников (продажи).

Выходные данные (Офлайн): Query-Independent Scores для каждого элемента.

Входные данные (Рантайм): Запрос пользователя; Геолокация пользователя; Предварительно рассчитанные Query-Independent Scores.

Выходные данные (Рантайм): Отранжированный список результатов вертикального поиска.

На что влияет

Конкретные типы контента и ниши: Влияет на ранжирование сущностей в специализированных базах данных Google. Это напрямую затрагивает музыку, книги, фильмы, и товары (Products/Shopping).
Специфические запросы: Влияние наиболее заметно, когда несколько результатов имеют схожие оценки релевантности внутри разреженного корпуса. Внешние сигналы популярности из веба становятся решающими для дифференциации результатов.

Когда применяется

Временные рамки и частота применения: Расчет Ranking Signal на основе WWW данных происходит периодически (офлайн), так как популярность сущностей меняется. Применение этих сигналов происходит при каждом запросе в вертикальной поисковой системе.
Условия применения: Применяется в поисковых системах, работающих с sparse corpora, где стандартных сигналов недостаточно для качественной дифференциации результатов.

Пошаговый алгоритм

Процесс разделен на две основные фазы: офлайн-расчет сигналов и рантайм-ранжирование.

Фаза А: Офлайн-расчет Query-Independent Scores

Идентификация элементов: Система обходит Sparse Corpus и идентифицирует элементы (например, товары).
Кросс-корпусный запрос: Название каждого элемента используется как поисковый запрос к WWW Corpus (Веб-поиску).
Расчет First Score Signal (Популярность запроса): Анализируются логи Веб-поиска для определения Query Volume и Query Frequency для названия элемента.
Расчет Second Score Signal (Популярность результатов):
1. Получаются результаты веб-поиска для названия элемента.
2. Анализируются Popularity Metrics (CTR, Query-to-Click ratio) для этих веб-страниц.
3. Применяется взвешивание: Если веб-страница тематически релевантна вертикали (например, обзор товара на технологическом сайте), ее сигналы получают больший вес.
Генерация Ranking Signal: First Score Signal и Second Score Signal комбинируются.
Интеграция локальных сигналов: Ranking Signal комбинируется с другими не-веб сигналами (например, Sell Count).
Сохранение: Итоговый Query-Independent Score сохраняется в индексе Sparse Corpus.

Фаза Б: Рантайм-ранжирование в Вертикальном поиске

Получение запроса: Пользователь вводит запрос в вертикальный поисковый движок. Определяется геолокация пользователя.
Идентификация кандидатов и Расчет Query-Dependent Score: Оценивается релевантность кандидатов запросу пользователя.
Получение Query-Independent Score: Извлекаются предварительно рассчитанные оценки популярности.
Корректировка по геолокации: Оценка может быть скорректирована на основе геолокации пользователя (Additional Score).
Комбинирование оценок: Query-Dependent Score и скорректированный Query-Independent Score объединяются для получения финального балла.
Ранжирование и выдача: Элементы сортируются и предоставляются пользователю.

Какие данные и как использует

Данные на входе

Система использует комбинацию данных из веб-корпуса и не-веб корпуса.

Данные из Веб-корпуса (WWW-based Corpus):

Поведенческие факторы:
- Query Volume: Общее количество поисковых запросов в веб-поиске, соответствующих элементу.
- Query Frequency: Частота выполнения поисковых запросов в веб-поиске за период.
- Query-to-click ratio: Отношение запросов к кликам для результирующих веб-страниц.
- Clickthrough ratio (CTR): Показатель кликабельности для результирующих веб-страниц.
Контентные факторы:
- Содержание веб-страниц используется для определения их тематической релевантности (например, наличие музыкальных терминов) для взвешивания поведенческих сигналов.

Данные из Не-веб корпуса (Non-Web based Corpus) и Пользовательские данные:

Коммерческие/Популярные факторы:
- Sell Count: Количество продаж элемента.
- Play Count: Количество воспроизведений (для медиа).
Временные факторы:
- Release Date: Дата выпуска элемента.
Географические факторы:
- User Query Location: Местоположение пользователя (используется для корректировки ранжирования).

Какие метрики используются и как они считаются

First Score Signal: Агрегация Query Volume и Query Frequency.
Second Score Signal: Агрегация CTR и Query-to-Click ratio результатов веб-поиска.
Контекстуальное Взвешивание (Weighting): Механизм повышения Second Score Signal, если результаты веб-поиска тематически связаны с вертикалью. Это критически важно для обеспечения релевантности импортируемых сигналов.
Ranking Signal: Комбинация (например, среднее значение, Claim 7) First Score Signal и Second Score Signal.
Итоговая оценка: Комбинация Query-Dependent Score и Query-Independent Score.

Прямое влияние Веб-популярности на Вертикальный поиск: Патент демонстрирует конкретный механизм, как популярность сущности (бренда, продукта, артиста) в основном Веб-поиске является прямым фактором ранжирования в специализированных поисковых системах Google (Music, Books, Shopping).
Использование поведенческих факторов из Веба: Google явно использует Query Volume, Query Frequency и CTR из Веб-поиска как измеримые сигналы популярности и качества для ранжирования в других продуктах.
Кросс-корпусная синергия: Несмотря на то, что базы данных разделены (non-overlapping), сигналы активно переносятся из богатого данными Веб-поиска для улучшения качества в разреженных корпусах (Sparse Corpora).
Критичность контекстуальной релевантности (Взвешивание): Система не просто использует общую популярность. Она применяет взвешивание (Claim 6), предпочитая сигналы (например, CTR) со страниц, тематически связанных с вертикалью. Это обеспечивает релевантность импортируемых сигналов.
Многофакторная оценка: Финальное ранжирование учитывает как веб-сигналы, так и внутренние сигналы вертикального поиска (продажи, прослушивания), а также контекст пользователя (геолокация).

Best practices (это мы делаем)

Построение популярности бренда/сущности в Веб-поиске (Entity Popularity): Необходимо стимулировать поисковый интерес к вашим продуктам, книгам или брендам в основном Веб-поиске. Высокие Query Volume и Query Frequency напрямую улучшат ранжирование этих сущностей в соответствующем вертикальном поиске.
Оптимизация веб-присутствия для высокого CTR: Работайте над оптимизацией сниппетов официальных сайтов, авторитетных обзоров и Knowledge Panels, связанных с вашей сущностью. Высокий CTR на этих страницах в Веб-поиске используется как Second Score Signal для повышения рейтинга в вертикалях.
Стимулирование создания тематического контента: Поощряйте создание обзоров и статей о вашей сущности на релевантных тематических площадках. Согласно механизму взвешивания (Claim 6), сигналы с тематических страниц (например, технологических сайтов для гаджета) получают больший вес.
Холистический подход к SEO: Рассматривайте Web SEO и Vertical SEO как взаимосвязанные дисциплины. Усилия по продвижению в основном поиске напрямую конвертируются в лучшие позиции в Google Shopping, Books, Local и т.д.

Worst practices (это делать не надо)

Изолированная оптимизация вертикального поиска: Фокусироваться только на оптимизации внутри вертикали (например, оптимизация фида для Google Shopping), игнорируя представленность и популярность бренда/продукта в Веб-поиске.
Манипуляция поведенческими факторами низкого качества: Попытки накрутки Query Volume или CTR. Это может быть неэффективно, так как система применяет взвешивание на основе тематической релевантности (контекста) веб-страниц, с которых получены сигналы.
Игнорирование официального сайта и внешних упоминаний: Отсутствие сильного официального сайта или упоминаний на авторитетных тематических ресурсах лишает систему возможности собрать качественные Second Score Signals (CTR).

Стратегическое значение

Патент подтверждает стратегию Google по оценке сущностей (Entities). Популярность в вебе становится универсальным фактором ранжирования во всей экосистеме Google. Для SEO-специалистов это означает, что долгосрочная стратегия должна быть направлена на развитие и продвижение сущностей (Entity Management) и генерацию устойчивого поискового интереса, а не только на техническую оптимизацию под конкретные платформы.

Практические примеры

Сценарий: Ранжирование товара в Google Shopping

Два магазина продают одинаковую модель кроссовок. Оба оптимизировали фид для Google Shopping (Sparse Corpus), и их Query-Dependent Score близок.

Анализ Магазина А (Малоизвестный бренд):
- Веб-поиск: Низкий Query Volume для бренда магазина. Низкий CTR на официальном сайте.
- Результат: Низкий Query-Independent Score.
Анализ Магазина Б (Известный ритейлер):
- Веб-поиск: Высокий Query Volume для бренда магазина. Высокий CTR на официальном сайте и в обзорах на тематических площадках.
- Результат: Высокий Query-Independent Score за счет сильных веб-сигналов.
Итог: Предложение Магазина Б будет ранжироваться выше в Google Shopping благодаря импортированным сигналам популярности и авторитетности бренда из Веб-поиска.

Влияет ли этот патент на ранжирование моего сайта в основном Веб-поиске (синие ссылки)?

Нет, напрямую не влияет. Патент описывает импорт сигналов ИЗ Веб-поиска В Вертикальный поиск (например, Google Shopping или Books), а не наоборот. Он предназначен для улучшения ранжирования в специализированных базах данных (Sparse Corpora), где не хватает собственных сигналов для оценки качества.

Какие именно данные из Веб-поиска используются?

Используются четыре ключевых поведенческих метрики: Query Volume (объем запросов по сущности), Query Frequency (частота запросов), CTR (кликабельность результатов веб-поиска по этой сущности) и Query-to-Click ratio. Это подтверждает использование поведенческих данных как меры популярности.

Что такое "Sparse Corpus" и какие системы к нему относятся?

Sparse Corpus — это специализированная база данных Google, отделенная от основного веб-индекса, где данных для ранжирования недостаточно. Для SEO-специалистов это чаще всего означает Google Shopping (Products), Google Books, Google Movies, а также, вероятно, Google Local (Maps), если они функционируют как отдельные корпуса.

Как я могу использовать это знание для улучшения позиций в Google Shopping или Google Local?

Необходимо повышать популярность вашего бренда и конкретных товаров/услуг в основном Веб-поиске. Стимулируйте брендовый трафик и запросы по названию товара. Оптимизируйте сниппеты вашего официального сайта, чтобы максимизировать CTR в Веб-поиске. Эти сигналы популярности будут импортированы и улучшат ваше ранжирование в вертикалях.

Имеет ли значение, с каких сайтов Google берет CTR (Claim 6)?

Да, это критически важно. Патент указывает, что система применяет взвешивание (weighting), если веб-страница, с которой получен сигнал CTR, тематически релевантна вертикали (например, музыкальный сайт для музыкального поиска). Это означает, что CTR с авторитетных, тематических ресурсов более ценен, чем с сайтов общей тематики.

Как система обрабатывает ситуацию, когда у сущности есть несколько значений (например, "Ягуар" как животное и как автомобиль)?

Для этого используется механизм контекстуального взвешивания (Claim 6). Если поиск происходит в автомобильной вертикали, система будет придавать больший вес сигналам популярности, исходящим с автомобильных сайтов, тем самым фокусируясь на автомобиле, а не на животном.

Учитывает ли система только веб-сигналы для определения популярности?

Нет. Помимо веб-сигналов (Ranking Signal), система учитывает и локальные данные из не-веб источников (Non-Web Based Corpus). К ним относятся данные о продажах (Sell Count), количестве воспроизведений (Play Count), дате выпуска (Release Date) и геолокации пользователя.

Что означает, что корпусы "не пересекаются" (non-overlapping)?

Это означает, что документ, существующий в Веб-индексе (веб-страница), не существует в специализированной базе данных (как запись о товаре), и наоборот. Они хранятся отдельно, но система переносит сигналы между ними, связывая их через общие сущности (Entities).

Как система связывает элемент в вертикальном поиске с данными в Веб-поиске?

Система использует название элемента (например, имя артиста, название книги или товара) из вертикальной базы данных и выполняет поиск по этому названию в Веб-поиске. Это подчеркивает важность консистентного наименования и распознавания сущностей (Entity Recognition).

Что важнее для ранжирования в вертикальном поиске: релевантность запросу или популярность в вебе?

Система использует комбинацию обоих факторов. Сначала определяется релевантность (Query-Dependent Score). Затем популярность в вебе (Query-Independent Score) используется для корректировки ранжирования, особенно для различения результатов с похожей релевантностью. Популярность помогает выбрать лучший результат среди релевантных.

Как Google использует иерархическую популярность связанных сущностей и данные веб-поиска для ранжирования в вертикальном поиске

Google использует механизм иерархического скоринга для ранжирования сущностей (например, брендов или исполнителей) в вертикальных поисках (non-WWW corpus). Популярность родительской сущности рассчитывается на основе агрегированной популярности дочерних (например, товаров или треков). Система использует данные о запросах и CTR из основного веб-поиска (WWW corpus) для определения популярности и применяет геолокацию и язык для устранения неоднозначности.

US9626435B2
2017-04-18

Google Shopping

Как Google использует данные веб-поиска для распознавания сущностей в специализированных вертикалях (на примере поиска медиаконтента)

Google использует двухэтапный процесс для ответа на описательные запросы в специализированных поисках (например, поиск фильмов по сюжету). Сначала система ищет информацию в основном веб-индексе, анализирует топовые результаты для выявления релевантных сущностей (названий фильмов), а затем использует эти сущности для поиска в специализированной базе данных.

US9063984B1
2015-06-23

Семантика и интент
Мультимедиа
Индексация

Как Google нормализует и объединяет разнородные сигналы для ранжирования критериев таргетинга в рекламных системах

Патент Google, описывающий методы ранжирования критериев распространения контента (например, ключевых слов или мест размещения для рекламы). Система объединяет основной сигнал (например, релевантность) с вспомогательными (CTR, показы), используя математические трансформации для уменьшения искажений данных (Skewness) и гарантируя, что отсутствие данных по сигналу не пессимизирует критерий. Патент относится к AdTech, а не к органическому поиску.

US9501549B1
2016-11-22

Поведенческие сигналы

Как Google ранжирует сущности (например, фильмы или книги), используя популярность связанных веб-страниц и поисковых запросов в качестве прокси-сигнала

Google использует механизм для определения популярности контентных сущностей (таких как фильмы, телешоу, книги), когда прямые данные о потреблении недоступны. Система идентифицирует авторитетные «эталонные веб-страницы» (например, страницы Википедии) и связанные поисковые запросы. Затем она измеряет популярность сущности, анализируя объем трафика на эти эталонные страницы и частоту связанных запросов в поиске, используя эти данные как прокси-сигнал для ранжирования сущности.

US9098551B1
2015-08-04

EEAT и качество
Поведенческие сигналы
SERP

Как Google использует офлайн-сигналы и авторитетность сущностей для ранжирования контента

Google использует реальные, офлайн-сигналы авторитетности для ранжирования документов, у которых отсутствует естественная ссылочная структура (например, оцифрованные книги). Система оценивает коммерческий успех документа (данные о продажах, списки бестселлеров), репутацию связанных сущностей (автора и издателя) и может переносить ссылочный авторитет с официальных сайтов этих сущностей на сам документ для улучшения его позиций в поиске.

US8799107B1
2014-08-05

EEAT и качество
SERP
Поведенческие сигналы

Как Google предсказывает следующий запрос пользователя на основе контента текущей страницы и исторических данных

Google использует машинное обучение для анализа логов поведения пользователей, чтобы понять, что они ищут после посещения определенного контента. Система создает совместное векторное пространство (joint embedding) для документов и запросов, где близость отражает семантическую связь и вероятность совместной встречаемости. Это позволяет предлагать релевантные последующие запросы (query suggestions) в реальном времени, даже если ключевые слова для этих запросов на странице отсутствуют.

US9594851B1
2017-03-14

Семантика и интент
Поведенческие сигналы
Персонализация

Как Google использует гибридную классификацию и данные о кликах пользователей для точного определения тематики контента

Google использует многоэтапный процесс для классификации контента в детальные иерархические категории. Система комбинирует традиционные методы классификации с анализом поисковых запросов и кликов пользователей (подтвержденных результатов поиска). Это позволяет точно определить узкоспециализированную тематику документа, фильтруя нерелевантные категории и взвешивая релевантность на основе TF-IDF и глубины иерархии.

US8145636B1
2012-03-27

Семантика и интент
Поведенческие сигналы

Как Google использует вероятностные модели и анализ пользовательского выбора (кликов) для обучения систем ранжирования

Патент Google описывает метод эффективного ранжирования контента (видео или результатов поиска) с использованием парных сравнений. Система моделирует качество как вероятностное распределение и оптимизирует сбор данных. Этот механизм может применяться для интерпретации кликов в поисковой выдаче как сигналов предпочтения, учитывая позицию результата и доверие к пользователю.

US8688716B1
2014-04-01

SERP
Поведенческие сигналы

Как Google использует клики по изображениям для определения схожести запросов и картинок (Поведенческая схожесть)

Google анализирует поведение пользователей в поиске по картинкам, чтобы определить схожесть двух запросов (или двух изображений). Если пользователи часто кликают на одни и те же изображения в ответ на разные запросы, эти запросы считаются похожими. Этот механизм (Коллаборативная фильтрация) позволяет находить связи независимо от языка или типа запроса (текст/изображение) и используется для генерации рекомендаций.

US8280881B1
2012-10-02

Поведенческие сигналы
Семантика и интент
Мультимедиа

Как Google определяет и ранжирует вертикали поиска (Web, Images, News, Local) на основе интента запроса и профиля пользователя

Патент описывает фундаментальный механизм Универсального Поиска (Universal Search). Система генерирует результаты из разных индексов (Web, Картинки, Новости, Карты) и вычисляет «Оценку Вероятности» (Likelihood Value) для каждой категории. Эта оценка определяет, какая вертикаль наиболее релевантна интенту запроса. Для расчета используются как агрегированные данные о поведении всех пользователей по схожим запросам, так и индивидуальный профиль пользователя.

US7966309B2
2011-06-21

Семантика и интент
Персонализация
SERP

Как Google использовал специальные токены в запросе (например, «+») для прямой навигации на верифицированные социальные страницы в обход SERP

Google может интерпретировать специальные токены в поисковом запросе (например, «+») как намерение пользователя найти официальную социальную страницу сущности. Если система идентифицирует верифицированный профиль, соответствующий запросу с высокой степенью уверенности, она может перенаправить пользователя прямо на эту страницу, минуя стандартную поисковую выдачу.

US9275421B2
2016-03-01

Семантика и интент
SERP
Ссылки

Как Google использует социальный граф и активность друзей для персонализации и переранжирования результатов поиска

Google использует данные из социального графа пользователя и активность его контактов (лайки, шеры, комментарии, плейлисты) для изменения ранжирования результатов поиска. Контент, одобренный социальным окружением, повышается в выдаче и сопровождается аннотациями, объясняющими причину повышения и указывающими на свежесть социального действия.

US8959083B1
2015-02-17

Персонализация
Поведенческие сигналы
SERP

Как Google планировал использовать цифровые подписи для расчета репутации авторов (Agent Rank) независимо от сайта публикации

Патент Google, описывающий концепцию "Agent Rank". Система предлагает авторам (агентам) использовать цифровые подписи для подтверждения авторства контента. Это позволяет рассчитывать репутационный рейтинг агента, используя алгоритмы, подобные PageRank, на основе того, кто ссылается на их подписанный контент. Этот рейтинг затем используется для влияния на ранжирование, независимо от того, где контент опубликован.

US7565358B2
2009-07-21

EEAT и качество
Ссылки

Как Google рассчитывает авторитетность и ранжирует сайты, вычисляя кратчайшие пути до доверенных источников (Seeds) в Веб-графе

Google использует масштабируемую распределенную систему для анализа огромных графов, таких как Веб-граф (триллионы связей). Система вычисляет кратчайшие пути от каждого узла (сайта) до набора предопределенных авторитетных источников («Seeds»). Эти расстояния используются для расчета метрик авторитетности и ранжирования сайтов: чем ближе сайт к доверенным источникам, тем выше его предполагаемое качество.

US8631094B1
2014-01-14

EEAT и качество
Ссылки

Как Google использует вовлеченность пользователей на связанных страницах (Reachability Score) для ранжирования основного документа

Google рассчитывает «Оценку Достижимости» (Reachability Score), анализируя, как пользователи взаимодействуют со страницами, на которые ссылается основной документ (внутренние и исходящие ссылки). Если пользователи активно переходят по этим ссылкам (высокий CTR) и проводят время на целевых страницах (высокое время доступа), основной документ получает повышение в ранжировании. Этот механизм измеряет потенциальную глубину и качество пользовательской сессии.

US8307005B1
2012-11-06

Поведенческие сигналы
Ссылки
SERP