Как Google использует время просмотра (Watch Time) и поведение пользователей для расчета независимой от запроса оценки качества видео

QUERY INDEPENDENT QUALITY SIGNALS (Независимые от запроса сигналы качества)

US8903812B1
Google LLC
2010-11-11
2014-12-02

Google рассчитывает независимый от запроса сигнал качества (Q) для видео, анализируя корреляции между поведенческими метриками: временем просмотра, рейтингами и количеством просмотров. Система использует математические функции (Predictor и Voting) для моделирования качества и определения достоверности данных, а также активно фильтрует спам в рейтингах. Этот сигнал Q затем используется для ранжирования видео в поиске.

Какую проблему решает

Патент решает задачу оценки внутреннего качества ресурсов (в первую очередь видео) независимо от поискового запроса. Основная проблема — как надежно интерпретировать "шумные" и подверженные спаму (например, накруткам) данные о поведении пользователей (время просмотра, рейтинги, просмотры) и преобразовать их в единый, устойчивый сигнал качества. Изобретение направлено на подавление шума и спама, а также позволяет рассчитывать оценку качества даже на небольших выборках данных.

Что запатентовано

Запатентована система и метод для генерации независимого от запроса сигнала качества (Query-Independent Quality Signal, Q). Метод основан на анализе корреляций между различными метриками взаимодействия пользователей (например, как Watch Time коррелирует с User Ratings). Для моделирования этих данных выводятся две ключевые функции: Predictor Function (P), которая оценивает качество на основе сигнала, и Voting/Variance Function (V), которая оценивает достоверность (вес) этого сигнала. Итоговый сигнал Q является взвешенной комбинацией этих функций.

Как это работает

Система работает в двух основных режимах:

Офлайн-анализ (Derivation): Система анализирует большие массивы исторических данных о взаимодействии пользователей. Она строит корреляции между разными сигналами (например, время просмотра и оценки). На основе этих корреляций выводятся математические модели (обычно сигмоидные функции): Predictor Function (P) и Voting Function (V).
Расчет и Применение (Evaluation & Ranking): Для конкретного видео система оценивает значения P и V на основе его текущих метрик. Применяются анти-спам механизмы (например, анализ Raters per view). Затем значения P и V комбинируются (взвешиваются) для расчета итогового Quality Signal Q. Этот сигнал Q используется как независимый фактор качества при ранжировании видео в поиске.

Актуальность для SEO

Высокая. Оценка качества контента на основе вовлеченности и поведенческих факторов (особенно времени просмотра) является фундаментальным аспектом современных поисковых и рекомендательных систем, в первую очередь YouTube и Google Video Search. Методы борьбы со спамом в рейтингах и оценки достоверности данных остаются критически важными в 2025 году.

Важность для SEO

Патент имеет высокое значение (8.5/10), особенно для Video SEO. Он детально описывает механизм, как именно поведенческие факторы (время просмотра, рейтинги) преобразуются в конкретный сигнал качества, напрямую влияющий на ранжирование. Это подтверждает, что оптимизация вовлеченности и удержания аудитории является более приоритетной задачей для ранжирования видео, чем простая оптимизация метаданных.

Термины и определения

Quality Signal (Q) (Сигнал качества): Независимая от запроса оценка качества ресурса (видео). Рассчитывается на основе взвешенной суммы функций P и V. Используется в ранжировании.
Predictor Function (P) (Функция предиктора): Математическая функция (обычно сигмоидная), которая моделирует корреляцию между входным сигналом (например, Watch Time) и эталоном качества (Ground Truth, например, User Rating).
Voting Function (V) / Variance Function (Функция голосования / Дисперсии): Математическая функция (обычно сигмоидная), которая измеряет дисперсию (variance) или достоверность функции P. Действует как вес (weight) и часто зависит от размера выборки (например, количества просмотров или оценок).
Ground Truth (Эталон истины): Сигнал, используемый как целевая переменная при построении корреляций. Например, User Rating может выступать как Ground Truth для оценки Watch Time.
Watch Time (Время просмотра): Время, которое пользователи тратят на просмотр видео. В патенте упоминается использование медианного времени просмотра (Median Watch Time).
Raters per view (Отношение числа оценивших к числу посмотревших): Метрика для обнаружения спама. Высокое значение может указывать на накрутку рейтингов (click spam).
Rank (Ранг): Независимый от запроса показатель авторитетности видео, основанный на ссылочной структуре (аналог PageRank), где ссылка на видео интерпретируется как голос за него.
Provider Credit (Кредит поставщика/автора): Сигнал авторитетности автора, основанный на среднем рейтинге всех видео, загруженных этим автором (иногда с исключением самых высоких оценок для борьбы со спамом).

Ключевые утверждения (Анализ Claims)

Claim 1 (Независимый пункт): Описывает основной метод расчета и использования сигнала качества на основе корреляции времени просмотра и рейтингов.

Система определяет корреляцию между временами просмотра (watch times) и пользовательскими рейтингами (user ratings) для первого набора видео.
Выводится функция предиктора (prediction function, P), моделирующая эту корреляцию.
Выводится функция дисперсии (variance function, V), моделирующая дисперсию (достоверность) функции P.
Выводится функция сигнала качества (quality signal function, Q), основанная на P и V.
Сигнал качества Q рассчитывается для второго набора видео (тех, что нужно ранжировать).
Сигналы Q предоставляются процессу ранжирования для использования при сортировке видео в ответ на запрос.

Claim 2 (Зависимый): Уточняет, что могут использоваться медианное время просмотра (median watch time) и средний пользовательский рейтинг.

Claim 3 и 4 (Зависимые): Указывают, что функция Q может дополнительно использовать корреляции между другими сигналами: количеством просмотров (view counts) и рейтингами (Claim 3), а также рангом видео (video rankings) и рейтингами (Claim 4).

Claim 5 (Зависимый): Уточняет механизм комбинирования: функция предиктора (P) взвешивается функцией дисперсии (V).

Claim 6 и 7 (Зависимые): Указывают, что и P, и V могут быть реализованы как сигмоидные функции (sigmoid function).

Где и как применяется

Изобретение применяется на этапах индексирования и ранжирования, используя данные о поведении пользователей.

INDEXING – Индексирование и извлечение признаков
На этом этапе происходит сбор данных о взаимодействии пользователей (просмотры, время, рейтинги) в логи (Tracking Logs). Ключевые процессы:

Офлайн-анализ (Analysis System/Analyzer): Система анализирует логи, выявляет корреляции между сигналами и выводит (derive) или обновляет функции P и V. Это ресурсоемкий процесс, выполняемый периодически.
Расчет Quality Signal (Quality Signal Engine): Сигнал Q рассчитывается для видео. Это может происходить заранее (во время индексации) или на лету (on the fly) во время запроса. Q сохраняется как независимый от запроса признак качества.

RANKING – Ранжирование
Ranking Engine использует рассчитанный Quality Signal Q как один из факторов для определения итогового порядка видео в результатах поиска.

Входные данные:

Поведенческие данные: Watch Times, User Ratings, View Counts, Number of Raters.
Ссылочные данные: Rank.
Метаданные: Total Running Time, данные для Provider Credit.

Выходные данные:

Набор функций P и V для различных входных сигналов.
Значение Quality Signal Q для конкретного видео.

На что влияет

Конкретные типы контента: В первую очередь — видеоконтент (YouTube, Google Video Search). Патент также упоминает применимость к другим ресурсам, где важны оценки и время взаимодействия: аудиоконтент (музыка, подкасты), стриминговый контент, электронные игры и веб-страницы.
Все типы запросов: Поскольку сигнал Q является Query-Independent, он влияет на ранжирование видео по любым запросам, к которым это видео релевантно.

Когда применяется

Вывод функций P и V: Периодически в офлайн-режиме по мере накопления новых данных.
Расчет и применение Q: При каждом ранжировании видеоресурсов.
Триггеры анти-спама: Активируются при обнаружении аномалий, например, когда метрика Raters per view превышает заданный порог (упоминается пример 1/400 или 0.0025).

Пошаговый алгоритм

Процесс А: Вывод функций (Офлайн-анализ)

Сбор и подготовка данных: Из Tracking Logs извлекаются данные о взаимодействиях (Watch Time, Ratings, Views и т.д.) для большого набора видео.
Построение корреляций: Анализируются взаимосвязи между сигналами. Например, строится график зависимости Avg. User Rating (Ground Truth) от ln(Median Watch Time). Данные могут кластеризоваться (binning).
Вывод Функции Предиктора (P): Подбираются константы для общей сигмоидной функции P(s), чтобы она наилучшим образом соответствовала кривой корреляции (curve fitting).
Вывод Функции Голосования/Дисперсии (V): Подбираются константы для сигмоидной функции V(s), которая моделирует достоверность функции P, обычно на основе размера выборки (например, ln(Number of Raters)).
Повторение: Шаги 2-4 повторяются для других пар сигналов (например, Views vs Rating, Rank vs Rating).

Процесс Б: Расчет Quality Signal Q и Ранжирование

Получение метрик видео: Для данного видео извлекаются его текущие метрики (сигналы $s_i$ ).
Применение анти-спам механизмов: Проверка Raters per view. Если значение слишком высокое, применяется пенальти (penalty), и количество оценок искусственно снижается. Также могут игнорироваться рейтинги при коротком времени просмотра.
Оценка функций: Рассчитываются значения $P(s_i)$ и $V(s_i)$ для каждого сигнала.
Комбинирование (Расчет Q): Рассчитывается взвешенная сумма результатов для получения итогового Quality Signal Q.
Ранжирование: Сигнал Q предоставляется процессу ранжирования.

Какие данные и как использует

Данные на входе

Система использует преимущественно поведенческие факторы, но также учитывает ссылочные, мультимедийные и авторские данные.

Поведенческие факторы:
- Watch Time: Время просмотра (медианное или среднее).
- View Count: Общее количество просмотров.
- User Ratings: Оценки пользователей (средний рейтинг).
- Number of Raters: Количество пользователей, оставивших оценку.
Ссылочные факторы:
- Rank: Ранг видео, основанный на ссылках с других ресурсов.
Мультимедиа факторы:
- Total Running Time: Общая длительность видео.
Данные об авторе:
- Provider Credit: Агрегированные данные о рейтингах других видео того же автора.

Какие метрики используются и как они считаются

Ключевым аспектом патента является математический аппарат для обработки этих данных.

1. Нормализация входных данных

Для многих сигналов используется натуральный логарифм (ln) в качестве входного значения (x) для функций P и V. Например: ln(Watch Time), ln(View Count), ln(Number of Raters). Это помогает нормализовать распределение данных и учесть эффект убывающей отдачи.

2. Quality Signal (Q)

Рассчитывается как взвешенная сумма функций P и V для k входных сигналов ( $s_i$ ). $B(s_i)$ представляет базу выборки.

$Q = \sum_{i=1}^{k} \frac{P(s_i) \cdot V(s_i)}{B(s_i)}$

3. Predictor Function (P) и Voting Function (V)

Описываются как общие сигмоидные функции. C1, C2, C3, C4 — константы, подбираемые в процессе анализа (curve fitting). x — значение входного сигнала (для P) или размер выборки (для V).

$F(s) = \frac{C1}{(1 + C2^{x-C3})} + C4$

4. Анти-спам метрика (Raters per view adjustment)

Система рассчитывает Raters per view (число оценивших / число просмотров). Если это значение слишком велико (например, > 0.0025), это считается признаком спама. Количество оценивших искусственно снижается (raters'). Формула, подтвержденная примером в патенте:

$raters' = raters \cdot (\frac{0.0025}{ratersperview})^{penalty}$

Где penalty (штраф) может быть равен 2. Также упоминается игнорирование рейтингов, если время просмотра было коротким.

Поведенческие факторы — основа статического качества: Патент детально описывает механизм, в котором Watch Time, Ratings и View Counts являются основой для расчета независимого от запроса сигнала качества (Q). Это подтверждает критическую важность оптимизации контента под удержание аудитории.
Время просмотра (Watch Time) — ключевой сигнал: Watch Time используется как основной сигнал для корреляции с качеством (Claim 1). Длительное время просмотра, подтвержденное положительной обратной связью, является сильным индикатором качества.
Математическое моделирование достоверности (Voting Function): Система не просто усредняет метрики, но и оценивает их достоверность с помощью Voting Function (V). Эта функция зависит от объема данных (например, количества оценок). Видео с большим количеством взаимодействий получают более надежный сигнал Q.
Использование сигмоидных функций и логарифмов: Применение сигмоидных функций и логарифмической шкалы для входных данных позволяет моделировать нелинейные зависимости и эффект насыщения (убывающую отдачу). Например, разница между 10 и 100 просмотрами значительнее, чем между 100,000 и 100,100.
Встроенные механизмы борьбы со спамом: Патент явно описывает методы борьбы с накруткой рейтингов. Анализ Raters per view позволяет выявлять аномалии и применять штрафы (penalty) для снижения веса подозрительных данных.
Авторитетность автора (Provider Credit): Качество видео оценивается также в контексте автора. Метрика Provider Credit (среднее качество других видео автора) может использоваться как входной сигнал для Q, подчеркивая важность общей репутации канала.

Best practices (это мы делаем)

Оптимизация под удержание и время просмотра (Watch Time): Это ключевая стратегия для Video SEO. Создавайте контент, который максимально долго удерживает внимание. Анализируйте моменты оттока аудитории и корректируйте структуру видео. Высокий Watch Time напрямую влияет на Quality Signal Q.
Стимулирование органического взаимодействия: Поощряйте пользователей ставить оценки, но делайте это органично. Система использует Voting Function для оценки достоверности, поэтому важен объем реальных взаимодействий, но без аномалий в Raters per view.
Повышение качества канала (Provider Credit): Работайте над общим качеством всех видео на канале. Патент упоминает Provider Credit. Стабильно высокое качество контента повышает авторитет источника.
Применение принципов к веб-контенту: Поскольку механизм универсален (применим к веб-страницам), следует оптимизировать веб-контент для увеличения времени взаимодействия (Time on Page, Dwell Time). Контент должен быть полезным и вовлекающим.
Внешнее продвижение (для Rank): Поскольку Rank (основанный на ссылках) упоминается как входной сигнал для Q, получение качественных ссылок и встраиваний (embeds) вашего видео на авторитетных ресурсах положительно влияет на его оценку качества.

Worst practices (это делать не надо)

Накрутка рейтингов и оценок (Click Spam): Это крайне опасно. Механизм анализа Raters per view обнаруживает аномально высокое количество оценок относительно просмотров и применяет штрафы (penalty), нивелируя эффект накрутки.
Покупка просмотров низкого качества: Покупка трафика с низким Watch Time негативно скажется на Quality Signal Q, так как снизит средние/медианные показатели времени просмотра.
Использование кликбейта: Заголовки и превью, обманывающие ожидания зрителя, приведут к быстрому закрытию видео. Это снижает Watch Time и, как следствие, обрушит Quality Signal Q.
Игнорирование качества отдельных видео: Размещение низкокачественного контента на авторитетном канале может снизить общий Provider Credit и негативно повлиять на ранжирование других видео.

Стратегическое значение

Патент подтверждает стратегию Google по использованию анализа поведения пользователей для оценки качества контента. Для Video SEO это означает, что техническая оптимизация (метаданные) важна для определения релевантности, но именно вовлеченность аудитории определяет качество (Quality Signal Q). Долгосрочная стратегия должна фокусироваться на создании контента, который действительно ценен для зрителя и стимулирует длительное взаимодействие.

Практические примеры

Сценарий 1: Борьба с накруткой рейтингов (Raters per view penalty)

Ситуация: Видео А имеет 4000 просмотров и 20 оценок (средний рейтинг 5.0). Соотношение Raters per view = 20/4000 = 0.005.
Анализ системы: Система определяет, что 0.005 превышает пороговое значение (0.0025), что указывает на потенциальный спам.
Применение пессимизации: Система пересчитывает эффективное количество оценивших (raters'). Используя формулу из патента (при penalty=2): $raters' = 20 \cdot (\frac{0.0025}{0.005})^2 = 20 \cdot 0.5^2 = 5$ .
Результат: При расчете Quality Signal Q система будет учитывать только 5 оценок вместо 20, что значительно снизит достоверность (Voting Function V) высокого рейтинга и уменьшит его влияние на ранжирование.

Сценарий 2: Влияние объема данных на достоверность (Voting Function)

Ситуация: Видео Б и Видео В имеют одинаковое медианное время просмотра (Watch Time) - 5 минут. Однако Видео Б имеет 100 просмотров, а Видео В — 10000 просмотров.
Расчет Predictor Function (P): Так как Watch Time одинаковый, значение P(Watch Time) будет одинаковым для обоих видео.
Расчет Voting Function (V): Функция V зависит от размера выборки, например, ln(View Count). Для Видео В значение V будет значительно выше (ln(10000) > ln(100)).
Расчет Q: Итоговый Quality Signal Q рассчитывается с учетом веса V (P * V). Поскольку V у Видео В выше, его оценка качества более достоверна.
Результат: Система более уверена в качестве Видео В, и оно получит преимущество в ранжировании по сравнению с Видео Б при прочих равных условиях.

Что является наиболее важным фактором качества видео согласно этому патенту?

Хотя система использует комбинацию сигналов, Watch Time (время просмотра) играет центральную роль. В основном пункте патента (Claim 1) именно корреляция между Watch Time и User Ratings (которые часто служат эталоном качества или Ground Truth) используется как основа для расчета качества. Это подчеркивает, что удержание аудитории является критически важным показателем.

Как система определяет, можно ли доверять данным о взаимодействии (например, если просмотров мало)?

Для этого используется Voting Function (V) или Variance Function. Эта функция оценивает достоверность данных на основе размера выборки (количества просмотров или оценок). Если данных мало, функция V выдаст низкий вес, и влияние этих данных на итоговый сигнал качества (Q) будет минимальным. Система больше доверяет статистически значимым данным.

Как патент предлагает бороться с накруткой рейтингов (спамом)?

Патент описывает конкретный механизм: анализ соотношения Raters per view (количество оценивших к просмотрам). Если это соотношение аномально высокое (например, > 0.0025), система активирует формулу штрафа (penalty) и искусственно снижает эффективное количество учитываемых оценок. Также упоминается возможность игнорирования рейтингов, если время просмотра было слишком коротким.

Влияет ли качество других видео автора (канала) на ранжирование конкретного видео?

Да, влияет. В патенте упоминается сигнал Provider Credit. Он рассчитывается как средний рейтинг всех видео, загруженных автором. Этот сигнал может использоваться как один из входов для расчета Quality Signal Q, что подчеркивает важность поддержания стабильно высокого качества на всем канале.

Что такое сигмоидные функции и зачем они используются?

Сигмоидные функции (S-образные кривые) используются для моделирования Predictor (P) и Voting (V) функций, так как позволяют учитывать нелинейные зависимости и эффект насыщения (убывающую отдачу). Например, рост времени просмотра с 1 до 2 минут сильно влияет на качество, а рост с 50 до 51 минуты — слабо. Сигмоида позволяет это смоделировать.

Применяется ли этот механизм только к видео?

Хотя патент в основном описывает применение к видео, в тексте указано, что механизм может быть применен к другим ресурсам, где доступны пользовательские рейтинги и данные о времени взаимодействия. К ним относятся аудиоконтент, электронные игры и веб-страницы. Это означает, что аналогичные принципы могут использоваться для оценки качества сайтов в веб-поиске.

Как влияют внешние ссылки на Quality Signal Q?

Внешние ссылки влияют через сигнал Rank. Патент упоминает, что Rank (аналог PageRank, основанный на ссылочной структуре интернета) может быть одним из входных сигналов для расчета Q. Таким образом, получение качественных обратных ссылок или встраиваний видео повышает его независимую оценку качества.

Что произойдет, если у видео высокий рейтинг, но низкое время просмотра?

Система анализирует корреляции. Если общий тренд показывает, что качественные видео имеют высокое время просмотра, то видео с низким Watch Time получит низкую оценку от соответствующей Predictor Function (P). Высокий рейтинг может быть частично нивелирован, особенно если система заподозрит спам (например, если оценки были поставлены при коротком просмотре).

Зачем используется натуральный логарифм (ln) для входных данных?

Использование натурального логарифма (ln) для таких сигналов, как Watch Time и View Count, позволяет нормализовать распределение данных и учесть закон убывающей отдачи. Это означает, что прирост с 10 до 100 просмотров считается более значимым, чем прирост с 1,000,000 до 1,000,090.

Что означает "независимый от запроса" сигнал качества для SEO?

Это оценка качества самого видео, которая не зависит от того, что ищет пользователь. Работа над улучшением Quality Signal (Q) (через улучшение вовлеченности) повысит производительность видео по всем запросам, по которым оно ранжируется. Усилия направляются на улучшение самого актива, а не только на оптимизацию под конкретный запрос.

Как Google использует время просмотра (Watch Time) для ранжирования видео и другого контента

Google измеряет, сколько времени пользователи тратят на потребление контента (особенно видео) после клика по результату поиска и во время последующей сессии. Ресурсы, которые удерживают внимание пользователей дольше, получают повышение в ранжировании (Boost), а ресурсы с коротким временем просмотра понижаются. Система учитывает не только клики, но и фактическое вовлечение пользователя в рамках всей сессии просмотра.

US9098511B1
2015-08-04

Поведенческие сигналы
Мультимедиа
SERP

Как Google использует вероятностные модели и анализ пользовательского выбора (кликов) для обучения систем ранжирования

Патент Google описывает метод эффективного ранжирования контента (видео или результатов поиска) с использованием парных сравнений. Система моделирует качество как вероятностное распределение и оптимизирует сбор данных. Этот механизм может применяться для интерпретации кликов в поисковой выдаче как сигналов предпочтения, учитывая позицию результата и доверие к пользователю.

US8688716B1
2014-04-01

SERP
Поведенческие сигналы

Как Google рассчитывает «VisualRank» для изображений и медиафайлов, используя виртуальные ссылки на основе схожести и поведения пользователей

Google использует алгоритм (концептуально называемый VisualRank) для ранжирования изображений и других медиафайлов путем создания «виртуальных ссылок» между ними. Эти ссылки основаны на визуальной схожести контента, данных о кликах пользователей и контексте размещения (URL analysis). Это позволяет оценить качество и авторитетность медиафайлов даже без явных гиперссылок, при этом система активно избегает показа слишком похожих (дублирующихся) результатов.

US8732187B1
2014-05-20

Ссылки
Мультимедиа
Поведенческие сигналы

Как Google (YouTube) использует последовательность просмотров и общее время просмотра для определения и ранжирования похожих видео

Google использует поведенческие сигналы для определения похожих видео на платформах типа YouTube. Система анализирует, какие видео пользователи смотрят одно за другим в течение короткого времени (ко-просмотры). Если пользователи положительно взаимодействуют (например, долго смотрят) с Видео А и сразу после этого с Видео Б, система считает их связанными. Финальный список рекомендаций ранжируется с учетом временной близости просмотров и общего времени просмотра (Total Watch Time).

US9088808B1
2015-07-21

Поведенческие сигналы
Мультимедиа
Персонализация

Как Google комбинирует поведенческие сигналы из разных поисковых систем для улучшения ранжирования

Google использует механизм для улучшения ранжирования путем объединения данных о поведении пользователей (клики и время взаимодействия) из разных поисковых систем (например, Веб-поиск и Поиск по Видео). Если в основной системе данных недостаточно, система заимствует данные из другой, применяя весовой коэффициент и фактор сглаживания для контроля смещения и обеспечения релевантности.

US8832083B1
2014-09-09

Поведенческие сигналы
SERP

Как Google автоматически определяет важность различных частей веб-страницы (DOM-узлов) для ранжирования

Google анализирует коллекции похожих структурированных документов (например, товарных карточек) и создает общую модель (DOM). Затем система изучает логи запросов и кликов, чтобы понять, какие части структуры (заголовки, основной контент, реклама) чаще всего содержат ключевые слова из успешных запросов. Этим частям присваивается больший вес при расчете релевантности.

US8538989B1
2013-09-17

Семантика и интент
Индексация
Структура сайта

Как Google использует данные веб-поиска и клики пользователей для классификации бизнесов и построения иерархии категорий

Google анализирует логи веб-поиска (введенные ключевые слова и последующие клики по результатам), чтобы понять, как пользователи интуитивно классифицируют бизнесы. Эти данные используются для автоматического построения динамической иерархической структуры категорий. Эта структура затем применяется для улучшения точности поиска, в частности, для оптимизации моделей распознавания речи в голосовых системах.

US7840407B2
2010-11-23

Поведенческие сигналы
Семантика и интент
Структура сайта

Как Google собирает и структурирует данные о поведении пользователей в Поиске по картинкам (включая ховеры, клики и 2D-позицию)

Патент Google описывает инфраструктуру для детального сбора данных в Поиске по картинкам. Система фильтрует общие логи, фиксируя не только клики, но и наведение курсора (ховеры), длительность взаимодействия и точное 2D-расположение (строка/столбец) изображения на выдаче. Эти данные агрегируются в Модель Запросов Изображений для оценки релевантности.

US8898150B1
2014-11-25

Поведенческие сигналы
SERP
Мультимедиа

Как Google использует контекст и анализ офлайн-поведения (Read Ranking) для соединения физических документов с цифровыми копиями

Система идентифицирует цифровой контент по сканированному фрагменту из физического мира, используя не только текст, но и обширный контекст (время, местоположение, историю пользователя). Патент также вводит концепцию «Read Ranking» — отслеживание популярности физических документов на основе того, что люди сканируют, как потенциальный сигнал ранжирования.

US20110295842A1
2011-12-01

Поведенческие сигналы
Персонализация
Семантика и интент

Как Google использует LLM для генерации поисковых сводок (SGE), основываясь на контенте веб-сайтов, и итеративно уточняет ответы

Google использует Большие Языковые Модели (LLM) для создания сводок (AI-ответов) в результатах поиска. Для повышения точности и актуальности система подает в LLM не только запрос, но и контент из топовых результатов поиска (SRDs). Патент описывает, как система выбирает источники, генерирует сводку, проверяет факты, добавляет ссылки на источники (linkifying) и аннотации уверенности. Кроме того, система может динамически переписывать сводку, если пользователь взаимодействует с одним из источников.

US11769017B1
2023-09-26

EEAT и качество
Ссылки
SERP

Как Google предсказывает намерения пользователя и выполняет поиск до ввода запроса (Predictive Search)

Google использует механизм для прогнозирования тем, интересующих пользователя в конкретный момент времени, основываясь на его истории и контексте. При обнаружении сигнала о намерении начать поиск (например, открытие страницы поиска), система проактивно выполняет запрос по предсказанной теме и мгновенно показывает результаты или перенаправляет пользователя на релевантный ресурс.

US8510285B1
2013-08-13

Семантика и интент
Персонализация
Поведенческие сигналы

Как Google определяет авторитетные сайты для конкретных тем, анализируя «гибридные запросы» пользователей

Google анализирует «гибридные запросы» (например, «back pain WebMD»), чтобы понять, какие сайты пользователи считают лучшими источниками информации по конкретным темам. Система создает карты соответствия между темами и авторитетными ресурсами. Эти данные используются для повышения релевантности авторитетных сайтов в выдаче по информационным запросам и для улучшения поисковых подсказок.

US9244972B1
2016-01-26

EEAT и качество
Семантика и интент
SERP

Как Google идентифицирует, связывает и индексирует концепции (фразы) для понимания тем документов

Фундаментальный патент Google, описывающий переход от индексирования слов к индексированию концепций (фраз). Система определяет «хорошие фразы» на основе частотности и их способности прогнозировать появление других фраз (Information Gain). Документы индексируются не только по содержащимся в них фразам, но и по наличию связанных фраз, что позволяет системе определять основные и второстепенные темы документа, а также контекстуально оценивать анкорный текст ссылок.

US7536408B2
2009-05-19

Индексация
Семантика и интент
Ссылки

Как Google рассчитывает репутационную значимость организаций и людей, используя данные из внешних источников для ранжирования

Google использует систему для оценки репутации и престижа сущностей (например, организаций или людей). Система не полагается только на предоставленные данные, а активно ищет «Дополнительные Аспекты» из внешних источников (например, профессиональные сети, СМИ). На основе этих данных рассчитываются две метрики: «Репутационная Значимость» (престиж относительно аналогов) и «Двустороннее Соответствие» (взаимная привлекательность), которые используются для ранжирования результатов поиска и рекомендаций.

US10878048B2
2020-12-29

EEAT и качество
SERP
Knowledge Graph

Как Google автоматически изучает синонимы, анализируя последовательные запросы пользователей и вариации анкорных текстов

Google использует методы для автоматического определения синонимов, акронимов и эквивалентных фраз. Система анализирует логи запросов: если пользователь быстро меняет запрос, сохраняя часть слов (например, с «отели в париже» на «гостиницы в париже»), система учится, что «отели» и «гостиницы» эквивалентны. Также анализируются вариации анкорных текстов, указывающих на одну и ту же страницу.

US6941293B1
2005-09-06

Семантика и интент
Ссылки