Как Google наследует сигналы качества и пессимизации между иерархически связанным контентом (например, Видео, Плейлисты, Каналы)

METHODS, SYSTEMS, AND MEDIA FOR COMBINING CLASSIFIER SCORES OF A HIERARCHICAL SET OF ENTITIES (Методы, системы и медиа для комбинирования оценок классификатора иерархического набора сущностей)

US20200159769A1
Google LLC
2019-11-15
2020-05-21

Google использует механизм для оценки качества контента (например, видео), учитывая не только его собственные характеристики, но и качество связанных с ним родительских сущностей (например, плейлиста или канала). Система комбинирует оценки качества (Classifier Scores) и оценки защиты (Protection Scores) всех уровней иерархии для расчета агрегированной оценки (Aggregate Score). Это позволяет точнее выявлять и понижать в поиске нежелательный контент, даже если он размещен на в целом качественном ресурсе, и наоборот.

Какую проблему решает

Патент решает проблему точной оценки качества контента на платформах с иерархической структурой (например, YouTube), где существует проблема "разреженного злоупотребления" (sparse abuse). Существующие решения часто классифицируют сущность (например, канал) как полностью нежелательную, даже если большая часть контента качественная, но присутствует один проблемный плейлист. Изобретение направлено на более гранулированную оценку, позволяющую избежать неточных классификаций и учитывать качество на разных уровнях иерархии (видео, плейлист, канал).

Что запатентовано

Запатентована система для комбинирования оценок классификаторов для иерархического набора сущностей. Суть изобретения заключается в расчете агрегированной оценки (Aggregate Score) для элемента контента (например, видео) путем объединения его собственных оценок качества (Classifier Score) и защиты (Protection Score) с аналогичными оценками его родительских сущностей (например, плейлиста, в который он входит, и канала, который его загрузил). Эта агрегированная оценка используется для принятия решения о понижении (demotion) контента в выдаче.

Как это работает

Система работает по принципу наследования и агрегации сигналов качества:

Определение иерархии: Для элемента контента (например, видео) определяются его предки (например, плейлист и канал).
Сбор оценок: Система получает Classifier Scores (оценки качества/спамности) и Protection Scores (оценки авторитетности/защиты от понижения) для самого элемента и всех его предков.
Расчет агрегированной оценки: Все полученные оценки комбинируются для вычисления итогового Aggregate Score. Protection Scores могут повышать нижнюю границу этой оценки.
Принятие решения о понижении: Если Aggregate Score ниже определенного порога, элемент контента понижается в результатах поиска (например, снижается его позиция или он исключается из выдачи).

Актуальность для SEO

Высокая. Патент опубликован в 2020 году и описывает механизмы модерации контента и оценки качества, которые критически важны для платформ с пользовательским контентом, таких как YouTube (контекст патента явно указывает на видео, плейлисты и каналы). Борьба со спамом, кликбейтом и нежелательным контентом остается приоритетной задачей.

Важность для SEO

Патент имеет высокое значение (8/10) для SEO-стратегий на платформах с иерархической структурой контента, в первую очередь для YouTube SEO. Он демонстрирует, что качество отдельного видео оценивается в контексте качества плейлиста и всего канала. Низкое качество родительской сущности может привести к понижению дочернего контента, даже если сам контент качественный. И наоборот, высокая авторитетность (Protection Score) канала может защитить контент от понижения.

Термины и определения

Aggregate Score (Агрегированная оценка): Итоговая оценка сущности, рассчитанная на основе комбинации Classifier Scores и Protection Scores самой сущности и ее предков.
Ancestor Entity (Родительская сущность / Предок): Сущность, находящаяся выше в иерархии. Например, для видео предками могут быть плейлист, в который оно входит, и канал, который его загрузил или создал плейлист.
Classifier Score (Оценка классификатора): Значение, представляющее качество сущности на основе ее характеристик. Например, оценка того, является ли контент спамом, кликбейтом, вводящим в заблуждение или нежелательным (порнографическим).
Demotion (Понижение / Пессимизация): Действие, предпринимаемое в отношении сущности, если ее Aggregate Score ниже порога. Может включать снижение позиции в поиске, исключение из выдачи или предотвращение монетизации.
Entity (Сущность): Элемент контента или учетная запись на медиаплатформе. В контексте патента: видео (media content item), плейлист (playlist), пользовательский канал (user channel).
Hierarchical Set of Entities (Иерархический набор сущностей): Структура, в которой сущности связаны отношениями родитель-потомок. Например, Канал -> Плейлист -> Видео; или Канал -> Видео.
Protection Score (Оценка защиты): Значение, представляющее степень, в которой сущность защищена от понижения (включена в "белый список"). Например, канал с большим количеством подписчиков (>15,000) может иметь высокую оценку защиты. Эта оценка повышает нижнюю границу Aggregate Score.
Sparse Abuse (Разреженное злоупотребление): Ситуация, когда сущность (например, канал) в основном содержит качественный контент, но также включает отдельные элементы нежелательного контента (например, один спамный плейлист).

Ключевые утверждения (Анализ Claims)

Claim 1 (Независимый пункт): Описывает основной метод генерации оценок для иерархических сущностей.

Система определяет первый набор оценок, связанных с элементом медиаконтента (media content item).
Система определяет второй набор оценок, связанных с первой родительской сущностью (first ancestor entity) этого элемента.
Вычисляется агрегированная оценка (aggregate score) элемента на основе первого и второго наборов оценок.
Определяется, следует ли понизить (demote) элемент медиаконтента на основе этой агрегированной оценки.
В случае положительного решения элемент медиаконтента понижается.

Claim 2 (Зависимый): Уточняет, что в расчете может участвовать и вторая родительская сущность.

Агрегированная оценка рассчитывается на основе оценок самого элемента, первой родительской сущности и второй родительской сущности. Это позволяет учитывать сложную иерархию, например: Видео + Плейлист (Предок 1) + Канал (Предок 2).

Claim 3 (Зависимый): Определяет контекст применения.

Элемент медиаконтента является видео элементом (video item). Родительская сущность является плейлистом (playlist), включающим это видео, или пользовательским каналом (user channel), загрузившим это видео.

Claim 4 (Зависимый): Детализирует состав набора оценок.

Набор оценок включает classifier score, который указывает на качество элемента, и protection score, который указывает на میزان защиты от понижения, предоставляемую элементу.

Claim 6 (Зависимый): Описывает применение механизма в контексте поиска.

Система получает поисковый запрос.
Генерируется набор результатов поиска, один из которых соответствует данному элементу медиаконтента.
Система обеспечивает представление результатов поиска с учетом примененного понижения (demotion).

Где и как применяется

Изобретение затрагивает этапы индексирования для предварительного расчета оценок и этапы ранжирования/переранжирования для их применения в реальном времени.

INDEXING – Индексирование и извлечение признаков
На этом этапе система должна предварительно рассчитать и сохранить индивидуальные Classifier Scores (оценки качества/спама) и Protection Scores (оценки авторитетности) для каждой сущности в иерархии (каждого видео, плейлиста, канала). Также должна быть проиндексирована сама иерархическая структура (кто является предком кого).

RANKING – Ранжирование / RERANKING – Переранжирование
Основное применение патента происходит во время обработки поискового запроса.

Генерация кандидатов: Система генерирует начальный набор результатов поиска.
Расчет агрегированных оценок: Для каждого кандидата в выдаче система в реальном времени (или используя кэшированные данные) выполняет расчет Aggregate Score. Это требует получения индивидуальных оценок кандидата и его предков из индекса.
Применение понижения: Система идентифицирует результаты, подлежащие понижению, на основе рассчитанных Aggregate Scores и применяет пессимизацию (снижает ранг или удаляет из выдачи).

Входные данные:

Поисковый запрос.
Кандидаты в результаты поиска (сущности).
Иерархические связи между сущностями.
Предварительно рассчитанные Classifier Scores для каждой сущности.
Предварительно рассчитанные Protection Scores для каждой сущности.

Выходные данные:

Aggregate Score для каждой сущности-кандидата.
Финальный набор результатов поиска с примененными понижениями.

На что влияет

Конкретные типы контента: В первую очередь влияет на контент, организованный иерархически на медиаплатформах (например, YouTube). Влияет на ранжирование видео, плейлистов и каналов.
Конкретные ниши или тематики: Наибольшее влияние в нишах, где распространены злоупотребления (спам, кликбейт, вводящий в заблуждение контент) и где важна оценка авторитетности источника (например, YMYL-тематики на видеоплатформах).

Когда применяется

Условия работы алгоритма: Алгоритм применяется при генерации результатов поиска на платформе, где контент имеет иерархическую структуру и для него рассчитываются Classifier Scores и Protection Scores.
Триггеры активации: Понижение активируется, когда Aggregate Score сущности оказывается ниже predetermined threshold (предопределенного порога).

Пошаговый алгоритм

Процесс А: Расчет оценок (Этап Индексирования / Офлайн)

Получение данных о сущности: Система анализирует характеристики сущности (видео, плейлиста или канала).
Расчет Classifier Score: Классификаторы оценивают качество контента (например, вероятность спама).
Расчет Protection Score: Система оценивает авторитетность и надежность сущности (например, на основе количества подписчиков канала).
Хранение оценок: Полученные оценки сохраняются в базе данных (Storage Device), причем каждая оценка может храниться независимо для быстрого обновления.

Процесс Б: Применение оценок (Этап Ранжирования / Онлайн)

Получение запроса и генерация результатов: Система получает поисковый запрос и генерирует начальный набор результатов.
Идентификация сущности и ее предков: Для каждого результата (например, видео) определяются его родительские сущности (плейлист, канал).
Получение индивидуальных оценок: Система извлекает сохраненные Classifier Scores и Protection Scores для самой сущности и всех ее предков.
Расчет Aggregate Score:
1. Комбинируются Classifier Scores сущности и ее предков (возможно, с применением весовых коэффициентов).
2. Полученный результат комбинируется с Protection Scores сущности и ее предков. Protection Scores увеличивают нижнюю границу итоговой оценки.
Проверка порога: Система определяет, ниже ли рассчитанный Aggregate Score предопределенного порога.
Применение понижения (Demotion): Если оценка ниже порога, результат понижается в выдаче (снижается его ранг или он удаляется).
Представление результатов: Пользователю предоставляется скорректированный набор результатов поиска.

Какие данные и как использует

Данные на входе

Патент фокусируется на использовании предварительно рассчитанных оценок и структурных связей.

Факторы качества контента (Content Quality Factors): Используются через Classifier Scores. Эти оценки основаны на анализе характеристик контента на предмет злоупотреблений: вводящий в заблуждение (misleading), повторяющийся (repetitive), откровенный (racy), порнографический (pornographic), нарушающий права (infringing), кликбейт (clickbait).
Факторы авторитетности/Пользовательские факторы (Authority/User Factors): Используются через Protection Scores. Патент упоминает, что эти оценки могут быть основаны на характеристиках пользователя или канала, например, на количестве подписчиков (упоминается пример >15,000 подписчиков).
Структурные факторы (Structural Factors): Критически важные данные — иерархические связи между сущностями (отношения родитель-потомок между видео, плейлистами и каналами).

Какие метрики используются и как они считаются

Aggregate Score: Итоговая метрика для принятия решения о понижении. Рассчитывается путем комбинирования Classifier Scores и Protection Scores сущности и ее предков. Патент не предоставляет конкретных формул для комбинирования, но указывает, что могут использоваться любые подходящие функции и весовые схемы (weighting scheme).
Механизм защиты: Protection Score используется для увеличения нижней границы (increase the lower bound) Aggregate Score, тем самым защищая авторитетные сущности от понижения.
Пороговые значения: Используется предопределенный порог (predetermined threshold), с которым сравнивается Aggregate Score для принятия решения о понижении.

Наследование качества (и проблем): Качество контента оценивается на смешанном гранулированном уровне (mixed granularity). Ранжирование видео зависит не только от его собственных характеристик, но и от качества плейлиста, в который оно входит, и канала, на котором оно опубликовано. Проблемы родительской сущности наследуются потомками.
Решение проблемы "Sparse Abuse": Система позволяет более точно реагировать на ситуации, когда качественный канал содержит проблемный плейлист, или наоборот. Агрегированная оценка позволяет учесть оба фактора.
Явное использование "Белых списков" (Whitelisting): Патент прямо вводит понятие Protection Score — механизма для защиты ценных сущностей (например, авторитетных каналов) от понижения. Эта оценка функционирует как буфер против низких Classifier Scores.
Важность структуры контента: Организация контента в иерархии (плейлисты, каналы) напрямую влияет на его ранжирование через механизм наследования оценок.
Независимость оценок при хранении: Система разработана для эффективного хранения и обновления оценок. Classifier Scores и Protection Scores хранятся независимо, что позволяет обновлять их в реальном времени без пересчета других показателей.

Best practices (это мы делаем)

Рекомендации в первую очередь касаются платформ типа YouTube.

Поддержание качества на всех уровнях иерархии: Необходимо следить за качеством не только отдельных видео, но и плейлистов, и канала в целом. Все элементы должны соответствовать критериям качества (отсутствие спама, кликбейта, вводящего в заблуждение контента).
Стратегическое использование плейлистов: Организуйте контент в тематически связанные, высококачественные плейлисты. Качественный плейлист может положительно повлиять на Aggregate Score входящих в него видео за счет своего высокого Classifier Score.
Развитие авторитетности канала (Protection Score): Фокусируйтесь на построении авторитетности канала (например, увеличении числа лояльных подписчиков). Высокий Protection Score канала защищает контент от понижения, повышая нижнюю границу Aggregate Score для всех видео на канале.
Изоляция проблемного контента: Если необходимо опубликовать контент, который может иметь низкий Classifier Score (например, экспериментальный или спорный), его следует максимально изолировать, чтобы он не влиял на оценки качественного контента (хотя в рамках одного канала полная изоляция невозможна из-за наследования оценки канала).

Worst practices (это делать не надо)

Создание спамных плейлистов: Добавление качественных видео в низкокачественные, спамные или кликбейтные плейлисты приведет к понижению этих видео, так как низкий Classifier Score плейлиста негативно повлияет на их Aggregate Score.
Смешивание качественного и низкокачественного контента на одном канале: Публикация спама или кликбейта снижает общий Classifier Score канала. Это, в свою очередь, негативно скажется на ранжировании всех видео на канале из-за механизма наследования.
Игнорирование структуры: Рассматривать ранжирование видео в отрыве от контекста плейлистов и канала является ошибкой, так как система явно учитывает всю иерархию.

Стратегическое значение

Патент подтверждает стратегическую важность комплексного подхода к качеству контента на платформах Google. Для успешного продвижения недостаточно иметь отдельные качественные единицы контента; важна вся экосистема (канал) и структура (плейлисты). Авторитетность (выраженная через Protection Score) является ключевым активом, который не только способствует ранжированию, но и защищает от пессимизации. Это подчеркивает важность долгосрочных стратегий построения бренда и авторитета.

Практические примеры

Сценарий 1: Качественное видео в спамном плейлисте

Ситуация: SEO-специалист создал отличное обучающее видео (высокий Classifier Score видео). Чтобы быстро получить просмотры, он добавляет его в плейлист с кликбейтным названием и описанием, содержащим спам (низкий Classifier Score плейлиста).
Работа механизма: При расчете Aggregate Score видео система учитывает низкую оценку плейлиста.
Результат: Aggregate Score видео снижается, что приводит к его понижению (Demotion) в поиске, несмотря на собственное высокое качество.

Сценарий 2: Спорное видео на авторитетном канале

Ситуация: Крупный новостной канал (высокий Protection Score канала) публикует видео на спорную тему, которое классификаторы помечают как потенциально нежелательное (низкий Classifier Score видео).
Работа механизма: При расчете Aggregate Score видео система учитывает низкую оценку видео, но также применяет высокий Protection Score канала.
Результат: Protection Score повышает нижнюю границу Aggregate Score. В результате итоговая оценка может не опуститься ниже порога, и видео избежит автоматического понижения.

К каким платформам Google в первую очередь относится этот патент?

Патент явно описывает иерархию "Пользовательский канал" (User Channel), "Плейлист" (Playlist) и "Видео" (Video/Media Content Item). Это напрямую соответствует структуре YouTube. Механизмы наследования качества, описанные в патенте, критически важны именно для этой платформы, хотя аналогичные принципы могут применяться и в других сервисах с иерархической организацией контента.

Что такое Classifier Score и Protection Score?

Classifier Score — это оценка качества контента, определяющая, не является ли он спамом, кликбейтом или другим нежелательным контентом. Protection Score — это оценка авторитетности или надежности сущности (например, канала), которая защищает ее от понижения в выдаче. Высокий Protection Score может компенсировать низкий Classifier Score.

Как рассчитывается Protection Score?

Патент не дает точной формулы, но приводит примеры факторов, которые могут использоваться. В частности, упоминается количество подписчиков канала (например, >15,000). На практике это соответствует сигналам авторитетности, надежности и включению в "белые списки" (whitelisting).

Может ли одно плохое видео понизить в ранжировании весь канал?

Да, это возможно. Если видео имеет низкий Classifier Score, это может повлиять на расчет Classifier Score всего канала (хотя патент не детализирует этот расчет). Если общий Classifier Score канала снизится, то все остальные видео на канале также пострадают, так как они наследуют оценку канала при расчете своего Aggregate Score.

Поможет ли авторитетный канал ранжироваться видео низкого качества?

Частично. Авторитетный канал имеет высокий Protection Score. При расчете Aggregate Score видео этот показатель повышает нижнюю границу итоговой оценки. Это может помочь видео избежать автоматического понижения (Demotion), даже если его собственный Classifier Score низкий. Однако это не гарантирует высоких позиций.

Насколько важны плейлисты для ранжирования видео согласно этому патенту?

Они очень важны. Плейлист является родительской сущностью (Ancestor Entity) для видео. Его Classifier Score и Protection Score напрямую участвуют в расчете Aggregate Score видео. Качественный плейлист может улучшить ранжирование видео, а спамный плейлист гарантированно его ухудшит.

Что такое "Sparse Abuse" и как патент решает эту проблему?

Sparse Abuse (разреженное злоупотребление) — это ситуация, когда в целом качественный канал содержит отдельные элементы спама (например, один плохой плейлист). Ранее системы могли пессимизировать весь канал. Этот патент позволяет оценить ситуацию более гранулированно, комбинируя высокое качество канала и низкое качество плейлиста для принятия решения по конкретным видео.

Если я удалю спамный плейлист, восстановятся ли позиции видео?

Да, должны восстановиться. Поскольку плейлист больше не будет являться родительской сущностью для видео, его низкий Classifier Score перестанет участвовать в расчете Aggregate Score видео. Если остальные оценки (самого видео и канала) достаточно высоки, видео больше не будет подвергаться понижению по этому фактору.

Учитывает ли система качество канала, который добавил мое видео в свой плейлист?

Да, патент это предусматривает. Иерархия может быть сложной. Если Канал А загрузил Видео, а Канал Б добавил это Видео в свой Плейлист, то при просмотре Видео в контексте этого плейлиста, предками будут Плейлист и Канал Б (создатель плейлиста). Качество Канала Б будет влиять на оценку Видео в этом контексте.

Как система комбинирует оценки разных уровней?

Патент не дает точных формул, но указывает, что сначала комбинируются Classifier Scores (качество) сущности и предков, а затем к результату применяются Protection Scores (авторитетность) сущности и предков. Система может использовать различные весовые коэффициенты для оценок на разных уровнях иерархии.

Как Google повышает ранжирование каналов на основе позиций их контента в результатах поиска

Google использует механизм для улучшения видимости «Каналов» (например, каналов YouTube) в поиске на контент-платформах. Система гарантирует присутствие определенного числа каналов в выдаче, а затем агрессивно повышает ранжирование канала, если его отдельные единицы контента (например, видео) уже занимают высокие позиции по данному запросу. Это достигается путем расчета совокупной оценки канала на основе позиций его контента.

US9348922B2
2016-05-24

SERP
Мультимедиа

Как Google использует репутацию контент-канала (например, YouTube) для ранжирования отдельных видео в зависимости от типа запроса

Google оценивает контент-каналы (например, YouTube), вычисляя специализированные «Оценки канала» (Channel Scores) для разных типов запросов (например, за свежесть или качество). Эти оценки рассчитываются на основе выбранного подмножества метрик канала и его контента, затем присваиваются отдельным видео и используются для корректировки их рейтинга в поиске.

US8949874B1
2015-02-03

EEAT и качество
Свежесть контента
SERP

Как Google (YouTube) использует сравнительное голосование пользователей для ранжирования контента в плейлистах и конкурсах

Патент Google (применимый к YouTube) описывает систему коллективного ранжирования определенного набора контента (плейлиста). Пользователи ранжируют элементы относительно друг друга, перемещая их вверх или вниз. Система агрегирует эти голоса, используя взвешенный алгоритм (Взвешенный подсчет Борда), который учитывает предыдущий рейтинг и количество голосов за каждую позицию для определения нового коллективного порядка.

US7840563B2
2010-11-23

Поведенческие сигналы

Как Google определяет тематическую авторитетность источников ("каналов") и агрессивно продвигает их свежий контент

Google идентифицирует "каналы" (сайты, блоги, разделы), которые исторически создают высококачественный контент по определенным темам. Система рассчитывает тематическую авторитетность, учитывая качество контента и сфокусированность канала. Когда авторитетный канал публикует новый контент по своей теме, Google может агрессивно повысить его в выдаче, даже если у контента еще нет ссылок или поведенческих сигналов.

US8874558B1
2014-10-28

EEAT и качество
Свежесть контента
Индексация

Как Google использует иерархическую популярность связанных сущностей и данные веб-поиска для ранжирования в вертикальном поиске

Google использует механизм иерархического скоринга для ранжирования сущностей (например, брендов или исполнителей) в вертикальных поисках (non-WWW corpus). Популярность родительской сущности рассчитывается на основе агрегированной популярности дочерних (например, товаров или треков). Система использует данные о запросах и CTR из основного веб-поиска (WWW corpus) для определения популярности и применяет геолокацию и язык для устранения неоднозначности.

US9626435B2
2017-04-18

Google Shopping

Как Google анализирует текст вокруг ссылки (Rare Words) для борьбы со спамом и определения шаблонных ссылок

Google использует механизм для оценки качества ссылок, выходящий за рамки анкорного текста. Система анализирует редкие слова (rare words) в тексте, непосредственно окружающем ссылку, чтобы определить её уникальный контекст. Ранжирование улучшается при наличии разнообразия этих контекстов. Ссылки с повторяющимся контекстом (спам, Google-бомбинг или шаблонные/сквозные ссылки) идентифицируются и дисконтируются.

US8577893B1
2013-11-05

Антиспам
Ссылки
Семантика и интент

Как Google использует исторические данные о кликах по Сущностям для ранжирования нового или редко посещаемого контента

Google решает проблему «холодного старта» для новых страниц, у которых нет собственных поведенческих данных. Система агрегирует историю кликов на уровне Сущностей (Entities). Если сущности, упомянутые на новой странице, исторически имеют высокий CTR по целевому запросу, страница получает бустинг в ранжировании, наследуя поведенческие сигналы через эти сущности.

US10303684B1
2019-05-28

Поведенческие сигналы
Семантика и интент
SERP

Как Google использует атрибуты пользователей и показатели предвзятости (Bias Measures) для персонализации ранжирования

Google анализирует, как разные группы пользователей (сегментированные по атрибутам, таким как интересы или демография) взаимодействуют с документами. Система вычисляет «показатель предвзятости» (Bias Measure), который показывает, насколько чаще или реже определенная группа взаимодействует с документом по сравнению с общей массой пользователей. При поиске Google определяет атрибуты пользователя и корректирует ранжирование, повышая или понижая документы на основе этих показателей предвзятости.

US9436742B1
2016-09-06

Персонализация
Поведенческие сигналы
SERP

Как Google использует историю физических перемещений пользователя для фильтрации и персонализации результатов поиска

Google может собирать и хранить историю физических перемещений пользователя (Location History). Патент описывает интерфейс, позволяющий пользователю осознанно включать свои прошлые местоположения (например, «места, где я был на прошлой неделе») в качестве фильтра для нового поискового запроса, чтобы сделать результаты более релевантными личному опыту.

US8874594B2
2014-10-28

Персонализация
Поведенческие сигналы
Local SEO

Как Google персонализирует поиск, повышая в выдаче объекты, которые пользователь ранее явно отметил как интересные

Google использует механизм персонализации поисковой выдачи. Если пользователь явно отметил определенный объект (например, место, компанию, веб-страницу) как интересующий его, этот объект получит значительное повышение в ранжировании при последующих релевантных запросах этого пользователя. Уровень повышения зависит от степени интереса, указанной пользователем.

US20150242512A1
2015-08-27

Персонализация
Поведенческие сигналы
SERP

Как Google использует всплески поискового интереса и анализ новостей для обновления Графа Знаний в реальном времени

Google отслеживает аномальный рост запросов о сущностях (людях, компаниях) как индикатор реального события. Система анализирует свежие документы, опубликованные в этот период, извлекая факты в формате Субъект-Глагол-Объект (SVO). Эти факты используются для оперативного обновления Графа Знаний или добавления блока «Недавно» в поисковую выдачу.

US9235653B2
2016-01-12

Knowledge Graph
Свежесть контента
Семантика и интент

Как Google использует контекст пользователя для генерации неявных поисковых запросов и проактивного показа результатов

Система Google отслеживает контекст пользователя в реальном времени (набираемый текст, открытые документы, письма). На основе этого контекста автоматически генерируются множественные неявные запросы. Система объединяет результаты из разных источников (локальных и глобальных) и проактивно показывает их пользователю, используя поведенческие данные (клики) для улучшения релевантности.

US7664734B2
2010-02-16

Поведенческие сигналы
Персонализация
Семантика и интент

Как Google использует исторические данные о поведении пользователей для сохранения эффективных синонимов

Google постоянно обновляет модели, определяющие синонимы для расширения запросов. Этот патент описывает защитный механизм: если новая модель отключает синоним, который исторически давал хорошие результаты (пользователи были довольны выдачей), система автоматически вернет этот синоним в работу, опираясь на накопленные данные о поведении пользователей.

US8762363B1
2014-06-24

Семантика и интент
Поведенческие сигналы
SERP

Как Google использует контекст пользователя для предоставления информации без явного запроса (Технология предиктивного поиска)

Google использует технологию предиктивного (проактивного) поиска, которая анализирует текущий контекст пользователя (местоположение, время, календарь, скорость движения, привычки) для автоматического предоставления релевантной информации. Система реагирует на «запрос без параметров» (например, открытие приложения или простое действие с устройством) и самостоятельно определяет информационные потребности пользователя.

US8478519B2
2013-07-02

Персонализация
Семантика и интент
Поведенческие сигналы

Как Google рассчитывает тематическую популярность (Topical Authority) документов на основе поведения пользователей

Google использует данные о посещаемости и навигации пользователей для расчета популярности документов. Система классифицирует документы и запросы по темам, а затем вычисляет популярность документа внутри каждой конкретной темы (Per-Topic Popularity). Эта метрика используется как сигнал ранжирования, когда тема запроса пользователя соответствует теме документа.

US8595225B1
2013-11-26

Поведенческие сигналы
Семантика и интент
SERP