Как Google итеративно генерирует запросы из метаданных контента для поиска "Похожих Видео" (на примере YouTube)

ITERATED RELATED ITEM DISCOVERY (Итеративное обнаружение связанных элементов)

US8078632B1
Google LLC
2008-02-15
2011-12-13

Google (в частности, YouTube, упомянутый в патенте) использует итеративный процесс для генерации списков связанного контента. Система анализирует метаданные (заголовок, описание, теги) просматриваемого элемента и создает упорядоченный список ключевых слов. Затем она формирует внутренний поисковый запрос и автоматически уточняет его — сужая добавлением слов или расширяя удалением слов — пока не будет найдено оптимальное количество похожих результатов.

Какую проблему решает

Патент решает проблему автоматического подбора релевантного и оптимального по количеству набора связанного контента (related items) для отображения рядом с основным элементом (например, блок «Похожие видео»). Традиционные методы, основанные на фиксированных ключевых словах из поиска пользователя или на популярности, часто дают неточные результаты. Изобретение предлагает метод динамической генерации оптимального поискового запроса, основанного непосредственно на метаданных самого элемента.

Что запатентовано

Запатентован метод итеративного обнаружения связанного контента (видео, аудио, документы). Система анализирует метаданные (metadata) исходного элемента и создает упорядоченный список слов (ordered list), ранжированный по значимости. На основе этого списка формируется внутренний поисковый запрос. Этот запрос итеративно модифицируется (путем добавления или удаления слов) до тех пор, пока количество полученных результатов не попадет в заданный диапазон (set range).

Как это работает

Механизм работает следующим образом:

Извлечение и Ранжирование: Система анализирует метаданные исходного контента (заголовок, описание, теги) и ранжирует слова, например, по частоте или TF-IDF.
Формирование начального запроса: Выбираются несколько самых высокоранжированных слов.
Выполнение поиска и оценка: Запрос выполняется, и система проверяет количество результатов.
Итеративная корректировка:
- Если результатов слишком много (запрос слишком широкий), система добавляет следующее по рангу слово из списка, чтобы сузить поиск.
- Если результатов слишком мало (запрос слишком узкий), система удаляет слово с самым низким рангом из запроса, чтобы расширить поиск.
Персонализация (Опционально): Ранжирование слов может быть скорректировано на основе истории пользователя (Word Frequency Profile).
Завершение: Процесс повторяется, пока количество результатов не попадет в заданный диапазон (например, 15-30 элементов).

Актуальность для SEO

Средняя. Патент подан в 2008 году. Современные рекомендательные системы в значительной степени перешли на нейросетевые подходы (embeddings) и коллаборативную фильтрацию. Однако описанный метод, основанный на анализе метаданных и итеративном поиске (балансировка Precision/Recall), остается фундаментальным и, вероятно, используется как компонент гибридных систем, особенно для «холодного старта» (новый контент).

Важность для SEO

Влияние на традиционное SEO (веб-поиск) минимальное. Однако патент имеет высокое значение (70/100) для оптимизации на контентных платформах (Video SEO), таких как YouTube (который прямо упоминается в патенте как подходящая реализация). Он демонстрирует конкретный механизм, где оптимизация метаданных (Title, Description, Tags) напрямую влияет на генерацию рекомендаций и «Похожих видео», что является значительным источником трафика на таких платформах.

Термины и определения

Content Item / Video (Элемент контента / Видео): Любой тип медиаконтента (видео, аудио, документ), для которого система генерирует рекомендации.
Iterated Related Item Discovery (Итеративное обнаружение связанных элементов): Процесс автоматического поиска релевантного контента путем последовательного уточнения (добавления или удаления слов) поискового запроса до достижения желаемого результата.
Metadata (Метаданные): Информация, описывающая элемент контента. В контексте патента это Title (Название), Description (Описание) и Tags (Теги).
Ordered List of Words (Упорядоченный список слов): Список слов, извлеченных из метаданных исходного элемента и ранжированных по определенному критерию (например, частоте или TF-IDF).
Set Range / Threshold (Заданный диапазон / Порог): Желаемое количество результатов поиска (например, от 15 до 30 видео), которое система пытается получить в процессе итерации.
TF-IDF (Term Frequency-Inverse Document Frequency): Статистическая мера для оценки важности слова (нормализованная частота). Упоминается как возможный метод ранжирования слов в Ordered list.
Word Frequency Profile (Профиль частотности слов): Данные пользователя, отражающие частоту слов в метаданных контента, который пользователь ранее просматривал или загружал. Используется для персонализации рекомендаций.

Ключевые утверждения (Анализ Claims)

Патент содержит несколько схожих независимых пунктов, описывающих процесс для видео (Claim 1) и обобщенный для элементов контента (Claim 19).

Claim 1 и 19 (Независимые пункты): Описывают основной метод идентификации набора связанных элементов.

Создание упорядоченного списка слов (ordered list) из метаданных первого элемента.
Формирование поискового запроса (search query) с использованием выбранного набора слов из списка.
Обработка запроса для получения результатов поиска.
Если количество связанных элементов НЕ находится в заданном диапазоне (set range), происходит итеративная модификация запроса и его повторная обработка. Модификация включает:
- Если количество элементов превышает диапазон (слишком много): Выборочное добавление как минимум одного слова из ordered list в запрос (сужение поиска).
- Если количество элементов меньше диапазона (слишком мало): Удаление как минимум одного слова из запроса (расширение поиска).
Если количество связанных элементов находится в заданном диапазоне, предоставление этих результатов.

Claim 2 и 20 (Зависимые): Уточняют, что создание упорядоченного списка включает ранжирование слов как функцию частоты (frequency) каждого слова в метаданных. Это может быть сырая частота (raw frequency) или нормализованная (например, TF-IDF).

Claim 3 и 21 (Зависимые): Уточняют, что формирование запроса включает выбор нескольких наиболее высокоранжированных слов (highest ranking words).

Claim 4 и 26 (Зависимые): Вводят механизм персонализации.

Хранение профиля частотности слов (word frequency profile) для пользователя на основе ранее просмотренного им контента.
Пересмотр (revising) упорядоченного списка на основе этого профиля. Это может включать переранжирование слов (Claim 5) или добавление слов из профиля (Claim 6).

Claims 22-25 (Зависимые от 19): Уточняют возможные модификации списка слов с использованием NLP: проверка орфографии (spell checking), стемминг (stemming), добавление синонимов (synonyms), удаление неподходящих слов (inappropriate words).

Где и как применяется

Этот патент не относится напрямую к архитектуре Google Web Search. Он описывает механизм работы системы рекомендаций внутри контентной платформы, такой как YouTube (упомянутой в патенте как Video Hosting Website).

INDEXING – Индексирование (на платформе)
На этом этапе система извлекает и индексирует метаданные (Title, Description, Tags) загружаемого контента. Также обрабатывается история просмотров пользователей для создания и обновления их Word frequency profiles. Могут рассчитываться глобальные метрики (например, IDF для TF-IDF).

RANKING / RETRIEVAL (Генерация рекомендаций)
Это основная область применения патента. Когда пользователь просматривает элемент контента (или когда контент загружается), активируется система генерации рекомендаций (Related Videos Server).

Система использует метаданные просматриваемого видео для генерации Ordered list of words.
(Опционально) Список корректируется с учетом профиля пользователя и NLP-обработки.
Система итеративно генерирует и отправляет внутренние поисковые запросы к поисковому движку платформы (Video Search Server).
Результаты оцениваются на соответствие Set Range. Процесс повторяется до получения оптимального набора.

Входные данные:

Метаданные (Title, Description, Tags) исходного видео.
(Опционально) Word frequency profile пользователя.
Системные настройки Set Range (желаемое количество рекомендаций).

Выходные данные:

Набор связанных элементов контента (список рекомендованных видео).
(Опционально) Оптимальный поисковый запрос, который привел к этому набору.

На что влияет

Типы контента: В первую очередь влияет на видеоконтент на хостинговых платформах. Также применим к аудио, документам и мультимедиа.
Обнаружение контента (Discovery): Влияет на то, как трафик перераспределяется между элементами контента через блоки рекомендаций. Это ключевой механизм для продвижения контента, не связанный с прямым поиском пользователя.
Персонализация: Система адаптирует рекомендации под конкретного пользователя, используя его историю взаимодействий.

Когда применяется

Алгоритм может применяться в двух режимах:

Онлайн (Динамически): В момент запроса пользователя на просмотр видео (dynamically at the time of the request). Это позволяет учитывать персонализацию.
Офлайн (Предварительный расчет): В момент загрузки видео на платформу или периодически (например, еженедельно). Результаты или оптимальный запрос кэшируются в базе данных (Related Videos Database).

Пороговые значения: Ключевым условием является Set Range (например, 15-30 результатов). Алгоритм работает до тех пор, пока это условие не будет выполнено.

Пошаговый алгоритм

Процесс идентификации связанных элементов.

Генерация упорядоченного списка слов: Система сканирует метаданные (название, описание, теги) исходного элемента. Слова извлекаются и ранжируются на основе их частоты или взвешенных мер, таких как TF-IDF.
Модификация списка (Опционально): Список может быть пересмотрен: применяется проверка орфографии, стемминг, добавление синонимов, удаление стоп-слов или нежелательных слов.
Персонализация списка (Опционально): Порядок слов в списке может быть скорректирован на основе Word frequency profile пользователя (его истории просмотров), или в список могут быть добавлены слова из профиля пользователя.
Формирование начального запроса: Система выбирает определенное количество наиболее высокоранжированных слов из списка (например, первые 4 слова) для формирования поискового запроса.
Выполнение поиска: Сформированный запрос отправляется во внутреннюю поисковую систему платформы.
Оценка результатов: Система проверяет, находится ли количество полученных результатов в заданном диапазоне (Threshold/Set Range).
Итеративная корректировка запроса:
- Если НЕТ (слишком много результатов): Поиск слишком широкий. Система модифицирует запрос, добавляя в него следующее по рангу слово из упорядоченного списка (сужение поиска). Переход к шагу 5.
- Если НЕТ (слишком мало результатов): Поиск слишком узкий. Система модифицирует запрос, удаляя из него слово с самым низким рангом (расширение поиска). Переход к шагу 5.
- Если ДА: Переход к шагу 8.
Завершение и Вывод: Когда количество результатов попадает в заданный диапазон, процесс итерации завершается. Полученные результаты предоставляются как набор связанных элементов.

Какие данные и как использует

Данные на входе

Контентные факторы (Метаданные): Критически важные данные. Используются Title (Название), Description (Описание) и Tags (Теги) исходного элемента. Это основа для генерации Ordered list of words.
Пользовательские и Поведенческие факторы: История просмотров и загрузок пользователя. Эти данные агрегируются для создания Word frequency profile, который используется для персонализации (пересмотра Ordered list).

Какие метрики используются и как они считаются

Frequency (Частота): Количество вхождений слова в метаданные. Используется для базового ранжирования слов в Ordered list. Патент упоминает сырую частоту (raw frequency) или нормализованную.
TF-IDF: Упоминается как конкретный метод нормализованной частоты для взвешивания важности слов. Может рассчитываться на уровне всего корпуса (corpus wide) или специфично для пользователя (user-specific).
Set Range / Threshold: Заданный администратором диапазон оптимального количества результатов (например, 15-30). Является условием для завершения итеративного процесса.
Методы анализа текста (NLP): Упоминаются вспомогательные методы обработки списка слов: стемминг (stemming), проверка орфографии (spell checking), добавление синонимов (synonyms) и удаление стоп-слов/нежелательных слов.

Метаданные как основа рекомендаций: Патент четко показывает, что метаданные (Title, Description, Tags) являются основным источником информации для генерации списка связанных элементов в этой системе. Качество метаданных напрямую влияет на то, где контент будет рекомендован.
Важность частоты и уникальности слов (TF-IDF): Система ранжирует слова по важности, используя частотные метрики. Если используется TF-IDF, это подчеркивает важность уникальных и описательных терминов, а не только общих слов.
Итеративный баланс релевантности и полноты (Precision/Recall): Система автоматически ищет баланс. Она стремится использовать максимальное количество ключевых слов для обеспечения релевантности (сужение), но ограничивает их, чтобы гарантировать наличие достаточного количества результатов (расширение).
Встроенная персонализация: Алгоритм учитывает интересы пользователя через Word frequency profile. Это означает, что разные пользователи могут получить разные рекомендации для одного и того же видео, так как система адаптирует внутренний запрос под их историю.
Фокус на Video SEO: Практическая ценность патента сосредоточена на оптимизации контента для платформ типа YouTube, а не для веб-поиска Google.

Best practices (это мы делаем)

Рекомендации применимы для Video SEO (YouTube и аналогичные платформы) для повышения видимости в блоках «Похожие видео».

Тщательная проработка метаданных: Обеспечьте максимальную релевантность и полноту Title, Description и Tags. Они являются топливом для этого алгоритма рекомендаций.
Приоритезация ключевых слов (с учетом TF-IDF): Используйте наиболее важные и специфические (уникальные для темы) ключевые слова в метаданных. Это повысит их ранг в ordered list и гарантирует их использование во внутренних поисковых запросах. Общие термины менее ценны.
Использование точных и специфичных тегов: Включайте теги, которые точно описывают содержание видео. Это поможет системе сформировать более точные запросы для поиска связанного контента.
Оптимизация под целевые рекомендации: Анализируйте метаданные популярных видео в вашей нише, рядом с которыми вы хотите показываться. Используйте схожие термины и структуру метаданных (при условии релевантности вашему контенту), чтобы повысить вероятность того, что система установит связь.
Создание серийного контента с консистентными метаданными: Убедитесь, что метаданные видео внутри одной серии согласованы. Это увеличит вероятность того, что система будет рекомендовать другие видео из этой же серии, так как их Ordered lists будут похожи.

Worst practices (это делать не надо)

Вводящие в заблуждение метаданные (Misleading Metadata) и Кликбейт: Использование нерелевантных, хотя и популярных, ключевых слов в метаданных. Это приведет к генерации неточных внутренних запросов. Ваше видео будет рекомендовано нецелевой аудитории, что ухудшит поведенческие факторы.
Переспам ключевыми словами (Keyword Stuffing): Искусственное завышение частоты ключевых слов может быть контрпродуктивным, если это нарушает правила платформы или если система использует TF-IDF (где переспам может исказить анализ).
Слишком короткие или отсутствующие описания и теги: Предоставление недостаточного количества информации для анализа. Система не сможет сгенерировать качественный Ordered list и будет вынуждена использовать слишком широкие запросы, что приведет к нерелевантным рекомендациям.

Стратегическое значение

Патент подчеркивает стратегическую важность оптимизации под системы рекомендаций (Discovery) на контентных платформах. Трафик из рекомендаций часто превышает трафик из прямого поиска. Понимание того, что метаданные напрямую используются для генерации этих рекомендаций (по крайней мере, в рамках описанной системы), делает оптимизацию Title, Description и Tags ключевым элементом стратегии Video SEO, направленной на увеличение охвата.

Практические примеры

Сценарий: Оптимизация видеообзора нового смартфона для показа рядом с официальным запуском на YouTube.

Анализ цели: Определить целевое видео (официальное видео запуска) и проанализировать его вероятные метаданные (Бренд, Модель, "Официальный запуск", Спецификации).
Оптимизация метаданных своего видео: Включить в заголовок, описание и теги ключевые термины, пересекающиеся с целью (Бренд, Модель), но также добавить уникальные идентификаторы, отражающие суть вашего контента ("Детальный обзор", "Тест камеры").
Ожидаемый механизм работы системы:
- Когда пользователь смотрит официальное видео, система генерирует Ordered List (например: ["Бренд", "Модель", "Запуск", "Официальный"]).
- Система выполняет итеративный поиск по этим терминам.
- Ваше видео имеет высокие шансы попасть в результаты, так как содержит высокочастотные термины ("Бренд", "Модель").
Результат: Ваше видео появляется в списке «Похожие видео» рядом с официальным запуском, получая релевантный трафик.

Описывает ли этот патент алгоритмы ранжирования Google Web Search?

Нет. Этот патент не связан с ранжированием в основном веб-поиске Google. Он описывает конкретный механизм для генерации списка "Связанных элементов" (Related Items) на контентных платформах. В тексте патента YouTube (YOUTUBE™) упоминается в качестве подходящего примера реализации.

Насколько важны Title, Description и Tags согласно этому патенту?

Они критически важны для этого механизма. Эти метаданные являются источником информации для генерации упорядоченного списка слов (Ordered list), из которого затем формируются внутренние поисковые запросы для поиска связанных видео. Качество оптимизации этих полей напрямую влияет на рекомендации.

Как система определяет, какие слова в метаданных важнее других?

Система ранжирует слова на основе их частоты (frequency) в метаданных исходного видео. Также упоминается возможность использования более сложных метрик, таких как TF-IDF, которые оценивают важность слов с учетом их уникальности в рамках всей коллекции контента.

Что такое "итеративное обнаружение" в контексте этого патента?

Это процесс автоматической корректировки поискового запроса. Система не просто выполняет один запрос, а итеративно (пошагово) изменяет его: добавляет слова, если результатов слишком много (сужает поиск), или убирает слова, если результатов слишком мало (расширяет поиск). Это продолжается до тех пор, пока не будет найдено оптимальное количество рекомендаций (Set Range).

Учитывает ли этот алгоритм персонализацию и историю пользователя?

Да, патент описывает механизм персонализации. Система использует "Профиль частотности слов" (Word frequency profile) пользователя, основанный на ранее просмотренном им контенте. Этот профиль используется для пересмотра упорядоченного списка слов, что позволяет адаптировать рекомендации под интересы конкретного пользователя.

Как SEO-специалист может использовать эту информацию для оптимизации видео на YouTube?

Необходимо сосредоточиться на точной и полной оптимизации метаданных. Важно использовать уникальные и релевантные ключевые слова (учитывая TF-IDF) и обеспечивать их естественную частоту. Также полезно анализировать метаданные популярных видео в нише и использовать схожие термины, чтобы "присоединиться" к их рекомендациям.

Актуален ли этот патент, учитывая современные нейросетевые подходы к рекомендациям (Embeddings)?

Хотя современные системы в значительной степени полагаются на нейронные сети и векторные представления (embeddings), базовые принципы использования метаданных остаются важными. Описанный механизм может использоваться как часть гибридной системы, для обработки "холодного старта" (новые видео или пользователи) или как резервный вариант.

Что произойдет, если у видео очень короткое описание и нет тегов?

Системе будет сложнее сгенерировать качественный упорядоченный список слов. Вероятно, она будет опираться только на слова из названия. Это может привести к генерации слишком широких поисковых запросов и, как следствие, к менее релевантным рекомендациям, отображаемым рядом с этим видео.

Использует ли система NLP для анализа метаданных?

Да. Патент упоминает, что сгенерированный упорядоченный список слов может быть модифицирован с использованием таких методов, как проверка орфографии (spell checking), стемминг (stemming), включение синонимов и удаление стоп-слов или нежелательных слов. Это стандартные этапы NLP-обработки текста.

Происходит ли расчет связанных видео в реальном времени?

Патент допускает оба варианта. Расчет может происходить динамически в момент запроса страницы пользователем. Также система может рассчитать оптимальный поисковый запрос или сам набор связанных видео заранее (например, при загрузке видео) и сохранить его в базе данных для ускорения отдачи.

Как Google создает видео-нарезки (Composite Videos) на лету, используя текстовый запрос и анализ аудиодорожек

Google может анализировать аудиодорожки (транскрипты) видео для идентификации конкретных сегментов, где произносятся слова из запроса пользователя. Система автоматически объединяет эти сегменты из разных видео в одно новое сводное видео (Composite Video). Для выбора сегментов используются метрики релевантности, популярности и свежести исходного контента.

US9672280B2
2017-06-06

Мультимедиа
Индексация
Семантика и интент

Как Google использует визуальное сходство для связывания изображений и видео, кластеризации выдачи и обогащения метаданных

Google анализирует визуальное содержимое изображений и ключевых кадров видео для выявления сходств. Это позволяет связывать разнотипный контент, даже если у него мало текстовых данных. Система использует эти связи для переноса метаданных (например, ключевых слов или геопозиции) от одного ресурса к другому, а также для кластеризации и смешивания изображений и видео в результатах поиска.

US9652462B2
2017-05-16

Мультимедиа
SERP
Семантика и интент

Как Google генерирует связанные запросы (Related Searches), используя сущности из топовых результатов и сохраняя структуру исходного запроса

Google использует систему для автоматической генерации уточнений запросов (например, «Связанные запросы»). Система анализирует топовые документы в выдаче и извлекает из них ключевые сущности. Затем эти сущности комбинируются с важными терминами исходного запроса, при этом строго сохраняется исходный порядок слов, чтобы создать релевантные и естественно звучащие предложения для дальнейшего поиска.

US8392443B1
2013-03-05

Семантика и интент
Поведенческие сигналы

Как Google сегментирует сложные запросы на смысловые компоненты для генерации поисковых подсказок и связанных запросов

Google использует механизм для генерации уточнений запроса (поисковых подсказок или связанных запросов) путем разделения исходного запроса на семантические компоненты (устойчивые фразы) с помощью вероятностного анализа. Система находит уточнения для каждого компонента по отдельности, а затем рекомбинирует их, сохраняя исходный порядок. Финальные кандидаты строго фильтруются на основе пользовательских данных (CTR) и синтаксической схожести.

US9703871B1
2017-07-11

Семантика и интент
SERP
Поведенческие сигналы

Как Google ранжирует и рекомендует источники контента (каналы, профили) на основе внутренних ссылок, аннотаций и кликов по ним

Google использует механизм для ранжирования и рекомендации источников контента (например, YouTube-каналов или профилей) внутри платформ. Система анализирует, как часто источник упоминается в аннотациях, описаниях и комментариях к контенту, который просматривал пользователь. Ключевым фактором ранжирования является не только количество упоминаний, но и общее число кликов (активаций) по этим ссылкам.

US9235625B2
2016-01-12

Ссылки
Поведенческие сигналы
Мультимедиа

Как Google собирает и структурирует данные о поведении пользователей в Поиске по картинкам (включая ховеры, клики и 2D-позицию)

Патент Google описывает инфраструктуру для детального сбора данных в Поиске по картинкам. Система фильтрует общие логи, фиксируя не только клики, но и наведение курсора (ховеры), длительность взаимодействия и точное 2D-расположение (строка/столбец) изображения на выдаче. Эти данные агрегируются в Модель Запросов Изображений для оценки релевантности.

US8898150B1
2014-11-25

Поведенческие сигналы
SERP
Мультимедиа

Как Google использует исторические паттерны CTR для предсказания сезонных и циклических изменений интента пользователя

Google анализирует исторические данные о кликах (CTR) для выявления предсказуемых изменений в интересах пользователей по неоднозначным запросам. Если интент меняется в зависимости от сезона, дня недели или времени суток, система корректирует ранжирование, чтобы соответствовать доминирующему в данный момент интенту. Например, по запросу "turkey" в ноябре приоритет получат рецепты, а не информация о стране.

US8909655B1
2014-12-09

Семантика и интент
Поведенческие сигналы
SERP

Как Google рассчитывает тематический авторитет сайта для кастомизации поиска с помощью Topic-Sensitive PageRank

Патент Google, описывающий механизм кастомизации результатов поиска, инициированного со стороннего сайта (например, Google Custom Search). Система использует «профиль сайта» для повышения результатов, соответствующих его тематике. Ключевая ценность патента — детальное описание расчета тематической авторитетности (Topic Boosts) путем анализа ссылок с эталонных сайтов (Start Sites), что является реализацией Topic-Sensitive PageRank.

US7565630B1
2009-07-21

Персонализация
SERP
Ссылки

Как Google использует личные данные пользователя (User Model) для понимания его намерений и персонализации выдачи

Google создает персональную модель пользователя (User Model) на основе его личного контента (письма, контакты, документы). Эта модель используется для определения неявного намерения пользователя (личный поиск или общий) и для аннотирования запроса контекстом из личных данных, чтобы предоставить точные персонализированные результаты.

US20150012558A1
2015-01-08

Персонализация
Семантика и интент
Поведенческие сигналы

Как Google комбинирует поведенческие сигналы из разных поисковых систем для улучшения ранжирования

Google использует механизм для улучшения ранжирования путем объединения данных о поведении пользователей (клики и время взаимодействия) из разных поисковых систем (например, Веб-поиск и Поиск по Видео). Если в основной системе данных недостаточно, система заимствует данные из другой, применяя весовой коэффициент и фактор сглаживания для контроля смещения и обеспечения релевантности.

US8832083B1
2014-09-09

Поведенческие сигналы
SERP

Как Google использует обучение с подкреплением (Reinforcement Learning) для оптимизации ранжирования и переписывания запросов на основе успешности поисковых сессий

Google использует систему Reinforcement Learning для динамической адаптации поисковых процессов. Система анализирует поисковые сессии (последовательности запросов и кликов) и учится оптимизировать выдачу, чтобы пользователь быстрее находил нужный результат. Это достигается путем корректировки весов факторов ранжирования, переписывания запросов или даже обновления индекса на лету для конкретных ситуаций.

US11157488B2
2021-10-26

Индексация
Поведенческие сигналы
Семантика и интент

Как Google использует ссылки, которыми делятся в почте, блогах и мессенджерах, как сигнал для корректировки ранжирования

Google запатентовал механизм (User Distributed Search), который учитывает, как пользователи делятся ссылками в коммуникациях (почта, блоги, мессенджеры). Если автор включает ссылку в сообщение, это дает ей первоначальную модификацию в ранжировании. Если получатели переходят по этой ссылке, её Ranking Score увеличивается ещё больше. Оба сигнала используются для влияния на позиции документа в будущей выдаче.

US8862572B2
2014-10-14

Поведенческие сигналы
Ссылки

US9235625B2
2016-01-12

Ссылки
Поведенческие сигналы
Мультимедиа

Как Google использует анализ аномалий в показах и кликах для выявления фейковых локальных бизнес-листингов (Map Spam)

Google анализирует статистику взаимодействий (кликов) для групп связанных бизнес-листингов (Common Business). Система вычисляет статистически нормальный уровень активности и устанавливает порог (Anomaly Detection Threshold). Резкий всплеск активности выше этого порога (например, на два стандартных отклонения) сигнализирует о наличии фейковых или спамных листингов, созданных для манипуляции локальной выдачей.

US20150154610A1
2015-06-04

Local SEO
Антиспам
Поведенческие сигналы

Как Google генерирует блок "Похожие вопросы" (People Also Ask) на основе анализа кликов и поведения пользователей

Google анализирует топовые результаты по исходному запросу и определяет "Тематические запросы" (Topic Sets) — прошлые запросы, по которым пользователи кликали на эти результаты. Затем система ищет популярные вопросы, соответствующие этим темам, фильтрует дубликаты на основе общности кликов и показывает их в блоке PAA для дальнейшего исследования темы.

US9213748B1
2015-12-15

SERP
Семантика и интент
Поведенческие сигналы