SEO HARDCORE
  • Разборы патентов
    • Патенты Google
  • Скоро SEO инструменты
  • Скоро SEO аналитика
  • seohardcore
SEO HARDCORE
назад

Как Google использует контент, который вы смотрите (например, на ТВ), для автоматического переписывания и персонализации ваших поисковых запросов

USING CONTENT IDENTIFICATION AS CONTEXT FOR SEARCH (Использование идентификации контента в качестве контекста для поиска)
  • US9244977B2
  • Google LLC
  • 2012-12-31
  • 2016-01-26
  • Персонализация
  • Семантика и интент
  • Поведенческие сигналы
  • Мультимедиа
  • Описание
  • Разбор
  • Выводы
  • Практика
  • FAQ
  • Похожие

Google может анализировать контент (фильмы, шоу, аудио), который пользователь потребляет на одном устройстве (например, ТВ), и использовать эту информацию как контекст для уточнения последующих поисковых запросов. Система распознает аудиовизуальный контекст и автоматически дополняет неоднозначные запросы пользователя, чтобы предоставить более релевантные результаты, в том числе на связанных устройствах (например, смартфоне).

Описание

Какую проблему решает

Патент решает проблему неоднозначности (ambiguity) поисковых запросов и повышения релевантности выдачи за счет использования непосредственного контекста активности пользователя. Когда пользователь ищет информацию во время или сразу после потребления медиаконтента (например, просмотра фильма), его запросы часто бывают короткими или общими. Цель изобретения — автоматически уточнить интент пользователя, используя информацию о том, что он только что видел или слышал.

Что запатентовано

Запатентована система, которая связывает потребление медиаконтента с поисковой активностью. Система анализирует контент, воспроизводимый на устройстве (например, ТВ), идентифицирует Contextual Information (объекты, актеры, темы) в реальном времени и создает Content Identifier Timestamp. Эта метка затем используется для автоматического дополнения (augmentation) и устранения неоднозначности последующих поисковых запросов пользователя, в том числе в кросс-девайсных сценариях.

Как это работает

Система работает следующим образом:

  • Мониторинг Контента: Search Management Component анализирует контент, воспроизводимый на коммуникационном устройстве.
  • Извлечение Контекста: Используя распознавание образов (pattern recognition) и аудио (audio recognition), а также метаданные, система идентифицирует контекстуальную информацию в определенный момент времени.
  • Генерация Метки: Создается Content Identifier Timestamp, связывающий контекст и время.
  • Получение Запроса: Пользователь вводит запрос на том же или сопряженном (paired) устройстве.
  • Аугментация Запроса: Система анализирует запрос в свете недавнего контекста. Если контекст релевантен, исходный запрос дополняется (например, идентификатором контента), создавая Augmented Search Query.
  • Кастомизация Выдачи: Поисковая система обрабатывает дополненный запрос, предоставляя персонализированные результаты.

Актуальность для SEO

Высокая. В условиях развития экосистем связанных устройств (Smart TV, Google Assistant, смартфоны) и мультимодального поиска, понимание контекста пользователя в реальном времени является стратегическим направлением. Этот патент описывает фундаментальный механизм для связи пассивного потребления медиа с активным поиском (Ambient Computing).

Важность для SEO

Патент имеет значительное влияние (7/10) на стратегию, хотя и не описывает алгоритмы ранжирования. Он демонстрирует, как Google динамически переписывает запросы на этапе Query Understanding на основе недавней активности пользователя. Для Senior SEO это критически важно: это подчеркивает переход от оптимизации под ключевые слова к оптимизации под сущности (Entities) и контексты, так как интент пользователя может быть автоматически и неявно уточнен системой.

Детальный разбор

Термины и определения

Augmented Search Query (Дополненный/Аугментированный поисковый запрос)
Исходный запрос пользователя, модифицированный системой путем добавления Contextual Information для повышения точности или устранения неоднозначности.
Audio Recognizer Component / Pattern Recognizer Component
Подсистемы Search Management Component, использующие техники распознавания аудио и образов соответственно, для идентификации информации (объектов, диалогов, сцен) в представленном контенте.
Content Identifier Timestamp (Метка идентификатора контента)
Структура данных, которая связывает идентифицированную контекстуальную информацию с конкретным моментом времени в потоке контента. Используется для корреляции контента с последующей активностью пользователя.
Contextual Information (Контекстуальная информация)
Данные, извлеченные из потребляемого контента. Могут включать идентификаторы сущностей (актеры, объекты, продукты, названия шоу), темы, сцены, диалоги, метаданные, субтитры.
Pairing (Сопряжение устройств)
Процесс установления связи между двумя устройствами (например, ТВ и смартфоном) для обмена контекстом. Может быть прямым (через протокол или общий аккаунт) или косвенным (на основе близости).
Search Management Component (Компонент управления поиском)
Основной модуль, отвечающий за идентификацию контента, извлечение контекста и аугментацию запросов.

Ключевые утверждения (Анализ Claims)

Claim 1 (Независимый пункт): Описывает систему для контекстуализации поиска на основе потребления ТВ-контента, включая кросс-девайсное применение.

  1. Система идентифицирует ТВ-контент (television-related content) в первый момент времени.
  2. Идентифицируется Contextual Information, включающая термины, указывающие на идентификатор (identifier) этого контента.
  3. Генерируется Content Identifier Timestamp, который связывает контекст с активностью пользователя на первом или втором устройстве.
  4. Во второй момент времени система получает поисковый запрос.
  5. Определяется, связаны ли термины контекста с терминами запроса.
  6. Контекст передается на второе устройство, которое генерирует модифицированный запрос.
  7. Модификация происходит путем добавления (appending) терминов контекстной информации (в частности, идентификатора контента) к запросу, если связь установлена.
  8. Система инициирует предоставление результатов поиска по модифицированному запросу.

Claim 9 (Независимый пункт): Описывает метод, аналогичный Claim 1, с явным акцентом на процесс сопряжения (pairing) устройств для передачи контекста.

  1. Идентификация контента, контекста и генерация Content Identifier Timestamp.
  2. Получение запроса и определение его связи с контекстом.
  3. Выполняется сопряжение (pairing) первого устройства со вторым.
  4. Контекст передается на второе устройство.
  5. Если связь установлена, запрос на втором устройстве модифицируется путем добавления контекста.
  6. Модифицированный запрос передается (например, в поисковую систему).

Claim 16 (Независимый пункт): Описывает систему со стороны поисковой машины (search engine), которая обрабатывает запрос, уже модифицированный на основе контекста ТВ-контента, идентифицированного на коммуникационном устройстве.

Где и как применяется

Изобретение применяется преимущественно на этапе понимания запроса для его обогащения контекстом реального времени.

QUNDERSTANDING – Понимание Запросов
Это основная область применения. Система работает как препроцессор запросов, который использует информацию о текущей или недавней активности пользователя (потреблении медиаконтента) для контекстуализации, устранения неоднозначности (Disambiguation) и дополнения (Augmentation) запроса. Это механизм переписывания запроса (Query Rewriting), который происходит до этапа ранжирования.

RERANKING – Переранжирование (Персонализация)
Использование непосредственного контекста является формой гипер-персонализации. Аугментированный запрос приводит к формированию кастомизированной выдачи (customized search results). Патент также упоминает, что контекст может использоваться для promotion (повышения) одних результатов над другими.

INDEXING – Индексирование и извлечение признаков
Косвенное взаимодействие. Для эффективной работы система полагается на базовые индексы и Граф Знаний, чтобы распознавать сущности (актеров, фильмы, объекты) внутри медиапотока.

Входные данные:

  • Аудиовизуальный поток или метаданные потребляемого контента.
  • Информация о времени просмотра.
  • Исходный поисковый запрос пользователя.
  • Данные о сопряжении устройств (pairing).
  • Опционально: История просмотра (historical content viewing history), история поиска (search history), местоположение.

Выходные данные:

  • Content Identifier Timestamp (внутренние данные).
  • Augmented Search Query (передается в поисковую систему).

На что влияет

  • Специфические запросы: Наибольшее влияние на неоднозначные (ambiguous) запросы, интерпретация которых зависит от контекста (например, [Ягуар], [Дом], [Аватар]). Также влияет на запросы о сущностях, присутствующих в просматриваемом контенте.
  • Конкретные ниши или тематики: Медиа, развлечения, спорт, электронная коммерция (товары, показанные в фильмах, рекламе или обзорах).
  • Кросс-девайсное взаимодействие: Влияет на сценарии, когда пользователь смотрит контент на одном устройстве (ТВ), а ищет на другом (смартфон).

Когда применяется

  • Условия работы: Алгоритм активируется, когда пользователь потребляет идентифицируемый медиаконтент на устройстве, способном извлекать контекст.
  • Триггеры активации: Ввод пользователем поискового запроса во время или вскоре после сессии потребления контента.
  • Условие применения аугментации: Система должна определить наличие релевантной связи между извлеченной Contextual Information и терминами введенного запроса.
  • Временные рамки: Применяется в реальном времени. Патент упоминает возможность фильтрации истории за определенный недавний период (defined recent time period, например, 24 часа), чтобы контекст оставался актуальным.

Пошаговый алгоритм

Процесс А: Извлечение контекста (Фоновый режим / Реальное время)

  1. Идентификация контента: В заданный момент времени система идентифицирует секцию контента, представляемую на устройстве.
  2. Анализ контента: Секция анализируется с использованием Pattern Recognizer Component (для видео) и Audio Recognizer Component (для аудио), а также анализируются метаданные и субтитры.
  3. Извлечение контекста: Идентифицируются элементы Contextual Information (сущности, объекты, темы, идентификатор контента).
  4. Генерация метки времени: Создается Content Identifier Timestamp, фиксирующий контекст и момент времени.
  5. Хранение и передача: Метка сохраняется и может быть передана на сопряженные устройства.

Процесс Б: Обработка и аугментация запроса (Реальное время)

  1. Получение запроса: Система получает поисковый запрос от пользователя.
  2. Анализ запроса: Идентифицируются поисковые термины.
  3. Сопоставление контекста: Система определяет, связаны ли элементы контекста из недавних Content Identifier Timestamps с терминами запроса.
  4. Аугментация запроса: Если релевантная связь найдена, система генерирует Augmented Search Query, добавляя (appending) к исходному запросу контекстуальную информацию.
  5. Выполнение поиска: Аугментированный запрос передается в поисковую систему для выполнения и генерации кастомизированных результатов.

Какие данные и как использует

Данные на входе

Система использует данные, получаемые непосредственно из потребляемого контента и активности пользователя.

  • Мультимедиа факторы: Видео- и аудиопотоки контента. Анализируются для распознавания объектов, сцен, лиц, диалогов и музыки.
  • Контентные факторы (Медиа): Текстовая информация: метаданные (названия, описания из TV-листингов) и скрытые субтитры (closed-caption information).
  • Пользовательские факторы:
    • Текущая активность: Факт просмотра контента в определенное время.
    • История: Historical content viewing history и Search history могут использоваться как дополнительный контекст.
    • Профиль: Интересы пользователя (User interests).
    • Устройство: Статус сопряжения устройств (Pairing).
  • Географические факторы: Местоположение (geographical location) устройства упоминается как возможный дополнительный контекст.

Какие метрики используются и как они считаются

  • Методы анализа Мультимедиа: Применяются Pattern recognition techniques для анализа визуальной информации и Voice recognition techniques для анализа аудио информации.
  • Определение релевантности контекста: Используются метрики (детали не раскрыты) для определения степени связи между терминами исходного запроса и Contextual Information. Это ключевой шаг для принятия решения об аугментации.
  • Фильтрация по времени: Используется filter component для ограничения анализа истории определенным недавним временным периодом (defined recent time period), чтобы контекст оставался актуальным.

Выводы

  1. Мгновенный контекст как главный сигнал интента: Патент демонстрирует, что Google может рассматривать текущую активность пользователя (потребление медиа) как доминирующий сигнал для интерпретации его поискового намерения, переопределяя другие возможные значения запроса.
  2. Автоматическое устранение неоднозначности (Disambiguation): Основная функция системы — разрешение неоднозначности запросов в реальном времени. Система проактивно уточняет интент, основываясь на контексте просмотра/прослушивания.
  3. Переписывание запросов (Query Rewriting) как ключевой механизм: Система не меняет ранжирование, а изменяет сам запрос (Augmentation). Ключевым техническим решением, защищенным в Claims, является добавление идентификаторов контента к исходному запросу.
  4. Кросс-девайсный контекст (Cross-Device Context): Подчеркивается важность экосистемы. Сопряжение (pairing) позволяет переносить контекст с одного устройства (ТВ) на другое (смартфон), обеспечивая бесшовный поисковый опыт.
  5. Зависимость от распознавания сущностей в медиа: Эффективность механизма напрямую зависит от способности Google точно распознавать сущности (объекты, людей, темы) внутри аудиовизуального контента с помощью технологий распознавания образов и аудио.

Практика

Best practices (это мы делаем)

  • Фокус на оптимизации сущностей (Entity Optimization): Поскольку система распознает сущности в медиа и использует их для уточнения запросов, критически важно, чтобы ваши бренды, продукты, ключевые лица были четко определены в Графе Знаний и на вашем сайте (используя Schema.org). Это поможет системе корректно идентифицировать вашу сущность в любом контексте.
  • Усиление связи Сущностей и Контекстов: Убедитесь, что ваши сущности имеют сильные семантические связи с релевантными контекстами. Если вы продвигаете бренд "Ягуар" (автомобиль), он должен быть четко отделен от сущности "Ягуар" (животное), чтобы системы disambiguation работали в вашу пользу.
  • Синергия Видео и Веб-контента: Развивайте стратегию, связывающую ваш видеоконтент с веб-страницами. Просмотр вашего видео может стать контекстом для последующего веб-поиска. Для создателей медиаконтента критично предоставлять полные метаданные и субтитры для облегчения распознавания контента системами Google.
  • Интеграция SEO и медиа-стратегии (Product Placement): Координируйте SEO-активности с медийными кампаниями (ТВ-реклама, продакт-плейсмент). Готовьте контент, оптимизированный под сущности, которые появятся в медиа, чтобы захватить трафик по аугментированным запросам.

Worst practices (это делать не надо)

  • Ставка на ранжирование по неоднозначным Head Terms: Попытки занять топ по высокочастотным, но неоднозначным ключевым словам становятся менее эффективными. Система будет динамически уточнять такие запросы на основе индивидуальной активности пользователя, уводя трафик на ресурсы, соответствующие этому уточненному контексту.
  • Игнорирование Персонализации и Контекста: Оценка позиций только по "чистым" запросам в режиме инкогнито становится менее показательной. Реальная выдача сильно зависит от немедленного контекста пользователя, формируемого его медиапотреблением.
  • Создание Неоднозначных Брендов: Запуск бренда с общим названием без создания сильных семантических связей рискован. Системы могут ошибочно интерпретировать запросы о нем на основе случайного медиаконтекста пользователя.

Стратегическое значение

Патент подтверждает стратегию Google по переходу к гипер-контекстуальному и проактивному поиску (Ambient Computing). Поиск рассматривается не как изолированное событие, а как часть непрерывного информационного потока пользователя на разных устройствах. Долгосрочная SEO-стратегия должна фокусироваться на построении сильных, однозначных сущностей и учитывать полный путь пользователя (user journey), включая его взаимодействие с медиаконтентом.

Практические примеры

Сценарий 1: Уточнение неоднозначного запроса (Disambiguation)

  1. Контекст: Пользователь смотрит сериал "House" (Доктор Хаус). Система генерирует Content Identifier Timestamp с контекстом: ["TV show", "House", "Hugh Laurie", "drama"].
  2. Запрос пользователя: Пользователь вводит на сопряженном устройстве запрос [house show].
  3. Действие системы: Система определяет связь и генерирует Augmented Search Query: "house Hugh Laurie TV show drama" (пример из патента).
  4. Результат: Пользователь получает выдачу о сериале, а не о шоу про недвижимость.

Сценарий 2: Поиск по названию фильма (Entity Search)

  1. Контекст: Пользователь смотрит фильм "The Enforcer". Система идентифицирует объект и контекст: ["Movie", "The Enforcer", "Clint Eastwood", ".44 Magnum" (оружие)].
  2. Запрос пользователя: Пользователь вводит запрос [enforcer].
  3. Действие системы: Система дополняет запрос до: "enforcer Clint Eastwood 'Dirty Harry' movie" (пример из патента).
  4. Результат: Пользователь получает выдачу о фильме, а не о других значениях слова "enforcer".

Вопросы и ответы

Как именно система определяет, какой контент смотрит пользователь?

Система использует несколько методов. Она может получать метаданные и субтитры напрямую от источника контента (например, стримингового приложения или ТВ-приставки). Кроме того, она активно анализирует сам контент с помощью распознавания образов (Pattern Recognition) для идентификации визуальных элементов и распознавания аудио (Audio Recognition) для анализа диалогов или музыки.

Влияет ли этот патент на традиционное SEO и алгоритмы ранжирования?

Прямого влияния на факторы ранжирования нет. Однако он критически влияет на этап Понимания Запроса (Query Understanding). Система изменяет то, что пользователь ищет, до того, как запрос попадает в систему ранжирования. Это означает, что важность оптимизации под конкретный неоднозначный термин снижается, а важность соответствия конечному, уточненному интенту пользователя (сущности или теме) возрастает.

Что такое Content Identifier Timestamp и как долго он актуален?

Это метка, которая связывает извлеченный контекст (например, актер, объект в кадре, тема) с конкретным моментом времени просмотра. Патент подразумевает, что он используется для влияния на непосредственные или недавние поисковые запросы. Также упоминается возможность фильтрации контекста по "определенному недавнему периоду времени" (например, 24 часа).

Как работает кросс-девайсная функциональность (Pairing)?

Она основана на механизме сопряжения (pairing). Устройства могут быть связаны через общий аккаунт пользователя, через специальный протокол или даже косвенно (на основе близости). Если устройства связаны, контекст с одного устройства (например, ТВ) может быть передан на второе (например, телефон) и использован для аугментации поиска на нем.

Может ли система использовать историю просмотров как контекст?

Да, патент явно упоминает возможность использования истории просмотра контента (historical content viewing history) и истории поиска (search history) из профиля пользователя в качестве дополнительной контекстуальной информации для аугментации запроса.

Как этот патент связан с оптимизацией под Сущности (Entity Optimization)?

Связь тесная. Система должна распознать сущности в медиаконтенте, чтобы использовать их как контекст. Если ваш бренд или продукт является четко определенной сущностью в Графе Знаний, системе будет проще как распознать его в медиа, так и найти ваш сайт, когда запрос будет аугментирован этой сущностью.

Влияет ли это только на поиск, связанный с фильмами и ТВ?

Хотя акцент сделан на ТВ-контенте (television-related content), механизмы применимы к любому идентифицируемому медиаконтенту, включая видеоигры, музыку и онлайн-видео (например, YouTube). Контекстом может быть любой распознаваемый элемент: продукт (Product Placement), место, песня, игра и т.д.

Как SEO-специалисту реагировать на этот механизм?

Необходимо сместить фокус с ранжирования по общим неоднозначным запросам на обеспечение максимальной релевантности по уточненным запросам, связанным с конкретными сущностями или темами. Также важно усиливать связь между вашим видеоконтентом и веб-страницами.

Насколько агрессивно система переписывает запрос?

Судя по примерам в патенте (например, изменение "house show" на "house Hugh Laurie TV show drama"), переписывание может быть достаточно агрессивным. Система может существенно модифицировать запрос, чтобы максимально точно отразить интент пользователя, основанный на контексте просмотра.

Что произойдет, если система не сможет распознать контент?

Если система не может идентифицировать контент или извлечь релевантную контекстуальную информацию, Content Identifier Timestamp не будет создан или не будет содержать полезных данных. В этом случае аугментация запроса не произойдет, и будет выполнен стандартный поиск по исходному запросу пользователя.

Похожие патенты

Как Google использует аудиовизуальный контекст (то, что пользователь смотрит в данный момент) для уточнения поисковых запросов
Google использует технологию для понимания запросов о медиаконтенте, который воспроизводится в данный момент (например, "Кто этот актер?"). Система идентифицирует программу и точный момент с помощью аудио/видео отпечатков, определяет, какие сущности (актеры, объекты) сейчас на экране, и использует эту информацию как контекст для точного ответа на запрос пользователя.
  • US10002191B2
  • 2018-06-19
  • Мультимедиа

  • Семантика и интент

Как Google использует контекст просмотра ТВ для модификации поисковых запросов в реальном времени
Google анализирует время, местоположение и содержание поискового запроса пользователя, сопоставляя их с данными о телепрограммах, транслируемых в данный момент. Если система предполагает, что запрос связан с просматриваемой передачей, она автоматически дополняет исходный запрос терминами из этой передачи для предоставления более релевантных результатов.
  • US8839303B2
  • 2014-09-16
  • Семантика и интент

  • Персонализация

  • SERP

Как Google автоматически понимает контекст запросов, заданных во время просмотра видео, используя временные метки и анализ N-грамм
Google использует систему для автоматического уточнения запросов, заданных во время просмотра мультимедиа (например, «Кто это?»). Система определяет сущности (людей, объекты), присутствующие на экране в момент запроса, используя временные метки и анализ истории поисковых запросов (N-грамм). Затем она переписывает запрос, добавляя релевантный контекст, чтобы предоставить точный ответ без прерывания просмотра.
  • US9852188B2
  • 2017-12-26
  • Мультимедиа

  • Семантика и интент

  • SERP

Как Google использует real-time анализ текста, аудио и изображений для автоматической генерации запросов и проактивного поиска
Система Google для анализа информации, захваченной из различных источников (вводимый текст, изображения документов, аудиопотоки) в реальном времени. Система автоматически распознает контент, выделяет ключевые фрагменты, формирует поисковые запросы и мгновенно предоставляет пользователю релевантный цифровой контент или связанные действия без явных запросов. Это механизм, лежащий в основе технологий визуального (Lens) и голосового поиска.
  • US8990235B2
  • 2015-03-24
  • Семантика и интент

  • Персонализация

  • Мультимедиа

Как Google использует историю медиапотребления и фоновый звук для персонализации поисковых подсказок (Autocomplete)
Google может анализировать историю потребления медиаконтента пользователем (музыка, фильмы) и захватывать фоновый звук (например, играющую музыку) в момент ввода запроса. На основе распознанных сущностей (артисты, названия) система персонализирует поисковые подсказки (Autocomplete), предлагая запросы, связанные с недавно потребленным или текущим контентом.
  • US9984075B2
  • 2018-05-29
  • Персонализация

  • Поведенческие сигналы

  • Семантика и интент

Популярные патенты

Как Google использует данные о посещаемости, уникальных пользователях и длине URL для ранжирования документов
Фундаментальный патент Google, описывающий использование поведенческих факторов в ранжировании. Система рассчитывает Usage Score на основе частоты посещений и количества уникальных пользователей, фильтруя ботов и взвешивая данные по географии. Этот балл комбинируется с текстовой релевантностью (IR Score) и длиной URL (Path Length Score) для определения итоговой позиции документа.
  • US8001118B2
  • 2011-08-16
  • Поведенческие сигналы

  • SERP

Как Google динамически меняет формулы ранжирования, адаптируя веса факторов под контекст запроса и пользователя
Google не использует единую модель ранжирования. Система использует машинное обучение для создания множества специализированных моделей (Predicted Performance Functions), обученных на исторических данных о кликах для разных контекстов (Search Contexts). При получении запроса система определяет контекст (тип запроса, язык, локация пользователя) и применяет ту модель, которая лучше всего предсказывает CTR в этой ситуации, динамически изменяя значимость различных сигналов ранжирования.
  • US8645390B1
  • 2014-02-04
  • Персонализация

  • Поведенческие сигналы

  • SERP

Как Google использует паттерны просмотра пользователей (co-visitation) для определения связанности документов и улучшения поиска
Google использует систему для определения того, насколько тесно связаны два документа, основываясь на агрегированных данных о поведении пользователей. Система рассчитывает вероятность того, что пользователь просмотрит Документ B в течение определенного времени после того, как Документ А был показан ему в результатах поиска. Эти данные используются для персонализации выдачи, предложения рекомендаций и улучшения релевантности на основе контекста сессии пользователя.
  • US8447760B1
  • 2013-05-21
  • Поведенческие сигналы

  • Персонализация

  • Семантика и интент

Как Google использует исторические данные о кликах (CTR) по категориям для определения доминирующего интента неоднозначных запросов
Google анализирует, на какие категории результатов пользователи кликали чаще всего в прошлом (CTR) по неоднозначному запросу (например, "Pool"). Система определяет доминирующие интенты, выявляя резкие перепады в CTR между категориями или используя иерархию категорий, и повышает в ранжировании результаты, соответствующие наиболее популярным интерпретациям.
  • US8738612B1
  • 2014-05-27
  • Семантика и интент

  • Поведенческие сигналы

  • SERP

Как Google использует социальные связи для выявления предвзятых ссылок и борьбы со ссылочными схемами и кликфродом
Google анализирует взаимоотношения между администраторами веб-сайтов (используя данные социальных сетей), чтобы определить независимость ссылок или кликов по рекламе. Если обнаружена тесная связь, это интерпретируется как предвзятость (Bias). В результате вес ссылки для ранжирования может быть снижен (борьба с Search Spamming), или клик по рекламе может быть дисконтирован (борьба с Ad Spamming).
  • US10402457B1
  • 2019-09-03
  • Ссылки

  • Антиспам

  • Краулинг

Как Google ранжирует сущности (книги, фильмы, людей), анализируя тематичность и авторитетность их упоминаний в вебе
Google использует механизм для оценки значимости конкретных сущностей (например, изданий книг или фильмов). Система анализирует, как эти сущности упоминаются на релевантных веб-страницах, учитывая уверенность распознавания (Confidence) и то, насколько страница посвящена именно этой сущности (Topicality). Эти сигналы агрегируются с учетом авторитетности и релевантности страниц для расчета итоговой оценки сущности, которая затем корректирует ее ранжирование в поиске.
  • US20150161127A1
  • 2015-06-11
  • Семантика и интент

  • EEAT и качество

  • SERP

Как Google персонализирует сниппеты и заголовки в выдаче на основе истории поиска и интересов пользователя
Google может динамически изменять сниппеты и заголовки (Title) результатов поиска, чтобы выделить ту часть контента на странице, которая соответствует известным интересам пользователя (история поиска, демография, недавний контекст). Это позволяет сделать представление выдачи более персонализированным, не обязательно изменяя ранжирование документов.
  • US9235626B2
  • 2016-01-12
  • Персонализация

  • SERP

  • Семантика и интент

Как Google использует клики пользователей в Поиске по Картинкам для определения реального содержания изображений
Google использует данные о поведении пользователей для автоматической идентификации содержания изображений. Если пользователи вводят определенный запрос (Идею) и массово кликают на конкретное изображение в результатах поиска, система ассоциирует это изображение с Концептом, производным от запроса. Это позволяет Google понимать, что изображено на картинке, не полагаясь исключительно на метаданные или сложный визуальный анализ, и улучшает релевантность ранжирования в Image Search.
  • US8065611B1
  • 2011-11-22
  • Поведенческие сигналы

  • Семантика и интент

  • Мультимедиа

Как Google комбинирует поведенческие сигналы из разных поисковых систем для улучшения ранжирования
Google использует механизм для улучшения ранжирования путем объединения данных о поведении пользователей (клики и время взаимодействия) из разных поисковых систем (например, Веб-поиск и Поиск по Видео). Если в основной системе данных недостаточно, система заимствует данные из другой, применяя весовой коэффициент и фактор сглаживания для контроля смещения и обеспечения релевантности.
  • US8832083B1
  • 2014-09-09
  • Поведенческие сигналы

  • SERP

Как Google классифицирует интент запросов (например, поиск порнографии), анализируя историю использования фильтров (SafeSearch)
Google использует данные о том, как часто пользователи включают или отключают фильтры контента (например, SafeSearch) при вводе конкретного запроса. Анализируя нормализованное соотношение фильтрованных и нефильтрованных поисковых операций, система классифицирует запрос как целенаправленно ищущий определенный тип контента (например, adult). Эта классификация затем используется для повышения или понижения релевантности соответствующего контента в выдаче.
  • US9152701B2
  • 2015-10-06
  • Семантика и интент

  • Безопасный поиск

  • Поведенческие сигналы

seohardcore