SEO HARDCORE
  • Разборы патентов
    • Патенты Google
  • Скоро SEO инструменты
  • Скоро SEO аналитика
  • seohardcore
SEO HARDCORE
назад

Как Google использует историю покупок, социальные связи, геолокацию и демографию для персонализации ранжирования в поиске по медиаконтенту (Приложения, Книги, Музыка, Фильмы)

PERSONALIZED DIGITAL CONTENT SEARCH (Персонализированный поиск цифрового контента)
  • US20140317099A1
  • Google LLC
  • 2013-04-23
  • 2014-10-23
  • Персонализация
  • Поведенческие сигналы
  • SERP
  • Мультимедиа
  • Описание
  • Разбор
  • Выводы
  • Практика
  • FAQ
  • Похожие

Google применяет механизм для глубокой персонализации результатов поиска в вертикалях цифрового контента (например, Google Play). Система комбинирует стандартные оценки релевантности с персонализированными оценками, основанными на «сигналах предпочтений пользователя». Эти сигналы включают историю покупок и просмотров, демографические данные, местоположение, активность социальных кругов пользователя и историю потребления смежного контента (например, просмотр трейлера влияет на ранжирование книги).

Описание

Какую проблему решает

Патент решает проблему неоптимального ранжирования в поисковых системах по цифровому контенту (книги, музыка, фильмы, приложения), где часто недостаточно данных для эффективной оценки документов. Это особенно актуально для обзорных запросов (browse queries, например, «танцевальная музыка») в отличие от навигационных (например, «Lady Gaga Bad Romance»). Традиционные системы часто выдают одинаковые результаты всем пользователям. Изобретение улучшает качество поиска, внедряя персонализацию, чтобы результаты соответствовали индивидуальным интересам пользователя.

Что запатентовано

Запатентована система персонализации результатов поиска по медиа-элементам (media items). Суть изобретения заключается в генерации итоговой оценки ранжирования путем комбинирования стандартных оценок с двумя типами персонализированных оценок: Personalized Query-Dependent Scores (PQD) и Personalized Query-Independent Scores (PQI). Эти персонализированные оценки основаны на различных сигналах предпочтений пользователя (media preference signals), таких как история покупок, социальные связи, демография и местоположение.

Как это работает

Система использует четыре основных компонента для ранжирования:

  • Стандартные оценки: Оценка релевантности запросу (Query-Dependent) и общая популярность контента в корпусе (Query-Independent, например, CTR, конверсии).
  • Персонализированные оценки, зависящие от запроса (PQD): Комбинация интересов пользователя с текущим запросом. Например, если запрос «игры», а пользователь любит стратегии, система повысит результаты о стратегиях.
  • Персонализированные оценки, не зависящие от запроса (PQI): Использование данных о пользователе (демография, местоположение, история покупок/просмотров, социальные круги) для повышения релевантного ему контента независимо от формулировки запроса.

Search Engine Ranker объединяет все эти оценки для формирования финального персонализированного списка результатов.

Актуальность для SEO

Высокая. Персонализация является ключевым элементом современных поисковых и рекомендательных систем, особенно в экосистемах цифрового контента (например, Google Play, App Store, стриминговые сервисы). Описанные механизмы, использующие историю взаимодействия, социальные сигналы, геолокацию и кросс-медийное потребление, активно применяются и развиваются.

Важность для SEO

Влияние на SEO высокое, но строго сегментированное. Патент критически важен для специалистов по ASO (App Store Optimization) и тех, кто продвигает цифровой контент (книги, музыку, фильмы) внутри вертикальных поисковых систем Google. Он описывает конкретные сигналы, которые влияют на видимость в этих системах. Для традиционного веб-поиска (WWW-based corpora) патент имеет ограниченное применение, так как фокусируется на «малых корпусах» (small corpora) цифрового контента.

Детальный разбор

Термины и определения

Browse Query (Обзорный/Информационный запрос)
Запрос, ориентированный на открытие нового контента или исследование темы (например, «бесплатные игры»). Противопоставляется навигационным запросам.
Digital Content Database / Small Corpora («Малые корпуса»)
Коллекция документов определенного типа (музыка, книги, фильмы, приложения). Патент фокусируется на этих специализированных базах данных, а не на общем веб-индексе (WWW-based corpora).
Media Item (Медиа-элемент)
Единица цифрового контента: видео, фильм, ТВ-шоу, книга, аудиозапись, приложение (app), музыкальный альбом.
Media Preference Signal (Сигнал предпочтения медиа)
Данные о пользователе, используемые для персонализации. Включают демографию, историю покупок/просмотров, местоположение, социальные связи и т.д.
Navigational Query (Навигационный запрос)
Детализированный запрос с ясным намерением найти конкретный объект (например, «Spotify»).
Personalized Query-Dependent Scores (PQD) (Персонализированные оценки, зависящие от запроса)
Оценки, генерируемые путем комбинирования информации об интересах пользователя с текущим запросом.
Personalized Query-Independent Scores (PQI) (Персонализированные оценки, не зависящие от запроса)
Оценки, основанные на сигналах, связанных с пользователем (например, демография, история покупок), независимо от текущего запроса.
Query-Dependent Scores (Оценки, зависящие от запроса)
Стандартные оценки релевантности документа терминам в запросе пользователя.
Query-Independent Scores (Оценки, не зависящие от запроса)
Стандартные оценки качества или популярности документа, основанные на сигналах в корпусе (например, Query Volume, CTR, Conversion ratio), не зависящие от текущего запроса.
Search Engine Ranker (Ранжировщик поисковой системы)
Компонент, который рассчитывает итоговую оценку (Final Score) для каждого документа, комбинируя все четыре типа оценок.

Ключевые утверждения (Анализ Claims)

Claim 1 (Независимый пункт): Описывает базовый метод персонализации поиска медиаконтента.

  1. Система получает запрос на поиск медиа-элемента.
  2. Идентифицируются результаты поиска.
  3. Генерируется оценка для каждого результата. Эта оценка основана на запросе И на одной или обеих персонализированных оценках (personalized query independent score и/или personalized query dependent score).
  4. Персонализированные оценки основаны как минимум на одном media preference signal, связанном с пользователем.
  5. Результаты ранжируются на основе сгенерированной оценки.

Claims 3-6 (Зависимые): Детализируют, какие именно media preference signals используются для разных типов контента. Это ключевая часть патента для практического применения.

Claim 3 (Книги): Сигналы предпочтений включают:

  • Демографические данные пользователя.
  • Историю предыдущих покупок и/или просмотров пользователя.
  • Популярность книг в социальных кругах пользователя.

Claim 4 (Музыка): Сигналы предпочтений включают:

  • Историю предыдущих покупок музыки и/или просмотров музыкальных видео.
  • Популярность музыки в социальных кругах пользователя.
  • Схожесть аудио (audio similarity) с треками, ранее купленными пользователем.
  • Тип музыки на концертах, посещенных пользователем.

Claim 5 (Фильмы/ТВ-шоу): Сигналы предпочтений включают:

  • Историю предыдущих покупок и/или просмотров фильмов/шоу.
  • Популярность фильмов/шоу в социальных кругах пользователя.

Claim 6 (Приложения/Apps): Сигналы предпочтений включают:

  • Популярность приложения среди демографической группы пользователя.
  • Популярность приложения в географическом местоположении пользователя.
  • Историю предыдущих покупок приложений пользователем.
  • Популярность приложений в социальных кругах пользователя.

Claim 7 (Зависимый): Уточняет, что personalized query independent score может основываться на популярности медиа-элемента среди пользователей, находящихся в текущем географическом местоположении пользователя.

Где и как применяется

Этот патент применяется в специализированных поисковых системах по цифровому контенту (Digital Content Search Engine), таких как Google Play (Apps, Books, Movies), а не в основном веб-поиске Google.

INDEXING – Индексирование и извлечение признаков
На этом этапе система индексирует медиа-элементы и вычисляет стандартные Query-Independent Scores (общую популярность, CTR). Также происходит сбор и обработка Media Preference Signals пользователей (история, демография, социальный граф).

RANKING – Ранжирование
На этом этапе вычисляются стандартные Query-Dependent Scores (релевантность медиа-элемента запросу).

RERANKING – Переранжирование (Персонализация)
Это основной этап применения патента. Search Engine Ranker взаимодействует с профилем пользователя.

  1. Вычисление PQI: Система рассчитывает Personalized Query-Independent Scores на основе демографии, истории покупок, социальных связей, локации пользователя и т.д.
  2. Вычисление PQD: Система рассчитывает Personalized Query-Dependent Scores, анализируя, как интересы пользователя пересекаются с текущим запросом.
  3. Комбинирование оценок: Ранжировщик объединяет все четыре типа оценок (стандартные и персонализированные) для генерации Final Score.
  4. Финальное ранжирование: Результаты сортируются по Final Score.

Входные данные:

  • Запрос пользователя (User Query).
  • Список медиа-элементов из Digital Content Database.
  • Стандартные оценки (Query-Dependent и Query-Independent).
  • Профиль пользователя, содержащий Media Preference Signals.

Выходные данные:

  • Персонализированный ранжированный список медиа-элементов с итоговыми оценками (Final Score).

На что влияет

  • Конкретные типы контента: Влияет исключительно на цифровой медиаконтент: книги, музыку, фильмы, ТВ-шоу, приложения (Apps).
  • Специфические запросы: Наибольшее влияние оказывает на Browse Queries (общие запросы, например, «экшн фильмы», «бесплатные игры»), где намерение пользователя широко и требуется персонализация. Меньше влияет на Navigational Queries.
  • Географические факторы: Местоположение пользователя явно используется как сильный сигнал персонализации, особенно для приложений (например, локальные приложения для расписания транспорта).

Когда применяется

  • Условия работы: Алгоритм применяется при поиске в специализированных базах цифрового контента.
  • Триггеры активации: Активируется при наличии достаточных данных о пользователе (media preference signals). Персонализация усиливается для Browse Queries, где стандартных сигналов ранжирования может быть недостаточно для дифференциации результатов.

Пошаговый алгоритм

Процесс персонализированного ранжирования цифрового контента:

  1. Получение запроса: Система получает от пользователя поисковый запрос на медиа-элемент.
  2. Идентификация результатов: Система идентифицирует набор медиа-элементов в Digital Content Database, соответствующих запросу.
  3. Получение стандартных оценок: Для каждого медиа-элемента извлекаются или рассчитываются:
    • Query-Dependent Score (релевантность запросу).
    • Query-Independent Score (общая популярность/качество в корпусе).
  4. Получение сигналов предпочтений: Система обращается к профилю пользователя для извлечения релевантных Media Preference Signals (история покупок, демография, социальные круги, местоположение, история просмотров смежного контента).
  5. Расчет персонализированных оценок:
    • Рассчитывается Personalized Query-Independent Score (PQI) на основе общих предпочтений пользователя.
    • Рассчитывается Personalized Query-Dependent Score (PQD) на основе пересечения предпочтений пользователя и текущего запроса.
  6. Генерация итоговой оценки: Search Engine Ranker генерирует Final Score для каждого медиа-элемента, комбинируя стандартные и персонализированные оценки (PQI и/или PQD).
  7. Ранжирование: Результаты поиска ранжируются на основе Final Score.
  8. Отображение: Ранжированный список результатов отображается пользователю.

Какие данные и как использует

Данные на входе

Патент детализирует использование поведенческих, географических, пользовательских и социальных факторов для персонализации.

Поведенческие факторы (История взаимодействия):

  • История покупок/загрузок (Buying History): Используется для всех типов контента. Система определяет категории/жанры и повышает похожий контент.
  • История просмотров/превью (Previewing/Viewing History): Просмотры книг, трейлеров, фильмов, музыкальных видео. Упоминается, что просмотр трейлера может вызвать повышение соответствующего фильма или связанной книги в результатах поиска.
  • Загрузки в хранилище (Music uploads to a music locker): Используется для анализа музыкальных предпочтений.
  • Посещение мероприятий (Attendance of music events): Посещение концертов используется для определения музыкальных вкусов.
  • История поиска (User Prior Search History): Используется для расчета PQD.

Пользовательские факторы:

  • Демографические сигналы (User Demographic Signals): Возраст, пол. Используется для повышения контента, популярного в соответствующей демографической группе.
  • Предпочтения жанров (Content Category/Genre Preferences): Выводятся на основе истории взаимодействия.

Географические факторы:

  • Местоположение пользователя (User's geographic location): Используется для повышения контента, популярного в данном регионе, или локально релевантного контента (особенно для приложений). Может определяться по IP или вводиться пользователем.

Социальные факторы:

  • Действия социальных кругов (Actions of user's social circles): Покупки, рекомендации (лайки, +1) друзей пользователя. Контент, популярный у друзей, получает повышение.

Мультимедиа факторы (Специфичные):

  • Схожесть аудио (Audio similarity): Для музыки система может повышать треки, которые по аудио характеристикам похожи на те, что пользователь уже купил или загрузил.

Какие метрики используются и как они считаются

Патент не предоставляет конкретных формул для комбинирования оценок, но определяет четыре ключевые метрики, которые объединяются в Final Score:

  1. Query-Dependent Score.
  2. Query-Independent Score (включая метрики популярности в корпусе: Query Volume, Query Frequency, Query-to-click ratio, Clickthrough ratio (CTR), Query-to-conversion ratio, Conversion ratio).
  3. Personalized Query-Dependent Score (PQD).
  4. Personalized Query-Independent Score (PQI).

Методы расчета PQD и PQI основаны на применении Media Preference Signals для бустинга (повышения оценки) медиа-элементов, соответствующих профилю пользователя.

Выводы

  1. Сегментированная релевантность (ASO и Вертикальный поиск): Этот патент имеет критическое значение для оптимизации приложений (ASO) и продвижения цифрового контента в вертикалях Google (Книги, Фильмы, Музыка). Он четко определяет, что ранжирование в этих системах глубоко персонализировано и отличается от веб-поиска.
  2. Ключевая роль истории взаимодействия: История покупок, просмотров и загрузок пользователя является фундаментальным сигналом (Media Preference Signal) для определения его интересов и последующего бустинга релевантного контента.
  3. Социальное доказательство как фактор ранжирования: Активность социальных кругов пользователя (покупки, лайки, +1) напрямую влияет на ранжирование контента для этого пользователя. Это подтверждает использование социального графа в качестве сильного сигнала ранжирования в этих вертикалях.
  4. Влияние демографии и геолокации: Демографические данные (возраст, пол) и местоположение пользователя используются для повышения контента, популярного в соответствующих сегментах аудитории. Локализация особенно критична для приложений (Apps).
  5. Кросс-медийное влияние: Патент описывает, как потребление одного типа контента влияет на ранжирование другого. Например, просмотр фильма или трейлера повышает ранжирование книги-первоисточника; просмотр музыкального видео повышает ранжирование соответствующего трека.
  6. Различие между PQI и PQD: Система использует как общие предпочтения пользователя (PQI) для бустинга определенных категорий контента, так и контекстуальные предпочтения (PQD) для интерпретации текущего запроса в свете интересов пользователя.

Практика

Best practices (это мы делаем)

Рекомендации применимы для ASO и продвижения контента в вертикалях Google (Google Play и т.п.).

  • Стимулирование социального взаимодействия: Активно поощряйте пользователей делиться контентом, ставить лайки/+1 и рекомендовать его в своих социальных сетях. Поскольку действия социальных кругов являются прямым сигналом персонализации, это увеличит видимость контента для друзей этих пользователей.
  • Оптимизация под целевые демографические и географические сегменты: Анализируйте, в каких демографических группах и регионах ваш контент наиболее популярен. Усиление позиций в ключевом сегменте приведет к бустингу в ранжировании для пользователей из этого сегмента за счет Personalized Query-Independent Score.
  • Использование кросс-промо и связывание контента: Используйте связь между разными типами медиа. Например, при продвижении книги активно продвигайте связанный с ней фильм (и наоборот), например, через трейлеры на YouTube. Просмотр трейлера пользователем улучшит ранжирование связанного контента для него.
  • Стимулирование вовлеченности и удержания (Retention): Поскольку история просмотров и покупок является ключевым сигналом, важно не только привлечь пользователя, но и удержать его. Чем больше пользователь взаимодействует с вашим контентом (или контентом вашей категории), тем выше вероятность бустинга в будущем.
  • Локализация приложений (ASO): Для приложений, имеющих локальную привязку (транспорт, доставка, услуги), критически важно фокусироваться на достижении популярности в конкретных регионах, так как геолокация является сильным сигналом персонализации для Apps.

Worst practices (это делать не надо)

  • Игнорирование персонализации в пользу только ключевых слов: Оптимизация метаданных (название, описание) под ключевые слова без учета целевой аудитории и её предпочтений будет неэффективной, так как персонализированные сигналы могут перевесить стандартную релевантность.
  • Накрутка общих поведенческих факторов без сегментации: Попытки манипулировать общими сигналами популярности (Query-Independent Scores) могут быть менее эффективными, чем органический рост популярности внутри целевого сегмента пользователей, который активирует Personalized Scores.
  • Фокус только на навигационном трафике: Концентрация только на брендовых (навигационных) запросах и игнорирование оптимизации под Browse Queries (общие категории) упускает возможность привлечения новой аудитории через механизмы персонализированного поиска.

Стратегическое значение

Патент подчеркивает, что в экосистемах цифрового контента Google приоритет отдается не просто релевантности запросу, а соответствию контента долгосрочным интересам и профилю пользователя. Для ASO и вертикального поиска это означает, что стратегия должна быть направлена на построение аудитории и стимулирование органического вовлечения внутри целевых сегментов. Понимание механизмов кросс-медийного влияния и роли социальных сигналов позволяет строить более сложные и эффективные маркетинговые кампании.

Практические примеры

Сценарий 1: Использование геолокации для ASO

  • Задача: Продвинуть новое приложение для заказа такси в Берлине по запросу «Taxi App».
  • Действия согласно патенту: Фокусировать маркетинговые усилия (реклама, PR) строго на Берлине для достижения высокой локальной популярности. Оптимизировать метаданные под локальный контекст.
  • Ожидаемый результат: Система идентифицирует, что приложение популярно в Берлине (Сигнал из Claim 6 и 7). Когда пользователь из Берлина вводит «Taxi App», система применит Personalized Query-Independent Score, основанный на геолокации, и повысит это приложение в выдаче выше глобальных конкурентов.

Сценарий 2: Кросс-медийное продвижение книги

  • Задача: Увеличить видимость книги в жанре фэнтези в Google Books.
  • Действия согласно патенту: Запустить рекламную кампанию на YouTube с трейлером этой книги (или фильма, если есть экранизация), таргетированную на любителей фэнтези.
  • Ожидаемый результат: Пользователи, посмотревшие трейлер, фиксируются системой. Когда эти пользователи позже ищут книги (даже по общему запросу «фэнтези»), система использует их историю просмотров видео (User's movie/trailer viewing history) для повышения данной книги в их персонализированной выдаче.

Сценарий 3: Использование социальных сигналов для музыки

  • Задача: Продвинуть новый альбом инди-группы.
  • Действия согласно патенту: Организовать кампанию в социальных сетях, стимулируя фанатов делиться альбомом и ставить лайки/+1. Провести конкурсы среди микро-инфлюенсеров.
  • Ожидаемый результат: Когда друзья этих фанатов и подписчиков будут искать музыку (например, по общему запросу "инди-музыка"), система использует активность их социальных кругов (Сигнал из Claim 4) для повышения альбома в выдаче, предполагая схожесть интересов.

Вопросы и ответы

Применим ли этот патент к обычному веб-поиску Google (синие ссылки)?

Нет. Патент явно фокусируется на поиске цифрового контента (Digital Content Search) в так называемых «малых корпусах» (Small Corpora) или Digital Content Database. Это относится к специализированным поисковым системам, таким как Google Play (Apps, Books, Movies) или Google Music, а не к основному индексу веб-страниц (WWW-based corpora).

Что такое «Media Preference Signal» и почему это важно?

Media Preference Signal — это любой сигнал о пользователе, который помогает системе понять его предпочтения. Это могут быть история покупок, просмотры видео, демография, местоположение или действия друзей. Эти сигналы являются основой для расчета персонализированных оценок (PQI и PQD) и напрямую определяют, какой контент будет повышен в выдаче для конкретного пользователя.

Как просмотр видео на YouTube может повлиять на ранжирование моей книги в Google Books согласно этому патенту?

Патент описывает кросс-медийное влияние. Если пользователь смотрит трейлер или фильм, система может повысить в ранжировании книги, которые послужили основой для этого фильма, или книги схожей тематики/автора. История просмотра видео (User's movie/trailer viewing history) является одним из сигналов предпочтений, используемых для персонализации поиска книг.

Какова роль социальных сетей в этом патенте?

Роль значительна. Патент многократно упоминает «Действия социальных кругов пользователя» (Actions of user's social circles) как важный сигнал для всех типов контента. Покупки, лайки или +1, сделанные друзьями пользователя, используются для повышения соответствующего контента в выдаче этого пользователя, исходя из предположения о схожести интересов.

В чем разница между Personalized Query-Independent (PQI) и Personalized Query-Dependent (PQD) оценками?

PQI основан на общих предпочтениях пользователя и влияет на выдачу независимо от запроса (например, бустинг контента, популярного в демографической группе пользователя). PQD учитывает текущий запрос и интерпретирует его через призму интересов пользователя (например, если пользователь любит историю и вводит «игры», система повысит исторические игры).

Насколько важна геолокация пользователя в этом механизме персонализации?

Геолокация очень важна, особенно для приложений (Apps). Система может повышать приложения, популярные в текущем местоположении пользователя, или те, которые релевантны локально (например, расписание местного транспорта). Это позволяет предоставлять более релевантные результаты для общих запросов, имеющих локальный интент.

Какие типы запросов получают наибольшее преимущество от этой системы персонализации?

Наибольшее преимущество получают Browse Queries (обзорные запросы), такие как «романтические фильмы» или «бесплатные игры». Для таких запросов часто не хватает стандартных сигналов ранжирования, и персонализация помогает выделить наиболее подходящий контент из большого набора результатов, основываясь на профиле пользователя.

Что важнее для ASO согласно этому патенту: общая популярность приложения или популярность среди целевой аудитории?

Оба фактора важны, но патент подчеркивает значение популярности среди целевой аудитории. Общая популярность влияет на стандартные Query-Independent Scores. Однако популярность внутри определенного демографического сегмента, региона или социального круга активирует Personalized Scores, что может дать значительный буст в ранжировании для пользователей из этих групп.

Упоминает ли патент использование данных о посещении мероприятий пользователем?

Да, конкретно для поиска музыки. Патент указывает, что система может использовать данные об интересе или посещении музыкальных событий (например, концертов) пользователем (User's interest/attendance of music events). Это позволяет системе лучше понять вкусы пользователя и повышать треки или альбомы схожего жанра.

Как система определяет музыкальные предпочтения пользователя, если он не покупает музыку, а слушает её через стриминг или загружает свою коллекцию?

Для музыки система анализирует не только покупки, но и историю просмотра музыкальных видео. Кроме того, патент упоминает анализ музыки, загруженной пользователем в музыкальное хранилище (User's music uploads to a music locker), и использование метрик схожести аудио (audio similarity) для поиска похожего контента.

Похожие патенты

Как Google использует историю поиска, поведение и многофакторные профили пользователей для персонализации поисковой выдачи
Google создает детальные профили пользователей на основе истории запросов, взаимодействия с результатами (клики, время просмотра) и анализа контента посещенных страниц. Эти профили (включающие интересы по терминам, категориям и ссылкам) используются для корректировки стандартных оценок ранжирования. Степень персонализации динамически регулируется уровнем уверенности системы в профиле (Confidence Score).
  • US9298777B2
  • 2016-03-29
  • Персонализация

  • Поведенческие сигналы

  • SERP

Как Google персонализирует поисковую выдачу, анализируя историю кликов и поведение пользователя на сайте
Google использует механизм для персонализации поисковой выдачи на основе истории взаимодействия пользователя с результатами поиска. Система отслеживает, какие сайты пользователь выбирает, как долго он на них остается (Dwell Time), частоту и контекст выбора. Основываясь на этих данных, предпочитаемые пользователем ресурсы повышаются в ранжировании при его последующих запросах.
  • US9037581B1
  • 2015-05-19
  • Персонализация

  • Поведенческие сигналы

  • SERP

Как Google использует личную историю поиска и профиль интересов для персонализации подсказок Autocomplete
Google персонализирует поисковые подсказки (Autocomplete), используя профиль интересов пользователя, созданный на основе его прошлых запросов и кликов. Система сравнивает тематику потенциальных подсказок с интересами пользователя и повышает в списке те варианты, которые соответствуют его предпочтениям, с учетом актуальности этих интересов.
  • US20140108445A1
  • 2014-04-17
  • Персонализация

  • Поведенческие сигналы

  • Семантика и интент

Как Google использует социальные связи, демографию и неявные сигналы для ранжирования персонализированных результатов
Google патентует систему для обработки «социальных опросных запросов» (например, «что мои друзья думают о фильме X»). Система определяет релевантность контента, учитывая социальный граф пользователя, авторитетность участников сети, их демографические атрибуты и неявные сигналы (например, текущее местоположение), чтобы предоставить персонализированные и социально релевантные результаты.
  • US9122756B2
  • 2015-09-01
  • Персонализация

  • Поведенческие сигналы

Как Google использует историю поиска и браузера для персонализации выдачи и определения предпочтений пользователя
Google записывает историю поиска, кликов по результатам и рекламе, а также посещенные сайты в централизованную базу данных пользователя. Эта информация используется для модификации поисковой выдачи: повышения позиций ранее посещенных сайтов, предложения связанных запросов и определения "предпочтительных местоположений" (избранного). Система позволяет пользователю контролировать сбор данных (подписка) и объединять историю с разных устройств.
  • US7747632B2
  • 2010-06-29
  • Персонализация

  • Поведенческие сигналы

  • SERP

Популярные патенты

Как Google собирает и структурирует данные о поведении пользователей в Поиске по картинкам (включая ховеры, клики и 2D-позицию)
Патент Google описывает инфраструктуру для детального сбора данных в Поиске по картинкам. Система фильтрует общие логи, фиксируя не только клики, но и наведение курсора (ховеры), длительность взаимодействия и точное 2D-расположение (строка/столбец) изображения на выдаче. Эти данные агрегируются в Модель Запросов Изображений для оценки релевантности.
  • US8898150B1
  • 2014-11-25
  • Поведенческие сигналы

  • SERP

  • Мультимедиа

Как Google определяет и ранжирует вертикали поиска (Web, Images, News, Local) на основе интента запроса и профиля пользователя
Патент описывает фундаментальный механизм Универсального Поиска (Universal Search). Система генерирует результаты из разных индексов (Web, Картинки, Новости, Карты) и вычисляет «Оценку Вероятности» (Likelihood Value) для каждой категории. Эта оценка определяет, какая вертикаль наиболее релевантна интенту запроса. Для расчета используются как агрегированные данные о поведении всех пользователей по схожим запросам, так и индивидуальный профиль пользователя.
  • US7966309B2
  • 2011-06-21
  • Семантика и интент

  • Персонализация

  • SERP

Как Google использует данные о поведении пользователей внутри документов (время чтения разделов, закладки) для улучшения ранжирования
Google может собирать и анализировать данные о том, как пользователи взаимодействуют с электронными документами (например, PDF, DOC, HTML). Система отслеживает, какие разделы или страницы просматриваются дольше всего или добавляются в закладки. Эта агрегированная информация используется для повышения в ранжировании документов, чьи ключевые слова находятся в наиболее используемых (и, следовательно, ценных) разделах.
  • US8005811B2
  • 2011-08-23
  • Поведенческие сигналы

  • SERP

Как Google использует машинное обучение и данные о длительности сессий для выявления битых Deep Links в мобильных приложениях
Google использует систему машинного обучения для анализа того, как долго пользователи взаимодействуют с контентом в приложении после перехода по Deep Link (Presentation Duration). Анализируя распределение этих временных интервалов, система классифицирует ссылку как рабочую или битую без необходимости прямого сканирования контента. Это позволяет Google удалять неработающие ссылки из индекса.
  • US10628511B2
  • 2020-04-21
  • Ссылки

  • Индексация

  • Поведенческие сигналы

Как Google ранжирует комментарии и UGC, используя объективное качество и субъективную персонализацию
Google использует двухфакторную модель для ранжирования пользовательского контента (комментариев, отзывов). Система вычисляет объективную оценку качества (репутация автора, грамотность, длина, рейтинги) и субъективную оценку персонализации (является ли автор другом или предпочтительным автором, соответствует ли контент интересам и истории поиска пользователя). Итоговый рейтинг объединяет обе оценки для показа наиболее релевантного и качественного UGC.
  • US8321463B2
  • 2012-11-27
  • Персонализация

  • EEAT и качество

  • Поведенческие сигналы

Как Google использует данные о кликах и пропусках для валидации и удаления неэффективных синонимов в поиске
Google постоянно тестирует правила подстановки (синонимы) для расширения запросов. Этот патент описывает механизм оценки эффективности этих правил с помощью анализа поведения пользователей (клики и пропуски результатов). Если пользователи часто пропускают результаты, содержащие подставленный термин, система автоматически удаляет это правило, очищая понимание запросов от нерелевантных синонимов.
  • US8965875B1
  • 2015-02-24
  • Поведенческие сигналы

  • Семантика и интент

  • EEAT и качество

Как Google использует клики пользователей в Поиске по Картинкам для определения реального содержания изображений
Google использует данные о поведении пользователей для автоматической идентификации содержания изображений. Если пользователи вводят определенный запрос (Идею) и массово кликают на конкретное изображение в результатах поиска, система ассоциирует это изображение с Концептом, производным от запроса. Это позволяет Google понимать, что изображено на картинке, не полагаясь исключительно на метаданные или сложный визуальный анализ, и улучшает релевантность ранжирования в Image Search.
  • US8065611B1
  • 2011-11-22
  • Поведенческие сигналы

  • Семантика и интент

  • Мультимедиа

Как Google использует данные о посещаемости, уникальных пользователях и длине URL для ранжирования документов
Фундаментальный патент Google, описывающий использование поведенческих факторов в ранжировании. Система рассчитывает Usage Score на основе частоты посещений и количества уникальных пользователей, фильтруя ботов и взвешивая данные по географии. Этот балл комбинируется с текстовой релевантностью (IR Score) и длиной URL (Path Length Score) для определения итоговой позиции документа.
  • US8001118B2
  • 2011-08-16
  • Поведенческие сигналы

  • SERP

Как Google использует погоду, время и местоположение для понимания истинного намерения пользователя и адаптации поисковой выдачи
Google анализирует, как физическое окружение (погода, время, местоположение) влияет на то, что ищут пользователи. Система выявляет корреляции между средой и поведением пользователей в прошлом (включая длительность кликов), чтобы лучше понять текущий интент многозначных запросов. Затем она переранжирует выдачу или переписывает запрос для предоставления наиболее релевантных результатов и рекламы.
  • US8898148B1
  • 2014-11-25
  • Семантика и интент

  • Поведенческие сигналы

  • Персонализация

Как Google использует офлайн-сигналы и авторитетность сущностей для ранжирования контента
Google использует реальные, офлайн-сигналы авторитетности для ранжирования документов, у которых отсутствует естественная ссылочная структура (например, оцифрованные книги). Система оценивает коммерческий успех документа (данные о продажах, списки бестселлеров), репутацию связанных сущностей (автора и издателя) и может переносить ссылочный авторитет с официальных сайтов этих сущностей на сам документ для улучшения его позиций в поиске.
  • US8799107B1
  • 2014-08-05
  • EEAT и качество

  • SERP

  • Поведенческие сигналы

seohardcore