SEO HARDCORE
  • Разборы патентов
    • Патенты Google
  • Скоро SEO инструменты
  • Скоро SEO аналитика
  • seohardcore
SEO HARDCORE
назад

Как Google использует историю поведения пользователя для персонализации выбора и ранжирования вертикальных блоков (Universal Search)

PERSONALIZED SEARCH RESULTS (Персонализированные результаты поиска)
  • US9305088B1
  • Google LLC
  • 2006-11-30
  • 2016-04-05
  • Персонализация
  • Поведенческие сигналы
  • SERP
  • Описание
  • Разбор
  • Выводы
  • Практика
  • FAQ
  • Похожие

Google отслеживает, с какими типами специализированных результатов (Новости, Картинки, Карты и т.д.) взаимодействует пользователь. На основе этой истории поведения строится персональная вероятностная модель, которая предсказывает, какие вертикали предпочтет пользователь в будущем. Система использует эти предсказания для выбора, оценки и ранжирования блоков вертикального поиска в выдаче.

Описание

Какую проблему решает

Патент решает задачу повышения релевантности и полезности Универсальной выдачи (Universal Search или Blended SERP). Вместо того чтобы показывать стандартный набор специализированных (вертикальных) результатов всем пользователям по одному и тому же запросу, система адаптирует состав и порядок этих блоков, отдавая приоритет тем типам контента (вертикалям), которые предпочитает конкретный пользователь на основе его истории.

Что запатентовано

Запатентована система, которая создает и использует Probability Model (вероятностную модель) для персонализации результатов поиска. Эта модель строится на основе отслеживания прошлого поведения пользователя (user's search related behavior), в частности, его взаимодействий с различными типами Specialized Results (например, Новости, Картинки, Карты). Цель модели — оценить вероятность того, что пользователь выберет определенный тип специализированного результата в будущем, и использовать эту оценку для отбора и/или ранжирования этих результатов в выдаче.

Как это работает

Система работает в двух режимах: обучение и применение.

  • Обучение: Система отслеживает и накапливает данные о том, как пользователь взаимодействует со Specialized Results. Учитываются такие параметры, как частота выбора конкретной вертикали, характеристики запросов и временные паттерны (например, будни/выходные). На основе этих данных строится персонализированная Probability Model.
  • Применение: Когда поступает новый запрос, система выполняет поиск как по основному индексу (corpus of documents), так и по специализированным источникам. Затем используется Probability Model пользователя для предсказания вероятности клика по каждому доступному типу Specialized Results. Эти вероятности используются для выбора (какие вертикали показать) и/или ранжирования (в каком порядке их показать) специализированных результатов в итоговой выдаче.

Актуальность для SEO

Высокая. Персонализация и смешивание результатов из разных вертикалей (Metasearch/Blending) являются фундаментальными компонентами современного поиска. Хотя конкретные статистические методы, упомянутые в патенте (поданном в 2006 году), такие как logistic regression, могли эволюционировать в сторону более сложных моделей машинного обучения, базовый принцип использования истории поведения для адаптации состава SERP остается критически важным.

Важность для SEO

Патент имеет значительное влияние на SEO (7.5/10), особенно для стратегий, ориентированных на вертикальный поиск (Новости, Изображения, Товары, Локальный поиск). Он демонстрирует, что видимость контента в блоках Universal Search зависит не только от релевантности запросу, но и от индивидуальных предпочтений пользователя. Это усложняет измерение эффективности оптимизации, поскольку состав SERP становится динамичным и персонализированным.

Детальный разбор

Термины и определения

Corpus of documents (Корпус документов)
Основной индекс документов (например, веб-страниц), используемый для стандартного поиска.
Probability Model (Вероятностная модель)
Статистическая модель, построенная на основе прошлого поведения пользователя. Используется для оценки вероятности того, что пользователь выберет определенный тип специализированного результата. В патенте упоминаются методы logistic regression и regression trees.
Search related behavior (Поведение, связанное с поиском)
Действия пользователя, которые отслеживаются системой для построения Probability Model. Включает историю запросов, клики на результаты и временные паттерны.
Specialized Results (Специализированные результаты)
Результаты поиска, полученные из Sources of specialized information. Соответствуют блокам Универсального поиска (Universal Search) или результатам вертикального поиска.
Sources of specialized information (Источники специализированной информации)
Специализированные индексы или базы данных (вертикали). Примеры из патента: новости, котировки акций, погода, музыка, фильмы, путешествия, карты, изображения, покупки, история поиска, определения слов, вопросы, патенты, местное время, дискуссионные группы, блоги и телепрограммы.
Tracked Parameters (Отслеживаемые параметры)
Конкретные данные о поведении пользователя, которые используются как признаки (features) для построения Probability Model (детализированы в Claim 2).

Ключевые утверждения (Анализ Claims)

Claim 1 (Независимый пункт): Описывает полный цикл работы системы, включающий обучение и применение.

  1. Получение запроса.
  2. Поиск по основному corpus of documents и по sources of specialized information (Новости, Карты и т.д.).
  3. Предоставление пользователю стандартных и специализированных результатов.
  4. Отслеживание параметров (tracking parameters), связанных с выбором пользователем Specialized Results.
  5. Построение Probability Model на основе отслеженных параметров для оценки вероятности выбора определенных типов Specialized Results в будущем.
  6. Использование модели для выбора (selecting) определенных Specialized Results в ответ на последующий запрос и их предоставление пользователю.

Claim 2 (Зависимый от 1): Перечисляет конкретные параметры (Tracked Parameters), используемые для построения модели (см. раздел 4.2).

Claim 18 (Независимый пункт): Фокусируется на механизме ранжирования специализированных результатов с использованием модели.

  1. Поиск по основному корпусу и специализированным источникам.
  2. Получение оценок вероятности (probability estimates) того, что пользователь выберет определенные типы Specialized Results, на основе его поискового поведения.
  3. Присвоение оценок (scoring) специализированным результатам на основе этих вероятностей. Ключевое уточнение: результату с более высокой вероятностью присваивается более высокая оценка (higher score).
  4. Ранжирование (ranking) специализированных результатов на основе присвоенных оценок.

Claim 28 (Независимый пункт): Фокусируется на выборочном предоставлении результатов.

  1. Поиск по основному корпусу и специализированным источникам.
  2. Оценка вероятностей выбора пользователем определенных типов Specialized Results.
  3. Система выборочно предоставляет (selectively providing) определенные типы специализированных результатов пользователю на основе этих вероятностей.

Где и как применяется

Изобретение затрагивает несколько этапов поиска, связывая анализ поведения пользователя с финальным формированием выдачи.

INDEXING – Индексирование
Система индексирует как основной корпус документов, так и sources of specialized information. В патенте (Claims 29, 30) упоминается, что специализированные источники могут быть проиндексированы отдельно от основного корпуса, что позволяет проводить независимый поиск по каждой вертикали.

Офлайн-процессы (Data Analysis)
Данные о поведении пользователей (история запросов и кликов на Specialized Results) собираются и обрабатываются для построения или обновления персонализированной Probability Model.

RANKING – Ранжирование (Онлайн)
При получении запроса система параллельно выполняет поиск по основному индексу и по релевантным специализированным индексам для генерации кандидатов.

METASEARCH – Метапоиск и Смешивание / RERANKING – Переранжирование
Это основная область применения патента. На этапе смешивания (Blending) система должна решить, какие блоки Specialized Results включить в финальную выдачу и в каком порядке. Probability Model предоставляет персонализированные данные (оценки вероятности) для алгоритма смешивания. Система использует эти данные для отбора и/или ранжирования специализированных блоков, модифицируя состав SERP для конкретного пользователя.

Входные данные:

  • Запрос пользователя и его идентификатор (Account ID, cookie, IP).
  • Набор стандартных результатов поиска.
  • Наборы Specialized Results из различных вертикалей.
  • Предварительно построенная Probability Model для пользователя.

Выходные данные:

  • Персонализированная страница результатов поиска (SERP), где Specialized Results выбраны и/или ранжированы на основе предсказанных предпочтений пользователя и размещены на видном месте (prominent position).

На что влияет

  • Конкретные типы контента: Влияет непосредственно на видимость контента, попадающего в Specialized Results (блоки Universal Search). Патент перечисляет множество типов: новости, карты, изображения, товары (Shopping), котировки акций, погода, патенты, блоги и т.д.
  • Специфические запросы: Наибольшее влияние оказывается на запросы, для которых релевантны сразу несколько вертикалей (неоднозначные или широкие запросы). Система решает, какую вертикаль предпочесть, основываясь на истории пользователя.

Когда применяется

  • Условия применения: Алгоритм применяется, когда система идентифицирует релевантные результаты в одном или нескольких источниках специализированной информации.
  • Триггеры активации: Для эффективной работы механизма требуется наличие достаточного объема исторических данных о поведении пользователя, чтобы построить надежную Probability Model.

Пошаговый алгоритм

Процесс А: Построение Вероятностной Модели (Обучение)

  1. Отслеживание взаимодействия: Система предоставляет пользователю поисковую выдачу и отслеживает его взаимодействие (клики) со Specialized Results.
  2. Сбор и агрегация параметров: Система собирает Tracked Parameters (см. раздел 4.2), связанные с этими взаимодействиями, и агрегирует их по пользователю.
  3. Построение/Обновление модели: На основе накопленных параметров система строит или обновляет персонализированную Probability Model. Используются статистические методы (например, logistic regression) для оценки вероятности будущих выборов для каждого типа специализированного результата.

Процесс Б: Применение Модели для Персонализации (Онлайн)

  1. Получение запроса: Система получает новый запрос от идентифицированного пользователя.
  2. Параллельный поиск: Получение набора стандартных результатов и наборов Specialized Results.
  3. Оценка вероятностей: Использование предварительно построенной Probability Model для данного пользователя, чтобы оценить вероятность того, что он выберет каждый из доступных типов Specialized Results.
  4. Отбор и Ранжирование: Система выполняет отбор и/или скоринг Specialized Results на основе полученных оценок вероятности.
    Вариант 1 (Отбор): Выбираются типы результатов с наивысшими вероятностями или те, что превышают порог.
    Вариант 2 (Ранжирование): Результатам присваиваются оценки (scores) на основе вероятностей (более высокая вероятность = более высокая оценка), после чего они ранжируются между собой.
  5. Смешивание и Предоставление: Выбранные и отранжированные Specialized Results предоставляются пользователю на заметной позиции вместе со стандартными результатами.

Какие данные и как использует

Данные на входе

Патент фокусируется на использовании поведенческих и пользовательских данных для персонализации выбора вертикалей.

  • Поведенческие факторы (Behavioral Factors): История взаимодействия пользователя с различными типами Specialized Results (клики).
  • Пользовательские факторы (User Factors): Идентификатор пользователя (упоминаются Account ID, cookie, IP address) для привязки поведения.

Какие метрики используются и как они считаются

Система использует Probability Model, которая обучается на конкретных отслеживаемых параметрах (Tracked Parameters). Патент (Claim 2) явно перечисляет следующие параметры, используемые как признаки (features) для модели:

  • Количество прошлых выборов (кликов) определенного типа специализированного результата.
  • Количество поисковых запросов на один выбор определенного типа (частота взаимодействия).
  • Количество дней поисковых запросов на один выбор определенного типа.
  • Средняя длина поискового запроса пользователя.
  • Среднее количество поисковых запросов в месяц (мера активности пользователя).
  • Процент выборов, которые происходят в выходные дни.
  • Процент выборов, которые происходят в будние дни.

Метрики на выходе модели:

  • Probability Estimates (Оценки вероятности): Выходные данные Probability Model для каждого типа Specialized Result. Предсказывают вероятность клика пользователя.
  • Scores (Оценки ранжирования): Присваиваются специализированным результатам на основе Probability Estimates. В патенте указано, что оценка может быть функцией (например, линейной функцией) от соответствующей вероятности. Используются для ранжирования блоков между собой.

Методы анализа:

  • Для построения Probability Model используются статистические методы моделирования. Явно упомянуты logistic regression (логистическая регрессия) и regression trees (деревья регрессии).

Выводы

  1. Персонализация состава SERP: Патент доказывает, что состав блоков Универсального Поиска (Новости, Картинки, Карты и т.д.) не является статичным для данного запроса, а активно персонализируется для каждого пользователя на основе его истории.
  2. Поведение пользователя обучает систему: Взаимодействие пользователя с вертикалями напрямую влияет на то, какие вертикали он увидит в будущем. Клик на определенный тип Specialized Result увеличивает вероятность его показа и повышает его ранжирование в дальнейшем.
  3. Ранжирование вертикалей основано на вероятности клика: Specialized Results (блоки) ранжируются между собой на основе предсказанной вероятности того, что пользователь их выберет (Claim 18). Более высокая вероятность ведет к более высокому score и позиции.
  4. Детальный поведенческий анализ: Модель строится на конкретных, измеримых параметрах поведения, включая не только клики, но и общую поисковую активность пользователя и временные паттерны (будни/выходные).
  5. Подавление неиспользуемых вертикалей: Если пользователь систематически игнорирует определенный тип контента, Probability Model снизит вероятность его показа, даже если он релевантен запросу.

Практика

Best practices (это мы делаем)

  • Комплексная оптимизация под вертикали (Holistic/Omnichannel SEO): Необходимо оптимизировать контент под все релевантные вертикали (Изображения, Новости, Видео, Локальный поиск, Товары). Поскольку предпочтения пользователя определяют, какая вертикаль получит приоритет, важно присутствовать во всех потенциально интересных для целевой аудитории форматах.
  • Стимулирование взаимодействия (Оптимизация CTR в вертикалях): Создавайте привлекательный контент и оптимизируйте сниппеты внутри вертикалей (например, качественные изображения, оптимизированные заголовки новостей, полные данные о товарах). Клики на ваши результаты в вертикалях обучают Probability Model пользователя в вашу пользу, увеличивая будущую видимость этого типа контента.
  • Анализ поведения аудитории и трафика: Изучайте, какие форматы контента предпочитает ваша целевая аудитория (используя данные Search Console по типам поиска). Понимание того, что разные сегменты пользователей могут видеть разные вертикали из-за персонализации, помогает точнее настраивать контент-стратегию.

Worst practices (это делать не надо)

  • Игнорирование вертикалей из-за низкой видимости в тестах: Не стоит отказываться от оптимизации под вертикаль только потому, что она не отображается в неперсонализированных или инкогнито тестах. Она может быть очень важна для пользователей, которые исторически проявляли к ней интерес.
  • Ориентация только на стандартную веб-выдачу: Стратегии, игнорирующие Specialized Results, упускают значительную часть видимости, особенно учитывая, что эти результаты часто размещаются на самых заметных позициях в SERP.
  • Предположение о статичности SERP: Нельзя предполагать, что один и тот же запрос всегда вызывает одинаковый набор и порядок вертикальных блоков для всех пользователей. Анализ SERP должен учитывать фактор персонализации.

Стратегическое значение

Патент подтверждает, что формирование итоговой выдачи (Metasearch/Blending) является глубоко персонализированным процессом. Это подчеркивает переход от статического ранжирования к динамическому формированию SERP на основе поведения и предпочтений пользователя в отношении форматов контента. Для SEO это означает необходимость разработки мультиформатных контент-стратегий и понимание того, что измерение позиций и видимости становится все более сложным.

Практические примеры

Сценарий 1: Персонализация выдачи по неоднозначному запросу [apple]

  1. Пользователь А (Инвестор): Регулярно проверяет финансовые новости и котировки акций. Его Probability Model имеет высокие оценки вероятности для вертикалей "Новости" и "Котировки акций" (Stocks).
  2. Пользователь Б (Покупатель): Часто ищет гаджеты и использует Google Shopping. Его Probability Model имеет высокие оценки для вертикали "Товары" (Shopping) и "Изображения" (Images).
  3. Запрос: Оба пользователя вводят запрос [apple].
  4. Обработка: Система находит релевантные Specialized Results в нескольких вертикалях.
  5. Персонализация (Scoring и Ranking):
    Для Пользователя А система присваивает высокие scores блокам "Котировки акций" и "Новости" и ранжирует их выше.
    Для Пользователя Б система присваивает высокие scores блокам "Товары" и "Изображения" и ранжирует их выше.
  6. Результат: Пользователь А видит на первых позициях финансовую информацию. Пользователь Б видит карусель с товарами Apple.

Сценарий 2: Влияние временных факторов

  1. История пользователя: Пользователь ищет рестораны (Maps/Local) преимущественно по выходным. Система учитывает параметр "Процент выборов в выходные дни".
  2. Новый запрос в будний день: Пользователь вводит запрос [итальянская кухня] во вторник днем.
  3. Применение модели: Модель предсказывает более низкую вероятность интереса к Картам именно сейчас по сравнению с другими вертикалями (например, Рецепты или Новости).
  4. Результат: Система может отдать предпочтение другим специализированным результатам, понижая или скрывая блок Local Pack/Maps.

Вопросы и ответы

На какие именно результаты поиска влияет этот патент?

Патент сфокусирован исключительно на Specialized Results — результатах из вертикальных поисковых систем, которые подмешиваются в основную выдачу (Universal Search). Примеры включают блоки Новостей, Картинок, Карт, Товаров и т.д. Патент не описывает персонализацию ранжирования стандартных "синих ссылок" веб-поиска.

Как система узнает, что я предпочитаю определенные вертикали?

Система отслеживает ваше прошлое поведение (search related behavior). Если вы часто кликаете на результаты из блока "Новости", система регистрирует это и обновляет вашу персональную Probability Model. Это увеличивает вероятность того, что в будущем блок "Новости" будет показан вам чаще и на более высоких позициях.

Какие именно поведенческие факторы учитывает модель?

Патент перечисляет конкретные параметры: количество и частоту ваших кликов на определенную вертикаль, вашу общую поисковую активность (среднее количество запросов, средняя длина запроса), а также временные паттерны — например, ищете ли вы этот тип контента чаще по будням или выходным (Claim 2).

Означает ли это, что два разных человека увидят разный состав SERP по одному и тому же запросу?

Да, именно это и является целью изобретения. Если один пользователь предпочитает изображения, а другой — новости, система постарается адаптировать выдачу под их предпочтения, показав предпочтительную вертикаль выше или включив ее в выдачу. Состав и порядок блоков Specialized Results будут отличаться.

Как это влияет на SEO-стратегию по продвижению в вертикальном поиске?

Это подчеркивает необходимость комплексного подхода. Недостаточно быть релевантным только в одной вертикали. Вы должны оптимизировать сайт под все релевантные вертикали (Изображения, Новости, Видео и т.д.), чтобы максимизировать шансы на показ независимо от персональных предпочтений пользователя.

Может ли система ранжировать специализированные блоки между собой?

Да. Патент (Claim 18) описывает механизм присвоения оценок (scoring) специализированным результатам на основе предсказанной вероятности клика. Если система решает показать несколько блоков (например, Новости и Картинки), блок с более высокой вероятностью клика для данного пользователя будет ранжироваться выше другого.

Как измерять эффективность SEO, если выдача постоянно меняется из-за персонализации?

Это усложняет мониторинг позиций. Необходимо больше полагаться на анализ реального трафика из разных источников (данные Search Console по типам поиска: Веб, Изображения, Новости) и использовать усредненные данные о видимости. Стандартные сервисы съема позиций могут не отражать реальную картину, которую видит ваша целевая аудитория.

Применяется ли эта персонализация, если пользователь не вошел в аккаунт Google?

Патент упоминает, что идентификация пользователя может осуществляться через информацию об аккаунте, файлы cookie или IP-адрес. Это означает, что система может применять персонализацию на основе истории поиска, связанной с браузером (через cookies), даже если пользователь не авторизован.

Что важнее для SEO в контексте этого патента: качество контента или поведение пользователя?

Оба фактора важны, но на разных этапах. Качество контента и его оптимизация необходимы для ранжирования внутри вертикали (чтобы попасть в кандидаты). Поведение пользователя определяет, будет ли сама вертикаль выбрана для показа в SERP и насколько высоко она будет ранжироваться относительно других вертикалей.

Влияет ли этот механизм на ранжирование внутри самой вертикали?

Нет. Патент описывает механизм выбора и ранжирования *типов* специализированных результатов (т.е. самих блоков вертикалей) в общей выдаче. Он не описывает, как ранжируются отдельные документы внутри конкретной вертикали (например, какая новость будет первой в блоке "Новости").

Похожие патенты

Как Google определяет и ранжирует вертикали поиска (Web, Images, News, Local) на основе интента запроса и профиля пользователя
Патент описывает фундаментальный механизм Универсального Поиска (Universal Search). Система генерирует результаты из разных индексов (Web, Картинки, Новости, Карты) и вычисляет «Оценку Вероятности» (Likelihood Value) для каждой категории. Эта оценка определяет, какая вертикаль наиболее релевантна интенту запроса. Для расчета используются как агрегированные данные о поведении всех пользователей по схожим запросам, так и индивидуальный профиль пользователя.
  • US7966309B2
  • 2011-06-21
  • Семантика и интент

  • Персонализация

  • SERP

Как Google использует историю поиска, поведение и многофакторные профили пользователей для персонализации поисковой выдачи
Google создает детальные профили пользователей на основе истории запросов, взаимодействия с результатами (клики, время просмотра) и анализа контента посещенных страниц. Эти профили (включающие интересы по терминам, категориям и ссылкам) используются для корректировки стандартных оценок ранжирования. Степень персонализации динамически регулируется уровнем уверенности системы в профиле (Confidence Score).
  • US9298777B2
  • 2016-03-29
  • Персонализация

  • Поведенческие сигналы

  • SERP

Как Google использует историю поиска и браузера для персонализации выдачи и определения предпочтений пользователя
Google записывает историю поиска, кликов по результатам и рекламе, а также посещенные сайты в централизованную базу данных пользователя. Эта информация используется для модификации поисковой выдачи: повышения позиций ранее посещенных сайтов, предложения связанных запросов и определения "предпочтительных местоположений" (избранного). Система позволяет пользователю контролировать сбор данных (подписка) и объединять историю с разных устройств.
  • US7747632B2
  • 2010-06-29
  • Персонализация

  • Поведенческие сигналы

  • SERP

Как Google использует статистику поиска и кликов по разным вертикалям (Web, Картинки, Видео) для определения предпочтительного типа контента и ранжирования в Универсальном Поиске
Google анализирует, в каких вертикалях (корпусах) пользователи чаще ищут определенный запрос и на какие типы результатов они кликают в смешанной выдаче. Система вычисляет "Меру относительной релевантности" для каждого корпуса и использует её для повышения результатов из наиболее предпочтительного корпуса, учитывая язык, страну пользователя и актуальные тренды.
  • US8359309B1
  • 2013-01-22
  • SERP

  • Поведенческие сигналы

  • Мультимедиа

Как Google использует фразы и тематические кластеры из истории пользователя для персонализации результатов поиска
Google может строить модель интересов пользователя, анализируя семантически значимые фразы и тематические кластеры в контенте, который пользователь потребляет (просматривает, сохраняет, печатает). При последующих запросах система повышает в ранжировании те документы, которые содержат фразы, одновременно релевантные запросу и присутствующие в профиле интересов пользователя.
  • US7580929B2
  • 2009-08-25
  • Персонализация

  • Семантика и интент

  • Поведенческие сигналы

Популярные патенты

Как Google рассчитывает «сигнал конкурентоспособности» (Competition Signal) страниц на основе анализа кликов, показов и времени взаимодействия
Google оценивает качество страниц, анализируя их «победы» и «поражения» в поисковой выдаче. Система сравнивает, как часто пользователи выбирают данный URL вместо других и как долго они взаимодействуют с контентом по сравнению с конкурентами (Dwell Time). На основе этих данных рассчитывается корректирующий фактор, который повышает или понижает позиции страницы, отражая её относительную конкурентоспособность и удовлетворенность пользователей.
  • US9020927B1
  • 2015-04-28
  • Поведенческие сигналы

  • SERP

  • EEAT и качество

Как Google агрегирует поведенческие данные из похожих запросов для ранжирования редких и длиннохвостых запросов
Google использует механизм обобщения запросов для улучшения ранжирования, особенно когда исторических данных по исходному запросу недостаточно. Система создает варианты запроса (удаляя стоп-слова, используя синонимы, стемминг или частичное совпадение) и агрегирует данные о поведении пользователей (клики, dwell time) из этих вариантов. Это позволяет оценить качество документа для исходного запроса, используя статистику из семантически близких запросов.
  • US9110975B1
  • 2015-08-18
  • Поведенческие сигналы

  • Семантика и интент

  • SERP

Как Google понижает в выдаче результаты, которые пользователь уже видел или проигнорировал в рамках одной поисковой сессии
Google использует механизм для улучшения пользовательского опыта во время длительных поисковых сессий. Если пользователь вводит несколько связанных запросов подряд, система идентифицирует результаты, которые уже появлялись в ответ на предыдущие запросы. Эти повторяющиеся результаты понижаются в ранжировании для текущего запроса, чтобы освободить место для новых, потенциально более полезных страниц. Понижение контролируется порогом релевантности, чтобы не скрывать важный контент.
  • US8051076B1
  • 2011-11-01
  • SERP

  • Поведенческие сигналы

Как Google использует интерактивные визуальные цитаты для генерации и уточнения ответов в мультимодальном поиске (SGE/Lens)
Google использует механизм для улучшения точности ответов, генерируемых LLM в ответ на мультимодальные запросы (изображение + текст). Система находит визуально похожие изображения, извлекает текст из их источников и генерирует ответ. Этот ответ сопровождается «визуальными цитатами» (исходными изображениями). Если пользователь видит, что цитата визуально не соответствует запросу, он может её отклонить. Система удалит текст этого источника и перегенерирует ответ, повышая его точность.
  • US20240378237A1
  • 2024-11-14
  • Мультимедиа

  • EEAT и качество

  • Семантика и интент

Как Google использует крупномасштабное машинное обучение и данные о поведении пользователей для предсказания кликов и ранжирования результатов
Google использует систему машинного обучения для создания модели ранжирования, которая предсказывает вероятность клика пользователя по документу. Модель обучается на огромных массивах данных о прошлых поисках (запросы, документы, клики). Система учитывает базовую вероятность клика (Prior Probability), основанную на позиции и предыдущей оценке документа, а затем корректирует её с помощью правил, выявляющих, какие признаки (Features) документа и запроса влияют на выбор пользователя.
  • US7231399B1
  • 2007-06-12
  • Поведенческие сигналы

Как Google использует машинное зрение и исторические клики для определения визуального интента и ранжирования изображений
Google использует систему, которая определяет визуальное значение текстового запроса, анализируя объекты на картинках, которые пользователи выбирали ранее по этому или похожим запросам. Система создает набор «меток контента» (визуальный профиль) для запроса и сравнивает его с объектами, распознанными на изображениях-кандидатах с помощью нейросетей. Это позволяет ранжировать изображения на основе их визуального соответствия интенту пользователя.
  • US20200159765A1
  • 2020-05-21
  • Семантика и интент

  • Мультимедиа

  • Персонализация

Как Google корректирует позиционную предвзятость (Position Bias) при обучении моделей ранжирования на кликах пользователей
Google использует механизм для устранения позиционной предвзятости (Position Bias) при обучении моделей ранжирования (Learning to Rank). Система анализирует, на какой позиции находился кликнутый результат, и присваивает этому клику вес важности. Клики по нижним позициям получают больший вес, чем клики по ТОП-1. Это позволяет модели учиться определять истинную релевантность, а не просто копировать существующий порядок выдачи.
  • US20210125108A1
  • 2021-04-29
  • Поведенческие сигналы

  • SERP

Как Google использует историю чтения новостных сайтов для определения географических интересов пользователя и персонализации выдачи
Google может определять географические интересы пользователя, анализируя местоположение издателей новостных сайтов, которые он посещал. Эта информация (Geo Signal) используется для корректировки ранжирования будущих поисковых запросов, повышая результаты, релевантные этим интересам, даже если пользователь физически находится в другом месте.
  • US20130246381A1
  • 2013-09-19
  • Персонализация

  • Поведенческие сигналы

  • SERP

Как Google использует последовательность кликов пользователей (Co-selection) для классификации изображений и фильтрации контента (SafeSearch)
Google анализирует, какие изображения пользователи выбирают последовательно в рамках одной сессии (co-selection). Если Изображение Б часто выбирается сразу после Изображения А (с известной темой), система присваивает Изображению Б ту же тему. Этот механизм использует графовый анализ поведения для уточнения тематики изображений, что критично для повышения релевантности и работы фильтров, таких как SafeSearch.
  • US8856124B2
  • 2014-10-07
  • Безопасный поиск

  • Поведенческие сигналы

  • Семантика и интент

Как Google персонализирует поиск, повышая в выдаче объекты, которые пользователь ранее явно отметил как интересные
Google использует механизм персонализации поисковой выдачи. Если пользователь явно отметил определенный объект (например, место, компанию, веб-страницу) как интересующий его, этот объект получит значительное повышение в ранжировании при последующих релевантных запросах этого пользователя. Уровень повышения зависит от степени интереса, указанной пользователем.
  • US20150242512A1
  • 2015-08-27
  • Персонализация

  • Поведенческие сигналы

  • SERP

seohardcore