SEO HARDCORE
  • Разборы патентов
    • Патенты Google
  • Скоро SEO инструменты
  • Скоро SEO аналитика
  • seohardcore
SEO HARDCORE
назад

Как Google формирует универсальную выдачу (Universal Search), смешивая и ранжируя результаты из разных вертикалей поиска

INTERFACE FOR A UNIVERSAL SEARCH ENGINE (Интерфейс для универсальной поисковой системы)
  • US7447678B2
  • Google LLC
  • 2003-12-31
  • 2008-11-04
  • SERP
  • Описание
  • Разбор
  • Выводы
  • Практика
  • FAQ
  • Похожие

Патент описывает фундаментальный механизм "Универсального Поиска". Google одновременно ищет информацию по запросу в разных категориях (Веб, Новости, Товары, Картинки). Система ранжирует не только документы, но и сами категории по релевантности запросу, определяя, какие результаты объединить в единую выдачу и насколько заметно (Prominence) они будут представлены.

Описание

Какую проблему решает

Патент решает проблему «изолированности» вертикального поиска. Ранее пользователям приходилось вручную выбирать категорию поиска (например, Новости или Картинки), но большинство игнорировало эти опции и использовало только основной (дефолтный) веб-поиск. Это приводило к упущению релевантного контента из специализированных индексов. Изобретение автоматизирует процесс интеграции наиболее релевантных результатов из разных вертикалей в единую поисковую выдачу.

Что запатентовано

Запатентована система и интерфейс для универсальной поисковой системы (Universal Search Engine). Ядром изобретения является метод одновременного поиска по нескольким категориям документов (вертикалям) и последующего ранжирования не только документов, но и самих категорий относительно друг друга. На основе этого ранжирования формируется смешанная страница результатов (SERP), где результаты из разных категорий представлены с разной степенью заметности (Prominence).

Как это работает

Система работает следующим образом:

  • Параллельный поиск: В ответ на запрос система одновременно ищет в нескольких категориях (например, General Web Documents, News, Products, Images).
  • Ранжирование категорий: Ranking Component оценивает, насколько каждая категория в целом релевантна запросу. Это может основываться на анализе полученных результатов или на анализе самого запроса (например, наличие триггерных слов).
  • Генерация интерфейса (Blending): Interface Generation Component создает единую SERP. Результаты группируются в секции по категориям.
  • Определение заметности (Prominence): Более высоко ранжированные категории представляются более заметно. Это может выражаться в большем количестве ссылок, наличии сниппетов, специальном форматировании или более высоком расположении на странице.

Актуальность для SEO

Критически высокая. Этот патент описывает фундаментальную концепцию «Universal Search» (Универсальный поиск) или «Blended Search» (Смешанный поиск), которая была внедрена Google и лежит в основе архитектуры современной поисковой выдачи. Механизмы смешивания вертикалей определяют, как пользователи видят результаты сегодня.

Важность для SEO

Патент имеет критическое значение (10/10) для SEO. Он определяет структуру современной SERP и вводит понятие конкуренции между различными типами контента. Это напрямую влияет на стратегию: недостаточно фокусироваться только на основном веб-поиске («10 синих ссылках»). Необходимо оптимизировать контент под релевантные вертикали (Картинки, Видео, Новости, Товары), так как система активно смешивает эти результаты, определяя общую видимость ресурса.

Детальный разбор

Термины и определения

Classifier (Классификатор)
Компонент системы, который на этапе индексирования анализирует входящие документы и определяет их принадлежность к одной или нескольким категориям на основе их источника, содержания и/или структуры.
Document Category (Категория документа / Вертикаль)
Специализированный индекс или сегмент базы данных. Примеры в патенте: Sponsored Links (Реклама), News (Новости), Products (Товары), Discussion Groups (Дискуссионные группы), Images (Картинки) и General Web Documents (Общие веб-документы).
Interface Generation Component (Компонент генерации интерфейса)
Компонент, который формирует итоговую веб-страницу (SERP), размещая результаты из разных категорий в соответствии с их ранжированием и определенной степенью заметности.
Prominence (Заметность)
Степень визуального выделения секции результатов на странице. Высокая заметность может включать большее количество ссылок, наличие текстовых сниппетов или специального форматирования. Низкая заметность может быть представлена одной ссылкой на категорию.
Ranking Component (Компонент ранжирования)
Ключевой компонент, который определяет относительную релевантность целых категорий (вертикалей) для данного запроса.
Search Component (Поисковый компонент)
Компонент, выполняющий фактический поиск по индексам категорий и возвращающий списки релевантных документов для каждой из них.
Textual Snippet (Текстовый сниппет)
Текстовое описание документа, отображаемое вместе со ссылкой. Его наличие или отсутствие используется в патенте как ключевой критерий определения заметности (Prominence).

Ключевые утверждения (Анализ Claims)

Claim 1 (Независимый пункт): Описывает основной метод работы универсального поиска.

  1. Система получает поисковый запрос.
  2. Выполняется поиск по нескольким категориям документов для получения списка результатов по каждой категории.
  3. Система ранжирует категории документов относительно друг друга. Ранжирование основано на контенте документов в полученных списках результатов.
  4. Генерируется документ (SERP), в котором результаты из как минимум двух категорий представлены в отдельных секциях.
  5. Секции отображаются с разной степенью заметности (Prominence) в зависимости от ранжирования. Первая секция (более высокая категория) более заметна, чем вторая (более низкая категория).
  6. Критическое определение заметности: Первая секция показывает текстовые сниппеты (textual snippet) для результатов, а вторая секция НЕ показывает текстовый сниппет для каждого из перечисленных результатов.

Claim 7 (Зависимый от 1): Уточняет, что ранжирование категорий может также основываться на самом поисковом запросе (а не только на контенте результатов).

Claim 11 (Зависимый от 1): Детализирует вид секции с низкой заметностью. Вторая (низкоранжированная) секция может не содержать прямых ссылок на документы, а только индикацию количества найденных результатов и ссылку на полный список результатов этой категории.

Claim 12 (Зависимый от 1): Указывает, что ранжирование категорий может производиться независимо от общего количества документов в списках результатов.

Claim 13 (Независимый пункт): Описывает архитектуру системы.

  1. Search component ищет по категориям.
  2. Ranking component ранжирует категории. Ранжирование основано на сравнении поискового запроса с контентом документов в списках результатов.
  3. Interface generation component генерирует SERP с секциями разной заметности (определяемой наличием/отсутствием сниппетов), как в Claim 1.

Где и как применяется

Изобретение является архитектурным и затрагивает несколько ключевых этапов поиска, формируя механизм Universal Search.

INDEXING – Индексирование и извлечение признаков
На этом этапе работает Classifier. Входящие документы анализируются и классифицируются по соответствующим категориям (News, Products, Images и т.д.). Каждая категория может храниться как отдельный специализированный индекс.

QUNDERSTANDING – Понимание Запросов
Анализ запроса может использоваться для выявления триггеров, которые влияют на ранжирование категорий (например, слово «buy» может повысить ранг категории Products).

RANKING – Ранжирование
Search Component выполняет параллельные поисковые запросы к индексам различных категорий. Для каждой категории формируется свой ранжированный список релевантных документов.

METASEARCH – Метапоиск и Смешивание (Universal Search & Blending)
Это основной этап применения патента.

  1. Ранжирование категорий: Ranking Component оценивает результаты, полученные на этапе RANKING, и определяет относительную релевантность каждой категории для данного запроса.
  2. Смешивание (Blending) и Генерация интерфейса: Interface Generation Component объединяет результаты. Он определяет степень заметности (Prominence) для каждой категории и формирует финальную структуру SERP с отдельными секциями.

Входные данные:

  • Поисковый запрос пользователя.
  • Списки релевантных документов из каждой категории (Вертикали).

Выходные данные:

  • Единая веб-страница (Blended SERP), содержащая сгруппированные по секциям результаты из нескольких категорий с разной степенью визуальной заметности.

На что влияет

  • Все типы контента и запросов: Патент влияет на отображение всех типов результатов, определяя структуру SERP (будут ли показаны только «синие ссылки» или подмешаны специализированные блоки).
  • Специфические запросы: Наиболее заметное влияние на запросы с явным интентом: коммерческие (активация Products), новостные (активация News) и мультимедийные (активация Images).

Когда применяется

Механизм оценки релевантности вертикалей работает практически при каждом запросе.

  • Триггеры активации: Появление конкретного специализированного блока активируется, когда Ranking Component определяет, что данная категория имеет достаточно высокий ранг релевантности для запроса. Это может быть вызвано высоким качеством результатов в этой категории или наличием специфических терминов в запросе.

Пошаговый алгоритм

Процесс работы универсальной поисковой системы:

  1. Получение запроса: Система получает запрос от пользователя.
  2. Параллельный поиск по категориям: Search Component одновременно направляет запрос к индексам доступных категорий (Веб, Новости, Товары, Изображения и т.д.). Формируются списки релевантных результатов для каждой категории.
  3. Ранжирование категорий: Ranking Component оценивает относительную релевантность каждой категории. Оценка производится путем анализа контента найденных документов или путем анализа триггерных слов в запросе.
  4. Генерация SERP и определение заметности: Interface Generation Component формирует итоговую веб-страницу. На основе ранжирования категорий определяется их порядок и степень заметности (Prominence).
  5. Применение уровней заметности:
    • Высокая заметность: Категория отображается заметно, включает несколько ссылок, текстовые сниппеты (обязательное условие по Claim 1) и, возможно, специальное форматирование (например, изображения).
    • Низкая заметность: Категория может быть представлена только ссылкой на результаты поиска в этой категории и указанием количества найденных документов, без прямых ссылок на документы и без сниппетов.
  6. Возврат результата: Сформированная смешанная страница возвращается пользователю.

Какие данные и как использует

Данные на входе

  • Контентные факторы: Содержание (contents) документов в каждой категории. Это ключевой фактор для Ranking Component при определении релевантности всей категории запросу.
  • Структурные факторы: Тип документа, его структура и метаданные используются Classifier на этапе индексирования для распределения документов по категориям.
  • Пользовательские факторы (Запрос): Текст запроса используется как для поиска документов, так и для выявления слов-триггеров, указывающих на интент и релевантность конкретных вертикалей.

Какие метрики используются и как они считаются

Патент не дает конкретных формул, но описывает принципы расчета метрик:

  • Релевантность категории (Category Relevance): Определяется Ranking Component. Методы расчета:
    1. Сравнение запроса с контентом топовых документов в каждой категории. Метрика основана на «closeness of the comparison» (близости сравнения).
    2. Анализ запроса на наличие терминов, которые указывают на конкретную категорию (например, «buy» для Products).
  • Заметность (Prominence): Метрика, определяющая формат вывода секции на SERP. Зависит от Релевантности Категории. Определяет:
    • Количество отображаемых ссылок.
    • Наличие или отсутствие текстовых сниппетов (ключевой критерий в Claim 1).
    • Наличие специального форматирования (изображения, цены).

Выводы

  1. Основа Universal Search: Патент описывает фундаментальный архитектурный сдвиг от поиска в изолированных индексах к созданию единой, смешанной поисковой выдачи (Blended SERP).
  2. Ранжирование вертикалей — ключевой процесс: Система динамически ранжирует не только отдельные документы, но и целые вертикали (категории). Это определяет структуру SERP для каждого конкретного запроса.
  3. Релевантность важнее количества: Решение о ранжировании категории не зависит от общего количества найденных результатов (Claim 12), а базируется на релевантности контента топовых документов в этой вертикали.
  4. Заметность (Prominence) как инструмент управления: Google активно управляет визуальным представлением результатов. Наличие или отсутствие сниппетов является ключевым фактором заметности согласно патенту, что позволяет выделить наиболее релевантный тип контента.
  5. Необходимость кросс-категорийной оптимизации: Для достижения максимальной видимости SEO-стратегия должна охватывать все релевантные специализированные вертикали, а не только основной веб-поиск.

Практика

Best practices (это мы делаем)

  • Комплексная мультиформатная стратегия: Создавать и оптимизировать контент под все релевантные для бизнеса вертикали (Images, News, Products и т.д.). Присутствие в нескольких вертикалях максимизирует общую видимость в смешанной выдаче.
  • Анализ интента и структуры SERP: Регулярно анализировать выдачу по целевым запросам, чтобы понять, какие вертикали активирует Google. Если Ranking Component высоко оценивает Products для запроса, необходимо инвестировать в оптимизацию товарных предложений.
  • Использование структурированных данных для классификации: Активно внедрять микроразметку (Schema.org) для Товаров (Product), Новостей (NewsArticle), Изображений и т.д. Это помогает Classifier корректно определить тип контента и направить его в соответствующую вертикаль.
  • Специфическая оптимизация под вертикали: Применять лучшие практики для каждой вертикали: оптимизация фидов для Google Merchant Center, соответствие требованиям Google News, Image SEO (alt-теги, контекст).

Worst practices (это делать не надо)

  • Игнорирование вертикального поиска: Фокусироваться исключительно на оптимизации под «синие ссылки» (General Web Documents). Это приводит к потере видимости в специализированных блоках, которые часто занимают приоритетные позиции.
  • Недооценка мультимедийного контента: Отсутствие качественных, оптимизированных изображений или видео исключает сайт из соответствующих вертикалей, снижая общую эффективность присутствия в Universal Search.
  • Игнорирование технических требований вертикалей: Попытка продвигать товары без использования продуктовых фидов или микроразметки, что затрудняет классификацию контента и попадание в блок Products.

Стратегическое значение

Этот патент заложил архитектурную основу современной поисковой выдачи. Он подтверждает стратегию Google предоставлять пользователю наилучший ответ на запрос, независимо от формата контента. Для SEO это означает, что долгосрочная стратегия должна быть мультиформатной. Конкуренция происходит не только между веб-страницами, но и между разными типами контента за место в различных блоках SERP. Понимание механизмов ранжирования и смешивания вертикалей критически важно.

Практические примеры

Сценарий: Оптимизация интернет-магазина под Universal Search

  1. Запрос: «Купить кроссовки Nike Air Max».
  2. Анализ системы: Запрос имеет явный коммерческий интент (триггер «купить»). Ranking Component присваивает категории Products наивысший ранг.
  3. Генерация SERP: Interface Generation Component размещает блок Products (Google Shopping) с высокой Prominence — вверху страницы, с изображениями и ценами.
  4. Действия SEO:
    • Обеспечить наличие оптимизированного фида в Merchant Center.
    • Внедрить микроразметку Product на страницах товаров.
    • Оптимизировать изображения товаров (Image SEO).
  5. Результат: Сайт получает видимость в высоко конверсионном блоке товаров, даже если он не занимает топ-1 в органической веб-выдаче (General Web Documents).

Вопросы и ответы

Что такое «Universal Search» (Универсальный поиск) согласно этому патенту?

Это механизм, при котором поисковая система одновременно ищет информацию в нескольких специализированных индексах (категориях или вертикалях), таких как Веб, Новости, Товары, Картинки. Затем она объединяет наиболее релевантные результаты из них на одной странице выдачи (SERP), избавляя пользователя от необходимости искать в каждой категории отдельно.

Как Google решает, какой блок (Новости, Картинки, Товары) показать выше или сделать более заметным?

Решение принимает Ranking Component. Он ранжирует сами категории по релевантности запросу. Это делается двумя основными способами: 1) путем анализа контента лучших результатов в каждой категории и сравнения его с запросом; 2) путем поиска триггерных слов в запросе (например, «купить» повышает ранг категории Товары). Более релевантная категория получает более высокую заметность (Prominence).

Что конкретно означает «Prominence» (Заметность) блока в этом патенте?

Заметность — это степень визуального выделения блока. В патенте (Claim 1) ключевым отличием высокой заметности является обязательное наличие текстовых сниппетов у результатов. Также заметность может определяться большим количеством ссылок, позицией на странице или наличием визуальных элементов (например, изображений).

Влияет ли общее количество найденных результатов в категории на ее ранжирование?

Нет. Патент явно указывает (Claim 12), что ранжирование категорий может производиться независимо от общего количества документов в списках результатов. Важна релевантность контента топовых документов в этой категории, а не общий размер индекса или количество совпадений.

Как этот патент влияет на SEO для E-commerce?

Влияние критическое. Для коммерческих запросов система активно оценивает категорию Products. Если она признана высокорелевантной, блок товаров получит высокую Prominence и займет лучшие позиции на SERP. Поэтому оптимизация под Google Shopping (Merchant Center) и использование микроразметки товаров обязательны для видимости.

Как помочь Google (компоненту Classifier) правильно классифицировать контент сайта?

Лучший способ — использовать явные сигналы, в первую очередь структурированные данные (Schema.org). Разметка Product для товаров, NewsArticle для новостей, ImageObject для изображений помогает системе однозначно идентифицировать тип контента и направить его в соответствующий индекс (вертикаль).

Может ли результат из вертикального поиска (например, Картинка) ранжироваться выше, чем лучший результат из основного веб-поиска?

Да. Если Ranking Component определит, что категория (например, Images) более релевантна запросу, чем категория General Web Documents, то блок этой категории будет размещен выше и получит большую визуальную заметность на странице результатов.

Нужно ли SEO-специалисту оптимизировать сайт под все вертикали сразу?

Необходимо оптимизировать под те вертикали, которые релевантны для бизнеса и часто появляются по целевым запросам. Анализируйте SERP, чтобы понять, какие типы контента предпочитает Google, и создавайте оптимизированный контент в этих форматах. Комплексный подход увеличивает общую видимость в Универсальном поиске.

Насколько актуален этот механизм, учитывая дату подачи патента (2003 год)?

Актуальность критически высока. Этот патент описывает рождение Универсального Поиска. Хотя реализация алгоритмов смешивания и ранжирования стала намного сложнее (с использованием ИИ и ML), базовая архитектура, описанная здесь (параллельный поиск, ранжирование вертикалей, смешивание результатов), по-прежнему определяет, как функционирует современный поиск Google.

Какова связь этого патента с современными SERP Features (Специальными элементами выдачи)?

Описанный механизм является архитектурной основой для SERP Features. Блоки Новостей (Top Stories), Карусели Изображений, Товарные блоки — это реализация концепции отображения различных категорий документов с разной степенью заметности в едином интерфейсе. Современные SERP Features — это эволюция этих «категорий».

Похожие патенты

Как Google определяет и ранжирует вертикали поиска (Web, Images, News, Local) на основе интента запроса и профиля пользователя
Патент описывает фундаментальный механизм Универсального Поиска (Universal Search). Система генерирует результаты из разных индексов (Web, Картинки, Новости, Карты) и вычисляет «Оценку Вероятности» (Likelihood Value) для каждой категории. Эта оценка определяет, какая вертикаль наиболее релевантна интенту запроса. Для расчета используются как агрегированные данные о поведении всех пользователей по схожим запросам, так и индивидуальный профиль пользователя.
  • US7966309B2
  • 2011-06-21
  • Семантика и интент

  • Персонализация

  • SERP

Как Google использует позиционный CTR (Selection Rate) для ранжирования и группировки вертикалей в Универсальном поиске
Google использует механизм для структурирования поисковой выдачи путем группировки результатов по категориям (вертикалям), таким как Новости, Видео или Веб. Система определяет порядок этих категорий, основываясь на ожидаемой частоте кликов (Selection Rate/CTR) тех позиций, которые занимают результаты категории в исходном смешанном ранжировании. Это определяет структуру Универсального поиска (Universal Search).
  • US8498984B1
  • 2013-07-30
  • SERP

  • Поведенческие сигналы

Как Google использует категоризацию контента и запросов для уточнения релевантности и ранжирования результатов
Google использует систему для улучшения ранжирования, комбинируя стандартную текстовую релевантность с оценкой соответствия категории. Система определяет, насколько сильно документ принадлежит к определенным категориям и насколько сильно запрос соответствует этим же категориям. Если и документ, и запрос сильно совпадают по категории, результат получает повышение в ранжировании. Это особенно важно для E-commerce и контента с четкой структурой.
  • US7814085B1
  • 2010-10-12
  • Семантика и интент

  • SERP

Как Google динамически переключает выдачу с общего поиска на специализированные вертикали (Рецепты, Вакансии, Товары)
Патент описывает, как Google динамически определяет тематические "режимы поиска" (например, "Вакансии" или "Рецепты") на основе запроса. Система предлагает переключиться в специализированный режим, который использует структурированные данные вместо общего веб-индекса и предоставляет уникальные элементы интерфейса для фильтрации, сортировки и форматирования результатов по атрибутам, специфичным для данной тематики.
  • US7890499B1
  • 2011-02-15
  • SERP

  • Семантика и интент

Как Google использует выделенный на странице контент для параллельного поиска в специализированных базах данных (приложения, расширения, товары)
Google патентует механизм «ассистированного поиска» для специализированных баз данных (например, магазинов приложений или расширений). Пользователь выделяет контент (текст/изображение) на веб-странице, и система использует его как запрос. Специальный конвертер анализирует выделенное, определяет несколько возможных интентов, оптимизирует их под конкретную базу данных и выполняет параллельный поиск, выдавая сгруппированные результаты.
  • US20230214427A1
  • 2023-07-06
  • Семантика и интент

  • SERP

Популярные патенты

Как Google использует контекст пользователя в реальном времени и машинное обучение для переранжирования результатов поиска
Google использует систему для прогнозирования истинного намерения пользователя на основе его текущего контекста (местоположение, время, среда, недавние действия) и исторических данных о поведении других пользователей в аналогичных ситуациях. Система переранжирует стандартные результаты поиска, чтобы выделить информацию (особенно "Search Features"), которая наиболее соответствует прогнозируемому намерению.
  • US10909124B2
  • 2021-02-02
  • Семантика и интент

  • Персонализация

  • SERP

Как Google итеративно распознает сущности на страницах и рассчитывает их важность с помощью PageRank
Google использует итеративный процесс для распознавания и устранения неоднозначности сущностей (людей, мест, понятий) в документах. Система начинает с известных фактов, находит упоминающие сущность документы, анализирует сопутствующие термины для уточнения модели распознавания и автоматически обнаруживает новые признаки. Патент также описывает расчет важности сущности путем суммирования PageRank ссылающихся документов, взвешенного на вероятность ссылки.
  • US8122026B1
  • 2012-02-21
  • Семантика и интент

  • Ссылки

  • Knowledge Graph

Как Google использует реальные данные о скорости загрузки страниц (RUM) для повышения быстрых и понижения медленных сайтов в выдаче
Google собирает данные о времени загрузки страниц у реальных пользователей (RUM) и использует их для корректировки ранжирования. Система сравнивает скорость сайта с глобальными порогами, основанными на процентилях. Если сайт медленнее большинства других (например, медленнее 85% или 96%), его рейтинг понижается. Очень быстрые сайты могут получать повышение. Оценка скорости учитывает географию и тип устройства пользователя.
  • US8645362B1
  • 2014-02-04
  • Техническое SEO

  • Поведенческие сигналы

  • SERP

Как Google использует крупномасштабное машинное обучение и данные о поведении пользователей для предсказания кликов и ранжирования результатов
Google использует систему машинного обучения для создания модели ранжирования, которая предсказывает вероятность клика пользователя по документу. Модель обучается на огромных массивах данных о прошлых поисках (запросы, документы, клики). Система учитывает базовую вероятность клика (Prior Probability), основанную на позиции и предыдущей оценке документа, а затем корректирует её с помощью правил, выявляющих, какие признаки (Features) документа и запроса влияют на выбор пользователя.
  • US7231399B1
  • 2007-06-12
  • Поведенческие сигналы

Как Google вычисляет семантическую близость запросов, анализируя поведение пользователей при переформулировках
Google использует механизм для определения семантического расстояния между запросами (Generalized Edit Distance). Вместо подсчета изменений символов система анализирует исторические логи, чтобы понять, как пользователи переформулируют запросы. На основе этих данных вычисляется «стоимость» замены одного термина на другой с помощью Pointwise Mutual Information (PMI), что позволяет генерировать более релевантные подсказки и расширения запросов.
  • US8417692B2
  • 2013-04-09
  • Семантика и интент

  • Поведенческие сигналы

Как Google использует анализ сопутствующих ссылок (co-citation) и нормализацию веса для определения связанных сайтов и конкурентов
Google анализирует структуру ссылок для поиска сайтов, связанных с выбранным документом и находящихся на том же уровне обобщения (например, конкурентов). Система определяет, на какие еще сайты ссылаются источники, цитирующие исходный документ (co-citation). Для повышения точности вес ссылок нормализуется: снижается влияние множественных ссылок с одного хоста и ссылок со страниц-каталогов (хабов).
  • US6754873B1
  • 2004-06-22
  • Ссылки

  • SERP

  • Техническое SEO

Как Google использует клики пользователей в поиске по картинкам для понимания содержания изображений и улучшения таргетинга
Google анализирует поведение пользователей в поиске по картинкам для идентификации содержания изображений. Если пользователи ищут определенный запрос (идею) и массово кликают на конкретное изображение в результатах, система связывает это изображение с данным запросом (концепцией). Эти данные используются для улучшения ранжирования в поиске картинок и для предложения релевантных ключевых слов рекламодателям, загружающим схожие изображения.
  • US11409812B1
  • 2022-08-09
  • Поведенческие сигналы

  • Семантика и интент

  • SERP

Как Google предсказывает следующий запрос пользователя на основе контента текущей страницы и исторических данных
Google использует машинное обучение для анализа логов поведения пользователей, чтобы понять, что они ищут после посещения определенного контента. Система создает совместное векторное пространство (joint embedding) для документов и запросов, где близость отражает семантическую связь и вероятность совместной встречаемости. Это позволяет предлагать релевантные последующие запросы (query suggestions) в реальном времени, даже если ключевые слова для этих запросов на странице отсутствуют.
  • US9594851B1
  • 2017-03-14
  • Семантика и интент

  • Поведенческие сигналы

  • Персонализация

Как Google использует контекст и анализ офлайн-поведения (Read Ranking) для соединения физических документов с цифровыми копиями
Система идентифицирует цифровой контент по сканированному фрагменту из физического мира, используя не только текст, но и обширный контекст (время, местоположение, историю пользователя). Патент также вводит концепцию «Read Ranking» — отслеживание популярности физических документов на основе того, что люди сканируют, как потенциальный сигнал ранжирования.
  • US20110295842A1
  • 2011-12-01
  • Поведенческие сигналы

  • Персонализация

  • Семантика и интент

Как Google использует клики (CTR) и время на сайте (Click Duration) для выявления спама и корректировки ранжирования в тематических выдачах
Google использует итеративный процесс для улучшения классификации контента и выявления спама, анализируя поведенческие сигналы (CTR и продолжительность клика). Если пользователи быстро покидают документ или игнорируют его в выдаче, он помечается как спам или нерелевантный теме. Эти данные затем используются для переобучения классификатора и корректировки ранжирования для будущих тематических запросов.
  • US7769751B1
  • 2010-08-03
  • Поведенческие сигналы

  • Антиспам

  • SERP

seohardcore