SEO HARDCORE
  • Разборы патентов
    • Патенты Google
  • Скоро SEO инструменты
  • Скоро SEO аналитика
  • seohardcore
SEO HARDCORE
назад

Как Google переносит данные о поведении пользователей из основного веб-поиска для улучшения ранжирования в вертикальных поисках (Книги, Товары)

SHARING SEARCH ENGINE RELEVANCE DATA BETWEEN CORPORA (Совместное использование данных о релевантности поисковых систем между корпусами документов)
  • US8396865B1
  • Google LLC
  • 2008-12-10
  • 2013-03-12
  • Поведенческие сигналы
  • Google Shopping
  • SERP
  • Описание
  • Разбор
  • Выводы
  • Практика
  • FAQ
  • Похожие

Google использует механизм для решения проблемы «холодного старта» в специализированных или новых поисковых вертикалях. Система идентифицирует один и тот же объект (например, товар или книгу по уникальному идентификатору) в разных корпусах. Затем она заимствует данные о релевантности (клики, время просмотра) из высокопосещаемого общего веб-поиска для корректировки ранжирования в вертикальном поиске, пока не накопит достаточно собственных данных.

Описание

Какую проблему решает

Патент решает проблему недостатка данных о поведении пользователей (relevance data) для новых документов или в специализированных поисковых системах (вертикалях) с низким трафиком. Эта проблема, известная как «холодный старт», не позволяет системе точно оценить релевантность документов, что может приводить к низкому ранжированию качественного контента из-за отсутствия статистически значимых поведенческих сигналов.

Что запатентовано

Запатентована система, которая улучшает ранжирование в первом корпусе документов (например, Google Shopping) путем заимствования relevance data, собранных во втором корпусе (например, основном веб-поиске). Это достигается путем идентификации документов в разных корпусах (corpora), которые относятся к одному и тому же физическому объекту (physical object), например, товару или книге с уникальным идентификатором. Данные о популярности объекта переносятся из одного корпуса в другой для корректировки рейтинга.

Как это работает

Ключевой механизм — это межкорпусный обмен и динамическое взвешивание данных:

  • Идентификация объекта: Система определяет, что Документ А в Корпусе 1 и Документ Б в Корпусе 2 описывают один и тот же объект, используя уникальные идентификаторы (ISBN для книг или product identification number для товаров).
  • Заимствование данных: Система анализирует relevance data (клики, время просмотра) Документа Б в ответ на схожий запрос в Корпусе 2.
  • Корректировка ранжирования: Новый рейтинг Документа А определяется путем взвешивания (weighting) его исходного рейтинга, его собственных данных (если есть) и заимствованных данных Документа Б.
  • Затухание заимствования: По мере накопления собственных поведенческих данных для Документа А, влияние заимствованных данных из Корпуса 2 автоматически снижается.

Актуальность для SEO

Высокая. С ростом числа вертикалей поиска (Shopping, News, Video, Books) и необходимостью быстрого ранжирования нового контента, использование данных из основного веб-поиска (General Content Search Engine) для улучшения качества в специализированных вертикалях (Specific Content Search Engine) остается критически важной задачей. Механизм подчеркивает важность унификации сущностей и использования поведенческих сигналов, что соответствует современным тенденциям поиска.

Важность для SEO

Патент имеет высокое значение для SEO, особенно для E-commerce, издательского дела и продвижения в вертикальных поисках. Он демонстрирует, как популярность и поведенческие сигналы страницы об объекте в основном веб-поиске могут напрямую влиять на ранжирование этого же объекта в Google Shopping или Google Books. Это подчеркивает критическую важность использования стандартизированных уникальных идентификаторов (GTIN, ISBN) для связи различных представлений контента.

Детальный разбор

Термины и определения

Corpus of documents (Корпус документов)
Коллекция документов, индексируемая поисковой системой. В патенте различаются первый и второй корпусы (например, корпус Книг и корпус Веб-страниц).
General Content Search Engine (Поисковая система по общему контенту)
Поисковая система, которая ищет контент всех категорий (например, основной поиск Google).
Physical Object (Физический объект)
Реальный объект, описываемый в документах, который имеет уникальный идентификационный номер. Примеры: книга (с ISBN) или товар (с product identification number).
Relevance Data (Данные о релевантности)
Данные, указывающие на популярность (popularity) документа среди пользователей в ответ на запрос. Включают поведенческие сигналы: количество кликов (selections), соотношение показов к кликам (CTR) и совокупное время просмотра документа (aggregate amount of time или dwell time).
Specific Content Search Engine (Поисковая система по специфическому контенту)
Вертикальная поисковая система, которая ищет контент определенной категории (например, Google Books, Google Shopping).
Weighting (Взвешивание)
Процесс определения степени влияния собственных (первых) и заимствованных (вторых) данных о релевантности на итоговый рейтинг. Вес динамически меняется.

Ключевые утверждения (Анализ Claims)

Claim 1 (Независимый пункт): Описывает основной метод совместного использования данных о релевантности с механизмом динамического взвешивания.

  1. Система предоставляет первый запрос (Query 1) первой поисковой системе (SE 1) для поиска в первом корпусе (Corpus 1).
  2. Получается набор первых результатов (включая Документ 1) с их рейтингами.
  3. Для Документа 1 система идентифицирует «вторые данные о релевантности» (second relevance data). Эти данные показывают популярность второго результата (Документ 2) в ответ на второй запрос (Query 2, идентичный или похожий на Query 1). Идентификация основана на том, что Документ 1 и Документ 2 описывают один и тот же physical object.
  4. Система определяет новый рейтинг для Документа 1, основываясь на его исходном рейтинге и second relevance data.
  5. Критическое уточнение (включено в Claim 1): Новый рейтинг также основывается на «первых данных о релевантности» (first relevance data) – собственной популярности Документа 1.
  6. Критическое уточнение (включено в Claim 1): Определение нового рейтинга включает взвешивание (weighting) first и second relevance data.
  7. Критическое уточнение (включено в Claim 1): Взвешивание отдает предпочтение (favors) first relevance data по мере увеличения количества выборов (кликов) Документа 1.

Ядро изобретения — это не просто заимствование данных, а специфический механизм взвешивания, который гарантирует, что заимствованные данные используются как временная мера для решения проблемы «холодного старта», и их влияние снижается по мере накопления собственных данных.

Claim 3 и 4 (Зависимые от 1): Уточняют примеры объектов и идентификаторов: книга (ISBN) или товар (product identification number).

Claim 8 (Зависимый от 1): Уточняет сценарий применения: SE 1 — это specific content search engine, а SE 2 (откуда берутся данные) — это general content search engine.

Claim 9 (Зависимый от 1): Уточняет, что relevance data могут быть основаны на совокупном времени просмотра документа (aggregate amount of time).

Где и как применяется

Изобретение предполагает взаимодействие между двумя различными поисковыми системами и затрагивает несколько этапов в архитектуре поиска.

INDEXING – Индексирование и извлечение признаков
На этом этапе система должна обработать документы в обоих корпусах для идентификации физических объектов. Это включает извлечение уникальных идентификаторов (ISBN, Product ID). Также система должна определить основное содержание (primary content) документа, чтобы убедиться, что документ действительно посвящен этому объекту (например, проверяя наличие единственного ISBN или используя анализ цитирования, описанный в патенте).

RANKING – Ранжирование / RERANKING – Переранжирование
Основное применение патента. Происходит в специализированной (или новой) поисковой системе.

  1. Начальное ранжирование: Ranking Engine генерирует исходный рейтинг результатов.
  2. Активация модификатора: Rank Modifier Engine анализирует результаты. Если для результата недостаточно собственных поведенческих данных (first relevance data), активируется механизм заимствования.
  3. Запрос данных: Система идентифицирует связанный документ во втором корпусе и получает его second relevance data для похожего запроса.
  4. Взвешивание и Переранжирование: Rank Modifier Engine применяет взвешивание и корректирует финальный рейтинг.

Входные данные:

  • Первый запрос (Query 1).
  • Начальный рейтинг результатов из Корпуса 1.
  • First relevance data (поведенческие данные из Корпуса 1).
  • Идентификаторы объектов (ISBN/Product ID) для документов Корпуса 1 и 2.
  • Second relevance data (поведенческие данные из Корпуса 2).

Выходные данные:

  • Скорректированный (новый) рейтинг результатов для Query 1.

На что влияет

  • Конкретные типы контента и Ниши: Наибольшее влияние оказывается на контент, связанный с четко идентифицируемыми объектами. Это критично для E-commerce (товары), издательского дела (книги), а также может применяться к медиа, если они имеют стандартные идентификаторы.
  • Специфические запросы: Влияет на запросы в вертикальных поисковых системах (Specific content search engine), где трафик ниже, чем в основном поиске.

Когда применяется

Алгоритм применяется при выполнении следующих условий:

  • Условие 1 (Недостаток данных): Когда у первой поисковой системы недостаточно собственных first relevance data для документа. Патент описывает пороговые значения (low threshold, high threshold) количества взаимодействий (кликов/просмотров). Если активность ниже low threshold, система полагается на заимствованные данные.
  • Условие 2 (Наличие связи): Когда возможно идентифицировать один и тот же физический объект в документах первого и второго корпусов.
  • Условие 3 (Наличие данных во втором корпусе): Когда во второй поисковой системе существуют достаточные second relevance data для связанного документа по похожему запросу.

Пошаговый алгоритм

Процесс обработки запроса в первой (специализированной) поисковой системе:

  1. Предоставление запроса: Запрос предоставляется поисковой системе.
  2. Получение результатов: Поисковая система извлекает набор релевантных документов из своего корпуса.
  3. Начальное ранжирование: Результатам присваивается начальный рейтинг.
  4. Обработка результата (Итерация): Система берет результат поиска (Документ 1).
  5. Идентификация контента: Система идентифицирует физический объект (например, книгу по ISBN), описанный в Документе 1.
  6. Поиск связанного документа: Система идентифицирует второй документ (Документ 2) в другом корпусе, который описывает тот же физический объект.
  7. Определение нового рейтинга (Ключевой этап):
    1. Система получает first relevance data (популярность Документа 1) и second relevance data (популярность Документа 2 для схожего запроса).
    2. Система анализирует объем first relevance data.
    3. Взвешивание:
      – Если объем first relevance data мал (ниже порога): Вес смещается в пользу second relevance data.
      – Если объем first relevance data велик (выше порога): Вес смещается в пользу first relevance data (заимствование минимально).
      – Если объем средний: Данные комбинируются (например, усредняются).
    4. Рассчитывается новый рейтинг для Документа 1 с учетом взвешенных данных.
  8. Проверка наличия других результатов: Если есть еще результаты, процесс повторяется. Иначе завершить.

Какие данные и как использует

Данные на входе

Патент фокусируется на использовании поведенческих данных и данных для идентификации объектов.

  • Структурные/Технические факторы (Идентификаторы объектов): Данные, используемые для связи документов между корпусами.
    • ISBN (International Standard Book Number).
    • Product identification number (например, GTIN).
  • Поведенческие факторы (Relevance Data): Это ключевые данные, используемые для корректировки рейтинга. Они собираются отдельно для каждого корпуса (first и second relevance data) и привязаны к конкретным запросам. Включают:
    • Клики (user selections).
    • Время просмотра документа (time on the document, dwell time). Упоминается, что более длительное время указывает на большую релевантность.
    • Соотношение просмотров к кликам (view to click ratio).
    • Пользовательские повышения или понижения результатов.
  • Контентные факторы: Используются в офлайн-процессе для определения основного содержания документа (primary content), если уникальный идентификатор не очевиден (например, через расчет Citation Score).

Какие метрики используются и как они считаются

  • Пороги объема данных (Low/High Thresholds): Пороговые значения количества взаимодействий (кликов/просмотров) в Корпусе 1. Определяют режим взвешивания (использовать данные Корпуса 2, смешивать или использовать только данные Корпуса 1).
  • Весовые коэффициенты (Weighting): Динамические коэффициенты, применяемые к first и second relevance data на основе порогов объема данных. Формула не приводится, но описан принцип: предпочтение отдается собственным данным по мере их накопления.
  • Citation Score (Оценка цитирования): Метрика, используемая для определения основного содержания документа. Рассчитывается как мера релевантности метаданных объекта (например, название, автор) к содержанию документа.

Выводы

  1. Перенос поведенческих сигналов между корпусами: Google может использовать популярность и вовлеченность пользователей в одном индексе (например, Веб-поиск) для прямого влияния на ранжирование в другом (например, Товары или Книги). Это позволяет улучшать качество поиска там, где собственных данных недостаточно.
  2. Решение проблемы "холодного старта": Основная цель механизма — обеспечить качественное ранжирование для новых документов или низкочастотных вертикалей, пока не накоплено достаточно собственных данных о поведении пользователей.
  3. Критичность уникальных идентификаторов: Для работы системы необходима точная идентификация одного и того же объекта в разных корпусах. Использование стандартизированных идентификаторов (ISBN, GTIN/Product ID) является ключом к связыванию данных.
  4. Заимствование данных временно (Динамическое взвешивание): Механизм weighting спроектирован так, чтобы снижать влияние заимствованных данных по мере накопления собственных (first relevance data). Долгосрочное ранжирование зависит от поведения пользователей именно в целевой вертикали.
  5. Важность Dwell Time: Патент явно указывает на использование агрегированного времени просмотра документа (aggregate amount of time) как важного сигнала релевантности.

Практика

Best practices (это мы делаем)

  • Использование стандартизированных уникальных идентификаторов: Критически важно для E-commerce и издателей. Убедитесь, что все товары и книги имеют корректные идентификаторы (GTIN, ISBN) как на веб-страницах (для основного поиска), так и в фидах данных (для вертикального поиска, например, Google Shopping). Это позволяет Google связать документы и применить механизм заимствования relevance data.
  • Внедрение микроразметки: Используйте Schema.org (Product, Book) для четкой передачи идентификаторов. Это облегчает Google идентификацию объектов и их связывание между корпусами.
  • Оптимизация под поведенческие факторы в основном поиске: Обеспечивайте высокую вовлеченность пользователей на веб-страницах, описывающих ключевые продукты. Хороший CTR и длительное время взаимодействия (Dwell Time) в основном поиске могут дать буст в вертикальном поиске, так как эти положительные сигналы могут быть перенесены.
  • Обеспечение консистентности данных: Убедитесь, что метаданные (название, характеристики) консистентны между веб-страницей и фидом данных. Это помогает системе корректно идентифицировать объект.

Worst practices (это делать не надо)

  • Игнорирование или неправильное использование уникальных идентификаторов: Отсутствие GTIN/ISBN или использование некорректных идентификаторов не позволит Google связать ваши документы между корпусами, лишая вас потенциального преимущества от переноса релевантности.
  • Фокус только на вертикальном поиске: Нельзя игнорировать оптимизацию страниц продукта для основного веб-поиска, полагаясь только на фиды для Google Shopping. Популярность в основном поиске является источником данных для ранжирования в вертикальном.
  • Манипуляции с поведенческими факторами: Попытки искусственно накрутить клики или время просмотра. Патент упоминает, что система использует широкий спектр данных из логов для настройки сигнала, что подразумевает наличие механизмов фильтрации некачественного трафика.

Стратегическое значение

Патент подчеркивает стратегию Google по унификации данных и синергии между своими сервисами. Для SEO это означает, что оптимизация должна быть комплексной. Нельзя рассматривать поисковые вертикали изолированно. Поведенческие сигналы и популярность контента в основном веб-поиске являются фундаментом для ранжирования в специализированных сервисах. Это подтверждает важность работы над качеством пользовательского опыта (UX) и вовлеченностью как над ключевыми факторами ранжирования во всей экосистеме Google.

Практические примеры

Сценарий: Запуск нового товара в Google Shopping

  1. Задача: Быстро получить высокие позиции в Google Shopping (Корпус 1) для нового товара, по которому еще нет истории кликов (first relevance data отсутствуют).
  2. Действия:
    1. Убедиться, что для товара указан корректный GTIN (product identification number) в фиде для Google Shopping.
    2. Создать качественную страницу товара на сайте (Корпус 2) с тем же GTIN в микроразметке.
    3. Запустить кампанию для привлечения трафика на страницу товара на сайте и добиться высокой вовлеченности пользователей в основном поиске (second relevance data высоки).
  3. Механизм работы (по патенту):
    1. Google связывает товар в Shopping (Документ 1) и страницу на сайте (Документ 2) по GTIN.
    2. Система видит недостаток first relevance data и заимствует положительные second relevance data из веб-поиска.
    3. Система повышает рейтинг товара в Shopping, используя заимствованные данные.
  4. Ожидаемый результат: Товар ранжируется выше в Google Shopping на старте, чем он ранжировался бы без учета данных из веб-поиска.

Вопросы и ответы

Что такое "Relevance Data" в контексте этого патента?

Relevance Data — это информация, основанная на поведении пользователей, указывающая на популярность и релевантность документа в ответ на запрос. Патент явно упоминает количество кликов (selections), соотношение показов к кликам (view to click ratio) и, что особенно важно, совокупное время просмотра документа пользователями (aggregate amount of time или Dwell Time).

Означает ли этот патент, что если мой товар популярен в веб-поиске, он автоматически будет хорошо ранжироваться в Google Shopping?

Не автоматически, но это дает значительное преимущество, особенно на старте. Для этого Google должен связать вашу веб-страницу и товар в Shopping как один и тот же объект (используя GTIN), и у вас должно быть недостаточно собственной истории кликов в Shopping. В этом случае система может заимствовать данные о популярности из веб-поиска для корректировки ранжирования.

Как долго Google будет использовать заимствованные данные для ранжирования?

Патент четко указывает, что это временная мера. Описан механизм взвешивания (weighting), который отдает предпочтение собственным данным о релевантности корпуса (first relevance data) по мере их накопления. Как только в вертикальном поиске накопится достаточно взаимодействий, влияние заимствованных данных будет минимизировано.

Как Google связывает документы в разных корпусах?

Основной метод — использование уникальных идентификаторов физических объектов (Physical Objects). Для книг это ISBN, для товаров — product identification number (например, GTIN). Если идентификаторы присутствуют в обоих документах, система может установить надежную связь.

Что делать, если у моего контента нет стандартного идентификатора?

Патент описывает альтернативный метод для идентификации основного содержания документа — использование Citation Score (упоминается в описании, но не в Claims). Система анализирует метаданные (например, название и автора) и проверяет, насколько они релевантны содержанию документа. Если оценка высока и фокус документа очевиден, система может идентифицировать объект даже без уникального ID.

Применяется ли этот механизм для обычного веб-поиска?

Патент в основном описывает сценарий, где данные заимствуются из General content search engine (общий поиск) для улучшения Specific content search engine (вертикальный поиск), поскольку в общем поиске обычно больше трафика. Однако технически механизм может работать в любом направлении между любыми двумя корпусами.

Что произойдет, если документ в корпусе-источнике имеет плохие поведенческие сигналы?

Система перенесет эти данные. Если документ в веб-поиске имеет низкий CTR или короткое время просмотра, это может негативно сказаться на ранжировании связанного документа в вертикальном поиске, пока тот не докажет свою релевантность собственными данными.

Что важнее: собственные данные о релевантности или заимствованные?

В долгосрочной перспективе собственные данные (first relevance data) всегда важнее. Система спроектирована так, чтобы отдавать им приоритет. Заимствованные данные (second relevance data) используются для компенсации недостатка собственных данных на начальных этапах (решение проблемы «холодного старта»).

Какова роль структурированных данных (Schema.org) в этом процессе?

Хотя патент напрямую не упоминает Schema.org, он подчеркивает критическую важность уникальных идентификаторов. В современном SEO использование Schema.org для указания GTIN, ISBN является лучшей практикой, которая помогает Google точно идентифицировать сущности, что необходимо для работы подобных механизмов связывания данных.

Каков главный вывод для SEO-стратегии из этого патента?

Главный вывод — необходимость комплексного подхода и важность унификации данных. SEO-специалисты должны обеспечить максимальную связанность всех представлений своего контента или товаров в экосистеме Google с помощью уникальных идентификаторов. Успех в одной системе Google (особенно в основном поиске) может положительно влиять на ранжирование в другой.

Похожие патенты

Как Google комбинирует поведенческие сигналы из разных поисковых систем для улучшения ранжирования
Google использует механизм для улучшения ранжирования путем объединения данных о поведении пользователей (клики и время взаимодействия) из разных поисковых систем (например, Веб-поиск и Поиск по Видео). Если в основной системе данных недостаточно, система заимствует данные из другой, применяя весовой коэффициент и фактор сглаживания для контроля смещения и обеспечения релевантности.
  • US8832083B1
  • 2014-09-09
  • Поведенческие сигналы

  • SERP

Как Google переносит вес поведенческих сигналов (кликов) между связанными запросами для улучшения ранжирования
Google улучшает ранжирование по редким или новым запросам, для которых недостаточно собственных данных, используя поведенческие сигналы (Clickthrough Data) из связанных запросов. Если пользователи часто вводят запросы последовательно, система идентифицирует связь и переносит данные о кликах с одного запроса на другой, позволяя документам с высоким engagement ранжироваться выше по всему кластеру.
  • US7505964B2
  • 2009-03-17
  • Поведенческие сигналы

  • SERP

Как Google переносит поведенческие сигналы через ссылки для повышения в ранжировании первоисточников контента
Google использует механизм для корректного учета поведенческих сигналов (например, времени пребывания). Если пользователь кликает на результат в выдаче, а затем переходит по ссылке на другую страницу, система может перенести позитивные сигналы с исходной страницы на целевую. Это позволяет повышать в рейтинге первоисточники информации, а не страницы-посредники.
  • US8959093B1
  • 2015-02-17
  • Поведенческие сигналы

  • Ссылки

  • SERP

Как Google меняет формат выдачи в вертикальном поиске на основе уверенности в интенте и какие факторы использует для оценки качества
Google использует механизм адаптации интерфейса в вертикальном поиске (например, Google Books или Shopping). Если система уверена, что результат №1 значительно релевантнее №2, он отображается заметно крупнее. Патент детализирует факторы оценки качества объекта (Quality Information), такие как репутация автора/бренда, продажи, внешнее признание и ссылочный вес связанных веб-сайтов, что дает ключевые инсайты для E-E-A-T.
  • US9141674B2
  • 2015-09-22
  • EEAT и качество

  • Семантика и интент

  • SERP

Как Google использует данные о поведении пользователей по похожим запросам для ранжирования новых или редких запросов
Google использует механизм для улучшения ранжирования запросов, по которым недостаточно данных о поведении пользователей (например, кликов). Система находит исторические запросы, семантически похожие на исходный, и «заимствует» их поведенческие данные. Степень сходства рассчитывается с учетом важности терминов, синонимов и порядка слов. Эти заимствованные данные используются для корректировки рейтинга документов по исходному запросу.
  • US9009146B1
  • 2015-04-14
  • Поведенческие сигналы

  • Семантика и интент

  • SERP

Популярные патенты

Как Google находит фактические ответы, начиная с потенциальных ответов и связывая их с запросами пользователей (Reverse Question Answering)
Google использует метод «обратного ответа на вопрос» для эффективного поиска фактов. Вместо глубокого анализа запроса система начинает с идентификации потенциальных ответов (например, дат, измерений) в индексе. Затем она определяет, для каких запросов эти ответы релевантны, анализируя, какие документы высоко ранжируются и получают клики по этим запросам. Это позволяет точно сопоставлять факты с разнообразными формулировками вопросов.
  • US9116996B1
  • 2015-08-25
  • Поведенческие сигналы

  • Семантика и интент

Как Google использует внутренние ссылки и структуру DOM для генерации шаблонов сайта и извлечения структурированных сниппетов
Google анализирует повторяющиеся блоки внутренних ссылок (например, списки товаров). Если текст возле ссылки на исходной странице совпадает с текстом на целевой странице, Google определяет DOM-структуру этого текста и создает шаблон домена. Этот шаблон позволяет автоматически извлекать ключевую информацию (например, цену и характеристики) для сниппетов со всех однотипных страниц сайта, даже без микроразметки.
  • US9971746B2
  • 2018-05-15
  • Структура сайта

  • SERP

  • Ссылки

Как Google использует связанные запросы и временный «бустинг» для обнаружения и тестирования релевантных документов, которые ранжируются низко
Патент описывает механизм улучшения поиска путем перемещения документов на более высокие позиции. Google идентифицирует документы, которые высоко ранжируются по связанным запросам (например, с синонимами, уточнениями или исправленными ошибками), но низко по исходному запросу, и повышает их. Цель — протестировать истинную релевантность этих документов и собрать пользовательский отклик (клики) для улучшения будущего ранжирования.
  • US8521725B1
  • 2013-08-27
  • Поведенческие сигналы

  • SERP

  • Семантика и интент

Как Google использует тематические списки предпочтительных и нежелательных сайтов (Editorial Opinion) для корректировки ранжирования
Google может заранее определять "Темы запросов" (Query Themes) и назначать для них списки "Предпочтительных" (Favored) и "Нежелательных" (Non-Favored) источников. Если запрос пользователя соответствует теме, система корректирует ранжирование: повышает предпочтительные источники и понижает нежелательные, используя "Параметр редакторского мнения" (Editorial Opinion Parameter).
  • US7096214B1
  • 2006-08-22
  • EEAT и качество

  • Антиспам

  • SERP

Как Google использует социальные связи и анализ контекста рекомендаций (Endorsements) для персонализации поисковой выдачи
Google анализирует контент (например, посты в микроблогах и социальных сетях), созданный контактами пользователя. Система определяет, является ли ссылка в этом контенте "подтверждением" (Endorsement) на основе окружающих ключевых слов. Если да, то при поиске пользователя эти результаты могут быть аннотированы, указывая, кто из контактов и через какой сервис подтвердил результат, и потенциально повышены в ранжировании.
  • US9092529B1
  • 2015-07-28
  • Поведенческие сигналы

  • Персонализация

  • EEAT и качество

Как Google предсказывает ваш следующий запрос на основе контента, который вы просматриваете, и истории поиска других пользователей
Google использует систему контекстной информации, которая анализирует контент на экране пользователя (например, статью или веб-страницу) и предсказывает, что пользователь захочет искать дальше. Система не просто ищет ключевые слова на странице, а использует исторические данные о последовательностях запросов (Query Logs). Она определяет, что другие пользователи искали после того, как вводили запросы, связанные с текущим контентом, и предлагает эти последующие запросы в качестве рекомендаций.
  • US20210232659A1
  • 2021-07-29
  • Семантика и интент

  • Поведенческие сигналы

  • Персонализация

Как Google решает, показывать ли промежуточную страницу (превью) или направлять пользователя сразу на сайт при клике в Поиске по картинкам
Google анализирует, насколько хорошо веб-страница представляет выбранное изображение («image-centricity»). Если изображение на странице качественное, заметное и удовлетворяет интент пользователя (на основе статических и поведенческих данных), Google направляет трафик из Поиска по картинкам напрямую на сайт. В противном случае, Google показывает промежуточный экран (Image Overlay).
  • US9135317B2
  • 2015-09-15
  • Поведенческие сигналы

  • Мультимедиа

  • Семантика и интент

Как Google использует генеративный ИИ для создания чата с конкретным сайтом прямо в поисковой выдаче и предоставления глубинных ссылок
Google патентует механизм, позволяющий пользователям взаимодействовать с конкретным результатом поиска через интерфейс чата (prompt input interface) прямо на странице выдачи. Искусственный интеллект анализирует запрос пользователя и его последующий промпт, определяет намерение (поиск информации, действие или навигация) и предоставляет глубинные ссылки (deep links) на конкретные внутренние страницы этого же домена в виде conversational response.
  • US12353458B2
  • 2025-07-08
  • Ссылки

  • Семантика и интент

  • SERP

Как Google использует интерактивные визуальные цитаты для генерации и уточнения ответов в мультимодальном поиске (SGE/Lens)
Google использует механизм для улучшения точности ответов, генерируемых LLM в ответ на мультимодальные запросы (изображение + текст). Система находит визуально похожие изображения, извлекает текст из их источников и генерирует ответ. Этот ответ сопровождается «визуальными цитатами» (исходными изображениями). Если пользователь видит, что цитата визуально не соответствует запросу, он может её отклонить. Система удалит текст этого источника и перегенерирует ответ, повышая его точность.
  • US20240378237A1
  • 2024-11-14
  • Мультимедиа

  • EEAT и качество

  • Семантика и интент

Как Google объединяет данные о ссылках и кликах для расчета авторитетности страниц (Query-Independent Score)
Google использует механизм расчета независимой от запроса оценки авторитетности (Query-Independent Score) с помощью дополненного графа ресурсов. Этот граф объединяет традиционные ссылки между страницами с данными о поведении пользователей, такими как клики по результатам поиска (CTR). Авторитетность передается не только через ссылки, но и через запросы, позволяя страницам с высоким уровнем вовлеченности пользователей набирать авторитет, даже если у них мало обратных ссылок.
  • US8386495B1
  • 2013-02-26
  • Поведенческие сигналы

  • Ссылки

  • SERP

seohardcore