SEO HARDCORE
  • Разборы патентов
    • Патенты Google
  • Скоро SEO инструменты
  • Скоро SEO аналитика
  • seohardcore
SEO HARDCORE
назад

Как Google объединяет разные URL в один результат, если они ведут на одну и ту же страницу (например, при мобильных редиректах)

DEDUPLICATION IN SEARCH RESULTS (Дедупликация в результатах поиска)
  • US10007731B2
  • Google LLC
  • 2012-09-12
  • 2018-06-26
  • SERP
  • Техническое SEO
  • Индексация
  • Описание
  • Разбор
  • Выводы
  • Практика
  • FAQ
  • Похожие

Google использует механизм дедупликации для повышения разнообразия выдачи. Если несколько разных URL в результатах поиска перенаправляют пользователя на одну и ту же целевую страницу (например, из-за редиректа на мобильную версию, страницу входа или главную страницу), Google объединяет эти функциональные дубликаты в один замещающий результат.

Описание

Какую проблему решает

Патент решает проблему снижения разнообразия и качества поисковой выдачи (SERP), вызванную «функциональной дубликацией». Это ситуация, когда несколько результатов поиска ссылаются на разные ресурсы (разные URL), но при клике пользователя они доставляют один и тот же контент или ведут на одну и ту же целевую страницу. Это часто происходит из-за условных редиректов, зависящих от контекста: например, мобильные редиректы, страницы входа (login walls) или меры по предотвращению «глубинных ссылок» (deep linking). Изобретение улучшает пользовательский опыт, предотвращая избыточность в SERP.

Что запатентовано

Запатентована система для идентификации и консолидации функционально дублирующихся результатов поиска. Система определяет, что два или более результата, ссылающиеся на разные ресурсы, приведут к доставке одного и того же набора контента (same set of content) на конкретное устройство пользователя. При обнаружении такого поведения система генерирует «замещающий результат поиска» (replacement search result) и модифицирует выдачу, удаляя дубликаты.

Как это работает

Механизм работает на основе данных, собранных при индексировании, и применяется в момент запроса:

  • Предварительный сбор данных: Во время сканирования система эмулирует запросы от разных устройств (например, мобильных), чтобы зафиксировать поведение сервера (редиректы или динамический контент).
  • Анализ контекста: При получении запроса система определяет характеристики устройства пользователя (Particular Characteristic).
  • Идентификация дубликатов: Система прогнозирует, будут ли несколько результатов в выдаче вести на один и тот же целевой ресурс (same destination resource) для данного пользователя.
  • Консолидация и замена: Если дубликаты найдены, генерируется replacement search result (единый результат или кластер), а исходные дубликаты удаляются из SERP.

Актуальность для SEO

Высокая. В условиях Mobile-First Indexing и разнообразия устройств корректная обработка контента, зависящего от устройства, критически важна. Этот патент описывает механизм, который напрямую наказывает за некорректные технические конфигурации (например, ошибочные мобильные редиректы на главную страницу), консолидируя видимость сайта в SERP.

Важность для SEO

Патент имеет высокое значение для технического SEO и мобильной стратегии. Он демонстрирует, что Google анализирует не только исходный URL, но и конечное поведение сайта для конкретного пользователя. Неправильная конфигурация редиректов может привести к тому, что Google консолидирует множество страниц сайта в один результат, что приведет к значительной потере видимости по специфическим запросам.

Детальный разбор

Термины и определения

Deep Linking (Глубинные ссылки)
Практика создания гиперссылок, которые указывают на конкретную внутреннюю страницу сайта, а не на главную. Некоторые сайты пытаются предотвратить это, перенаправляя внешний трафик на главную страницу.
Device-Specific Versions (Версии, специфичные для устройств)
Различные версии контента, оптимизированные для разных устройств (например, Full Version для десктопа и Mobile Version для смартфона).
Duplicate Search Results (Дублирующиеся результаты поиска)
В контексте патента — функциональные дубликаты: результаты, которые ссылаются на разные URL, но в конечном итоге ведут пользователя на одну и ту же страницу (same destination resource) или доставляют идентичный контент.
Particular Characteristic (Определенная характеристика)
Свойство пользовательского устройства (например, тип устройства — мобильный телефон) или контекст пользователя, которое влияет на то, какой контент будет предоставлен сервером.
Replacement Search Result (Замещающий результат поиска)
Новый результат поиска, сгенерированный для замены двух или более дублирующихся результатов. Он может быть единым результатом, ссылающимся на общий целевой ресурс, или агрегированным (кластеризованным) результатом.

Ключевые утверждения (Анализ Claims)

Claim 1 (Независимый пункт): Описывает основной метод дедупликации на основе обнаружения идентичных редиректов.

  1. Система идентифицирует в наборе результатов поиска два несовпадающих результата: Первый (с URL 1, Ресурс 1) и Второй (с URL 2, Ресурс 2).
  2. Определяется, что код, включенный в Ресурс 1, и код, включенный в Ресурс 2, указывают на редирект на один и тот же третий URL (URL 3), ведущий на общий целевой ресурс (Ресурс 3).
  3. Подтверждается, что оба ресурса автоматически перенаправляют пользовательские устройства на этот общий целевой ресурс с помощью URL 3.
  4. В ответ на это генерируется replacement search result, отличный от исходных, который включает URL 3.
  5. Предоставляется страница результатов поиска (SERP), которая содержит replacement search result и опускает по крайней мере один из двух исходных дублирующихся результатов.

Claim 2 (Зависимый от 1): Добавляет контекстную зависимость.

Система определяет, что устройство пользователя обладает «определенной характеристикой» (particular characteristic). Уточняется, что редирект на общий ресурс происходит только для устройств с этой характеристикой. Это означает, что дедупликация может происходить, например, только в мобильной выдаче.

Claim 3 (Зависимый от 2): Конкретизирует характеристику и сценарий.

Характеристика идентифицирует устройство как мобильное (через cookie или другой код). Исходные ресурсы отформатированы для немобильных устройств, а целевой ресурс — для мобильных. Это явное указание на обработку мобильных редиректов.

Claim 4, 5, 6 (Зависимые): Описывают варианты представления замещающего результата.

Replacement search result может быть представлен как единый результат, заменяющий оба исходных (Claim 4), или как кластер связанных результатов (cluster of related search results) (Claim 5). В кластере могут сохраняться гиперссылки на исходные ресурсы (Claim 6).

Где и как применяется

Изобретение требует предварительной подготовки данных во время сканирования и индексирования для применения на финальных этапах формирования выдачи.

CRAWLING – Сканирование и Сбор данных
Система должна эмулировать разные устройства. Веб-краулер отправляет запросы с различными заголовками (например, User-Agent мобильного устройства), чтобы зафиксировать поведение сервера (редиректы или динамический контент).

INDEXING – Индексирование и извлечение признаков
Система сохраняет информацию о поведении ресурсов для разных устройств. Патент предполагает хранение данных о редиректах или уникальных идентификаторов контента, специфичного для устройства. Это может быть хэш URL редиректа или контрольная сумма (checksum) HTML-контента, фактически предоставленного в ответ на запрос. В индексе могут храниться данные дедупликации, привязанные к конкретным типам устройств.

RERANKING – Переранжирование / METASEARCH – Метапоиск и Смешивание
Основное применение патента происходит после получения первоначального списка ранжированных результатов (RANKING).

  1. Идентификация контекста: Система определяет характеристики устройства пользователя.
  2. Обнаружение дубликатов: Используя данные из индекса, система проверяет результаты в списке на предмет функциональной дубликации для данного контекста.
  3. Консолидация: Если дубликаты найдены, De-duplication Apparatus генерирует replacement search result, а исходные результаты удаляются или кластеризуются.

Входные данные:

  • Исходный набор ранжированных результатов поиска.
  • Характеристики пользовательского устройства (Particular Characteristic).
  • Индексные данные о поведении ресурсов (редиректы, хэши контента) для разных типов устройств.

Выходные данные:

  • Модифицированная SERP с удаленными функциональными дубликатами и вставленным replacement search result.

На что влияет

  • Мобильная выдача (Mobile SEO): Наибольшее влияние, особенно для сайтов, использующих отдельные мобильные URL (m-dot) или динамическое предоставление контента (Dynamic Serving).
  • Технические конфигурации: Влияет на сайты с ошибочными редиректами (например, когда все глубокие страницы перенаправляют на главную страницу мобильной версии — Faulty Redirects).
  • Сайты с обязательной аутентификацией (Login Walls): Если несколько страниц перенаправляют неавторизованных пользователей на одну и ту же страницу входа, система может их дедуплицировать.
  • Сайты, блокирующие Deep Linking: Сайты, которые перенаправляют весь внешний трафик с глубоких страниц на главную страницу.

Когда применяется

  • Триггер активации: Когда в результатах поиска присутствуют два или более результата, ссылающиеся на разные URL.
  • Условие срабатывания: Когда система определяет (на основе кода страниц или индексных данных), что эти разные URL будут доставлять идентичный контент или перенаправлять на один и тот же целевой URL.
  • Контекстная зависимость: Активация часто зависит от того, обладает ли пользовательское устройство определенной характеристикой (например, является мобильным), которая вызывает такое поведение сервера.

Пошаговый алгоритм

Процесс А: Подготовка данных (Офлайн - Crawling/Indexing)

  1. Сканирование с эмуляцией устройств: Краулер отправляет запросы к URL, эмулируя различные устройства (меняя User-Agent).
  2. Фиксация поведения сервера: Регистрируется ответ сервера для каждого типа устройства (например, наличие и цель редиректа).
  3. Анализ контента: Если контент динамический, система анализирует фактически полученный HTML.
  4. Сохранение данных дедупликации: В индексе для каждого URL сохраняются данные о его поведении. Это могут быть целевые URL редиректов или контрольные суммы (хэши) полученного контента для каждого типа устройства.

Процесс Б: Обработка запроса (Реальное время - Reranking)

  1. Получение запроса и контекста: Система получает запрос и определяет характеристики устройства пользователя.
  2. Генерация первичных результатов: Формируется стандартный набор результатов поиска.
  3. Идентификация функциональных дубликатов: Система анализирует результаты и, используя индексные данные для данного типа устройства, определяет, какие из них вернут одинаковый контент (сравнение целевых URL редиректов или хэшей контента).
  4. Генерация замещающего результата: Если дубликаты найдены, генерируется replacement search result. Он может быть единичным результатом, ссылающимся на целевой URL, или кластером.
  5. Определение ранга: Система определяет позицию для нового результата (например, по наивысшему рангу из замененных результатов).
  6. Модификация SERP: Система представляет модифицированную страницу поиска, включая замещающий результат вместо идентифицированных дубликатов.

Какие данные и как использует

Данные на входе

  • Технические факторы:
    • URL ресурсов: Исходные и целевые URL редиректов.
    • Код ресурсов: Инструкции редиректа, заложенные в коде страницы (как указано в Claim 1).
    • HTTP-заголовки: User-Agent, используемый краулерами для эмуляции и User-Agent реального пользователя.
  • Пользовательские факторы (Контекст):
    • Характеристики устройства (Particular Characteristic): Тип устройства (мобильный/десктоп).
    • Статус аутентификации: Наличие или отсутствие cookie, влияющее на редиректы (например, на страницу входа).
  • Контентные факторы:
    • HTML-контент: Фактический контент, который сервер предоставляет в ответ на запрос от конкретного устройства (используется для анализа идентичности).

Какие метрики используются и как они считаются

Патент основан на определении идентичности доставленного контента.

  • Идентичность целевого URL (Redirect Destination): Сравнение URL, на который происходит редирект с разных исходных страниц. Если целевой URL одинаков для двух исходных URL, они считаются дубликатами. Это основной метод, описанный в Claims.
  • Идентичность контента (Хэши/Контрольные суммы): В описании патента упоминается возможность использования контрольной суммы (checksum) HTML-контента. Если хэши контента, полученного с двух разных URL для определенного типа устройства, совпадают, они считаются дубликатами, даже если явного редиректа нет (например, при динамическом показе).

Выводы

  1. Google активно борется с функциональными дубликатами: Система стремится к максимальному разнообразию SERP. Если разные URL ведут пользователя в одно и то же место в данном контексте, они будут консолидированы.
  2. Анализ конечного пользовательского опыта: При оценке страниц Google учитывает то, что фактически увидит пользователь на своем устройстве после всех редиректов, а не только исходный контент в индексе.
  3. Контекстная дедупликация: Дедупликация зависит от характеристик устройства пользователя. Результаты могут быть объединены в мобильной выдаче, но оставаться раздельными в десктопной.
  4. Подтверждение мульти-агентного сканирования: Для работы системы Google должен сканировать веб с использованием разных User-Agent (например, Googlebot Smartphone), чтобы заранее понять поведение серверов.
  5. Критичность корректных редиректов: Патент явно нацелен на наказание за некорректные технические решения, такие как ошибочные мобильные редиректы или блокировка deep linking. Консолидация уменьшает видимость сайта в SERP.

Практика

Best practices (это мы делаем)

  • Настройка корректных 1-к-1 редиректов (для отдельных мобильных URL): Если используются отдельные URL (m-dot), убедитесь, что каждая десктопная страница (site.com/pageA) перенаправляет мобильного пользователя строго на эквивалентную мобильную страницу (m.site.com/pageA), а не на главную (m.site.com). Это предотвратит консолидацию ваших страниц.
  • Использование адаптивного дизайна (Responsive Design): Это предпочтительный метод, так как он использует один URL и один набор контента для всех устройств, что позволяет избежать проблем, описанных в патенте.
  • Корректная настройка динамического показа (Dynamic Serving): Если контент меняется в зависимости от устройства на одном URL, обязательно используйте HTTP-заголовок Vary: User-Agent. Это помогает Google корректно индексировать разные версии контента.
  • Обеспечение доступности контента (Deep Linking): Убедитесь, что пользователи и поисковые боты могут напрямую попадать на внутренние страницы сайта из поиска. Избегайте принудительных редиректов на главную страницу.
  • Аудит поведения сайта для разных User-Agent: Регулярно проверяйте (используя эмуляцию в браузере или инструменты вроде Google Search Console), как ваш сайт отвечает на запросы от Googlebot Desktop и Googlebot Smartphone. Убедитесь в корректности редиректов.

Worst practices (это делать не надо)

  • Ошибочные мобильные редиректы (Faulty Redirects): Перенаправление пользователей с глубоких страниц десктопной версии на главную страницу мобильной версии. Это гарантированно активирует механизм дедупликации и приведет к потере видимости внутренних страниц.
  • Блокировка Deep Linking: Настройка редиректов, которые перехватывают внешний трафик на внутренние страницы и отправляют его на главную. Google консолидирует такие результаты.
  • Некорректные Login Walls: Если несколько индексируемых страниц при прямом заходе пользователя редиректят на одну и ту же страницу логина, это может привести к их дедупликации в выдаче.

Стратегическое значение

Патент подчеркивает важность безупречной технической реализации SEO, особенно в эпоху Mobile-First. Google оценивает сайт не как набор статических документов, а как динамическую систему, поведение которой зависит от контекста пользователя. Стратегически важно обеспечить корректный доступ к контенту на всех типах устройств, чтобы избежать непреднамеренной консолидации страниц в выдаче и потери трафика из-за технических ошибок.

Практические примеры

Сценарий: Некорректная мобильная конфигурация кулинарного сайта

  1. Ситуация: У сайта example.net есть три релевантные страницы рецептов:
    • example.net/chickensoup (Рецепт 1)
    • example.net/friedchicken (Рецепт 2)
    • example.net/chickenmonterey (Рецепт 3)
  2. Ошибка конфигурации: Сайт настроен так, что при заходе с мобильного устройства на любую из этих страниц происходит редирект на главную страницу мобильной версии m.example.net.
  3. Запрос пользователя: Пользователь ищет с мобильного телефона "рецепты курицы".
  4. Действие Google (согласно патенту):
    • Google определяет, что пользователь использует мобильное устройство (Particular Characteristic).
    • Система проверяет индекс и видит, что все три URL для этого устройства ведут на один и тот же целевой ресурс (m.example.net).
    • Google идентифицирует их как функциональные дубликаты и генерирует Replacement Search Result.
  5. Результат в SERP: Вместо трех отдельных результатов для разных рецептов Google покажет один результат, ссылающийся на m.example.net. Видимость по конкретным рецептам потеряна.

Вопросы и ответы

Что такое "функциональные дубликаты" в контексте этого патента?

Это результаты поиска, которые ссылаются на разные исходные URL, но в конечном итоге приводят конкретного пользователя на одну и ту же целевую страницу. Исходный контент на этих URL может быть разным, но из-за серверных редиректов (например, мобильных или логин-воллов) пользователь видит одно и то же.

Как Google узнает, куда ведет редирект, еще до того, как пользователь кликнул по ссылке?

Google собирает эту информацию заранее, в процессе сканирования и индексирования. Краулеры Google (например, Googlebot Smartphone) эмулируют запросы от разных типов устройств (меняя User-Agent). Система фиксирует, как сервер реагирует на эти запросы — происходят ли редиректы и куда они ведут. Эта информация сохраняется в индексе.

Что произойдет, если я перенаправлю всех мобильных пользователей на главную страницу моего сайта?

Это классический пример некорректной конфигурации (Faulty Redirect). Если несколько ваших внутренних страниц попадут в топ мобильной выдачи, Google консолидирует их в один результат, ведущий на вашу главную страницу. Вы потеряете видимость по специфическим запросам и ухудшите пользовательский опыт.

Как правильно настроить редиректы для мобильной версии сайта (m-dot)?

Необходимо настраивать постраничные (эквивалентные) редиректы 1-к-1. Десктопная страница site.com/product1 должна перенаправлять мобильного пользователя строго на m.site.com/product1, а не на главную m.site.com. Это гарантирует сохранение релевантности и предотвращает нежелательную дедупликацию.

Влияет ли этот патент на сайты с адаптивным дизайном (Responsive Design)?

Как правило, нет. Адаптивный дизайн использует один URL и один набор HTML для всех устройств, изменяя только отображение через CSS. Поскольку URL один и редиректов между версиями нет, механизм дедупликации, описанный в патенте, к таким конфигурациям обычно не применяется.

Что такое Replacement Search Result и как он выглядит?

Это результат, который Google генерирует для замены найденных функциональных дубликатов. Патент описывает два варианта: либо это единый результат, ссылающийся на конечный URL редиректа, либо это кластер (агрегированный блок), который может содержать ссылки на исходные страницы, но представлен как единый элемент в выдаче.

На какой позиции будет ранжироваться замещающий результат?

Патент предлагает несколько вариантов. Замещающий результат может занять позицию самого высокоранжированного из удаленных дубликатов. Также его ранг может быть рассчитан как функция от рангов всех дубликатов (например, среднее значение) или система может пересчитать ранг непосредственно для конечного URL редиректа.

Может ли этот механизм применяться, если редиректа нет, но контент одинаковый (Dynamic Serving)?

Да. Хотя Claims фокусируются на редиректах, общее описание патента упоминает использование хэшей или контрольных сумм фактически отдаваемого контента. Это позволяет идентифицировать дубликаты, если разные URL отдают идентичный HTML для определенного устройства без изменения URL.

Что делать, если мой сайт требует обязательного логина для доступа к контенту?

Если несколько страниц сайта ранжируются, но все они редиректят неавторизованного пользователя на одну и ту же страницу логина, Google может консолидировать эти результаты. Для SEO важно, чтобы индексируемый контент был доступен пользователям напрямую или с использованием рекомендаций Google по пейволлам (например, структурированные данные для подписок).

Как проверить, не считает ли Google мои страницы функциональными дубликатами?

Проанализируйте мобильную выдачу по запросам, где вы ожидаете увидеть несколько своих страниц. Если вы видите только главную страницу, это признак проблемы. Также отслеживайте отчеты в Google Search Console на наличие ошибок типа «Некорректные редиректы» (Faulty Redirects) и проверяйте поведение сайта, эмулируя Googlebot Smartphone.

Похожие патенты

Как Google объединяет и нормализует результаты из разных индексов (веб и мобильного) для пользователей мобильных устройств
Google использует систему смешивания (Results Mixer) для объединения выдачи из разных поисковых движков (например, основного веба и мобильного веба). Поскольку движки используют разные формулы ранжирования, система нормализует оценки, используя классификацию запросов, свойства контента и калибровку на основе человеческих оценок. Также описан механизм дедупликации, отдающий приоритет мобильной версии контента.
  • US7962477B2
  • 2011-06-14
  • SERP

  • Семантика и интент

Как Google использует редиректы, анализ URL и оценку качества для объединения дубликатов и выбора канонической версии
Google использует итеративный процесс для борьбы с дубликатами при индексировании. Система кластеризует похожие документы, выбирает лучшего представителя из каждого кластера на основе качества и определяет конечную цель его редиректов. Если цели редиректов из разных кластеров оказываются дубликатами (например, на основе анализа паттернов URL), исходные кластеры объединяются. Это позволяет консолидировать сигналы и выбрать единую каноническую версию для индекса.
  • US8661069B1
  • 2014-02-25
  • Индексация

  • Техническое SEO

  • Структура сайта

Как Google подменяет ссылки в выдаче, чтобы обойти медленные редиректы на мобильные версии сайтов
Google оптимизирует скорость загрузки, определяя, когда клик по результату поиска вызовет условный редирект (например, с десктопной версии на мобильную). Система заранее подменяет исходную ссылку в выдаче на конечный URL редиректа. Это позволяет устройству пользователя сразу загружать нужную страницу, минуя промежуточный запрос и экономя время.
  • US9342615B2
  • 2016-05-17
  • Техническое SEO

  • SERP

  • Ссылки

Как Google объединяет данные о странице, если она находится в разных индексах под разными URL (например, Web и Shopping)
Google использует механизм для сопоставления разных URL, ведущих на одну и ту же страницу, но хранящихся в разных индексах (например, основной веб-индекс и индекс товаров). Система извлекает уникальные идентификаторы (например, SKU) из параметров URL. Если идентификаторы совпадают и контент верифицирован, URL связываются, позволяя Google обогащать результаты в одном индексе данными из другого (например, показ цены в веб-выдаче).
  • US8645355B2
  • 2014-02-04
  • Индексация

Как Google автоматически обнаруживает и удаляет идентификаторы сессий из URL для оптимизации сканирования и предотвращения дублирования
Google использует механизм для автоматического обнаружения идентификаторов сессий в URL-адресах во время сканирования. Система анализирует подстроки, которые выглядят случайными и повторяются в нескольких URL с одного сайта. Эти идентификаторы удаляются для создания «чистых» версий URL. Это позволяет поисковой системе распознавать дублирующийся контент и избегать повторного сканирования одних и тех же страниц, оптимизируя краулинговый бюджет.
  • US7886032B1
  • 2011-02-08
  • Краулинг

  • Техническое SEO

  • Индексация

Популярные патенты

Как Google создает и использует базу «идеальных» ответов (Canonical Content Items) для ответов на вопросы пользователей
Google использует систему для идентификации и создания «канонических элементов контента» — образцовых объяснений тем, часто в формате вопрос-ответ. Система анализирует огромные массивы существующего контента, кластеризует похожие вопросы и ответы и выбирает или синтезирует идеальную версию. Когда пользователь задает вопрос, система сопоставляет его с этой базой данных, чтобы мгновенно предоставить высококачественный, модельный ответ.
  • US9396263B1
  • 2016-07-19
  • Семантика и интент

  • EEAT и качество

Как Google планировал использовать социальные связи, сети доверия и экспертизу для персонализации и переранжирования поисковой выдачи
Google запатентовал метод использования данных из социальных сетей («member networks») для влияния на ранжирование. Пользователи могли явно одобрять («endorse») результаты поиска. Эти одобрения показывались другим связанным пользователям (друзьям или людям, ищущим экспертное мнение) и использовались для переранжирования выдачи, добавляя персонализированный слой доверия.
  • US8825639B2
  • 2014-09-02
  • Персонализация

  • EEAT и качество

  • Поведенческие сигналы

Как Google A/B тестирует и оптимизирует сниппеты (заголовки, описания, изображения) для повышения CTR
Google использует механизм для оптимизации отображения контента (сниппетов). Система показывает разные варианты заголовков, описаний или изображений для одной и той же ссылки разным пользователям или на разных платформах. Затем она измеряет кликабельность (CTR) каждого варианта и выбирает наиболее эффективный для дальнейшего использования, учитывая также тип устройства пользователя.
  • US9569432B1
  • 2017-02-14
  • SERP

  • Поведенческие сигналы

  • Персонализация

Как Google находит фактические ответы, начиная с потенциальных ответов и связывая их с запросами пользователей (Reverse Question Answering)
Google использует метод «обратного ответа на вопрос» для эффективного поиска фактов. Вместо глубокого анализа запроса система начинает с идентификации потенциальных ответов (например, дат, измерений) в индексе. Затем она определяет, для каких запросов эти ответы релевантны, анализируя, какие документы высоко ранжируются и получают клики по этим запросам. Это позволяет точно сопоставлять факты с разнообразными формулировками вопросов.
  • US9116996B1
  • 2015-08-25
  • Поведенческие сигналы

  • Семантика и интент

Как Google динамически меняет формулы ранжирования, адаптируя веса факторов под контекст запроса и пользователя
Google не использует единую модель ранжирования. Система использует машинное обучение для создания множества специализированных моделей (Predicted Performance Functions), обученных на исторических данных о кликах для разных контекстов (Search Contexts). При получении запроса система определяет контекст (тип запроса, язык, локация пользователя) и применяет ту модель, которая лучше всего предсказывает CTR в этой ситуации, динамически изменяя значимость различных сигналов ранжирования.
  • US8645390B1
  • 2014-02-04
  • Персонализация

  • Поведенческие сигналы

  • SERP

Как Google использует историю поиска, поведение и многофакторные профили пользователей для персонализации поисковой выдачи
Google создает детальные профили пользователей на основе истории запросов, взаимодействия с результатами (клики, время просмотра) и анализа контента посещенных страниц. Эти профили (включающие интересы по терминам, категориям и ссылкам) используются для корректировки стандартных оценок ранжирования. Степень персонализации динамически регулируется уровнем уверенности системы в профиле (Confidence Score).
  • US9298777B2
  • 2016-03-29
  • Персонализация

  • Поведенческие сигналы

  • SERP

Как Google использует структурированные данные для отображения прямых ссылок на песни в результатах поиска (Rich Snippets)
Google улучшает результаты поиска музыки, извлекая детали песен (названия, альбомы, продолжительность) из структурированной разметки (например, HTML5 microdata) на веб-страницах. Это позволяет Google отображать прямые ссылки на конкретные песни (вторичные ссылки) внутри основного блока результатов поиска, при условии соблюдения определенных порогов качества и популярности.
  • US9128993B2
  • 2015-09-08
  • Ссылки

  • SERP

  • Индексация

Как Google использует исторические паттерны CTR для предсказания сезонных и циклических изменений интента пользователя
Google анализирует исторические данные о кликах (CTR) для выявления предсказуемых изменений в интересах пользователей по неоднозначным запросам. Если интент меняется в зависимости от сезона, дня недели или времени суток, система корректирует ранжирование, чтобы соответствовать доминирующему в данный момент интенту. Например, по запросу "turkey" в ноябре приоритет получат рецепты, а не информация о стране.
  • US8909655B1
  • 2014-12-09
  • Семантика и интент

  • Поведенческие сигналы

  • SERP

Как Google интегрирует персональный и социальный контент (Email, посты друзей, календарь) в универсальную поисковую выдачу
Google использует этот механизм для глубокой персонализации поиска, интегрируя релевантный контент из личных источников пользователя (Gmail, Drive, Calendar) и от его социальных связей. Система индексирует этот контент с разрешения пользователя, ранжирует его с учетом социальных сигналов (Affinity) и адаптивно отображает в SERP, смешивая с публичными результатами.
  • US20150310100A1
  • 2015-10-29
  • Персонализация

  • Индексация

  • Поведенческие сигналы

Как Google запоминает прошлые уточнения поиска пользователя и автоматически перенаправляет его к конечному результату
Google использует механизм персонализации, который отслеживает, как пользователи уточняют свои поисковые запросы. Если пользователь часто вводит общий запрос, а затем выполняет ряд действий (например, меняет запрос или взаимодействует с картой), чтобы добраться до конкретного результата, система запоминает эту последовательность. В будущем, при вводе того же общего запроса, Google может сразу показать конечный результат, минуя промежуточные шаги.
  • US9305102B2
  • 2016-04-05
  • Персонализация

  • Поведенческие сигналы

seohardcore