
Google использует механизм для сопоставления разных URL, ведущих на одну и ту же страницу, но хранящихся в разных индексах (например, основной веб-индекс и индекс товаров). Система извлекает уникальные идентификаторы (например, SKU) из параметров URL. Если идентификаторы совпадают и контент верифицирован, URL связываются, позволяя Google обогащать результаты в одном индексе данными из другого (например, показ цены в веб-выдаче).
Патент решает проблему фрагментации данных, возникающую, когда один и тот же документ доступен по разным URL и индексируется в разных поисковых индексах Google. Например, First Search Index (Веб-индекс) может содержать чистый URL, полученный краулером, а Second Search Index (например, индекс товаров Google Shopping) может содержать URL с параметрами отслеживания, полученный через фид. Эта фрагментация мешает консолидации сигналов ранжирования и не позволяет обмениваться данными между индексами.
Запатентована система автоматического сопоставления (mapping) эквивалентных URL, хранящихся в разных индексах. Суть изобретения заключается в методе извлечения параметров из URL, фильтрации неуникальных параметров и идентификации уникальных ключей (например, SKU продукта). Если уникальные идентификаторы URL из разных индексов совпадают и контент верифицирован, система связывает эти URL и позволяет обмениваться данными.
Система анализирует URL в разных индексах:
Identifiers).Высокая. В условиях роста специализированных индексов (Shopping, News, Video) и необходимости предоставления обогащенных результатов (Rich Results), консолидация данных об одном и том же контенте критически важна. Этот механизм позволяет Google эффективно объединять сигналы и данные из разных источников.
Влияние на SEO умеренно-высокое (6.5/10). Патент носит инфраструктурный характер, но имеет значительное влияние на E-commerce и сайты, использующие фиды. Он описывает механизм, позволяющий Google обогащать результаты веб-поиска данными (например, ценой, наличием), которые присутствуют только в специализированных индексах. Это подчеркивает важность наличия последовательных и уникальных идентификаторов в структуре URL для правильной консолидации сигналов и отображения Rich Results.
Address. Может включать SKU, ID продукта, ID сессии, параметры отслеживания и т.д.submissions), например, индекс товаров Google Shopping (через фиды Merchant Center) или Google News.Addresses из разных индексов, указывающая на то, что они ведут на один и тот же документ.Claim 1 (Независимый пункт): Описывает основной процесс сопоставления URL.
Mapping) между URL1 и URL2, если первый идентификатор равен второму идентификатору.Claim 3 (Зависимый от 1): Детализирует критически важный процесс фильтрации идентификаторов.
Идентификатор исключается из набора, если он также связан с третьим адресом, хранящимся в том же самом (первом) поисковом индексе. Это гарантирует, что идентификатор, используемый для сопоставления, является уникальным в пределах данного индекса, отсеивая общие параметры (например, категории или сессии).
Claim 7 (Зависимый от 1): Уточняет процесс верификации.
Верификация подтверждается, если части информации совпадают. Указанные части включают: заголовок (Title) документа, язык документа или контент документа.
Claim 8 (Зависимый от 1): Описывает механизм обмена данными (обогащение).
Система извлекает данные из записи для второго адреса (Index 2) и передает эти данные вместе с сопоставлением в первый индекс (Index 1).
Claim 10 (Независимый пункт): Описывает реализацию с фокусом на Домен, Ключ и верификацию контента.
Key), связанный с идентификатором.Изобретение применяется на этапе постобработки индексов для консолидации данных и влияет на финальное отображение результатов.
INDEXING – Индексирование и извлечение признаков (Постобработка)
Основная работа алгоритма происходит здесь (или в виде отдельного офлайн-процесса). Processing Server анализирует существующие индексы (First и Second Search Index):
Identifiers из URL.Keys).Mapping и обеспечивает обмен данными.Rules) для оптимизации.METASEARCH – Метапоиск и Смешивание
На этапе формирования выдачи система использует созданный Mapping для обогащения результатов. Когда результат извлекается из одного индекса, система проверяет наличие сопоставления и может подтянуть дополнительные данные (например, цену, наличие) из связанного индекса для отображения в сниппете (Rich Results).
Входные данные:
Выходные данные:
Mapping, связывающая эквивалентные URL.Процесс сопоставления адресов из разных индексов (Индекс А и Индекс Б):
Keys) и связываются с соответствующими адресами.Keys между Индексом А и Индексом Б. Если адрес из Индекса А и адрес из Индекса Б имеют общий домен и связаны с одним и тем же Key, создается предварительное сопоставление (mapping).Title, длина документа) по обоим адресам. Если информация совпадает, mapping подтверждается.Оптимизация (Генерация Правил):
После обработки множества адресов с одного домена система может определить, что только определенный параметр (например, 'sku') является надежным уникальным идентификатором. Система создает Правило (Rule) для этого домена. При последующей обработке адресов с этого домена система сразу применяет правило для быстрого извлечения Key, минуя этапы 2-3.
Identifiers и Keys.Title), метаданные (например, длина документа, язык). Используются для подтверждения, что разные URL ведут на одну и ту же страницу.Keys), извлеченных из URL разных индексов.Title matching), совпадение длины документа или совпадение контента.Key.Title) или метаданных, что защищает от ложных срабатываний.Keys и сопоставления страницы между веб-индексом и индексом товаров.mapping и передачу данных о цене/наличии.Title), на разных версиях URL (например, чистый URL и URL, указанный в фиде) идентичны. Это необходимо для успешного прохождения этапа верификации сопоставления.Rules для вашего домена.Rich Results.Title или основной контент страницы отличается в зависимости от параметров URL (например, в зависимости от источника трафика), система не пройдет этап верификации и не сможет связать URL.Этот патент подтверждает, что Google оперирует множеством независимых индексов и активно решает задачу консолидации данных между ними. Для SEO-специалистов это имеет два ключевых стратегических значения. Во-первых, он объясняет механизм, лежащий в основе многих Rich Results: данные для сниппета в веб-поиске часто берутся из специализированных индексов. Во-вторых, он подчеркивает важность технического SEO в части структуры URL и консистентности данных: наличие надежных уникальных идентификаторов напрямую влияет на способность Google консолидировать сигналы и корректно отображать обогащенные результаты.
Сценарий: Обогащение результатов поиска для интернет-магазина
https://www.site.com/products/tovar-1234. В веб-индексе нет точных данных о цене.https://www.site.com/products/get.php?sku=1234&utm_source=gmc. В индексе товаров есть цена (99$) и наличие (В наличии).utm_source=gmc используется на многих страницах и фильтрует его. В обоих случаях остается уникальный идентификатор (Key) 1234.Key 1234.Title и контент по обоим URL. Они совпадают. Сопоставление подтверждено.https://www.site.com/products/tovar-1234.https://www.site.com/products/tovar-1234 отображается с Rich Snippet, включающим цену и наличие.Является ли этот патент описанием алгоритма каноникализации (rel=canonical)?
Нет. Каноникализация обычно решает проблему дублирования в пределах одного индекса (веб-индекса) и основывается на явных указаниях вебмастера или эвристиках. Этот патент описывает механизм сопоставления между разными, независимыми индексами (например, Веб и Товары), который основан на автоматическом извлечении уникальных идентификаторов из URL и последующей верификации контента. Это можно назвать межиндексной каноникализацией.
Как Google определяет, какой параметр в URL является уникальным идентификатором (SKU), а какой — нет (UTM-метка)?
Система использует процесс фильтрации. Она анализирует все параметры URL в пределах одного индекса. Если параметр встречается у нескольких разных страниц (например, utm_source=google или category=shoes), он помечается как неуникальный и игнорируется. Параметры, которые остаются связанными только с одной страницей (например, sku=12345), считаются уникальными идентификаторами (Keys) и используются для сопоставления.
Как система верифицирует, что два URL действительно ведут на одну страницу?
После того как система нашла совпадение по уникальным идентификаторам, она выполняет этап верификации. Патент упоминает сравнение информации о документах, хранящейся в индексах. Верификация включает сравнение заголовков (Title), длины документа, языка или основного контента страницы. Если они совпадают, сопоставление подтверждается.
Как этот патент влияет на отображение Rich Results (обогащенных сниппетов)?
Он напрямую влияет на Rich Results. Этот механизм позволяет Google брать данные из специализированного индекса (например, цену и наличие из Google Shopping) и отображать их в сниппете органического результата в основном веб-поиске. Если сопоставление не будет установлено, веб-результат может не получить обогащенный сниппет, даже если данные присутствуют в фиде.
Нужно ли мне добавлять уникальные идентификаторы (SKU) в URL, если у меня их сейчас нет?
Для сайтов E-commerce это настоятельно рекомендуется. Наличие четкого, стабильного уникального идентификатора в структуре URL значительно повышает надежность работы систем Google по консолидации данных и отображению Rich Results. Это помогает гарантировать, что сигналы ранжирования и данные о товаре будут корректно объединены.
Что такое "Правила" (Rules) в контексте этого патента и как они создаются?
Правила — это механизм оптимизации. Если система обработала множество URL с одного домена и определила, что параметр sku всегда является уникальным идентификатором для определенной структуры URL, она создает правило для этого домена. В дальнейшем, встречая новый URL с такой же структурой, система сразу извлекает значение параметра sku, минуя сложный процесс фильтрации. Правила создаются автоматически.
Может ли этот механизм объединять сигналы ранжирования (например, ссылки или поведенческие факторы)?
Да, это одно из следствий работы системы. Установив, что URL А (на который ведут внешние ссылки) и URL Б (который содержит структурированные данные о товаре) являются одной и той же страницей, Google может консолидировать все сигналы. В патенте упоминается, что сопоставление позволяет определить, когда разные пользователи получают доступ к одному и тому же документу, используя разные адреса.
Что делать, если Google неверно сопоставил мои URL?
Необходимо проанализировать структуру URL и используемые идентификаторы. Убедитесь, что идентификаторы, которые вы считаете уникальными, действительно уникальны в пределах вашего сайта. Также проверьте, нет ли на сайте страниц с разными идентификаторами, но идентичным контентом и Title, что может сбивать с толку этап верификации.
Влияет ли этот патент только на E-commerce?
Хотя основное применение связано с товарами, механизм универсален. Он может применяться для сопоставления статей между веб-индексом и индексом Новостей (Google News), видео между веб-индексом и индексом Видео, или любых других сущностей, имеющих разные URL в разных индексах.
Что важнее для сопоставления: совпадение домена или совпадение идентификатора?
Оба условия важны. Система, описанная в Claim 10, требует совпадения как домена, так и уникального идентификатора (Key) для создания предварительного сопоставления. Это гарантирует, что сопоставляются документы в рамках одного сайта, идентифицируемые одним и тем же ключом.

SERP
Техническое SEO
Индексация

Краулинг
Техническое SEO
Индексация

Google Shopping
SERP
Индексация

Краулинг
Техническое SEO
Индексация

Краулинг
Техническое SEO
Индексация

Семантика и интент
SERP
Поведенческие сигналы

Поведенческие сигналы
SERP

Семантика и интент
SERP
Поведенческие сигналы

Ссылки
Индексация
Поведенческие сигналы

Поведенческие сигналы
Семантика и интент

Поведенческие сигналы
Семантика и интент
Мультимедиа

Безопасный поиск
Поведенческие сигналы
Семантика и интент

Персонализация
Поведенческие сигналы
SERP

Поведенческие сигналы
SERP

EEAT и качество
Ссылки
