
Google анализирует повторяющиеся блоки внутренних ссылок (например, списки товаров). Если текст возле ссылки на исходной странице совпадает с текстом на целевой странице, Google определяет DOM-структуру этого текста и создает шаблон домена. Этот шаблон позволяет автоматически извлекать ключевую информацию (например, цену и характеристики) для сниппетов со всех однотипных страниц сайта, даже без микроразметки.
Патент решает проблему автоматического извлечения наиболее релевантного контента (summary content) из веб-страниц для использования в качестве сниппетов в поисковой выдаче. Основная сложность — отличить основное содержание от шаблонного контента (boilerplate), такого как реклама или навигация. Изобретение предлагает метод точной идентификации местоположения ключевой информации и извлечения структурированных данных на основе анализа внутренних ссылочных паттернов сайта.
Запатентована система генерации шаблонов домена (Domain Template Generation System). Эта система изучает структуру сайта, анализируя повторяющиеся паттерны внутренних ссылок. Она сопоставляет текст, расположенный рядом с внутренней ссылкой на одной странице (Subordinate Text), с контентом целевой страницы. При совпадении система определяет точное местоположение (DOM path) этой информации и создает Domain Template, который используется для масштабного извлечения сниппетов с однотипных страниц этого домена.
Ключевой механизм основан на предположении, что текст, используемый сайтом для описания страницы в списках, является хорошим кандидатом для сниппета.
Repeated HTML Pattern) на странице (например, список товаров), содержащие внутренние ссылки.Subordinate Text) — анкор или текст рядом с ним (Proximate Text).DOM path и создает Domain Template.Высокая. Точная генерация сниппетов и понимание структуры страницы (Page Understanding) критически важны для современного поиска. Этот патент описывает конкретный механизм для автоматического создания структурированных сниппетов (Rich Results) и отделения основного контента от boilerplate, что особенно актуально для e-commerce и контентных проектов с шаблонной структурой.
Патент имеет высокое значение для SEO (8.5/10). Он напрямую влияет на то, как контент сайта отображается в SERP, что критично для оптимизации CTR. Понимание этого механизма позволяет SEO-специалистам структурировать HTML-шаблоны и внутреннюю перелинковку таким образом, чтобы гарантировать правильное извлечение ключевой информации (цен, характеристик, кратких описаний) в сниппеты, даже без использования микроразметки.
DOM path) ключевого сводного текста на страницах этого домена, имеющих схожую структуру.Anchor Text и/или Proximate Text.Claim 1 (Независимый пункт): Описывает основной процесс генерации шаблона и его использования для сниппетов.
subordinate to and proximate to the anchor) в Первом ресурсе.Domain Template для этого домена, который указывает местоположение этого текста во Втором ресурсе.Domain Template.snippet) на странице результатов поиска.Claim 2, 3 и 4 (Зависимые): Детализируют, как выбирается анкорь для анализа.
Выбор анкоря основан на идентификации Repeated HTML Pattern. Элементы в этом повторении должны содержать анкорь, ссылающийся на ресурс внутри того же домена (Claim 3). Анкорь выбирается, если количество повторений удовлетворяет пороговому значению (Claim 4).
Claim 8 (Зависимый): Описывает критически важный механизм расширенного извлечения структурированных данных (DOM Expansion).
parent DOM node).Sibling DOM Nodes), которые также являются дочерними для этого родительского узла.Пример: Если система нашла совпадение по Цене, она может извлечь Название, Характеристики и Рейтинг из соседних узлов, если они находятся под общим родителем.
Изобретение применяется на этапах индексирования и формирования поисковой выдачи.
CRAWLING – Сканирование и Сбор данных
Система собирает HTML-код страниц, необходимый для последующего анализа структуры и внутренних ссылок.
INDEXING – Индексирование и извлечение признаков
Основной этап работы алгоритма. Domain Template Generation System работает здесь:
Repeated HTML Patterns.Subordinate Text между связанными страницами.Domain Templates, привязанные к домену.METASEARCH / RERANKING (Формирование SERP)
На этапе формирования SERP система выбирает сниппет для отображения. Текст, извлеченный с помощью Domain Template, получает высокий приоритет, так как он был идентифицирован как точное и структурированное описание контента.
Входные данные:
Выходные данные:
Domain Templates (правила извлечения контента на основе DOM Path).Алгоритм активируется при выполнении нескольких условий в процессе индексирования:
Repeated HTML Pattern, где количество повторений превышает определенный порог (Claim 4).Subordinate Text (текст возле ссылки на Первом ресурсе) должен совпадать с текстом на Втором ресурсе (целевой странице) (Claim 1).Процесс А: Генерация Domain Template
Repeated HTML Pattern. Проверяется, превышает ли количество повторений порог.Subordinate Text (анкор и/или Proximate Text) рядом с анкорем на Первом ресурсе.DOM path, ведущий к совпавшему тексту на Втором ресурсе.Domain Template для домена, специфицирующий этот DOM path.Процесс Б: Расширенное извлечение (DOM Expansion - Claim 8)
Sibling DOM Nodes (другие дочерние узлы этого родителя).Процесс В: Применение шаблона
Domain Template.DOM path (включая расширенное извлечение, если применимо).Патент фокусируется исключительно на структурных, ссылочных и контентных факторах, присутствующих в коде страниц.
Repeated HTML Patterns (повторяющиеся элементы в коде).Proximate Text / Subordinate Text (текст, окружающий анкорь).Repeated HTML Pattern, необходимое для активации анализа (Claim 4).Subordinate Text с Первого ресурса на Втором ресурсе.DOM path страницы структуре, определенной в Domain Template.Sibling DOM Nodes), система может собрать структурированную информацию (Цена, Рейтинг, Характеристики) для формирования Rich Snippets, даже без явной микроразметки.Domain Templates. Если сайт использует согласованные HTML-шаблоны для однотипных страниц, Google может эффективно создать правило извлечения и применять его масштабно. Хаотичная структура блокирует этот процесс.DOM path текста, который совпадает с описанием из другого места на сайте, Google эффективно определяет местоположение основного контента и игнорирует шаблонные элементы (навигацию, рекламу) при генерации сниппета.Domain Template, с высокой вероятностью будет использован в качестве сниппета в SERP, переопределяя другие источники (например, meta description).Domain Template.Repeated HTML Patterns (категории, похожие товары/статьи) используйте дескриптивные анкоры и/или Proximate Text (цена, краткое описание). Критически важно, чтобы этот текст также присутствовал на целевой странице в основном контенте.Sibling DOM Nodes) под общим родителем. Использование списков определений (<dl>) или чистой блочной структуры облегчает расширенное извлечение данных.Domain Template и приводит к непредсказуемой генерации сниппетов.Proximate Text) в повторяющихся блоках не дает системе данных для анализа.Патент подтверждает, что Google активно использует машинное обучение для понимания архитектуры сайтов в масштабе. Вместо анализа каждой страницы индивидуально, система стремится вывести правила на уровне домена (Domain Templates). Для SEO это означает, что архитектурная согласованность, техническая чистота кода и информационная архитектура напрямую влияют на видимость сайта в поиске через качество и структурированность сниппетов.
Сценарий: Генерация структурированного сниппета для E-commerce (Механизм Claim 8)
Задача: Добиться отображения ключевых характеристик (Цена, Скорость CPU, Рейтинг) в сниппете товара.
Sibling DOM Nodes. <div class="product-specs"> <!-- Родительский узел --> <span class="price">$500.00</span> <!-- Sibling 1 (Найденный узел) --> <span class="cpu">2.0 GHz</span> <!-- Sibling 2 --> <span class="rating">4.1/5.0</span> <!-- Sibling 3 --> </div>Что такое «Domain Template» и почему он важен для SEO?
Domain Template — это правило, созданное Google для конкретного сайта, которое определяет точное местоположение (DOM path) основного контента на однотипных страницах. Это критически важно для SEO, потому что текст, извлеченный с помощью этого шаблона, почти гарантированно станет сниппетом в поисковой выдаче. Контролируя шаблон через структуру сайта, вы контролируете сниппет и, следовательно, CTR.
Что такое «Repeated HTML Pattern» и как его найти на моем сайте?
Это блок кода, где одна и та же HTML-структура повторяется несколько раз (Claim 2), и количество повторений превышает определенный порог (Claim 4). Типичные примеры — это листинг товаров в категории, список статей в блоге или блок «Похожие товары». Система ищет такие паттерны как отправную точку для анализа.
Что важнее для этого алгоритма: Anchor Text или Proximate Text (текст рядом со ссылкой)?
Патент указывает, что система может использовать и то, и другое (называя это Subordinate Text). Если анкор дескриптивный (например, название товара), он может быть использован. Если анкор общий («Купить»), система будет искать Proximate Text (например, цену или краткое описание). Важно, чтобы хотя бы один из этих элементов точно совпадал с текстом на целевой странице.
Как работает расширенное извлечение данных (Claim 8) и как его оптимизировать?
Это механизм для создания структурированных сниппетов (DOM Expansion). Когда система находит совпадение текста в определенном DOM-узле, она поднимается к родительскому узлу и смотрит на соседние узлы (Sibling DOM Nodes). Чтобы оптимизировать это, группируйте связанные атрибуты (Цена, Рейтинг, Характеристики) под общим родителем в чистой и семантичной DOM-структуре.
Заменяет ли этот механизм необходимость внедрения микроразметки Schema.org?
Не заменяет, но дополняет. Этот механизм позволяет Google извлекать структурированные данные имплицитно (через анализ DOM), даже если разметка отсутствует. Однако явная разметка Schema.org всегда предпочтительнее, так как она устраняет неоднозначность и является более надежным сигналом, особенно при сложной верстке.
Что делать, если Google показывает неправильные сниппеты для моих страниц?
Это может означать, что Google не смог создать корректный Domain Template. Проверьте консистентность ваших HTML-шаблонов. Убедитесь, что текст, который вы используете в листингах (рядом с внутренними ссылками), точно совпадает с текстом на целевых страницах и находится в основном контентном блоке, а не в сайдбаре или футере.
Влияет ли этот патент на ранжирование напрямую?
Патент описывает механизм генерации сниппетов, а не ранжирование. Однако, поскольку качественные и структурированные сниппеты значительно повышают CTR, этот механизм оказывает сильное косвенное влияние на поведенческие факторы. Кроме того, способность системы отделять основной контент от boilerplate может влиять на оценку качества страницы.
Как этот алгоритм обрабатывает сайты на JavaScript (SPA/CSR)?
Система анализирует DOM после рендеринга. Если JavaScript формирует консистентную и доступную для анализа DOM-структуру, механизм будет работать. Однако, если ключевая информация требует сложного или отложенного JavaScript-рендеринга, система может столкнуться с трудностями при идентификации совпадений и генерации шаблона. Рекомендуется использовать SSR или пререндеринг.
Применяется ли этот механизм к ссылкам с внешних сайтов?
Нет. Патент четко указывает (Claim 1, Claim 3), что анализируются ссылки между ресурсами, принадлежащими одному и тому же домену (belonging to the particular domain). Это механизм, основанный на анализе внутренней структуры сайта.
Может ли этот механизм объяснить, почему Google игнорирует мой Meta Description?
Да, вполне. Если Google сгенерировал надежный Domain Template, который позволяет извлекать точное и структурированное описание контента непосредственно со страницы, он предпочтет использовать этот текст вместо указанного вручную Meta Description, считая его более релевантным и полезным для пользователя.

Ссылки
Семантика и интент
Индексация

SERP
Семантика и интент
Структура сайта

Структура сайта
Семантика и интент
Техническое SEO

Ссылки
Индексация
Техническое SEO

Структура сайта

Поведенческие сигналы
Ссылки
SERP

Персонализация
Поведенческие сигналы
SERP

Персонализация
Семантика и интент
Поведенческие сигналы

Поведенческие сигналы
SERP

Персонализация
Поведенческие сигналы
Семантика и интент

Поведенческие сигналы
SERP

Семантика и интент
Мультимедиа
Персонализация

EEAT и качество
Ссылки

SERP
EEAT и качество
Поведенческие сигналы

Поведенческие сигналы
Семантика и интент
Мультимедиа
