
Google анализирует структуру сайтов для автоматического определения «Visual Leaf Pages» (например, карточек товаров или рецептов), где изображение является основным контентом. Система находит «Hub Pages» (например, категории), которые ссылаются на них, и выявляет общие структурные признаки (шаблоны верстки, URL). Эти шаблоны используются для классификации страниц и повышения их ранжирования в поиске по картинкам для соответствующих запросов.
Патент решает проблему масштабной и точной идентификации Visual Leaf Pages (Визуальных Конечных Страниц) без необходимости ручной разметки обучающих данных (unsupervised learning). VLP — это страницы, где визуальный контент (изображение или видео) является доминирующим и критически важным (например, карточки товаров, рецепты). Цель — улучшить релевантность результатов в поиске по картинкам, особенно для запросов, связанных с конкретными действиями (шопинг, готовка), путем повышения таких страниц в выдаче.
Запатентована система для автоматической идентификации Visual Leaf Pages на основе анализа структуры сайта и шаблонов страниц. Система идентифицирует Hub Pages (например, страницы категорий) и анализирует страницы, на которые они ссылаются через ссылки, основанные на изображениях (image-based links). На основе общих характеристик (структурных, визуальных, URL) этих конечных страниц система создает статистические модели (Cluster Models), специфичные для каждого хоста. Эти модели затем используются для классификации новых страниц и повышения их search score в релевантных сценариях поиска.
Система работает в два этапа: построение моделей (офлайн) и применение (онлайн).
Visual Leaf Pages (с доминирующим изображением) и Hub Pages, которые ссылаются на них через image-based links.Feature Values) из конечных страниц (например, глубина URL, метаданные, особенности верстки/layout).Cluster Data для каждого хаба путем вычисления «центральной тенденции» (Central Tendency, например, среднего значения и стандартного отклонения) признаков связанных страниц.Cluster Models для всего хоста.Cluster Models к страницам-кандидатам.Visual Leaf Page и интент запроса соответствует, её search score повышается.Высокая. Визуальный поиск и электронная коммерция продолжают расти. Способность Google автоматически понимать структуру страниц, типы шаблонов и намерения пользователей без ручного обучения (unsupervised learning) является ключевым элементом современных поисковых систем. Этот патент описывает конкретный механизм для улучшения качества поиска по картинкам.
Патент имеет высокое значение (8/10), особенно для E-commerce, сайтов с рецептами и любых ресурсов, где трафик из поиска по картинкам критичен. Он подчеркивает важность консистентной структуры сайта, унифицированных шаблонов для однотипных страниц, использования внутренних ссылок на основе изображений и внедрения структурированных данных. Несоблюдение этих практик может привести к неправильной классификации страниц и потере видимости в визуальном поиске.
salient) изображений или видео, которые отображаются на видном месте (prominently displayed). Удаление этих изображений сделает страницу значительно менее информативной. Примеры: карточка товара, страница рецепта.image-based links. Примеры: страница категории товаров, листинг.Hub Page на VLP, представленная в виде изображения (например, кликабельное превью товара).URL depth), контентные признаки и метаданные (og:image, Product/Recipe metadata).Feature Values для группы страниц (например, среднее значение и стандартное отклонение). Используется для описания типичных характеристик VLP, связанных с конкретным хабом.Central Feature Values, представляющий группу VLP, связанных с одной Hub Page.Cluster Data с одного хоста. Представляет собой обобщенный шаблон для определенного типа VLP на сайте.Cluster Model к веб-странице. Отражает степень соответствия страницы данному шаблону.Claim 1 (Независимый пункт): Описывает полный цикл работы системы — от идентификации структуры до влияния на ранжирование.
Visual Leaf Pages (VLP) и Hub Pages, которые ссылаются на них через image-based links.Cluster Data для каждой Hub Page. Это включает определение Feature Values (включая признаки верстки контента - layout of content) для связанных VLP и вычисление Central Tendency этих признаков.Visual Leaf Page Classifier), обученного на базовом наборе данных (включающем сгенерированные Cluster Data), для классификации этой страницы как VLP.particular type of activity, например, шопинг).increasing) search score веб-страницы на основании её классификации как VLP и соответствия интенту запроса.Claim 2 (Зависимый от 1): Детализирует процесс объединения (оптимизации) кластеров.
Система объединяет Cluster Data в Cluster Models. Процесс включает определение различий между кластерами. Если различие меньше порогового значения, кластеры объединяются в Cluster Model, который затем уникально ассоциируется с хостом. Это позволяет обобщить шаблоны на уровне сайта.
Claim 3 (Зависимый от 2): Детализирует процесс классификации с использованием объединенных моделей.
При обработке страницы система идентифицирует Cluster Models, ассоциированные с хостом этой страницы. Каждая модель применяется для генерации Model Score. Если наивысший Model Score превышает пороговое значение, страница классифицируется как Visual Leaf Page.
Изобретение охватывает этапы индексирования (для построения моделей) и ранжирования (для применения моделей и бустинга).
INDEXING – Индексирование и извлечение признаков
На этом этапе происходит основная работа по анализу структуры и построению моделей (офлайн-компонент, Model Builder).
Feature Values: глубина URL, наличие метаданных (Product, Recipe), og:image, характеристики изображений, особенности верстки (layout features).Hub Pages и потенциальными Visual Leaf Pages через image-based links.Cluster Data и их объединение в Cluster Models. Эти модели сохраняются и ассоциируются с хостом.RANKING – Ранжирование / RERANKING – Переранжирование
На этом этапе происходит применение моделей в реальном времени (онлайн-компонент, Page Analyzer).
Cluster Models для расчета Model Score и классификации страницы как VLP.search score.Входные данные:
image-based links).Feature Values страниц (URL, верстка, метаданные, характеристики изображений).Выходные данные:
Cluster Models, ассоциированные с хостом (офлайн).search score (онлайн).Cluster Models хоста с высоким Model Score (т.е. классифицирована как VLP).Фаза 1: Построение моделей (Офлайн, Model Builder)
image-based links.Hub Page, извлекается набор Feature Values (глубина URL, метаданные, верстка и т.д.).Hub Page вычисляется Central Tendency (среднее, стандартное отклонение) признаков связанных VLP. Это формирует исходные Cluster Data.Cluster Data разных хабов. Если расстояние (различие) между ними меньше порога, они объединяются.Cluster Models для хоста.Cluster Models с хостом в индексе.Фаза 2: Классификация и Ранжирование (Онлайн, Page Analyzer)
Cluster Models хоста.Model Score.Model Score превышает порог, страница классифицируется как Visual Leaf Page.search score увеличивается.Система использует комбинацию признаков для построения моделей и классификации.
URL Depth (Глубина URL). Консистентность глубины важна для кластеризации.layout of content) (Claim 1).central portion).Customizable selection of images), например, галерея товара.og:image.Product metadata).Recipe metadata).image-based link с Hub Page на Leaf Page (ключевой сигнал для бутстрэппинга).Cluster Data и Cluster Model могут быть векторами, содержащими элементы среднего значения (mean) и стандартного отклонения (standard deviation) для каждого Feature Value в кластере.Central Tendency).Cluster Model.Salient Image.Model Score для классификации страницы как VLP.Visual Leaf Pages) без ручного обучения (unsupervised learning). Система ищет паттерны в организации контента.Hub Pages (категории, листинги) используются как отправная точка для идентификации конечных страниц. То, как хаб ссылается на дочерние страницы (через image-based links), является сильным сигналом для бутстрэппинга.Central Tendency. Это означает, что Visual Leaf Pages одного типа должны иметь схожие признаки (одинаковый шаблон верстки, схожую глубину URL, одинаковый набор метаданных). Неконсистентность затрудняет формирование точных Cluster Models.Cluster Models.Hub Pages (категории/листинги) и Visual Leaf Pages (товары/рецепты). Hub Pages должны преимущественно ссылаться на однотипные Leaf Pages.Hub Pages на Visual Leaf Pages должны быть реализованы через кликабельные изображения (превью товаров). Это ключевой триггер для анализа, описанного в патенте.Visual Leaf Page главное изображение должно быть самым крупным элементом, располагаться в центральной или верхней части экрана. Если есть галерея, она должна поддерживать функционал «настраиваемого выбора» (customizable selection).og:image) критически важно, так как они явно указаны как используемые Feature Values для кластеризации.Central Tendency и мешает построению моделей.Hub Page ссылается и на товары, и на информационные статьи вперемешку, это затрудняет идентификацию паттерна VLP.image-based links на Hub Pages может исключить сайт из этого механизма анализа.Патент подтверждает, что Google анализирует не только контент страницы, но и её роль в общей структуре сайта, а также используемые шаблоны (layout). Это часть стратегии Google по переходу от анализа ключевых слов к пониманию структуры и интента. Для SEO-специалистов это означает, что техническая оптимизация, архитектура сайта и UX (в части консистентности шаблонов) напрямую влияют на способность Google классифицировать контент и, как следствие, на ранжирование в специфических сценариях, таких как поиск по картинкам.
Сценарий: Оптимизация E-commerce сайта для VLP-классификации
Hub Pages) ссылаются на карточки товаров (Visual Leaf Pages) преимущественно через кликабельные изображения товаров.Feature Values: Salient Image).og:image.Hub Page).Cluster Models для карточек товаров. При запросах с интентом покупки в Google Images эти страницы получают бустинг в ранжировании, что увеличивает визуальную видимость и трафик.Что такое Visual Leaf Page (VLP) в контексте этого патента?
Это конечная страница, где основное содержание представлено одним или несколькими доминирующими изображениями или видео. Это не просто страница с картинками, а страница, где визуальный контент критически важен для выполнения задачи пользователя, например, карточка товара или страница рецепта. Удаление этого контента сделает страницу значительно менее информативной.
Что такое Hub Page и какова её роль?
Hub Page — это узловая страница, например, страница категории или галерея, которая ссылается на Visual Leaf Pages. Её роль критична для работы алгоритма: система использует Hub Pages как отправную точку для поиска и группировки VLP. Важно, чтобы ссылки с хаба на VLP были основаны на изображениях (image-based links).
Почему консистентность (одинаковость) шаблонов так важна для этого алгоритма?
Алгоритм работает путем вычисления «Центральной тенденции» (Central Tendency) признаков страниц, принадлежащих к одной группе. Если страницы используют разные шаблоны (layout) или имеют разную структуру URL, их признаки сильно различаются. Это делает статистическую модель неточной и мешает надежному определению общего паттерна для данного типа контента на сайте.
Влияет ли этот патент на ранжирование в обычном веб-поиске?
Патент фокусируется на улучшении поиска по картинкам. В Claim 1 явно указано, что повышение search score происходит, когда система определяет, что запрос запрашивает «результаты поиска по картинкам для определенного типа активности» (например, шопинг). Прямого влияния на стандартный веб-поиск не описано, но точная классификация страниц всегда полезна для поисковой системы.
Насколько важна глубина URL (URL Depth)?
URL Depth явно указана как один из признаков (Feature Values), используемых для кластеризации. Это означает, что для успешного формирования модели желательно, чтобы однотипные страницы (например, все товары) имели схожую глубину вложенности URL. Консистентность структуры URL помогает алгоритму группировать страницы.
Какие типы структурированных данных помогают в классификации VLP?
Патент явно упоминает использование метаданных продукта (Product metadata) и метаданных рецепта (Recipe metadata) в качестве признаков для кластеризации. Также упоминается использование разметки og:image. Внедрение соответствующей разметки Schema.org и Open Graph является прямой рекомендацией для улучшения классификации.
Что делает изображение «значимым» (Salient Image) по мнению Google?
Значимость определяется несколькими факторами. Изображение должно быть «prominently displayed». Патент уточняет, что это может означать отображение в центральной части страницы (central portion), размер, пропорционально больший, чем у остального контента, или наличие функционала настраиваемого выбора изображений (например, галерея товара).
Является ли этот процесс обучения контролируемым (supervised)?
Нет. Патент подчеркивает, что система разработана для работы в неконтролируемом (unsupervised) режиме, минимизируя необходимость в ручной аннотации данных. Система самостоятельно обучается распознавать паттерны VLP, используя структуру самого сайта (связи Hub-Leaf) как отправную точку для бутстраппинга процесса классификации.
Модели VLP универсальны для всех сайтов?
Нет, модели специфичны для каждого хоста. Система строит Cluster Models на основе анализа конкретного сайта и затем ассоциирует эти модели с этим хостом (Claim 2). Это означает, что система адаптируется к уникальной структуре и дизайну каждого сайта, а не применяет универсальные правила.
Что делать, если структура моего сайта не соответствует модели Хаб -> VLP?
Если ваш сайт полагается на трафик из поиска по картинкам для транзакционных запросов, рекомендуется привести архитектуру в соответствие с этой моделью. Это включает создание четких страниц категорий (Хабов), использование кликабельных превью (Image-based links) и оптимизацию карточек товаров (VLP) с акцентом на главное изображение и внедрение микроразметки.

Индексация
Local SEO
Структура сайта

Семантика и интент
SERP

Мультимедиа
SERP
Семантика и интент

Мультимедиа
EEAT и качество
SERP

Ссылки
Мультимедиа
Поведенческие сигналы

Семантика и интент
Поведенческие сигналы

Ссылки
SERP
Техническое SEO

Поведенческие сигналы
SERP

Индексация
Краулинг
Ссылки

Поведенческие сигналы
Мультимедиа
SERP

SERP
EEAT и качество
Персонализация

Поведенческие сигналы
Семантика и интент
SERP

Индексация
Поведенческие сигналы

EEAT и качество
SERP
Knowledge Graph

Семантика и интент
Безопасный поиск
Поведенческие сигналы
