
Google анализирует коллекции похожих структурированных документов (например, товарных карточек) и создает общую модель (DOM). Затем система изучает логи запросов и кликов, чтобы понять, какие части структуры (заголовки, основной контент, реклама) чаще всего содержат ключевые слова из успешных запросов. Этим частям присваивается больший вес при расчете релевантности.
Патент решает задачу автоматического определения семантической важности различных частей (сегментов) веб-документа. Вместо использования жестко заданных правил (например, «текст в заголовке важнее основного текста»), система предлагает метод определения весов на основе анализа данных о запросах и поведении пользователей. Это позволяет поисковой системе более точно оценивать релевантность контента, расположенного в ключевых областях страницы, и снижать вес шаблонного контента (boilerplate), навигации или рекламы.
Запатентована система для автоматического присвоения весов различным частям документа на основе анализа коллекции структурированных документов. Система создает обобщенную модель структуры документа (Document Object Model, DOM) для группы похожих страниц. Затем она анализирует логи запросов (Query Logs) и кликов (Click Logs), чтобы определить, какие узлы DOM чаще всего содержат термины из запросов, которые привели к взаимодействию пользователя с документом (Impression). Узлам с высокой корреляцией присваиваются более высокие веса, которые затем используются при ранжировании.
Ключевой механизм работает следующим образом:
Impressions).Scoring Function).Высокая. Понимание структуры документа и выделение основного контента (Main Content) на фоне шаблонных элементов является критически важной задачей для современных поисковых систем. Методы, описанные в патенте, лежат в основе систем, позволяющих Google игнорировать шум (рекламу, навигацию) и фокусироваться на семантическом центре страницы, что напрямую влияет на оценку качества и релевантности.
Патент имеет высокое значение для технического и контентного SEO. Он демонстрирует механизм, с помощью которого Google может автоматически снижать значимость контента в зависимости от его расположения на странице. Это подчеркивает важность чистой семантической верстки и размещения ключевой информации в тех структурных элементах, которые с наибольшей вероятностью будут идентифицированы как семантически важные для данного типа документа.
User Activity Log. Хранит данные о том, какой контент был выбран (кликнут) пользователем в ответ на запросы.Node Weight соответствующего узла в DOM.User Activity Log. Хранит историю запросов, отправленных пользователями.Portion Weights контента, найденного в документе.Query Logs и Click Logs.Claim 1 (Независимый пункт): Описывает основной метод присвоения весов частям документа.
DOM, который представляет общий формат документов в коллекции.DOM присваиваются веса (Node Weights) на основе подсчета (count) поисковых терминов, содержащихся в соответствующих частях документов.Portion Weights) для частей конкретного (первого) документа. Эти веса наследуются от весов соответствующих узлов DOM.Ядро изобретения по Claim 1 — это автоматическое определение важности структурных элементов на основе того, насколько часто они содержат релевантные поисковые термины.
Claim 2 (Зависимый от 1): Уточняет, что данные о запросах включают информацию об Impressions (предшествующих выборах пользователя).
Claim 3 (Зависимый от 2): Детализирует процесс присвоения весов.
Claim 4 (Зависимый от 3): Вводит ключевое условие для увеличения веса.
Impression (т.е. пользователь кликнул на документ, когда искал эти термины).Claims 2-4 критически важны, так как они связывают вес структурного элемента не просто с наличием ключевых слов, а с успешным взаимодействием пользователя. Это позволяет системе учиться на поведении пользователей для определения семантической важности.
Claim 5 (Зависимый от 4): Указывает на источник данных.
User Activity Log для определения количества Impressions, связанных с каждой частью документов.Изобретение применяется на этапах индексирования и ранжирования, используя данные о поведении пользователей.
CRAWLING – Сканирование и Сбор данных
На этом этапе собираются структурированные документы и логи активности пользователей (запросы и клики), которые служат входными данными для системы.
INDEXING – Индексирование и извлечение признаков
Основное применение патента происходит здесь (вероятно, в виде офлайн или пакетного процесса):
User Activity Logs, сопоставляет запросы и клики (Impressions) с узлами DOM и вычисляет Node Weights.Portion Weights, наследуемые от DOM. Эти веса сохраняются в индексе и используются для взвешивания контента внутри документа.RANKING – Ранжирование
На этом этапе система использует предварительно рассчитанные веса. Scoring Function при расчете релевантности документа запросу учитывает не только наличие терминов, но и Portion Weights тех частей документа, где эти термины были найдены.
Входные данные:
User Activity Log (Query Logs и Click Logs), относящийся к этим документам.Выходные данные:
Node Weights.Portion Weights для индексируемых документов.Scoring Function для ранжирования.Node Weights, вероятно, выполняются периодически в пакетном режиме (офлайн), так как требуют анализа больших объемов логов. Применение рассчитанных весов (Portion Weights) происходит постоянно во время индексации и ранжирования.Этап А: Генерация модели и расчет весов (Офлайн/Пакетная обработка)
User Activity Log извлекаются данные о запросах, по которым документы из коллекции были релевантны, а также данные об Impressions (кликах).Impression (кликом пользователя).Этап Б: Применение весов (Индексация/Ранжирование)
Portion Weight наследуется от Node Weight соответствующего узла в обобщенном DOM.Portion Weights.Scoring Function для документа. Контент в более важных (с большим весом) частях вносит больший вклад в итоговый рейтинг.User Activity Log, включающий Query Logs (поисковые запросы) и Click Logs (данные об Impressions или выборе пользователем документа).Count of Search Terms и значительно увеличивается при наличии корреляции с Count of Impressions.Node Weight и применяемая к конкретному документу.Node Weight. Контент в этих блоках будет иметь меньшее влияние на ранжирование.Impressions (кликов). Недостаточно просто разместить ключевое слово в элементе; важно, чтобы пользователи, ищущие это слово, кликали на документ именно тогда, когда слово находится в этом элементе.<header>, <footer>, <nav>, <article>, <aside>, <main>). Это помогает поисковой системе корректно построить DOM и отделить основное содержание от вспомогательных блоков.Node Weight.Impressions) используются для определения весов, важно работать над привлекательностью сниппетов. Высокий CTR по релевантным запросам может косвенно подтвердить системе, что контент в ключевых узлах (например, Title, Description) является важным.Патент подтверждает стратегию Google по глубокому пониманию структуры и контекста контента на странице. Он показывает, как поведенческие сигналы используются не только для прямого ранжирования, но и для обучения системы пониманию семантической структуры веб-документов. Для SEO это означает, что информационная архитектура, чистота кода и пользовательский опыт (UX) являются взаимосвязанными факторами, определяющими, как именно контент будет взвешен при ранжировании.
Сценарий: Оптимизация карточки товара E-commerce
Node Weight.Node Weight.Применяется ли этот механизм к каждой отдельной странице в интернете?
Нет. Механизм предназначен для работы с коллекциями структурированных документов, которые имеют общий формат или шаблон. Чтобы система могла рассчитать веса, ей необходимо сгенерировать обобщенный DOM и собрать достаточный объем статистики по запросам и кликам для этой группы страниц. Уникальные страницы с нетипичной структурой, скорее всего, обрабатываются другими алгоритмами.
Как система определяет, какие документы относятся к одной коллекции?
Патент упоминает, что система использует сходство между структурированными документами для генерации общего DOM. На практике это может включать анализ URL-структуры, а также методы распознавания шаблонов (pattern recognition techniques) для сравнения структуры HTML-кода различных страниц. Документы с высоким уровнем структурного сходства объединяются в коллекцию.
Что такое Impression в этом патенте и как он отличается от обычного понимания «показа»?
В патенте термин Impression используется специфически и определяется как «предшествующий выбор пользователем» (prior user selection) документа. Это больше соответствует понятию «клик» (Click) или успешное взаимодействие, а не просто показу документа в результатах поиска. Именно клики используются для увеличения веса узлов DOM.
Как этот патент влияет на значимость контента в футере или сайдбаре?
Он предоставляет механизм для автоматического снижения веса этого контента. Если система определяет, что футер или сайдбар редко содержат термины из запросов, по которым пользователи кликают на документы, этим узлам DOM будет присвоен низкий вес. В результате, контент в этих блоках будет оказывать минимальное влияние на ранжирование страницы по этим запросам.
Означает ли это, что традиционные веса (например, Title важнее Body) больше не используются?
Не обязательно. Система может использовать этот механизм для уточнения или переопределения стандартных весов. Например, если анализ данных показывает, что для определенного типа сайтов (например, форумов) основной текст сообщения (Body) чаще содержит ключевые термины из успешных запросов, чем заголовок (Title), система может присвоить Body больший вес, чем Title, именно для этого шаблона.
Как можно использовать этот патент для улучшения SEO?
Ключевая стратегия — обеспечить четкую семантическую структуру и консистентность шаблонов. Используйте HTML5 теги (<main>, <article>, <nav>) для разграничения основного контента и вспомогательных элементов. Размещайте наиболее важную информацию в тех частях страницы, которые логически являются центральными для пользователя, так как именно они, вероятно, получат наибольший вес.
Влияет ли этот патент на обработку JavaScript и динамического контента?
Патент описывает работу с DOM, который является результатом рендеринга страницы, включая исполнение JavaScript. Если динамический контент формирует стабильную и консистентную структуру DOM в коллекции документов, механизм будет применим. Однако, если JavaScript создает непредсказуемую или сильно различающуюся структуру, это затруднит генерацию обобщенного DOM.
Может ли система ошибочно принять основной контент за рекламу или наоборот?
Да, это возможно, особенно если структура документа запутанная или если реклама маскируется под основной контент. Однако, поскольку веса рассчитываются на основе анализа запросов и кликов, система стремится к самокоррекции. Если пользователи кликают на документ, ища термины, которые находятся в блоке, похожем на рекламу, вес этого блока может быть увеличен.
Как часто пересчитываются веса узлов DOM?
Патент не указывает точную частоту, но предполагает, что это процесс, требующий обработки логов активности пользователей. Вероятно, это происходит периодически в пакетном режиме (офлайн), по мере накопления новых данных о запросах и кликах. Это позволяет системе адаптироваться к изменениям в дизайне сайта или поведении пользователей.
Что произойдет, если я изменю дизайн и структуру своего сайта?
При значительном изменении структуры система должна будет идентифицировать новый шаблон, сгенерировать новый обобщенный DOM и начать процесс сбора статистики и расчета весов заново для новой структуры. В переходный период оценка важности различных частей страницы может быть неоптимальной, пока не накопится достаточно данных по новому шаблону.

Семантика и интент

Структура сайта
Техническое SEO
Ссылки

Структура сайта
Семантика и интент
Техническое SEO

Индексация
Техническое SEO
Структура сайта

Семантика и интент
Структура сайта
Техническое SEO

Поведенческие сигналы
Персонализация
EEAT и качество

Семантика и интент
Поведенческие сигналы

EEAT и качество
Семантика и интент
SERP

Ссылки
SERP

Поведенческие сигналы
SERP

EEAT и качество
Поведенческие сигналы

EEAT и качество
Антиспам
Ссылки

Мультиязычность
Семантика и интент
Ссылки

Поведенческие сигналы
Мультимедиа
SERP

Семантика и интент
Поведенческие сигналы
Knowledge Graph
