Google использует механизм для улучшения информативности сниппетов. Вместо стандартного описания страницы (например, главной), система может создать «синтезированный сниппет». Он формируется путем объединения кратких заголовков важных подразделов этой страницы (часто совпадающих с Sitelinks). Система сравнивает качество разных типов сниппетов и выбирает лучший.
Описание
Какую задачу решает
Патент решает проблему низкой информативности стандартных сниппетов (Normal Snippet), особенно для главных страниц сайтов или важных навигационных хабов. Часто текст на таких страницах слишком общий и не дает пользователю четкого представления о структуре и основном содержании ресурса. Изобретение направлено на улучшение качества SERP за счет предоставления более полезного описания.
Что запатентовано
Запатентована система генерации альтернативных «синтезированных сниппетов» (Synthesized Snippet). Суть изобретения заключается в использовании информации не с самой целевой страницы, а с ее важных «подстраниц» (Sub-pages), часто соответствующих Sitelinks (Shortcut links). Система идентифицирует эти подстраницы, извлекает их заголовки (Titles), фильтрует по строгим критериям и объединяет их. Также запатентован механизм сравнения качества (Scores) разных сниппетов для выбора лучшего.
Как это работает
Механизм работает следующим образом:
- Идентификация подстраниц: Система анализирует структуру сайта (ссылки, иерархию URL, хлебные крошки), чтобы определить важные Sub-pages.
- Отбор кандидатов: Подстраницы фильтруются на основе их показателей качества (Quality Score) и характеристик их заголовков (например, длина, отсутствие определенных символов).
- Генерация сниппета: Заголовки отобранных подстраниц объединяются (конкатенируются) для формирования Synthesized Snippet.
- Сравнение и выбор: Система вычисляет оценочные баллы (Scores) как для Normal Snippet, так и для Synthesized Snippet. В результатах поиска отображается тот сниппет, чей балл оказался выше.
Актуальность для SEO
Высокая. Описанный механизм активно используется в Google для генерации сниппетов главных страниц и важных разделов крупных сайтов, особенно по брендовым и навигационным запросам. Это напрямую влияет на представление сайта в выдаче (SERP Appearance) и его CTR.
Важность для SEO
Патент имеет высокое значение для SEO (8/10). Он не влияет на ранжирование напрямую, но критически важен для CTR. Патент показывает, что Google может динамически изменять представление сайта в выдаче, основываясь на анализе его структуры и качества подразделов. Это подчеркивает критическую важность информационной архитектуры, качества внутренних страниц и оптимизации их заголовков (Titles).
Детальный разбор
Термины и определения
- Normal Snippet (Стандартный сниппет)
- Сниппет, сгенерированный на основе текста самой веб-страницы или ее мета-описания (meta-description). В патенте также называется First Snippet.
- Synthesized Snippet (Синтезированный сниппет)
- Альтернативный сниппет, сгенерированный путем синтеза (объединения) текста, связанного с подстраницами целевой веб-страницы, чаще всего их заголовков. В патенте также называется Second Snippet.
- Sub-page (Подстраница)
- Страница, связанная с основной страницей (например, находится ниже в иерархии или связана ссылкой). Используется как источник данных для синтезированного сниппета. Обычно находится на том же сайте, но патент допускает и внешние страницы.
- Shortcut links (Быстрые ссылки / Sitelinks)
- Ссылки на другие страницы того же сайта, отображаемые под основным результатом поиска. В патенте указывается, что Sub-pages часто соответствуют этим ссылкам.
- Quality Score / Measure of quality (Показатель качества)
- Метрика, используемая для оценки качества или важности подстраницы. Подстраницы с низким качеством исключаются из процесса генерации сниппета.
- Title (Заголовок подстраницы)
- Краткий описательный текст подстраницы (например, ее HTML Title). Является основным строительным блоком для Synthesized Snippet.
- Score (Оценочный балл сниппета)
- Метрика для сравнения качества разных типов сниппетов (First Score и Second Score). Для синтезированного сниппета балл зависит от количества использованных подстраниц и длины сниппета.
Ключевые утверждения (Анализ Claims)
Патент US10572489B2 является патентом-продолжением (continuation). Его Claims сосредоточены на механизме сравнения и выбора между двумя типами сниппетов.
Claim 1 (Независимый пункт): Описывает процесс выбора сниппета при ответе на поисковый запрос.
- Система получает поисковый запрос и идентифицирует релевантные веб-страницы.
- Для каждой страницы оцениваются два балла: first score и second score.
- First score относится к первому сниппету (Normal Snippet), основанному на тексте самой страницы.
- Second score относится ко второму сниппету (Synthesized Snippet), основанному на тексте других страниц, на которые ссылается данная страница.
- Ключевое уточнение расчета: Second score базируется на (i) количестве других веб-страниц, использованных для его генерации, и (ii) длине второго сниппета.
- Система выбирает только один сниппет из двух на основе сравнения first score и second score.
- Генерируется документ с результатами поиска, включающий ссылку на страницу и выбранный сниппет.
Claim 3 (Зависимый): Детализирует логику выбора.
Система определяет, выше ли second score, чем first score. Если да, то выбирается только второй сниппет (Synthesized Snippet) для включения в поисковую выдачу.
Claims 2, 4, 5 (Зависимые): Определяют источники данных.
«Другие страницы» (Sub-pages) могут быть частью того же веб-сайта (Claim 2) ИЛИ частью другого веб-сайта (Claim 4). Если используется другой веб-сайт, второй сниппет может включать ссылки на каждую из этих других страниц (Claim 5).
Где и как применяется
Изобретение затрагивает этапы индексирования для подготовки данных и финальные этапы формирования выдачи.
INDEXING – Индексирование и извлечение признаков
На этом этапе происходят ключевые подготовительные процессы:
- Анализ структуры: Система анализирует ссылочную структуру (link structure), иерархию URL и хлебные крошки (breadcrumbs) для идентификации Sub-pages.
- Извлечение признаков: Извлекаются заголовки (Titles) подстраниц.
- Оценка качества: Рассчитываются показатели качества (Quality Score) для подстраниц.
- Предварительная генерация: В описании указано, что Synthesized Snippets могут быть сгенерированы и сохранены заранее (офлайн), до получения запроса.
RERANKING – Переранжирование / METASEARCH – Метапоиск и Смешивание
На этапе формирования финальной выдачи (SERP) происходит применение логики выбора сниппета:
- Система получает или генерирует Normal Snippet и Synthesized Snippet.
- Рассчитываются финальные оценочные баллы (Scores) для обоих типов сниппетов.
- Происходит выбор наиболее качественного сниппета для отображения. Патент описывает применение этого механизма как для основных результатов поиска, так и для сниппетов самих быстрых ссылок (Shortcut Links).
Входные данные:
- Структура сайта (ссылки, URL, хлебные крошки).
- Заголовки (Titles) подстраниц.
- Показатели качества (Quality Scores) подстраниц.
- Текст и мета-описание основной страницы.
Выходные данные:
- Выбранный сниппет (Normal или Synthesized) для отображения в SERP.
На что влияет
- Конкретные типы контента: Наибольшее влияние оказывается на страницы, являющиеся навигационными узлами — главные страницы сайтов, страницы категорий, страницы-хабы.
- Специфические запросы: Особенно актуально для навигационных и брендовых запросов, где пользователь ищет конкретный сайт, и важно быстро понять его структуру.
Когда применяется
Алгоритм выбора сниппета применяется при формировании SERP, но генерация Synthesized Snippet происходит при выполнении ряда условий:
- Наличие данных: Для страницы должны быть идентифицированы подходящие Sub-pages (Sitelinks).
- Критерии качества и формата: Подстраницы должны иметь достаточный Quality Score, а их заголовки должны соответствовать требованиям по длине и содержанию символов.
- Триггер активации: Synthesized Snippet отображается только тогда, когда его оценочный балл (Second Score) превышает балл Normal Snippet (First Score).
- Исключения: В патенте упоминается, что если Normal Snippet основан на качественном мета-описании (тип «meta»), он может быть предпочтительнее или получить повышенную оценку.
Пошаговый алгоритм
Алгоритм состоит из двух основных частей: генерация синтезированного сниппета и выбор сниппета для показа.
Процесс А: Генерация Синтезированного Сниппета (Может выполняться Офлайн на этапе Индексирования)
- Определение подстраниц: Для веб-страницы определяются Sub-pages на основе анализа структуры ссылок, иерархии URL или хлебных крошек.
- Определение заголовков: Для идентифицированных Sub-pages определяются их Titles.
- Выбор подстраниц для сниппета: Система перебирает подстраницы (например, отсортированные по Quality Score) и проверяет критерии (примеры из описания патента):
- Подстраница напрямую связана ссылкой с основной страницей (directly linked).
- Quality Score подстраницы выше Порога 1.
- Длина заголовка подстраницы меньше Порога 2 (например, 20-30 символов).
- Заголовок не содержит нежелательных символов (например, запятые, тире, точки).
- Общая длина уже выбранных заголовков плюс длина текущего заголовка меньше Порога 3.
- Генерация сниппета: Заголовки выбранных подстраниц конкатенируются для формирования Synthesized Snippet.
- Сохранение: Сгенерированный сниппет сохраняется в ассоциации с веб-страницей.
Процесс Б: Выбор Сниппета (Выполняется Онлайн во время Запроса)
- Получение запроса и результатов: Система получает запрос и идентифицирует релевантные страницы.
- Получение сниппетов: Для каждой страницы определяются Normal Snippet и Synthesized Snippet.
- Расчет оценок качества (Scores):
- Рассчитывается First Score для Normal Snippet.
- Рассчитывается Second Score для Synthesized Snippet. Согласно Claims, он основан на количестве использованных подстраниц и длине сниппета. Согласно описанию, также может учитывать Quality Scores подстраниц.
- Сравнение оценок: Система сравнивает First Score и Second Score.
- Выбор сниппета: Выбирается сниппет с наивысшей оценкой. (Если Second Score > First Score, выбирается Synthesized Snippet).
- Генерация SERP: Формируется поисковая выдача с выбранным сниппетом.
Какие данные и как использует
Данные на входе
- Структурные факторы: Критически важные данные. Используется анализ ссылочной структуры (внутренние ссылки), иерархии URL (website hierarchy) и хлебных крошек (breadcrumbs) для определения Sub-pages.
- Контентные факторы:
- Заголовки (Titles) подстраниц являются основным контентом для синтеза.
- Текст и мета-описания целевой страницы используются для генерации Normal Snippet.
- Факторы качества (Site/Page Quality Factors): Используются предварительно рассчитанные показатели качества (Quality Score) подстраниц для их фильтрации. Патент упоминает, что это может быть query-independent quality score или данные о трафике (user traffic).
Какие метрики используются и как они считаются
- Quality Score (Подстраницы): Метрика качества подстраницы. Используется для фильтрации (Порог 1) и сортировки кандидатов.
- Title Length (Длина заголовка): Количество символов в заголовке подстраницы. Используется для фильтрации (Порог 2).
- Total Length (Общая длина): Длина итогового синтезированного сниппета. Ограничена сверху (Порог 3).
- First Score (Оценка стандартного сниппета): Метрика качества/информативности Normal Snippet.
- Second Score (Оценка синтезированного сниппета): Метрика качества Synthesized Snippet. Рассчитывается на основе количества включенных подстраниц, их качества и общей длины сниппета.
Выводы
- Информационная архитектура напрямую влияет на сниппеты: Google использует структуру сайта (ссылки, URL, хлебные крошки) для понимания иерархии и идентификации ключевых подстраниц (Sitelinks). Четкая архитектура необходима для генерации качественных Synthesized Snippets.
- Критичность заголовков (Titles) внутренних страниц: Заголовки ключевых внутренних страниц могут формировать сниппет родительской (например, главной) страницы. Патент устанавливает строгие требования к ним: краткость (например, < 30 символов) и отсутствие лишних символов (запятые, тире, точки).
- Качество подстраниц имеет значение: Для включения в Synthesized Snippet подстраница должна иметь Quality Score выше определенного порога. Недостаточно просто иметь ссылку с главной страницы; страница должна быть качественной.
- Существует система оценки качества сниппетов: Google не просто генерирует сниппеты, но и оценивает их качество с помощью метрик (Scores). Система сравнивает стандартный и синтезированный сниппеты и выбирает лучший, наиболее информативный вариант.
- Двойное применение механизма: Описанный механизм может использоваться как для генерации сниппета основного результата поиска, так и для генерации сниппетов самих быстрых ссылок (Sitelinks).
Практика
Best practices (это мы делаем)
- Стратегическая оптимизация Titles ключевых разделов: Оптимизируйте заголовки страниц, которые являются потенциальными Sitelinks (категории, услуги, важные разделы). Они должны быть:
- Краткими (ориентир 20-30 символов).
- Информативными и точно описывающими содержание раздела.
- Чистыми (без лишних символов, таких как точки, запятые, длинные тире), так как они могут привести к исключению из сниппета согласно описанию патента.
- Обеспечение четкой и логичной структуры сайта: Используйте понятную иерархию URL и логичную внутреннюю перелинковку. Это помогает Google корректно определить Sub-pages.
- Внедрение хлебных крошек (Breadcrumbs): Используйте хлебные крошки (на странице и в микроразметке), так как они явно указаны в патенте как способ определения структуры сайта.
- Повышение качества ключевых разделов: Работайте над повышением Quality Score (авторитетности, трафика, качества контента) важных внутренних страниц. Только качественные страницы пройдут порог для включения в сниппет.
- Явная перелинковка с хабовых страниц: Убедитесь, что с главной или других важных родительских страниц есть прямые ссылки на ключевые разделы. Наличие прямой ссылки упомянуто как один из критериев отбора.
Worst practices (это делать не надо)
- Длинные и переоптимизированные заголовки разделов: Использование длинных коммерческих Titles для категорий (например, «Купить X дешево в Москве с доставкой») приведет к тому, что они будут отфильтрованы из-за длины и не попадут в Synthesized Snippet.
- Запутанная навигация и структура: Отсутствие четкой иерархии затрудняет системе идентификацию Sub-pages и снижает вероятность генерации структурированного сниппета.
- Низкое качество страниц разделов: Если важные разделы сайта имеют низкий Quality Score (например, пустые категории, тонкий контент), они будут игнорироваться при генерации сниппета.
Стратегическое значение
Патент подтверждает, что представление сайта в SERP (и, следовательно, CTR) напрямую зависит от качества его информационной архитектуры и технической оптимизации заголовков. Это демонстрирует тесную связь между оптимизацией Sitelinks и оптимизацией сниппетов. Для SEO-стратегии это означает, что работа над структурой и формулировками заголовков внутренних разделов напрямую влияет на CTR родительских страниц, особенно по брендовым и навигационным запросам.
Практические примеры
Сценарий: Оптимизация сниппета главной страницы интернет-магазина
Ситуация: Главная страница магазина ExampleStore.com имеет стандартный сниппет: «ExampleStore — это онлайн-ритейлер товаров…». Он неинформативен.
Действия SEO-специалиста:
- Аудит структуры: Убедиться, что с главной страницы есть прямые ссылки на основные категории товаров.
- Оптимизация заголовков (Titles) категорий:
- Страница /books: Был заголовок «Книги: купить новые и букинистические издания». Оптимизирован до: «Книги».
- Страница /video: Был заголовок «Фильмы, сериалы и ТВ-шоу». Оптимизирован до: «Фильмы и ТВ».
- Страница /apparel: Был заголовок «Одежда, обувь, аксессуары». Оптимизирован до: «Одежда».
- Проверка качества: Убедиться, что страницы категорий качественные и имеют хороший трафик (индикатор Quality Score).
Ожидаемый результат: Google идентифицирует эти категории как важные Sub-pages с подходящими заголовками. Система генерирует Synthesized Snippet: «Книги — Фильмы и ТВ — Одежда». Его Score оказывается выше стандартного, и он начинает отображаться в SERP.
Вопросы и ответы
Как этот патент связан с Sitelinks (Быстрыми ссылками)?
Связь прямая. В патенте указано, что Sub-pages часто соответствуют Shortcut links (термин для Sitelinks). Страницы, которые Google выбирает для показа в качестве Sitelinks, являются основными кандидатами для генерации Synthesized Snippet. Их заголовки используются как строительные блоки для сниппета родительской страницы.
Какова идеальная длина заголовка (Title) для попадания в синтезированный сниппет?
В патенте упоминаются примеры пороговых значений длины заголовка в 20 или 30 символов. Чем короче и информативнее заголовок важного раздела, тем выше вероятность, что он будет использован, и тем больше разделов поместится в сниппет, что потенциально повысит его Score.
Какие символы нежелательно использовать в заголовках важных разделов?
В описании патента явно указан пример критериев фильтрации, который исключает заголовки, содержащие запятые, тире или точки. Рекомендуется избегать использования этих символов в заголовках ключевых навигационных страниц, чтобы повысить шансы на их включение в сниппет.
Что важнее для генерации такого сниппета: качество страницы или ее заголовок?
Важны оба фактора. Система использует многоступенчатую фильтрацию. Сначала проверяется показатель качества (Quality Score) подстраницы — если он ниже порога, страница исключается. Затем проверяется формат и длина заголовка. Страница должна быть качественной, а ее заголовок — соответствовать формальным требованиям.
Как Google определяет иерархию страниц для выбора подстраниц?
Google использует несколько методов, упомянутых в патенте: анализ ссылочной структуры (прямые ссылки с родительской страницы), анализ иерархии URL (например, /category/subcategory) и анализ хлебных крошек (breadcrumbs). Внедрение четкой структуры по всем этим направлениям помогает системе корректно определить иерархию.
Могу ли я заставить Google использовать Synthesized Snippet вместо обычного?
Напрямую заставить нельзя. Решение принимается алгоритмически путем сравнения оценочных баллов (Scores). Чтобы повысить вероятность его использования, необходимо улучшить Second Score: создать четкую структуру, обеспечить прямые ссылки на качественные разделы и оптимизировать их Titles (сделать короткими и чистыми).
Применяется ли этот механизм только к главным страницам?
Нет. Хотя главные страницы являются частым примером, механизм может применяться к любой странице, для которой Google идентифицирует важные подстраницы (например, к странице категории для ее подкатегорий). Также он применяется для формирования сниппетов самих Sitelinks.
Что такое Quality Score подстраницы, упомянутый в патенте?
Патент не дает точного определения, но упоминает, что это может быть query-independent quality score (независимая от запроса оценка качества) или метрика, основанная на трафике пользователя (user traffic). На практике это можно интерпретировать как общую авторитетность, качество контента и важность страницы.
Может ли синтезированный сниппет формироваться из страниц другого сайта?
Да, хотя основное описание фокусируется на внутренних подстраницах, Формула изобретения (Claims 4 и 5) допускает, что страницы, используемые для синтеза, могут принадлежать другому сайту. В этом случае сниппет может содержать ссылки на эти внешние страницы. На практике это встречается редко.
Что делать, если у меня качественный Meta Description, заменит ли его синтезированный сниппет?
Патент упоминает, что сниппеты на основе meta-descriptions (тип «meta») могут получать приоритет или повышенную оценку, если они признаны качественными. Однако, если система посчитает Synthesized Snippet значительно более информативным (т.е. его Score будет выше), она может выбрать его.