
Google анализирует структурно похожие страницы, ссылающиеся на различные ресурсы. Определяя, где известные поисковые запросы (Seed Queries) появляются в структуре этих ссылающихся страниц (например, в заголовках или Title), Google создает шаблоны. Эти шаблоны затем используются для извлечения текста из аналогичных мест на других страницах, создавая «синтетический описательный текст» (аналог анкорного текста) для целевых ресурсов. Это улучшает ранжирование, даже если фактический анкорный текст низкого качества.
Патент решает проблему зависимости поисковых систем от качества традиционного анкорного текста. Если анкорный текст неинформативен (например, «читать далее», «сайт»), отсутствует или является манипулятивным, поисковой системе сложно понять релевантность целевой страницы. Это может приводить к недооценке и плохому ранжированию релевантных ресурсов. Изобретение позволяет генерировать высококачественный описательный текст, используя контент ссылающейся страницы, находящийся вне самого анкора.
Запатентована система генерации Synthetic Descriptive Text (синтетического описательного текста) для целевого ресурса путем анализа структуры ссылающейся страницы. Система использует известные запросы (Seed Queries), основанные на данных о кликах, для выявления структурных шаблонов (Templates) на группах похожих ссылающихся страниц. Извлеченный текст функционирует аналогично анкорному тексту при оценке релевантности.
Механизм работает следующим образом:
Seed Queries (запросы, по которым пользователи часто кликают на этот ресурс).Seed Queries появляются в структуре ссылающихся страниц (например, в теге <h1> или <title>). На основе этого создается шаблон (Template), например: «Извлечь текст из <h1>».<h1>), становится Synthetic Descriptive Text для целевого ресурса, на который ссылается эта страница.Высокая. Понимание контекста ссылки и снижение зависимости от манипулируемых анкоров является ключевым направлением развития поиска. Этот патент описывает конкретный, масштабируемый механизм для использования структуры и контента ссылающейся страницы как сигнала релевантности. Участие Пола Хаара (Paul Haahr), одного из ключевых инженеров поиска Google, подчеркивает значимость изобретения.
Патент имеет высокое значение (8/10). Он демонстрирует, что контекст, окружающий ссылку на ссылающейся странице (включая заголовки и Title), может быть использован в качестве замены или дополнения к анкорному тексту. Это смещает фокус с манипулирования анкорами на обеспечение того, чтобы ссылки размещались в релевантном и хорошо структурированном контексте, особенно на сайтах с шаблонной структурой (каталоги, справочники).
generative rule), определяющий, какой текст и из какой структуры ссылающегося ресурса следует извлечь. Шаблон также определяет, где должна находиться ссылка на целевой ресурс.constraints) на контекст их появления (например, расположение в определенном теге или частоту появления).Claim 1 (Независимый пункт): Описывает основной метод генерации синтетического текста.
linking resources), каждый из которых ведет на соответствующий целевой ресурс (target resource).Seed Queries в индексе.Templates). Каждый шаблон выводится из одного или нескольких наборов данных (триплет: ссылающийся ресурс, целевой ресурс, Seed Query). Шаблон определяет местоположение терминов из Seed Query в ссылающемся ресурсе. Процесс включает генерацию кандидатов в шаблоны и выбор лучших из них.Synthetic Descriptive Text. Для этого: Synthetic Descriptive Text для целевого ресурса, на который ссылается этот другой ресурс.Claim 2 (Зависимый от 1): Детализирует процесс генерации кандидатов в шаблоны.
Если термин из Seed Query появляется в определенной структуре ссылающегося ресурса, генерируется кандидат в шаблоны. Он определяет правило (generative rule) для извлечения текста из аналогичных структур на других страницах и указывает необходимое расположение ссылки.
Claim 3 (Зависимый от 2): Уточняет состав шаблона.
Шаблон может включать Literals (точные фразы) и/или Wildcards (переменные с ограничениями на контекст).
Claim 5 и 6 (Зависимые от 2): Уточняют, что такое структура.
Структура включает Embedded Coding Fragment, например, пару HTML-тегов (например, <h1>...</h1>), которая заключает в себе термин из Seed Query.
Изобретение применяется на этапах индексирования для извлечения признаков и на этапе ранжирования для оценки релевантности.
CRAWLING – Сканирование и Сбор данных
Система собирает полный HTML-код и структуру ссылающихся ресурсов.
INDEXING – Индексирование и извлечение признаков
Это основной этап применения патента. Descriptive Text Engine работает здесь (частично офлайн, частично во время индексации).
Seed Queries. Анализ структур ссылающихся страниц.Templates.Templates для извлечения Synthetic Descriptive Text во время индексирования ссылающихся страниц.Query-Independent Score (включая Template Score, Linking Score, Target Score) для извлеченного текста.RANKING – Ранжирование
На этом этапе система использует предварительно вычисленный синтетический текст в реальном времени.
Query-Dependent Score (насколько синтетический текст соответствует текущему запросу).Query-Dependent Score комбинируется с Query-Independent Score для получения итоговой оценки, которая используется для корректировки общего Ranking Score ресурса.Входные данные:
Seed Queries (из индекса/логов поведения пользователей).Выходные данные:
Templates) для извлечения текста.Synthetic Descriptive Text, ассоциированный с целевыми ресурсами.Query-Independent Scores).structurally similar linking documents).Seed Queries, связанных с целевыми ресурсами, на которые ссылается данная группа страниц.Алгоритм состоит из трех основных процессов.
Процесс А: Генерация синтетического текста (Индексирование/Офлайн)
Seed Queries.Seed Queries появляются в структуре (Embedded Coding Fragments) ссылающихся ресурсов.Literals и Wildcards).Templates.Synthetic Descriptive Text.Query-Independent Score (см. Процесс В). Текст и оценка сохраняются в индексе и связываются с целевым ресурсом.Процесс Б: Использование синтетического текста (Ранжирование)
Ranking Score.Query-Independent Score (QIS). Результаты агрегируются по всем фрагментам.Ranking Score ресурса корректируется на основе общей оценки синтетического текста.Процесс В: Расчет Query-Independent Score (QIS) (Индексирование)
Эта оценка определяет надежность и вес синтетического текста.
Template Score, Linking Score и Target Score.Embedded Coding Fragments (теги <title>, <h1> и др.) и расположение ссылки в структуре документа для создания и применения шаблонов.Target Score.Seed Queries основаны на данных о кликах пользователей. Также частота кликов на ссылающиеся ресурсы влияет на Linking Score.Система использует комплексную модель оценки веса синтетического текста.
Synthetic Descriptive Text, если система может идентифицировать надежный структурный шаблон.Query-Independent Score учитывает надежность шаблона (Template Score), качество ссылающегося сайта (Linking Score) и подтверждение на целевой странице (Target Score).Target Score).Synthetic Descriptive Text, даже если анкор нейтральный.Target Score.Linking Score будет низким, что снизит вес любого извлеченного текста.Патент подтверждает стратегию Google по снижению зависимости от прямых анкорных текстов, которые легко подвержены манипуляциям, и переходу к более глубокому контекстуальному и структурному анализу ссылок. Он демонстрирует, как Google использует машинное обучение и поведенческие данные (Seed Queries) для масштабируемого извлечения сигналов релевантности. Для SEO это означает, что качество, структура и контекст на сайте-доноре играют комплексную роль в оценке ссылки.
Сценарий: Ссылка из отраслевого каталога
Компания «Вектор» (сантехнические услуги) размещает профиль в авторитетном городском каталоге услуг City-Catalog.ru.
<title>Вектор - Сантехнические услуги в Москве - Городской Каталог</title><h1>Компания «Вектор»</h1><a href="vector-plumbing.ru">vector-plumbing.ru</a>Как работает алгоритм:
Seed Queries, Google определяет, что тег <title> содержит наиболее релевантное описание. Создается шаблон: «Извлечь текст из <title> до разделителя "- Городской Каталог"».Synthetic Descriptive Text, улучшая его ранжирование по соответствующим запросам.Что такое «Synthetic Descriptive Text» и чем он отличается от обычного анкорного текста?
Synthetic Descriptive Text — это текст, который извлекается из контента ссылающейся страницы, но находится вне самого тега <a> (например, из заголовка H1 или Title ссылающейся страницы). В отличие от обычного анкорного текста (текста ссылки), он генерируется системой Google автоматически путем применения шаблонов к структурно похожим страницам. В индексе он функционирует аналогично анкорному тексту, помогая определить релевантность целевой страницы.
Что такое «Seed Queries» и почему они важны для этого алгоритма?
Seed Queries — это запросы, по которым пользователи часто переходят на определенный ресурс из поиска (данные о кликах). Они критически важны, так как служат основой для обучения системы. Анализируя, где термины из Seed Queries появляются на ссылающихся страницах (например, в H1), система учится определять, какие части структуры содержат наиболее ценное описание, и создает шаблоны для извлечения текста из аналогичных мест.
Означает ли этот патент, что анкорный текст больше не важен?
Нет, анкорный текст остается сильным сигналом. Однако этот патент показывает, что у Google есть надежный механизм для компенсации низкокачественного или отсутствующего анкорного текста. Если анкор неинформативен (например, «здесь» или URL), система может использовать контекст страницы (например, заголовок ссылающейся страницы) в качестве синтетического анкора, при условии, что она доверяет структуре сайта.
На какие типы сайтов-доноров следует обратить внимание в контексте этого патента?
Особое внимание следует уделить сайтам со структурированным, шаблонным представлением контента, которые ссылаются на множество внешних ресурсов. Это включает авторитетные отраслевые каталоги, справочники, сайты отзывов, списки партнеров. Важно, чтобы текст в ключевых структурных элементах (Title, H1) на этих сайтах был оптимизирован и релевантен вашей целевой странице.
Как Google оценивает вес извлеченного синтетического текста? Все ли они одинаково полезны?
Нет, они не одинаково полезны. Google использует сложную оценку Query-Independent Score, которая состоит из трех частей: Template Score (надежность шаблона), Linking Score (качество ссылающегося сайта) и Target Score (подтверждение релевантности на целевой странице). Синтетический текст, извлеченный надежным шаблоном с высококачественного сайта и подтвержденный контентом целевой страницы, будет иметь значительно больший вес.
Что такое Linking Score и как его повысить у доноров?
Linking Score — это оценка качества группы ссылающихся ресурсов. Согласно патенту, она повышается, если на эти ресурсы часто кликают в результатах поиска и если они ссылаются на разнообразные веб-сайты (признак авторитетного хаба). Для SEO это подтверждает важность получения ссылок с популярных, авторитетных сайтов, которые получают реальный трафик.
Зачем нужен Target Score? Неужели Google не доверяет извлеченному тексту?
Target Score служит механизмом валидации. Он проверяет, присутствуют ли термины из синтетического текста на самой целевой странице. Это предотвращает ошибки и гарантирует, что извлеченный текст действительно релевантен содержанию целевого ресурса. Если терминов нет на целевой странице, вес синтетического текста снижается.
Применяется ли этот механизм к ссылкам внутри одного сайта (перелинковка)?
Патент в основном описывает применение к внешним ссылкам. В тексте упоминается опция идентификации в качестве целевых ресурсов только ресурсов вне группы ссылающихся ресурсов (т.е. внешние сайты). Хотя принципы могут быть применимы и к внутренней перелинковке, если структура сайта это позволяет, основной фокус изобретения — улучшение понимания внешних ссылок с плохими анкорами.
Чем отличается извлечение текста по шаблону от простого анализа околоссылочного текста?
Анализ околоссылочного текста обычно рассматривает текст непосредственно перед или после ссылки в рамках одного блока. Описанный механизм действует иначе: он идентифицирует ключевые структурные элементы страницы (например, H1, Title), которые могут находиться далеко от самой ссылки, основываясь на шаблонах, подтвержденных Seed Queries. Это более структурный подход к пониманию контекста.
Как этот патент влияет на стратегии исходящих ссылок для моего сайта?
Если ваш сайт является каталогом или агрегатором и ссылается на множество внешних ресурсов, этот патент подчеркивает важность четкой и описательной структуры ваших страниц. Убедитесь, что заголовки и тайтлы страниц, с которых вы ссылаетесь, точно отражают суть целевых ресурсов. Это поможет Google корректно генерировать шаблоны и повысит качество вашего сайта (потенциально повышая ваш Linking Score).

Ссылки
Семантика и интент
Индексация

Структура сайта
Семантика и интент
SERP

Структура сайта
SERP
Ссылки

SERP
Поведенческие сигналы
EEAT и качество

Ссылки
Индексация
Техническое SEO

Персонализация
EEAT и качество
Поведенческие сигналы

Ссылки
SERP

Local SEO
SERP
Ссылки

Персонализация
Индексация
Поведенческие сигналы

Поведенческие сигналы
SERP
EEAT и качество

Ссылки
Поведенческие сигналы
EEAT и качество

Персонализация
Семантика и интент
Мультимедиа

Семантика и интент
Мультимедиа
Персонализация

Структура сайта
Техническое SEO
Ссылки

Персонализация
Семантика и интент
SERP
