
Google может генерировать «Синтетический Описательный Текст» для страницы, анализируя контент и структуру сайтов, которые на нее ссылаются. Система создает структурные шаблоны для извлечения релевантного текста (например, заголовков или абзацев рядом со ссылкой), который затем используется как мощный сигнал ранжирования. Этот механизм позволяет лучше понять содержание страницы, особенно если традиционный анкорный текст низкого качества или отсутствует.
Патент решает проблему оценки релевантности ресурсов, когда традиционные сигналы, такие как анкорный текст (anchor text), являются низкокачественными, неинформативными (например, «читать здесь») или отсутствуют. Также решается задача ранжирования релевантных ресурсов, которые сами могут не содержать терминов из запроса пользователя. Цель — улучшить качество поиска путем генерации высококачественного описательного текста для целевого ресурса на основе контекста и структуры ссылающейся страницы.
Запатентована система генерации и использования Synthetic Descriptive Text (Синтетического Описательного Текста) для ранжирования. Система анализирует страницы, ссылающиеся на целевой ресурс, и извлекает из них текст, который описывает этот ресурс, даже если текст находится за пределами самого анкора ссылки. Этот процесс основан на идентификации структурных шаблонов (Templates) на ссылающихся страницах. Извлеченный текст сохраняется в индексе и используется для корректировки оценки ранжирования целевого ресурса.
Процесс делится на два этапа: генерация текста (индексирование/офлайн) и ранжирование (онлайн).
Генерация:
Seed Queries (запросы, по которым пользователи часто кликают на ресурс).Seed Queries появляются на этих страницах (например, в теге Title, H1).Templates).Synthetic Descriptive Text и ассоциируется с целевыми ресурсами в индексе.Ранжирование:
Query-Dependent Score).Query-Independent Score).Synthetic Descriptive Text Score, который корректирует итоговый Ranking Score ресурса.Высокая. Понимание контекста ссылок и переход от анализа исключительно анкорного текста к анализу всего контента ссылающейся страницы является ключевым направлением развития поиска (особенно с развитием NLP и семантического анализа). Этот патент описывает конкретный, масштабируемый механизм использования околоссылочного и структурного контекста для определения релевантности. Участие Пола Хаара (Paul Haahr) подчеркивает значимость механизма для ядра ранжирования.
Патент имеет высокое значение (8/10). Он демонстрирует, что Google активно использует контент ссылающейся страницы ЗА ПРЕДЕЛАМИ анкорного текста для ранжирования целевой страницы. Это означает, что контекст размещения ссылки (например, заголовок раздела, Title ссылающейся страницы) может напрямую влиять на ранжирование вашего сайта по запросам, которых нет ни в анкоре, ни даже на вашей странице. Стратегии линкбилдинга должны учитывать не только авторитетность донора и анкор, но и структурное расположение ссылки и релевантность окружающего контента.
Linking Resource), который используется для описания целевого ресурса (Target Resource). Генерируется путем применения шаблона (Template) и используется как сигнал ранжирования.Seed Queries.Synthetic Descriptive Text. Рассчитывается на основе трех компонентов: Template Score, Linking Score и Target Score.Synthetic Descriptive Text текущему поисковому запросу пользователя.Query-Independent Score. Метрика качества и надежности шаблона. Учитывает, насколько специфичен и надежен шаблон.Query-Independent Score. Метрика качества группы ссылающихся ресурсов (сайта). Учитывает популярность (клики) и разнообразие исходящих ссылок.Query-Independent Score. Метрика валидации, проверяющая соответствие синтетического текста контенту целевого ресурса.Claim 1 (Независимый пункт): Описывает основной метод использования синтетического текста при ранжировании.
initial scores).Synthetic Descriptive Text, извлеченным из других (ссылающихся) ресурсов.Template. Шаблон выводится на основе анализа триплетов (Ссылающийся ресурс, Целевой ресурс, Seed Query) и идентификации местоположения терминов Seed Query в ссылающихся ресурсах.Query-Dependent Score (релевантность запросу).Template Score (качество шаблона).Synthetic Descriptive Text Score на основе этих оценок.Synthetic Descriptive Text Score.Claim 3 (Зависимый от 1): Детализирует расчет итоговой оценки.
Итоговый Synthetic Descriptive Text Score рассчитывается путем комбинирования Query-Dependent Scores и Query-Independent Scores (которые вычисляются из Template Score).
Claim 4 (Зависимый от 3): Детализирует расчет Query-Independent Score.
Эта оценка также учитывает Linking Score, который основан на характеристиках группы ссылающихся ресурсов (качество донора).
Claim 5 (Зависимый от 3): Детализирует расчет Query-Independent Score.
Эта оценка также учитывает Target Score, который основан на характеристиках целевого ресурса (подтверждение релевантности текста контенту страницы).
Claims 6-9 (Зависимые от 1): Детализируют факторы, влияющие на Template Score.
Template Score зависит от: количества различных фрагментов кода (embedded coding fragments), использованных для генерации шаблона (Claim 6); общего количества фрагментов текста, сгенерированных этим шаблоном (Claim 7); является ли шаблон самым высокопроизводительным (highest-performing) на данном ссылающемся ресурсе (Claim 8); количества различных целевых ресурсов, для которых шаблон генерирует текст (Claim 9).
Изобретение затрагивает два ключевых этапа поиска: Индексирование (для генерации данных) и Ранжирование (для их использования).
INDEXING – Индексирование и извлечение признаков
На этом этапе происходит основной офлайн-процесс генерации данных:
Seed Queries.Linking Resources).Templates.Synthetic Descriptive Text и его ассоциация с целевыми ресурсами (Target Resources) в индексе.Query-Independent Scores (включая Template Score, Linking Score, Target Score) и их сохранение в индексе.RANKING – Ранжирование
На этом этапе (в реальном времени) происходит использование сгенерированного текста (вероятно, на стадиях L2/L3 ранжирования):
Synthetic Descriptive Text.Query-Dependent Score (релевантность текста текущему запросу).Query-Dependent Score с предварительно рассчитанным Query-Independent Score.Synthetic Descriptive Text Score.Seed Queries.Synthetic Descriptive Text, и этот текст соответствует текущему запросу.Процесс А: Генерация Синтетического Текста (Индексирование/Офлайн)
Seed Queries (запросы, которые приводили к кликам на эти ресурсы).Seed Queries появляются в соответствующих ссылающихся ресурсах (например, в теге <h1>, <title>).Seed Query "Дороти Паркер" найден в структуре <h1>Дороти Паркер - Биография</h1>, создается шаблон: извлечь текст из <h1>[...] - Биография</h1>. Шаблоны могут использовать литералы или wildcards.Seed Queries).Synthetic Descriptive Text.Процесс В: Расчет Query-Independent Score (Индексирование/Офлайн)
Template Score, Linking Score и Target Score комбинируются (например, перемножаются или суммируются после нормализации) для получения Query-Independent Score.Процесс С: Использование Синтетического Текста (Ранжирование/Онлайн)
Initial Scores.Synthetic Descriptive Text и их Query-Independent Scores.Query-Dependent Score и Query-Independent Score комбинируются для каждого фрагмента. Затем эти комбинированные оценки агрегируются для получения итоговой оценки ресурса.Initial Score ресурса корректируется на основе Synthetic Descriptive Text Score.Seed Queries (какие запросы приводят к кликам на ресурс). Также используются для расчета Linking Score (как часто кликают на ссылающиеся ресурсы).Embedded Coding Fragments, включая <title>, <h1> и другие элементы.Linking Score.Target Score).Система использует многоуровневую модель оценки:
1. Synthetic Descriptive Text Score (Итоговая оценка)
Query-Independent Score, Query-Dependent Score).2. Query-Dependent Score (Зависит от запроса)
3. Query-Independent Score (Не зависит от запроса)
3.1. Template Score (Оценка Шаблона):
embedded coding fragments.3.2. Linking Score (Оценка Ссылающегося Источника):
3.3. Target Score (Оценка Целевого Ресурса):
Templates. Текст, расположенный в значимых структурных элементах (H1, Title) на ссылающейся странице, с большей вероятностью будет извлечен и использован.Seed Queries (данные о кликах). Google учится определять, какие части ссылающейся страницы содержат наиболее ценную информацию, основываясь на поведении пользователей.Query-Independent Score), которая включает надежность шаблона (Template Score), качество ссылающегося сайта (Linking Score) и проверку на соответствие целевой странице (Target Score).Linking Score напрямую учитывает популярность ссылающегося сайта у пользователей. Синтетический текст с авторитетного и посещаемого сайта будет иметь значительно больший вес.Linking Score, ссылки с сайтов, которые получают много кликов (имеют трафик) и которые ссылаются на разнообразные ресурсы (признак редакционного контента, а не PBN/линк-фермы), передают больший вес через Synthetic Descriptive Text.Synthetic Descriptive Text (выше Template Score).Target Score), вес текста будет минимальным.Linking Score для сайтов, которые ссылаются на ограниченное число внешних ресурсов или имеют мало трафика, что делает такие ссылки менее эффективными.Target Score.Этот патент подчеркивает эволюцию Google в анализе ссылок от механистического учета анкоров к глубокому семантическому и структурному анализу контекста ссылающейся страницы. Стратегически это означает, что линкбилдинг все больше сближается с Content Marketing и Digital PR. Целью является получение редакционных ссылок в высококачественном, релевантном и хорошо структурированном контенте на посещаемых ресурсах. Система стремится понять, почему автор поставил ссылку и что он сказал о целевом ресурсе.
Сценарий: Ранжирование страницы товара по обзору
Linking Score) публикует обзор.<h2>Камера Galaxy Z9: Революция в мобильной фотографии</h2><p>Основное преимущество — это 200МП сенсор с 10-кратным оптическим зумом. Подробные характеристики <a href="...">здесь</a>.</p><h2> над ссылкой. Шаблон 2 извлекает текст из предложения, содержащего ссылку.Чем Synthetic Descriptive Text отличается от обычного анкорного текста?
Анкорный текст — это кликабельный текст самой ссылки. Synthetic Descriptive Text — это текст, извлеченный из контента ссылающейся страницы ЗА пределами анкора. Он может быть взят из заголовка раздела, где находится ссылка, из предложения рядом со ссылкой или даже из Title ссылающейся страницы, на основе структурных шаблонов, идентифицированных Google.
Что такое Seed Queries и почему они важны?
Seed Queries — это запросы, по которым пользователи часто переходят на определенную страницу из поиска (поведенческие данные). Они критически важны, так как служат обучающими данными для этого алгоритма. Google анализирует, где термины из этих успешных запросов появляются на ссылающихся страницах, чтобы научиться автоматически извлекать релевантный контекст (создавать Templates).
Как Google оценивает качество извлеченного синтетического текста?
Качество оценивается метрикой Query-Independent Score, которая состоит из трех компонентов: Template Score (насколько надежен шаблон извлечения), Linking Score (насколько авторитетен ссылающийся сайт) и Target Score (насколько текст соответствует содержанию целевой страницы). Текст с низкокачественного сайта или извлеченный ненадежным шаблоном получит низкую оценку.
Означает ли этот патент, что анкорный текст больше не важен?
Нет, анкорный текст остается важным сигналом. Однако этот патент показывает, что Google имеет развитые механизмы для компенсации недостатков анкорного текста. Если анкор неинформативен, система будет больше полагаться на Synthetic Descriptive Text. Лучшая стратегия — когда и анкор, и окружающий контекст релевантны и качественны.
Что такое Linking Score и как повлиять на него при линкбилдинге?
Linking Score оценивает качество ссылающегося сайта (донора). Он учитывает популярность сайта у пользователей (частоту кликов из поиска) и разнообразие его исходящих ссылок. Чтобы максимизировать этот показатель, следует получать ссылки с авторитетных, посещаемых сайтов, которые ведут естественную ссылочную политику (не являются линк-фермами или PBN).
Влияет ли структура HTML на извлечение синтетического текста?
Да, напрямую. Шаблоны (Templates) генерируются на основе структурных элементов (Embedded Coding Fragments), таких как заголовки (H1, H2) или теги параграфов. Ссылки из хорошо структурированного контента с большей вероятностью предоставят качественный Synthetic Descriptive Text, извлеченный с помощью надежных шаблонов.
Может ли страница ранжироваться по терминам, которых нет ни на ней, ни в анкорах?
Да, это одно из ключевых применений этого механизма. Если термины присутствуют в Synthetic Descriptive Text, извлеченном из высококачественного контекста на авторитетном сайте, целевая страница может ранжироваться по этим терминам, даже если они отсутствуют в её собственном контенте и входящих анкорах.
Что такое Target Score и как его улучшить?
Target Score проверяет, соответствует ли извлеченный синтетический текст содержанию целевой страницы (например, встречаются ли там те же термины). Для его улучшения необходимо убедиться, что контекст, из которого вы получаете ссылки, действительно соответствует тому, что находится на вашей странице. Это мера валидации и защиты от нерелевантного контекста.
Как этот патент влияет на ссылки-изображения или PDF-файлы?
Этот механизм очень полезен для таких ресурсов. Поскольку у них мало собственного текста или нет традиционного анкора (кроме alt-атрибута у изображений), система может извлечь Synthetic Descriptive Text из текста, окружающего ссылку на этот ресурс (например, из подписи или описания в статье), тем самым определяя его релевантность.
Применяется ли этот механизм к внутренним ссылкам?
Патент упоминает возможность исключения внутренних ссылок (ссылок внутри одной группы ресурсов) на этапе идентификации целевых ресурсов. Однако базовая технология анализа структуры ссылающейся страницы для понимания контекста ссылки с высокой вероятностью может применяться Google и для анализа внутренних ссылок, поэтому важно поддерживать четкую структуру и релевантный контекст при внутренней перелинковке.

Ссылки
Структура сайта
Семантика и интент

Структура сайта
Семантика и интент
SERP

Структура сайта
SERP
Ссылки

Индексация
Ссылки
SERP

Ссылки
Индексация
Техническое SEO

Поведенческие сигналы
Семантика и интент
SERP

Семантика и интент
Персонализация
Поведенческие сигналы

SERP
Ссылки
Структура сайта

Индексация
Поведенческие сигналы
Семантика и интент

SERP
EEAT и качество
Персонализация

Семантика и интент
Поведенческие сигналы
SERP

SERP
EEAT и качество
Поведенческие сигналы

SERP
Поведенческие сигналы

EEAT и качество
Свежесть контента
Семантика и интент

Ссылки
Мультиязычность
Семантика и интент
