
Google анализирует текст на страницах, ссылающихся на целевой документ, извлекая «Web Quotes». Это не только текст абзаца, окружающего ссылку, но и текст из ближайших заголовков. Эти цитаты ранжируются по качеству ссылающегося источника (например, PageRank) и используются для индексирования целевой страницы (даже если этих слов на ней нет) и для формирования сниппета в результатах поиска.
Патент решает задачу повышения качества поискового индекса и точности генерации сводок страниц (сниппетов). Он направлен на автоматический выбор наилучшего внешнего описательного текста для целевой страницы среди множества ссылающихся на неё источников. Это позволяет лучше понять содержание и релевантность страницы, особенно если её собственный контент скуден или сложен для анализа.
Запатентована система генерации, дополнения и ранжирования описательного текста, называемого Web Quote (Веб-цитата). Ключевая особенность изобретения — формирование Web Quote путем извлечения текста из абзаца, содержащего гиперссылку, и его дополнения (augmenting) текстом, расположенным вне этого абзаца, например, из ближайших заголовков (Header Information). Эти цитаты затем используются для улучшения индекса и генерации сниппетов.
Система работает в несколько этапов:
Web Quote.Web Quotes фильтруются и ранжируются. Основной критерий ранжирования — метрика качества (Quality Metric) ссылающейся страницы (например, PageRank).Web Quotes используются для (1) индексирования целевой страницы и (2) генерации её сниппета в SERP.Высокая. Анализ контекста обратных ссылок (не только анкорного текста) является фундаментальным аспектом современных поисковых систем. Принципы использования околоссылочного текста, структурных элементов (заголовков) и авторитетности источника для понимания содержания целевой страницы и генерации релевантных сниппетов остаются критически важными, несмотря на эволюцию NLP-технологий.
Патент имеет критическое значение для SEO (9/10). Он формализует важность контекста, в котором размещается обратная ссылка. Это означает, что не только анкор, но и окружающий текст в абзаце, а также соседние заголовки на ссылающейся странице, напрямую влияют на то, как Google индексирует и представляет целевую страницу. Это подчеркивает необходимость стратегий линкбилдинга, сфокусированных на получении ссылок в релевантном и описательном контексте на высококачественных сайтах.
Web Quote.Web Quote.augmentation) Web Quote.Web Quotes. В патенте PageRank приводится как пример такой метрики.Page Summary), возвращаемая пользователю в результатах поиска для описания веб-страницы.Claim 1 (Независимый пункт): Описывает основной метод генерации, ранжирования и использования Web Quotes для индексации и поиска.
Target Document).Web Quote, используя текст из абзаца, содержащего гиперссылку.Web Quote дополняется (augmenting) путем включения текста, который находится в документе, но за пределами выбранного абзаца.Metric of Quality) для каждого ссылающегося документа.Web Quotes ранжируются на основе этой метрики качества ссылающихся документов.Web Quotes на основе ранжирования.Web Quote (web quote term), даже если этот термин отсутствует в целевом документе.web quote term.Web Quote (например, как сниппет).Ядро изобретения — использование расширенного внешнего контекста (текст абзаца + текст вне абзаца) с приоритезацией на основе качества источника для двух целей: расширения индексации (включая термины, которых нет на странице) и генерации сниппета.
Claim 3 (Зависимый): Определяет предпочтительную эвристику для извлечения текста.
Текст извлекается только в том случае, если абзац имеет специфическую структуру: начинается с гиперссылки, за которой следует текст, и не содержит дополнительных гиперссылок до конца абзаца. Это соответствует формату каталога или списка определений.
Claim 9 (Зависимый от 1): Уточняет процесс дополнения (Augmenting).
Дополнение Web Quote включает в себя включение текста из заголовка (header) ссылающегося документа.
Claim 6 (Зависимый от 1): Уточняет метрику качества.
Метрика качества определяется с использованием техники, основанной на ссылочной структуре веб-страниц (в описании патента это соответствует PageRank).
Изобретение затрагивает ключевые этапы поисковой архитектуры: индексирование и генерацию выдачи.
CRAWLING – Сканирование и Сбор данных
Spider Program собирает данные о ссылочных связях и контент ссылающихся документов, что служит сырьем для генерации Web Quotes.
INDEXING – Индексирование и извлечение признаков
Основной этап применения. Компонент Web Quote Generator работает здесь:
Web Quotes. Ранжирование использует предварительно рассчитанные метрики качества сайтов (например, PageRank).Web Quotes добавляются в инвертированный индекс и ассоциируются с целевым документом.RANKING – Ранжирование
На этапе ранжирования целевой документ может быть признан релевантным запросу благодаря терминам, извлеченным из ассоциированных Web Quotes.
METASEARCH – Метапоиск и Смешивание (Генерация SERP)
При формировании выдачи система может использовать Web Quotes для генерации сниппетов. Выбор может основываться на заранее рассчитанном качестве источника (Claim 1) или на релевантности Web Quote запросу пользователя (как описано в патенте).
Входные данные:
PageRank).Выходные данные:
Web Quotes для целевого документа.Web Quotes.Web Quotes происходит на этапе индексирования (офлайн). Использование для ранжирования и генерации сниппетов происходит в реальном времени в ответ на запрос.Процесс А: Генерация и Ранжирование Web Quotes (Этап Индексирования)
Header Information) и включает его в Web Quote.Web Quotes фильтруются для удаления неадекватных описаний. Фильтрация основывается на эмпирических признаках: длина, пунктуация, использование и позиция глаголов, прилагательных. Также могут удаляться дубликаты.Web Quote присваивается значение на основе метрики качества ссылающейся страницы (например, PageRank).Web Quotes сортируются на основе присвоенных оценок. Выбираются лучшие.Web Quotes (особенно те, которых нет на целевой странице) интегрируются в индекс и ассоциируются с целевым документом.Процесс Б: Использование Web Quotes (Этап Генерации SERP)
Web Quotes).Web Quote. Web Quotes на лету, отдавая предпочтение тем, которые наиболее точно соответствуют терминам поискового запроса пользователя.Web Quotes. В патенте явно упоминается PageRank как пример метрики, основанной на структуре ссылок.Web Quote в качестве сниппета (в одном из вариантов реализации).Web Quotes. Чем выше качество (авторитетность) ссылающейся страницы, тем выше оценка Web Quote.Web Quotes. Основаны на лингвистических и структурных характеристиках текста: Web Quote.Web Quotes для генерации сниппетов. Рассчитывается на основе совпадения терминов поискового запроса с текстом Web Quote.Web Quote.Web Quotes используются для индексации целевой страницы, позволяя ей ранжироваться по запросам, слов из которых нет на самой странице. Это ключевой механизм расширения семантического покрытия.Web Quotes ранжируются на основе авторитетности (Quality Metric / PageRank) ссылающегося сайта. Контекст, полученный с высококачественных сайтов, имеет приоритет.Web Quote, усиливая контекст.Web Quotes ранжируются по качеству ссылающегося сайта (PageRank), необходимо фокусироваться на получении ссылок с авторитетных ресурсов. Описание с трастового сайта с большей вероятностью будет использовано для индексации и сниппета.Web Quotes.Web Quotes или будут проигнорированы.Web Quote.Web Quotes будут иметь низкий рейтинг и не будут выбраны системой.Этот патент подчеркивает стратегическую важность перехода от традиционного линкбилдинга к линкёрнингу (Link Earning) и цифровому PR. Способность влиять на то, как авторитетные источники описывают ваш ресурс (включая текст вокруг ссылки и заголовки), напрямую влияет на индексацию и представление сайта в поиске. Стратегия должна быть направлена на обеспечение не только факта ссылки, но и качественного контекстного окружения на авторитетной площадке.
Сценарий: Оптимизация размещения ссылки для статьи о машинном обучении
PageRank) SEO-специалист обеспечивает следующую структуру вставки:<h3>Алгоритмы Кластеризации</h3>
<p><a href="https://example.com/ml-clustering">Подробное руководство по K-Means и DBSCAN</a> — детальный разбор алгоритмов, примеры кода на Python и сравнение производительности.</p>
Web Quote, объединяющий оба элемента.Web Quote получает высокий рейтинг.Что такое «Web Quote» согласно патенту и чем он отличается от анкора?
«Web Quote» — это агрегированный описательный текст, извлеченный со ссылающейся страницы. В отличие от анкора (текста самой ссылки), «Web Quote» включает текст из того же абзаца, где находится ссылка, и дополнительно дополняется текстом извне этого абзаца, например, из ближайшего заголовка. Это дает гораздо более полный контекст.
Как «Web Quotes» влияют на индексирование и ранжирование?
Они напрямую расширяют набор ключевых слов, по которым индексируется целевая страница. Патент явно указывает (Claim 1), что термины из высокоранжированного «Web Quote» могут быть ассоциированы с целевой страницей в индексе, даже если этих терминов нет в ее собственном контенте. Это позволяет странице ранжироваться по более широкому спектру релевантных запросов.
Как Google выбирает, какой «Web Quote» использовать, если на страницу ссылается много сайтов?
Система ранжирует все сгенерированные «Web Quotes». Основным критерием ранжирования, описанным в патенте, является метрика качества ссылающегося сайта (в качестве примера приводится PageRank). Описание, взятое с более авторитетного сайта, получит приоритет.
Может ли «Web Quote» использоваться в качестве сниппета в выдаче?
Да, это одно из двух основных применений. Система может выбрать наиболее качественный «Web Quote» (на основе авторитетности источника) или, в альтернативном варианте, выбрать тот «Web Quote», который наиболее релевантен введенному пользователем поисковому запросу, и использовать его как сниппет.
Влияют ли заголовки (H1-H6) на ссылающейся странице на мою страницу?
Да, напрямую. Патент явно указывает (Claim 9), что текст из заголовков (Header Information) на ссылающейся странице используется для дополнения (аугментации) «Web Quote». Размещение ссылки под тематически релевантным заголовком усиливает контекст ссылки и улучшает понимание вашей страницы системой.
Какая структура размещения ссылки идеальна для генерации хорошего «Web Quote»?
Согласно патенту (Claim 3), предпочтительной является структура, где ссылка находится в начале абзаца, за ней следует описательный текст, и в этом абзаце нет других ссылок. Идеально, если этому абзацу предшествует релевантный заголовок.
Что произойдет, если ссылка окружена низкокачественным или нерелевантным текстом?
Система имеет механизмы фильтрации. «Web Quotes», которые не соответствуют критериям качества (например, слишком короткие, имеют плохую структуру, пунктуацию или лингвистические признаки), будут отфильтрованы. Также, если сам ссылающийся сайт низкого качества, его «Web Quote» получит низкий рейтинг.
Применяется ли этот механизм к внутренним ссылкам?
Хотя патент в основном обсуждает механизм в контексте оценки качества источника (используя PageRank, что более применимо к внешним ссылкам), логично предположить, что анализ окружающего текста применяется ко всем гиперссылкам для понимания контекста и генерации внутренних описаний страниц. Поэтому контекст внутренних ссылок также важен.
Актуален ли этот патент в эпоху BERT и NLP?
Да, он остается высоко актуальным. Патент описывает базовую архитектуру и цели использования околоссылочного текста (что извлекать и зачем). Современные NLP-модели, такие как BERT, используются для более sofisticрованного выполнения этих задач — лучшего понимания контекста вокруг ссылки и более точной оценки релевантности «Web Quote».
Как применить эти знания в стратегии линкбилдинга?
Необходимо сместить фокус с получения любой ссылки на получение ссылки в правильном контексте на качественном ресурсе. При аутриче важно обращать внимание не только на анкор, но и на окружающий текст и структуру размещения (например, близость к заголовкам). Это требует более тесного взаимодействия с авторами и редакторами площадок.

Ссылки
Семантика и интент
Индексация

Структура сайта
SERP
Ссылки

SERP
Семантика и интент
Структура сайта

Ссылки
SERP
EEAT и качество

SERP
Структура сайта
Техническое SEO

SERP
Ссылки
Структура сайта

Семантика и интент
Персонализация
Поведенческие сигналы

Индексация
Ссылки
SERP

EEAT и качество
Семантика и интент
SERP

Поведенческие сигналы
Персонализация
Семантика и интент

Поведенческие сигналы
Персонализация
Семантика и интент

Ссылки
SERP
Структура сайта

Поведенческие сигналы
Персонализация
SERP

Поведенческие сигналы
EEAT и качество

Техническое SEO
Ссылки
