SEO HARDCORE
  • Разборы патентов
    • Патенты Google
  • Скоро SEO инструменты
  • Скоро SEO аналитика
  • seohardcore
SEO HARDCORE
назад

Как Google использует околоссылочный текст и заголовки (Web Quotes) для индексирования страниц и генерации сниппетов

USING TEXT SURROUNDING HYPERTEXT LINKS WHEN INDEXING AND GENERATING PAGE SUMMARIES (Использование текста, окружающего гипертекстовые ссылки, при индексировании и генерации сводок страниц)
  • US8495483B1
  • Google LLC
  • 2003-03-12
  • 2013-07-23
  • Индексация
  • Ссылки
  • SERP
  • Описание
  • Разбор
  • Выводы
  • Практика
  • FAQ
  • Похожие

Google анализирует текст на страницах, ссылающихся на целевой документ, извлекая «Web Quotes». Это не только текст абзаца, окружающего ссылку, но и текст из ближайших заголовков. Эти цитаты ранжируются по качеству ссылающегося источника (например, PageRank) и используются для индексирования целевой страницы (даже если этих слов на ней нет) и для формирования сниппета в результатах поиска.

Описание

Какую проблему решает

Патент решает задачу повышения качества поискового индекса и точности генерации сводок страниц (сниппетов). Он направлен на автоматический выбор наилучшего внешнего описательного текста для целевой страницы среди множества ссылающихся на неё источников. Это позволяет лучше понять содержание и релевантность страницы, особенно если её собственный контент скуден или сложен для анализа.

Что запатентовано

Запатентована система генерации, дополнения и ранжирования описательного текста, называемого Web Quote (Веб-цитата). Ключевая особенность изобретения — формирование Web Quote путем извлечения текста из абзаца, содержащего гиперссылку, и его дополнения (augmenting) текстом, расположенным вне этого абзаца, например, из ближайших заголовков (Header Information). Эти цитаты затем используются для улучшения индекса и генерации сниппетов.

Как это работает

Система работает в несколько этапов:

  • Идентификация источников: Определяются страницы, ссылающиеся на целевой документ.
  • Извлечение и Дополнение: Извлекается текст из абзаца, содержащего ссылку, и дополняется контекстом, например, текстом из ближайшего заголовка. Это формирует Web Quote.
  • Фильтрация и Ранжирование: Полученные Web Quotes фильтруются и ранжируются. Основной критерий ранжирования — метрика качества (Quality Metric) ссылающейся страницы (например, PageRank).
  • Применение: Наиболее качественные Web Quotes используются для (1) индексирования целевой страницы и (2) генерации её сниппета в SERP.

Актуальность для SEO

Высокая. Анализ контекста обратных ссылок (не только анкорного текста) является фундаментальным аспектом современных поисковых систем. Принципы использования околоссылочного текста, структурных элементов (заголовков) и авторитетности источника для понимания содержания целевой страницы и генерации релевантных сниппетов остаются критически важными, несмотря на эволюцию NLP-технологий.

Важность для SEO

Патент имеет критическое значение для SEO (9/10). Он формализует важность контекста, в котором размещается обратная ссылка. Это означает, что не только анкор, но и окружающий текст в абзаце, а также соседние заголовки на ссылающейся странице, напрямую влияют на то, как Google индексирует и представляет целевую страницу. Это подчеркивает необходимость стратегий линкбилдинга, сфокусированных на получении ссылок в релевантном и описательном контексте на высококачественных сайтах.

Детальный разбор

Термины и определения

Web Quote (Веб-цитата)
Описательный текст о целевой странице, извлеченный со ссылающейся страницы. Формируется из текста абзаца, содержащего ссылку, и дополняется текстом вне этого абзаца (например, заголовками).
Target Document (Целевой документ)
Страница, на которую ведет ссылка и для которой генерируется Web Quote.
Linking Document / Source Page (Ссылающийся документ / Исходная страница)
Страница, содержащая ссылку и текст, из которого извлекается Web Quote.
Anchor (Анкорь)
HTML-структура, определяющая гиперссылку.
Paragraph / Block (Абзац / Блок)
Блок текста, содержащий анкорь. Определяется HTML-разметкой (например, тегами <p> или разделителями строк).
Header Information (Информация заголовка)
Текст, расположенный вне абзаца с анкорем (например, ближайший заголовок), используемый для дополнения (augmentation) Web Quote.
Quality Metric (Метрика качества)
Оценка, присваиваемая исходной странице. Используется для ранжирования извлеченных Web Quotes. В патенте PageRank приводится как пример такой метрики.
Snippet (Сниппет)
Сводка текста (Page Summary), возвращаемая пользователю в результатах поиска для описания веб-страницы.

Ключевые утверждения (Анализ Claims)

Claim 1 (Независимый пункт): Описывает основной метод генерации, ранжирования и использования Web Quotes для индексации и поиска.

  1. Система выбирает документы, содержащие гиперссылку на целевой документ (Target Document).
  2. Для каждого ссылающегося документа генерируется Web Quote, используя текст из абзаца, содержащего гиперссылку.
  3. Web Quote дополняется (augmenting) путем включения текста, который находится в документе, но за пределами выбранного абзаца.
  4. Определяется метрика качества (Metric of Quality) для каждого ссылающегося документа.
  5. Web Quotes ранжируются на основе этой метрики качества ссылающихся документов.
  6. Выбирается один из Web Quotes на основе ранжирования.
  7. В индекс сохраняется информация, связывающая целевой документ с его собственными терминами.
  8. В индекс также сохраняется информация, связывающая целевой документ с термином из выбранного Web Quote (web quote term), даже если этот термин отсутствует в целевом документе.
  9. Целевой документ идентифицируется как релевантный поисковому запросу на основе этого web quote term.
  10. В ответ на запрос предоставляется информация о целевом документе и выбранный Web Quote (например, как сниппет).

Ядро изобретения — использование расширенного внешнего контекста (текст абзаца + текст вне абзаца) с приоритезацией на основе качества источника для двух целей: расширения индексации (включая термины, которых нет на странице) и генерации сниппета.

Claim 3 (Зависимый): Определяет предпочтительную эвристику для извлечения текста.

Текст извлекается только в том случае, если абзац имеет специфическую структуру: начинается с гиперссылки, за которой следует текст, и не содержит дополнительных гиперссылок до конца абзаца. Это соответствует формату каталога или списка определений.

Claim 9 (Зависимый от 1): Уточняет процесс дополнения (Augmenting).

Дополнение Web Quote включает в себя включение текста из заголовка (header) ссылающегося документа.

Claim 6 (Зависимый от 1): Уточняет метрику качества.

Метрика качества определяется с использованием техники, основанной на ссылочной структуре веб-страниц (в описании патента это соответствует PageRank).

Где и как применяется

Изобретение затрагивает ключевые этапы поисковой архитектуры: индексирование и генерацию выдачи.

CRAWLING – Сканирование и Сбор данных
Spider Program собирает данные о ссылочных связях и контент ссылающихся документов, что служит сырьем для генерации Web Quotes.

INDEXING – Индексирование и извлечение признаков
Основной этап применения. Компонент Web Quote Generator работает здесь:

  1. Извлечение признаков: Анализирует HTML ссылающихся страниц, идентифицирует абзацы со ссылками и соседние элементы (заголовки).
  2. Генерация и Ранжирование: Формируются, фильтруются и ранжируются Web Quotes. Ранжирование использует предварительно рассчитанные метрики качества сайтов (например, PageRank).
  3. Расширение Индекса: Термины из высокоранжированных Web Quotes добавляются в инвертированный индекс и ассоциируются с целевым документом.

RANKING – Ранжирование
На этапе ранжирования целевой документ может быть признан релевантным запросу благодаря терминам, извлеченным из ассоциированных Web Quotes.

METASEARCH – Метапоиск и Смешивание (Генерация SERP)
При формировании выдачи система может использовать Web Quotes для генерации сниппетов. Выбор может основываться на заранее рассчитанном качестве источника (Claim 1) или на релевантности Web Quote запросу пользователя (как описано в патенте).

Входные данные:

  • Список ссылающихся документов и их контент (HTML).
  • Метрики качества ссылающихся документов (например, PageRank).
  • Поисковый запрос (при использовании для генерации сниппетов в реальном времени).

Выходные данные:

  • Ранжированный список Web Quotes для целевого документа.
  • Расширенный индекс, включающий термины из Web Quotes.
  • Сниппет для отображения в SERP.

На что влияет

  • Индексация и Ранжирование: Напрямую влияет на то, по каким запросам страница может ранжироваться, добавляя внешние описательные термины в ее семантический профиль.
  • Генерация сниппетов: Влияет на представление страницы в результатах поиска и, как следствие, на CTR.
  • Типы контента: Механизм особенно важен для страниц, содержание которых сложно понять только по их собственному контенту (главные страницы, мультимедиа, страницы с малым количеством текста).

Когда применяется

  • Временные рамки: Генерация и ранжирование Web Quotes происходит на этапе индексирования (офлайн). Использование для ранжирования и генерации сниппетов происходит в реальном времени в ответ на запрос.
  • Условия: Применяется при условии, что ссылающиеся страницы доступны для сканирования и из них можно извлечь осмысленный описательный текст, соответствующий критериям фильтрации и структурным эвристикам (например, паттерн из Claim 3).

Пошаговый алгоритм

Процесс А: Генерация и Ранжирование Web Quotes (Этап Индексирования)

  1. Идентификация ссылающихся страниц: Для целевой страницы получается список веб-страниц, которые на неё ссылаются.
  2. Извлечение околоссылочного текста: Для каждой ссылающейся страницы анализируются блоки текста (например, абзацы), содержащие ссылку. Извлекается текст из этих блоков. Применяются эвристики: предпочтение отдается абзацам, которые начинаются со ссылки, за которой следует текст, и не содержат других ссылок.
  3. Дополнение текста (Augmentation): Извлеченный текст дополняется текстом, расположенным вне абзаца со ссылкой. Система анализирует HTML для поиска ближайшего заголовка (Header Information) и включает его в Web Quote.
  4. Фильтрация Web Quotes: Сгенерированные Web Quotes фильтруются для удаления неадекватных описаний. Фильтрация основывается на эмпирических признаках: длина, пунктуация, использование и позиция глаголов, прилагательных. Также могут удаляться дубликаты.
  5. Присвоение оценок качества: Каждому Web Quote присваивается значение на основе метрики качества ссылающейся страницы (например, PageRank).
  6. Сортировка и Выбор: Web Quotes сортируются на основе присвоенных оценок. Выбираются лучшие.
  7. Индексирование: Термины из лучших Web Quotes (особенно те, которых нет на целевой странице) интегрируются в индекс и ассоциируются с целевым документом.

Процесс Б: Использование Web Quotes (Этап Генерации SERP)

  1. Получение запроса и результатов: Система идентифицирует релевантные документы (в том числе за счет терминов из Web Quotes).
  2. Генерация сниппетов: Для формирования сниппета система может использовать высокоранжированный Web Quote.
    Альтернативный вариант: Система может переранжировать доступные Web Quotes на лету, отдавая предпочтение тем, которые наиболее точно соответствуют терминам поискового запроса пользователя.
  3. Отображение результатов: Результаты поиска отображаются вместе с выбранными сниппетами.

Какие данные и как использует

Данные на входе

  • Контентные и Структурные факторы (Ссылающейся страницы):
    • Текст абзаца: Текст, окружающий гиперссылку в пределах одного блока.
    • Заголовки (Header Information): Текст из заголовков, расположенных рядом со ссылкой.
    • HTML-структура: Используется для идентификации абзацев (теги <p>, разделители строк) и заголовков. Анализируется структура абзаца (позиция ссылки, наличие других ссылок).
  • Ссылочные факторы:
    • Наличие ссылки (Anchor).
    • Метрики качества ссылающегося сайта: Используются для ранжирования Web Quotes. В патенте явно упоминается PageRank как пример метрики, основанной на структуре ссылок.
  • Пользовательские факторы:
    • Поисковый запрос: Может использоваться для выбора наиболее релевантного Web Quote в качестве сниппета (в одном из вариантов реализации).

Какие метрики используются и как они считаются

  • Метрика качества источника (Source Quality Metric / PageRank): Используется для ранжирования Web Quotes. Чем выше качество (авторитетность) ссылающейся страницы, тем выше оценка Web Quote.
  • Критерии фильтрации (Filtering Criteria): Используются для отсева некачественных Web Quotes. Основаны на лингвистических и структурных характеристиках текста:
    • Длина Web Quote.
    • Пунктуация.
    • Использование глаголов и прилагательных.
    • Позиция глаголов.
  • Метрика релевантности запросу (Query Relevance Metric): Альтернативный метод ранжирования Web Quotes для генерации сниппетов. Рассчитывается на основе совпадения терминов поискового запроса с текстом Web Quote.

Выводы

  1. Контекст ссылки значительно шире, чем анкорный текст: Патент подтверждает, что Google анализирует не только анкор, но и текст, окружающий ссылку (в пределах абзаца), а также структурные элементы страницы (заголовки) рядом со ссылкой. Это формирует Web Quote.
  2. Расширенное индексирование за счет внешних описаний: Термины из Web Quotes используются для индексации целевой страницы, позволяя ей ранжироваться по запросам, слов из которых нет на самой странице. Это ключевой механизм расширения семантического покрытия.
  3. Качество источника определяет вес контекста: Web Quotes ранжируются на основе авторитетности (Quality Metric / PageRank) ссылающегося сайта. Контекст, полученный с высококачественных сайтов, имеет приоритет.
  4. Два применения «Web Quotes»: Система использует их как для улучшения индекса (офлайн), так и для генерации сниппетов в результатах поиска (онлайн).
  5. Структура размещения ссылки имеет значение: Патент указывает на предпочтительные HTML-паттерны для извлечения описаний, например, абзац, начинающийся со ссылки, за которой следует описание, без других ссылок в этом же абзаце.
  6. Автоматическая фильтрация описаний: Существуют механизмы для отсева низкокачественных или неинформативных описаний на основе лингвистических и структурных признаков.

Практика

Best practices (это мы делаем)

  • Фокус на контекстуальном линкбилдинге: При получении обратных ссылок критически важно, чтобы ссылка была размещена в абзаце с релевантным и описательным текстом, который точно характеризует содержание целевой страницы.
  • Оптимизация окружения ссылки и заголовков (Outreach): При аутриче или гостевом постинге следует стремиться к размещению ссылки сразу после релевантного подзаголовка и в начале описательного абзаца. Текст заголовка может быть включен в Web Quote, усиливая контекст.
  • Приоритет качества доноров: Так как Web Quotes ранжируются по качеству ссылающегося сайта (PageRank), необходимо фокусироваться на получении ссылок с авторитетных ресурсов. Описание с трастового сайта с большей вероятностью будет использовано для индексации и сниппета.
  • Создание контента, достойного описания (Linkable Assets): Создавайте полезный контент, который естественно стимулирует других авторов ссылаться на него с подробными пояснениями в тексте своих статей, формируя качественные Web Quotes.
  • Оптимизация внутренней перелинковки: Применяйте те же принципы к внутренним ссылкам. Окружающий текст и контекст внутренних ссылок также помогают системе лучше понять содержание страниц сайта.

Worst practices (это делать не надо)

  • Получение ссылок в нерелевантном окружении: Ссылки, окруженные текстом, не имеющим отношения к целевой странице, могут привести к генерации нерелевантных Web Quotes или будут проигнорированы.
  • Игнорирование структуры размещения: Размещение ссылок в футерах, боковых панелях или списках ссылок без описательного контекста и релевантных заголовков не позволяет системе сгенерировать качественный Web Quote.
  • Фокус на количестве в ущерб качеству доноров: Массовое получение ссылок с низкокачественных сайтов неэффективно, так как их Web Quotes будут иметь низкий рейтинг и не будут выбраны системой.
  • Перенасыщенные ссылками блоки: Размещение ссылки в абзаце, содержащем много других ссылок, затрудняет изоляцию описательного текста, относящегося именно к этой ссылке.

Стратегическое значение

Этот патент подчеркивает стратегическую важность перехода от традиционного линкбилдинга к линкёрнингу (Link Earning) и цифровому PR. Способность влиять на то, как авторитетные источники описывают ваш ресурс (включая текст вокруг ссылки и заголовки), напрямую влияет на индексацию и представление сайта в поиске. Стратегия должна быть направлена на обеспечение не только факта ссылки, но и качественного контекстного окружения на авторитетной площадке.

Практические примеры

Сценарий: Оптимизация размещения ссылки для статьи о машинном обучении

  1. Цель: Улучшить индексацию статьи по запросам, связанным с конкретными алгоритмами.
  2. Действия (Аутрич): При размещении гостевого поста на авторитетном блоге (высокий PageRank) SEO-специалист обеспечивает следующую структуру вставки:

<h3>Алгоритмы Кластеризации</h3>
<p><a href="https://example.com/ml-clustering">Подробное руководство по K-Means и DBSCAN</a> — детальный разбор алгоритмов, примеры кода на Python и сравнение производительности.</p>

  1. Как это работает по патенту:
    • Система извлекает текст из абзаца: "— детальный разбор алгоритмов, примеры кода на Python и сравнение производительности." (Паттерн из Claim 3 соблюден).
    • Система дополняет (Augmentation) его текстом из заголовка: "Алгоритмы Кластеризации".
    • Формируется Web Quote, объединяющий оба элемента.
    • Так как источник авторитетный, этот Web Quote получает высокий рейтинг.
  2. Ожидаемый результат: Целевая страница начинает лучше индексироваться по терминам "примеры кода Python для кластеризации", "сравнение производительности K-Means DBSCAN" (даже если этих точных фраз нет на странице), и этот текст может быть использован в качестве сниппета в SERP.

Вопросы и ответы

Что такое «Web Quote» согласно патенту и чем он отличается от анкора?

«Web Quote» — это агрегированный описательный текст, извлеченный со ссылающейся страницы. В отличие от анкора (текста самой ссылки), «Web Quote» включает текст из того же абзаца, где находится ссылка, и дополнительно дополняется текстом извне этого абзаца, например, из ближайшего заголовка. Это дает гораздо более полный контекст.

Как «Web Quotes» влияют на индексирование и ранжирование?

Они напрямую расширяют набор ключевых слов, по которым индексируется целевая страница. Патент явно указывает (Claim 1), что термины из высокоранжированного «Web Quote» могут быть ассоциированы с целевой страницей в индексе, даже если этих терминов нет в ее собственном контенте. Это позволяет странице ранжироваться по более широкому спектру релевантных запросов.

Как Google выбирает, какой «Web Quote» использовать, если на страницу ссылается много сайтов?

Система ранжирует все сгенерированные «Web Quotes». Основным критерием ранжирования, описанным в патенте, является метрика качества ссылающегося сайта (в качестве примера приводится PageRank). Описание, взятое с более авторитетного сайта, получит приоритет.

Может ли «Web Quote» использоваться в качестве сниппета в выдаче?

Да, это одно из двух основных применений. Система может выбрать наиболее качественный «Web Quote» (на основе авторитетности источника) или, в альтернативном варианте, выбрать тот «Web Quote», который наиболее релевантен введенному пользователем поисковому запросу, и использовать его как сниппет.

Влияют ли заголовки (H1-H6) на ссылающейся странице на мою страницу?

Да, напрямую. Патент явно указывает (Claim 9), что текст из заголовков (Header Information) на ссылающейся странице используется для дополнения (аугментации) «Web Quote». Размещение ссылки под тематически релевантным заголовком усиливает контекст ссылки и улучшает понимание вашей страницы системой.

Какая структура размещения ссылки идеальна для генерации хорошего «Web Quote»?

Согласно патенту (Claim 3), предпочтительной является структура, где ссылка находится в начале абзаца, за ней следует описательный текст, и в этом абзаце нет других ссылок. Идеально, если этому абзацу предшествует релевантный заголовок.

Что произойдет, если ссылка окружена низкокачественным или нерелевантным текстом?

Система имеет механизмы фильтрации. «Web Quotes», которые не соответствуют критериям качества (например, слишком короткие, имеют плохую структуру, пунктуацию или лингвистические признаки), будут отфильтрованы. Также, если сам ссылающийся сайт низкого качества, его «Web Quote» получит низкий рейтинг.

Применяется ли этот механизм к внутренним ссылкам?

Хотя патент в основном обсуждает механизм в контексте оценки качества источника (используя PageRank, что более применимо к внешним ссылкам), логично предположить, что анализ окружающего текста применяется ко всем гиперссылкам для понимания контекста и генерации внутренних описаний страниц. Поэтому контекст внутренних ссылок также важен.

Актуален ли этот патент в эпоху BERT и NLP?

Да, он остается высоко актуальным. Патент описывает базовую архитектуру и цели использования околоссылочного текста (что извлекать и зачем). Современные NLP-модели, такие как BERT, используются для более sofisticрованного выполнения этих задач — лучшего понимания контекста вокруг ссылки и более точной оценки релевантности «Web Quote».

Как применить эти знания в стратегии линкбилдинга?

Необходимо сместить фокус с получения любой ссылки на получение ссылки в правильном контексте на качественном ресурсе. При аутриче важно обращать внимание не только на анкор, но и на окружающий текст и структуру размещения (например, близость к заголовкам). Это требует более тесного взаимодействия с авторами и редакторами площадок.

Похожие патенты

Как Google использует контент вокруг ссылок (вне анкора) для генерации «Синтетического Описательного Текста» и ранжирования вашего сайта
Google может генерировать «Синтетический Описательный Текст» для страницы, анализируя контент и структуру сайтов, которые на нее ссылаются. Система создает структурные шаблоны для извлечения релевантного текста (например, заголовков или абзацев рядом со ссылкой), который затем используется как мощный сигнал ранжирования. Этот механизм позволяет лучше понять содержание страницы, особенно если традиционный анкорный текст низкого качества или отсутствует.
  • US9208233B1
  • 2015-12-08
  • Ссылки

  • Семантика и интент

  • Индексация

Как Google использует внутренние ссылки и структуру DOM для генерации шаблонов сайта и извлечения структурированных сниппетов
Google анализирует повторяющиеся блоки внутренних ссылок (например, списки товаров). Если текст возле ссылки на исходной странице совпадает с текстом на целевой странице, Google определяет DOM-структуру этого текста и создает шаблон домена. Этот шаблон позволяет автоматически извлекать ключевую информацию (например, цену и характеристики) для сниппетов со всех однотипных страниц сайта, даже без микроразметки.
  • US9971746B2
  • 2018-05-15
  • Структура сайта

  • SERP

  • Ссылки

Как Google генерирует сниппеты для Sitelinks, используя контент целевых страниц, а не исходный запрос
Google использует специальный метод для генерации сниппетов в расширенных результатах поиска (Sitelinks). Сниппет для главной страницы часто основан на запросе пользователя, но сниппеты для внутренних ссылок (sub-documents) генерируются на основе "репрезентативных ключевых слов" (например, Title) самой внутренней страницы, а не исходного навигационного запроса. Это позволяет сделать описание Sitelinks более точным и релевантным теме целевой страницы.
  • US9081831B2
  • 2015-07-14
  • SERP

  • Семантика и интент

  • Структура сайта

Как Google использует цитирования на веб-страницах для ранжирования книг в основной выдаче
Google использует механизм для определения релевантных книг по общим информационным запросам, даже если пользователь не искал книгу специально. Система анализирует, какие книги цитируются на топовых веб-страницах в выдаче. Книги получают оценку, основанную на авторитетности цитирующих страниц и контексте цитирования, и затем подмешиваются в результаты поиска.
  • US8392429B1
  • 2013-03-05
  • Ссылки

  • SERP

  • EEAT и качество

Как Google синтезирует сниппеты, объединяя заголовки высококачественных внутренних страниц сайта (Sitelinks)
Google может заменить стандартный сниппет веб-страницы на «синтезированный сниппет», созданный путем объединения заголовков её наиболее важных подстраниц (например, тех, что попадают в Sitelinks). Это происходит, когда стандартный сниппет неинформативен, позволяя пользователю лучше понять структуру и содержание сайта прямо в выдаче.
  • US9158849B2
  • 2015-10-13
  • SERP

  • Структура сайта

  • Техническое SEO

Популярные патенты

Как Google выбирает Sitelinks, анализируя визуальное расположение и структуру DOM навигационных меню
Google использует механизм для генерации Sitelinks путем рендеринга страницы и анализа DOM-структуры. Система определяет визуальное расположение (координаты X, Y) гиперссылок и группирует их на основе визуальной близости и общих родительских элементов. Sitelinks выбираются исключительно из доминирующей группы (например, главного меню), а ссылки из других групп игнорируются.
  • US9053177B1
  • 2015-06-09
  • SERP

  • Ссылки

  • Структура сайта

Как Google использует данные сессий и разнообразие результатов для генерации блока "Связанные запросы"
Google анализирует поисковые сессии пользователей, чтобы найти запросы, которые часто следуют за одним и тем же предшествующим запросом (родственные запросы). Затем система фильтрует эти потенциальные "Связанные запросы", чтобы убедиться, что они предлагают разнообразные результаты по сравнению с исходным запросом и другими предложениями, помогая пользователям исследовать смежные, но отличные темы.
  • US8244749B1
  • 2012-08-14
  • Семантика и интент

  • Персонализация

  • Поведенческие сигналы

Как Google использует околоссылочный текст и заголовки (Web Quotes) для индексирования страниц и генерации сниппетов
Google анализирует текст на страницах, ссылающихся на целевой документ, извлекая «Web Quotes». Это не только текст абзаца, окружающего ссылку, но и текст из ближайших заголовков. Эти цитаты ранжируются по качеству ссылающегося источника (например, PageRank) и используются для индексирования целевой страницы (даже если этих слов на ней нет) и для формирования сниппета в результатах поиска.
  • US8495483B1
  • 2013-07-23
  • Индексация

  • Ссылки

  • SERP

Как Google определяет авторитетные сайты для конкретных тем, анализируя «гибридные запросы» пользователей
Google анализирует «гибридные запросы» (например, «back pain WebMD»), чтобы понять, какие сайты пользователи считают лучшими источниками информации по конкретным темам. Система создает карты соответствия между темами и авторитетными ресурсами. Эти данные используются для повышения релевантности авторитетных сайтов в выдаче по информационным запросам и для улучшения поисковых подсказок.
  • US9244972B1
  • 2016-01-26
  • EEAT и качество

  • Семантика и интент

  • SERP

Как Google связывает документы на основе поведения пользователей, времени взаимодействия и контентной близости для персонализации поиска
Google использует систему для определения "меры ассоциации" между различными документами (статьями, веб-страницами, письмами). Ассоциация рассчитывается на основе того, насколько близко по времени пользователь взаимодействовал с этими документами, насколько похож их контент и совпадают ли метаданные (например, автор). Эти связи используются для понимания пути пользователя и персонализации последующих результатов поиска.
  • US8131754B1
  • 2012-03-06
  • Поведенческие сигналы

  • Персонализация

  • Семантика и интент

Как Google использует контекст пользователя для генерации неявных поисковых запросов и проактивного показа результатов
Система Google отслеживает контекст пользователя в реальном времени (набираемый текст, открытые документы, письма). На основе этого контекста автоматически генерируются множественные неявные запросы. Система объединяет результаты из разных источников (локальных и глобальных) и проактивно показывает их пользователю, используя поведенческие данные (клики) для улучшения релевантности.
  • US7664734B2
  • 2010-02-16
  • Поведенческие сигналы

  • Персонализация

  • Семантика и интент

Как Google использует организационные структуры (папки, ярлыки) как ссылки для расчета PageRank и ранжирования документов
Google может анализировать, как документы организованы пользователями (например, в папках, через ярлыки или закладки), и использовать эти организационные структуры для расчета рейтинга документа. Документы, концептуально сгруппированные вместе, передают друг другу ранжирующий вес (аналогично PageRank), причем более тесные связи (например, в одной папке) передают больше веса, чем более слабые связи (например, в соседних папках).
  • US8090736B1
  • 2012-01-03
  • Ссылки

  • SERP

  • Структура сайта

Как Google использует данные о совместном посещении сайтов (Co-Visitation) для персонализации и повышения релевантности выдачи
Google использует поведенческие данные сообщества пользователей для определения тематической связи между сайтами. Если пользователи часто посещают Сайт А и Сайт Б в течение короткого промежутка времени (Co-Visitation), система создает "Вектор повышения" (Boost Vector). Этот вектор используется для повышения в выдаче тематически связанных сайтов, основываясь на истории посещений пользователя или контексте текущего сайта, улучшая персонализацию и релевантность.
  • US8874570B1
  • 2014-10-28
  • Поведенческие сигналы

  • Персонализация

  • SERP

Как Google вычисляет оценку качества сайта на основе соотношения брендового интереса и общего поискового трафика
Google использует поведенческие данные для расчета оценки качества сайта (Site Quality Score). Метрика основана на соотношении количества уникальных запросов, направленных конкретно на сайт (брендовый/навигационный интерес), к общему количеству уникальных запросов, которые привели пользователей на этот сайт. Высокий показатель этого соотношения свидетельствует о высоком качестве и авторитетности сайта.
  • US9031929B1
  • 2015-05-12
  • Поведенческие сигналы

  • EEAT и качество

Как Google консолидирует сигналы ранжирования между мобильными и десктопными версиями страниц, используя десктопный авторитет для мобильного поиска
Патент Google описывает механизм для решения проблемы недостатка сигналов ранжирования в мобильном вебе. Система идентифицирует корреляцию между мобильной страницей и её десктопным аналогом. Если мобильная версия недостаточно популярна сама по себе, она наследует сигналы ранжирования (например, обратные ссылки и PageRank) от авторитетной десктопной версии, улучшая её позиции в мобильном поиске.
  • US8996514B1
  • 2015-03-31
  • Техническое SEO

  • Ссылки

seohardcore