SEO HARDCORE
  • Разборы патентов
    • Патенты Google
  • Скоро SEO инструменты
  • Скоро SEO аналитика
  • seohardcore
SEO HARDCORE
назад

Как Google использует связанные фразы и расширения запросов для генерации сниппетов в поисковой выдаче

PHRASE-BASED GENERATION OF DOCUMENT DESCRIPTIONS (Генерация описаний документов на основе фраз)
  • US7584175B2
  • Google LLC
  • 2004-07-26
  • 2009-09-01
  • Семантика и интент
  • SERP
  • Персонализация
  • Описание
  • Разбор
  • Выводы
  • Практика
  • FAQ
  • Похожие

Google использует запатентованный метод для автоматической генерации описаний документов (сниппетов) в результатах поиска. Система анализирует предложения в документе и ранжирует их на основе наличия трех элементов: самой фразы из запроса, семантически связанных фраз (определенных через Information Gain) и расширений фразы запроса. Наиболее релевантные предложения выбираются для формирования сниппета.

Описание

Какую проблему решает

Патент решает задачу создания релевантных и информативных описаний документов (сниппетов) для отображения в результатах поиска. Вместо использования фиксированного текста (например, meta description) или простого извлечения текста вокруг ключевого слова, система стремится предоставить пользователю краткое изложение содержания документа, контекстуально связанное с поисковым запросом. Также рассматривается возможность персонализации сниппета.

Что запатентовано

Запатентован метод автоматической генерации описания документа в ответ на запрос. Суть изобретения заключается в ранжировании предложений документа на основе статистического подсчета трех типов фраз: 1) фраз из запроса (Query Phrases), 2) связанных фраз (Related Phrases), и 3) расширений фраз запроса (Phrase Extensions). Предложения с наибольшим количеством этих элементов выбираются для формирования описания.

Как это работает

Система функционирует на основе предварительно созданного фразового индекса, где определены связи между фразами (Related Phrases и Extensions).

  1. Получение результатов: Система получает набор документов, релевантных запросу.
  2. Анализ предложений: Для каждого документа система анализирует его предложения.
  3. Подсчет фраз: В каждом предложении подсчитывается количество вхождений Query Phrases (Qp), Related Phrases (Qr) и Phrase Extensions (Qe).
  4. Ранжирование предложений: Предложения сортируются на основе этих трех подсчетов, используя их как первичный (Qp), вторичный (Qr) и третичный (Qe) ключи сортировки.
  5. Генерация сниппета: Несколько (например, 5) предложений с наивысшим рейтингом выбираются и объединяются для формирования описания документа.

Актуальность для SEO

Высокая. Генерация динамических, релевантных запросу сниппетов остается критически важной функцией поисковых систем для повышения CTR. Описанные в патенте принципы использования семантически связанных концепций (Related Phrases) для выбора наиболее информативных предложений лежат в основе современных подходов к генерации сниппетов, хотя конкретные реализации, вероятно, эволюционировали в сторону более сложных нейросетевых моделей (BERT/MUM).

Важность для SEO

Патент имеет высокое значение (8.5/10). Он напрямую описывает механизм, который определяет, какой именно текст будет показан пользователю в SERP. Понимание этого механизма позволяет SEO-специалистам оптимизировать структуру и контент страниц таким образом, чтобы влиять на выбор предложений для сниппета. Это подчеркивает важность использования не только целевых ключевых слов, но и семантически связанных фраз (Related Phrases) в ключевых предложениях контента.

Детальный разбор

Термины и определения

Good Phrase (Хорошая/Значимая фраза)
Фраза, идентифицированная системой индексирования как значимая на основе частотности, использования и предиктивной силы (способности предсказывать появление других фраз).
Information Gain (Прирост информации)
Предиктивная метрика, используемая для определения связи между фразами. Рассчитывается как отношение фактической частоты совместной встречаемости двух фраз (A) к ожидаемой частоте (E). I(j,k)=A(j,k)/E(j,k)I(j,k)=A(j,k)/E(j,k)I(j,k)=A(j,k)/E(j,k).
Related Phrases (Qr) (Связанные фразы)
Две фразы считаются связанными, если показатель Information Gain между ними превышает определенный порог. Это фразы, которые часто используются для обсуждения одной и той же темы.
Phrase Extension (Qe) (Расширение фразы)
Супер-последовательность, которая начинается с базовой фразы. Например, "Президент Соединенных Штатов" является расширением фразы "Президент".
Query Phrase (Qp) (Фраза запроса)
Good Phrase, идентифицированная в поисковом запросе пользователя.
User Model (Модель пользователя)
Коллекция фраз, извлеченных из документов, к которым пользователь ранее получал доступ. Используется для персонализации сниппетов.

Ключевые утверждения (Анализ Claims)

Патент фокусируется на методе генерации описания документа (сниппета).

Claim 1 (Независимый пункт): Описывает основной метод генерации описания документа.

  1. Система получает документ в ответ на запрос, содержащий Query Phrase.
  2. Для предложений документа рассчитываются три показателя (counts):
    • Первый подсчет (Count 1): количество вхождений Query Phrase.
    • Второй подсчет (Count 2): количество вхождений Related Phrases (определенных через Information Gain выше порога).
    • Третий подсчет (Count 3): количество вхождений Phrase Extensions.
  3. Одно или несколько предложений выбираются на основе этих трех показателей.
  4. Из выбранных предложений формируется описание документа.

Claim 2 (Зависимый от 1): Уточняет механизм выбора.

Предложения сортируются в порядке убывания их соответствующих подсчетов, и выбирается определенное количество предложений с наивысшими показателями.

Claim 3 (Зависимый от 2): Определяет строгую иерархию сортировки.

  • Первичный ключ сортировки: Первый подсчет (Query Phrase).
  • Вторичный ключ сортировки: Второй подсчет (Related Phrases).
  • Третичный ключ сортировки: Третий подсчет (Phrase Extensions).

Это определяет приоритеты системы: сначала точное соответствие запросу, затем семантический контекст, и в последнюю очередь — уточнения (расширения).

Claim 4 (Зависимый от 1): Уточняет формирование описания.

Описание формируется путем конкатенации (объединения) выбранных предложений в блок текста.

Где и как применяется

Изобретение затрагивает несколько этапов поисковой архитектуры, опираясь на данные, сгенерированные во время индексации, и применяясь после основного ранжирования.

INDEXING – Индексирование и извлечение признаков

На этом этапе происходит предварительная работа: идентификация Good Phrases, расчет Information Gain, определение Related Phrases и Phrase Extensions. Эти данные сохраняются в индексе и базе данных фраз (Phrase Data).

QUNDERSTANDING – Понимание Запросов

При получении запроса система идентифицирует в нем Query Phrases и извлекает для них соответствующие Related Phrases и Phrase Extensions из Phrase Data.

RERANKING / METASEARCH (Presentation System)

Основное применение патента. После того как основной поиск (Search System) вернул набор ранжированных результатов, система презентации (Presentation System) генерирует сниппеты. Этот процесс происходит динамически для каждого запроса.

Входные данные:

  • Поисковый запрос и идентифицированные Query Phrases (Qp).
  • Набор релевантных документов.
  • Данные о фразах (Qr и Qe для фраз запроса).
  • (Опционально) User Model для персонализации.

Выходные данные:

  • Модифицированные результаты поиска с автоматически сгенерированными сниппетами для документов.

На что влияет

  • Все типы контента и запросов: Механизм универсален и применяется ко всем документам в результатах поиска, для которых генерируется текстовый сниппет.
  • CTR и восприятие релевантности: Напрямую влияет на то, насколько привлекательным и релевантным выглядит результат для пользователя в SERP, что определяет кликабельность (CTR).

Когда применяется

  • При отображении результатов поиска: Алгоритм активируется для генерации описания каждого документа на странице результатов поиска (SERP).
  • Вариативность: Патент описывает стандартный механизм (в Claims) и опциональный персонализированный механизм (в Description), который активируется при наличии User Model.

Пошаговый алгоритм

Процесс А: Стандартная генерация сниппета (Claims 1-3)

  1. Инициализация: Система получает поисковый запрос и набор релевантных документов.
  2. Определение набора фраз: Идентифицируются фразы запроса (Qp), связанные фразы (Qr) и расширения фраз (Qe).
  3. Обработка документа (для каждого документа):
    1. Разбивка на предложения: Документ разделяется на отдельные предложения.
    2. Подсчет вхождений в предложениях: Для каждого предложения рассчитываются три метрики:
      • Count 1: Количество вхождений Qp.
      • Count 2: Количество вхождений Qr.
      • Count 3: Количество вхождений Qe.
    3. Ранжирование предложений: Предложения сортируются по убыванию с использованием многоуровневой сортировки:
      • Первичный ключ: Count 1.
      • Вторичный ключ: Count 2.
      • Третичный ключ: Count 3.
    4. Выбор лучших предложений: Выбирается N (например, 5) предложений с наивысшим рейтингом.
    5. Формирование описания: Выбранные предложения объединяются (конкатенируются).
  4. Вывод результата: SERP со сгенерированными сниппетами предоставляется пользователю.

Процесс Б: Персонализированная генерация сниппета (Description)

  1. Инициализация и Определение фраз: Аналогично Процессу А.
  2. Пересечение с моделью пользователя: Связанные фразы запроса (Qr) пересекаются с фразами в User Model (Ur).
  3. Приоритизация фраз: Создается объединенный список фраз (Qu). Фразы, присутствующие в Ur, получают приоритет.
  4. Ранжирование предложений (Персонализированное): Предложения документа ранжируются на основе количества вхождений фраз из Qu. Ключи сортировки смещаются, отдавая приоритет фразам из Ur.
  5. Выбор и формирование описания: Аналогично Процессу А.

Какие данные и как использует

Данные на входе

Система использует данные, сгенерированные на этапе индексирования, и данные, получаемые в реальном времени.

  • Контентные факторы:
    • Текст документа, разделенный на предложения.
    • Текст поискового запроса.
  • Системные данные (Phrase Data):
    • Good Phrase List: Список значимых фраз в корпусе.
    • Related Phrases: Предварительно рассчитанные связи на основе Information Gain.
    • Phrase Extensions: Предварительно идентифицированные расширения фраз.
  • Пользовательские факторы (Опционально):
    • User Model: История фраз из ранее посещенных пользователем документов.

Какие метрики используются и как они считаются

Ключевые метрики для генерации сниппета (рассчитываются в реальном времени):

  • Count 1 (Query Phrases): Суммирование количества вхождений Qp в предложении.
  • Count 2 (Related Phrases): Суммирование количества вхождений Qr в предложении.
  • Count 3 (Phrase Extensions): Суммирование количества вхождений Qe в предложении.

Метрики, используемые для подготовки данных (на этапе индексирования):

  • Expected Co-occurrence Rate (E(j,k)): Ожидаемая частота совместной встречаемости двух фраз.
  • Actual Co-occurrence Rate (A(j,k)): Фактическая частота совместной встречаемости двух фраз.
  • Information Gain (I(j,k)): Метрика предиктивной связи. I(j,k)=A(j,k)/E(j,k)I(j,k)=A(j,k)/E(j,k)I(j,k)=A(j,k)/E(j,k). Используется для определения Related Phrases.

Методы сортировки: Используется многоуровневая сортировка (Multi-key Sort) для ранжирования предложений на основе Count 1, Count 2 и Count 3 в строгом порядке приоритета.

Выводы

  1. Сниппеты основаны на релевантности предложений: Google не просто извлекает текст вокруг первого вхождения ключевого слова. Система анализирует весь документ и ранжирует каждое предложение по его релевантности конкретному запросу.
  2. Многофакторная оценка релевантности предложения: Релевантность предложения определяется тремя компонентами: наличием самой фразы запроса (Qp), семантически связанных фраз (Qr) и расширений фразы (Qe).
  3. Четкая иерархия приоритетов (Ключи сортировки): Патент (Claim 3) определяет строгий приоритет. Наибольший вес имеет Qp (Первичный ключ), затем Qr (Вторичный ключ), и в последнюю очередь – Qe (Третичный ключ).
  4. Семантика через статистику (Information Gain): Связь между фразами (Related Phrases) определяется статистически через Information Gain, что указывает на data-driven подход к пониманию семантической близости.
  5. Влияние на структуру контента: Для того чтобы предложение попало в сниппет, оно должно быть насыщено как целевыми ключевыми словами, так и связанными концепциями в рамках одного предложения.
  6. Персонализация сниппетов: Патент предусматривает механизм персонализации, при котором предложения, содержащие фразы из User Model, получают приоритет, делая сниппет более релевантным интересам конкретного пользователя.

Практика

Best practices (это мы делаем)

  • Создание семантически насыщенных предложений: Формулируйте ключевые предложения (например, в начале абзацев, в выводах, в определениях) так, чтобы они включали как основную целевую фразу (Qp), так и несколько семантически связанных концепций (Qr). Это увеличивает шансы предложения быть выбранным для сниппета согласно первичному и вторичному ключам сортировки.
  • Исследование и интеграция Related Phrases: Необходимо понимать, какие фразы Google может считать связанными с вашими целевыми запросами (используя анализ семантического ядра, анализ сущностей). Интеграция этих фраз в контент повышает его семантическую глубину и улучшает потенциал для генерации качественных сниппетов.
  • Использование расширений фраз (Phrase Extensions): Включайте в текст полные, развернутые формулировки ключевых концепций. Если целевой запрос — "SEO аудит", используйте также "SEO аудит сайта под ключ" в ключевых предложениях. Это задействует третичный ключ сортировки (Qe).
  • Оптимизация структуры документа: Убедитесь, что документ легко парсится на предложения. Используйте четкую структуру и избегайте разрыва ключевых идей на несколько коротких, неполных предложений.
  • Анализ текущих сниппетов: Изучайте, какие предложения Google выбирает для ваших страниц и страниц конкурентов. Это поможет понять, какие паттерны контента система предпочитает для конкретных запросов.

Worst practices (это делать не надо)

  • Keyword Stuffing без семантики: Многократное повторение только целевой фразы (высокий Count 1) может быть менее эффективным, чем умеренное использование целевой фразы в сочетании с несколькими связанными фразами (средний Count 1 + высокий Count 2).
  • Игнорирование связанных концепций: Создание контента, который фокусируется исключительно на прямом вхождении ключевого слова и игнорирует связанные темы и фразы (Related Phrases), приведет к генерации менее информативных сниппетов.
  • Изоляция концепций по разным предложениям: Разделение основной темы (Qp) и связанных концепций (Qr) по разным предложениям. Алгоритм предпочитает предложения, где эти элементы встречаются вместе.
  • Полная зависимость от Meta Description: Полагаться только на заполненный тег Meta Description рискованно, так как описанный механизм динамически генерирует сниппеты на основе контента страницы, если он лучше соответствует запросу.

Стратегическое значение

Этот патент подтверждает стратегическую важность семантической оптимизации контента. Для Google важно не просто наличие ключевых слов, но и контекст, в котором они используются, определяемый наличием связанных фраз. Это влияет не только на ранжирование (как описано в смежных патентах этого семейства), но и критически важно для представления документа в выдаче (CTR). Стратегия должна быть направлена на создание контента, который демонстрирует глубокое понимание темы, используя богатый набор связанных концепций.

Практические примеры

Сценарий: Оптимизация сниппета для статьи о породе собак "Австралийская овчарка".

Целевой запрос (Qp): "Австралийская овчарка"

Предполагаемые связанные фразы (Qr): "блю мерль" (blue merle), "ред мерль" (red merle), "аусси" (aussie), "пастушья собака" (herding dog).

Предполагаемые расширения (Qe): "Австралийская овчарка стандарт породы".

Анализ предложений в документе:

Предложение А: "Австралийская овчарка – это порода собак."
Score: Qp=1, Qr=0, Qe=0.

Предложение Б: "Многие любят породу Австралийская овчарка, также известную как аусси."
Score: Qp=1, Qr=1, Qe=0.

Предложение В (Оптимизированное): "Австралийская овчарка (аусси) – это энергичная пастушья собака, часто имеющая окрас блю мерль или ред мерль."
Score: Qp=1, Qr=4, Qe=0.

Результат: Предложение В имеет наивысший совокупный рейтинг. При равном Qp (первичный ключ), оно выигрывает за счет более высокого Qr (вторичный ключ). Оно с наибольшей вероятностью будет выбрано системой для генерации сниппета.

Вопросы и ответы

Как система определяет, какие фразы являются «Связанными фразами» (Related Phrases) для данного запроса?

Патент указывает, что связь определяется на этапе индексирования с помощью метрики Information Gain (Прирост информации). Если фактическая частота совместной встречаемости двух фраз значительно превышает ожидаемую (т.е. Information Gain выше порога), они считаются связанными. Это статистический метод определения семантической близости.

В каком порядке система учитывает наличие фраз при выборе предложения для сниппета?

Патент (Claim 3) четко определяет порядок сортировки предложений. Первичный ключ — количество вхождений самой фразы запроса (Query Phrase). Вторичный ключ — количество связанных фраз (Related Phrases). Третичный ключ — количество расширений фразы (Phrase Extensions). Предложение с наилучшей комбинацией этих трех показателей будет выбрано.

Что такое «Расширение фразы» (Phrase Extension) и почему оно важно?

Phrase Extension — это более длинная фраза, которая начинается с базовой фразы (например, "SEO аудит сайта" является расширением для "SEO аудит"). Их наличие в предложении является третьим по важности фактором при выборе сниппета. Это показывает, что система ценит более полные и точные формулировки концепций.

Означает ли этот патент, что Meta Description больше не используется?

Нет, не означает. Патент описывает механизм автоматической генерации описания на основе контента страницы. Поисковые системы могут использовать этот механизм, когда Meta Description отсутствует, плохо заполнен или когда система считает, что динамически сгенерированный сниппет будет более релевантен запросу пользователя, чем статический Meta Description.

Как SEO-специалисту использовать знание этого патента для улучшения CTR?

Необходимо оптимизировать ключевые предложения на странице так, чтобы они были максимально информативными и семантически насыщенными. Включайте в одно предложение и целевой запрос, и связанные с ним сущности или LSI-фразы (потенциальные Related Phrases). Это повышает вероятность выбора именно этого предложения для сниппета, делая его более привлекательным для пользователя.

Влияет ли этот механизм на ранжирование документа?

Конкретно этот патент (US7584175B2) описывает только генерацию описаний (Presentation System) и не описывает влияния на ранжирование. Однако он является частью целого семейства патентов Анны Паттерсон (Phrase-Based Indexing/Searching), которые используют Related Phrases и Information Gain также и для ранжирования документов.

Что делать, если Google выбирает для сниппета нежелательный текст со страницы?

Проанализируйте выбранный текст на предмет наличия Query Phrases и Related Phrases. Вероятно, этот текст имеет более высокий совокупный рейтинг по этим показателям, чем тот текст, который вы хотели бы видеть. Чтобы изменить сниппет, нужно переписать желаемый текст, сделав его более семантически насыщенным, или деоптимизировать нежелательный текст.

Как работает персонализация сниппетов, описанная в патенте?

Система может использовать User Model (историю интересов пользователя, выраженную во фразах). При генерации сниппета приоритет отдается тем предложениям, которые содержат фразы, присутствующие как в запросе, так и в модели пользователя. Это делает сниппет более адаптированным под интересы конкретного человека.

Стоит ли использовать очень длинные предложения, чтобы вместить больше связанных фраз?

Хотя семантическая насыщенность важна, читабельность и структура также имеют значение. Слишком длинные и сложные предложения могут плохо восприниматься пользователями и могут быть обрезаны в SERP. Лучше стремиться к балансу между насыщенностью ключевыми и связанными фразами и ясностью изложения.

Как определить, какие именно фразы Google считает связанными (Related Phrases) с моим запросом?

Патент не предоставляет инструментов для этого, так как это внутренние данные Google, основанные на статистическом анализе всего корпуса. SEO-специалисты могут предполагать это, анализируя семантическое ядро, используя инструменты для анализа сущностей (Entities), изучая выдачу по смежным запросам и анализируя блок "People Also Ask".

Похожие патенты

Как Google динамически выбирает текст для сниппета, основываясь на типе запроса и структуре документа
Google использует адаптивную систему для генерации сниппетов в результатах поиска. Система анализирует тип запроса (например, поиск по автору или по содержанию) и местоположение ключевых слов в документе. На основе этого выбирается алгоритм генерации. Параграфы оцениваются по их длине, позиции в документе, качеству текста и форматированию, чтобы выбрать наиболее информативный фрагмент, часто отдавая предпочтение введению или резюме.
  • US8145617B1
  • 2012-03-27
  • SERP

  • Семантика и интент

Как Google генерирует сниппеты для Sitelinks, используя контент целевых страниц, а не исходный запрос
Google использует специальный метод для генерации сниппетов в расширенных результатах поиска (Sitelinks). Сниппет для главной страницы часто основан на запросе пользователя, но сниппеты для внутренних ссылок (sub-documents) генерируются на основе "репрезентативных ключевых слов" (например, Title) самой внутренней страницы, а не исходного навигационного запроса. Это позволяет сделать описание Sitelinks более точным и релевантным теме целевой страницы.
  • US9081831B2
  • 2015-07-14
  • SERP

  • Семантика и интент

  • Структура сайта

Как Google персонализирует сниппеты в выдаче, используя профиль интересов пользователя
Google использует механизм для генерации сниппетов в поисковой выдаче, основанный не только на терминах запроса, но и на профиле интересов пользователя. Система анализирует документ, находит термины, соответствующие интересам пользователя, и выделяет их в сниппете. Это призвано повысить релевантность сниппета для конкретного пользователя и лучше отразить содержание документа в контексте его интересов.
  • US8631006B1
  • 2014-01-14
  • Персонализация

  • SERP

  • Семантика и интент

Как Google может генерировать альтернативные запросы из контента страниц и встраивать их в сниппеты
Google использует механизм для помощи пользователям в уточнении их поискового намерения. Система анализирует текст веб-страниц в результатах поиска и находит фразы, похожие на исходный запрос или характеризующие документ. Эти фразы затем встраиваются непосредственно в сниппеты как кликабельные предложения для нового поиска, облегчая навигацию и уточнение запроса.
  • US9183323B1
  • 2015-11-10
  • Семантика и интент

  • SERP

Как Google генерирует сниппеты для фактических ответов, требуя близости вопроса и ответа в тексте источника
Патент Google описывает систему ответа на фактические запросы (Fact Query Engine). Для подтверждения факта, извлеченного из Fact Repository (аналог Knowledge Graph), система генерирует сниппеты из исходных веб-документов. Ключевое требование: сниппет должен содержать как термины из запроса пользователя, так и термины ответа, причем система предпочитает фрагменты, где они расположены близко друг к другу (Proximity).
  • US7587387B2
  • 2009-09-08
  • Семантика и интент

  • Knowledge Graph

  • SERP

Популярные патенты

Как Google предсказывает намерения пользователя и выполняет поиск до ввода запроса (Predictive Search)
Google использует механизм для прогнозирования тем, интересующих пользователя в конкретный момент времени, основываясь на его истории и контексте. При обнаружении сигнала о намерении начать поиск (например, открытие страницы поиска), система проактивно выполняет запрос по предсказанной теме и мгновенно показывает результаты или перенаправляет пользователя на релевантный ресурс.
  • US8510285B1
  • 2013-08-13
  • Семантика и интент

  • Персонализация

  • Поведенческие сигналы

Как Google персонализирует поиск, повышая в выдаче объекты, которые пользователь ранее явно отметил как интересные
Google использует механизм персонализации поисковой выдачи. Если пользователь явно отметил определенный объект (например, место, компанию, веб-страницу) как интересующий его, этот объект получит значительное повышение в ранжировании при последующих релевантных запросах этого пользователя. Уровень повышения зависит от степени интереса, указанной пользователем.
  • US20150242512A1
  • 2015-08-27
  • Персонализация

  • Поведенческие сигналы

  • SERP

Как Google определяет географическую релевантность сайта по локали ссылающихся на него ресурсов и их аудитории
Google использует географические сигналы ссылающихся сайтов для определения локальной релевантности целевого домена. Система анализирует контент, технические данные и, что важно, географию аудитории ссылающихся ресурсов, чтобы вычислить «Link Based Locale Score». Эта оценка комбинируется с собственными сигналами сайта и используется для повышения позиций в релевантных географических регионах.
  • US8788490B1
  • 2014-07-22
  • Local SEO

  • Ссылки

  • SERP

Как Google Assistant адаптирует выдачу на лету, позволяя пользователям навигировать по результатам и запоминать предпочтения по источникам и темам
Google использует механизм для диалоговых систем (например, Google Assistant), позволяющий пользователям взаимодействовать с поисковой выдачей через естественный язык. Система предоставляет результаты последовательно и адаптирует порядок выдачи в ответ на команды навигации (например, «Вернись к новости о Кафе»). Кроме того, система фиксирует отношение пользователя к атрибутам контента (например, «Не показывай новости из Источника 1») и использует эти данные для фильтрации или изменения ранжирования в текущих и будущих сессиях.
  • US10481861B2
  • 2019-11-19
  • Персонализация

  • Семантика и интент

  • Поведенческие сигналы

Как Google позволяет вебмастерам управлять весом и интерпретацией исходящих ссылок через атрибуты тега (Основа nofollow)
Google запатентовал механизм, позволяющий вебмастерам добавлять в теги ссылок () специальные пары "параметр=значение" (например, rel=nofollow или linkweight=0.5). Эта информация используется краулером и поисковой системой для изменения способа обработки ссылки, например, для корректировки передаваемого веса (PageRank) или блокировки ее учета.
  • US7979417B1
  • 2011-07-12
  • Ссылки

  • Краулинг

  • Техническое SEO

Как Google кластеризует похожие страницы, анализируя, куда пользователи переходят дальше (Co-visitation)
Google анализирует навигационные пути пользователей для определения схожести документов. Если после просмотра Страницы А и Страницы Б пользователи часто переходят к одному и тому же набору последующих страниц, Google считает Страницу А и Страницу Б похожими и объединяет их в кластер. Этот механизм позволяет определять тематическую близость на основе поведения пользователей.
  • US8650196B1
  • 2014-02-11
  • Поведенческие сигналы

  • SERP

  • Семантика и интент

Как Google рассчитывает «сигнал конкурентоспособности» (Competition Signal) страниц на основе анализа кликов, показов и времени взаимодействия
Google оценивает качество страниц, анализируя их «победы» и «поражения» в поисковой выдаче. Система сравнивает, как часто пользователи выбирают данный URL вместо других и как долго они взаимодействуют с контентом по сравнению с конкурентами (Dwell Time). На основе этих данных рассчитывается корректирующий фактор, который повышает или понижает позиции страницы, отражая её относительную конкурентоспособность и удовлетворенность пользователей.
  • US9020927B1
  • 2015-04-28
  • Поведенческие сигналы

  • SERP

  • EEAT и качество

Как Google предсказывает, какие сайты будут интересны пользователю на основе его контекста (местоположение, время, интересы) без поискового запроса
Google использует агрегированные данные о поведении пользователей для прогнозирования контента. Система анализирует контекст пользователя (местоположение, время, интересы, историю) и определяет, какие сайты посещают похожие пользователи в аналогичном контексте значительно чаще, чем пользователи в целом. Этот механизм позволяет предлагать релевантный контент без явного запроса (например, в Google Discover).
  • US9195703B1
  • 2015-11-24
  • Персонализация

  • Поведенческие сигналы

  • Семантика и интент

Как Google использует историю навигации и клики по рекламе для генерации ключевых слов, гео-таргетинга и выявления MFA-сайтов
Патент Google, описывающий три механизма, основанных на анализе поведения пользователей (selection data). Система использует путь навигации пользователя для генерации новых ключевых слов для рекламы, улучшает гео-таргетинг объявлений на основе предпочтений пользователей, а также выявляет низкокачественные сайты (MFA/манипулятивные) по аномально высокому CTR рекламных блоков.
  • US8005716B1
  • 2011-08-23
  • Поведенческие сигналы

  • Семантика и интент

  • Антиспам

Как Google определяет географическую зону релевантности бизнеса на основе реального поведения пользователей (Catchment Areas)
Google определяет уникальную "зону охвата" (Catchment Area) для локального бизнеса, анализируя, из каких географических точек пользователи кликали на его результаты в поиске. Эта динамическая зона заменяет фиксированный радиус и используется для фильтрации кандидатов при локальном поиске, учитывая известность бренда, категорию бизнеса и физические препятствия.
  • US8775434B1
  • 2014-07-08
  • Local SEO

  • Поведенческие сигналы

seohardcore