SEO HARDCORE
  • Разборы патентов
    • Патенты Google
  • Скоро SEO инструменты
  • Скоро SEO аналитика
  • seohardcore
SEO HARDCORE
назад

Как Google использует сущности (Concepts) для определения точного контекста и генерации синонимов запроса

USING CONCEPTS AS CONTEXTS FOR QUERY TERM SUBSTITUTIONS (Использование концептов в качестве контекстов для замен терминов запроса)
  • US9104750B1
  • Google LLC
  • 2012-10-12
  • 2015-08-11
  • Семантика и интент
  • Описание
  • Разбор
  • Выводы
  • Практика
  • FAQ
  • Похожие

Google идентифицирует многословные фразы (Concepts) в запросе и рассматривает их как единое целое. Это позволяет системе понять точный контекст остальных слов в запросе и сгенерировать высокоточные синонимы (замены) на основе анализа поведения пользователей в логах запросов, минуя вычислительные ограничения стандартного N-граммного анализа.

Описание

Какую проблему решает

Патент решает проблему вычислительной сложности при определении контекста запроса для генерации замен (синонимов). Традиционно системы ограничиваются анализом одного или двух соседних слов (unigram, bigram), так как сложность растет экспоненциально с увеличением числа слов (N-gram). Это ограничивает точность, так как реальный контекст часто требует анализа более длинных фраз. Изобретение позволяет учитывать богатый контекст (триграммы и более) без критического увеличения вычислительной нагрузки.

Что запатентовано

Запатентована система генерации контекстно-зависимых правил замены терминов (Substitution Rules). Суть изобретения заключается в идентификации «Концептов» (Concepts) — последовательности слов, имеющих коллективное значение (например, «New York Times»). Система обрабатывает Концепт как единый элемент (one term) при определении контекста для соседних слов. Это позволяет эффективно анализировать логи запросов и выявлять точные замены, специфичные для данного Концепта.

Как это работает

Механизм работает в несколько этапов:

  • Идентификация Концептов: Система анализирует входящий запрос (например, "New York Times Puzzle") и сверяет его с базой данных Collection of Concepts, идентифицируя известные фразы ("New York Times").
  • Определение Контекста: Идентифицированный Концепт становится контекстом для остальных слов в запросе (контекст для "Puzzle" — это "New York Times").
  • Сбор данных (Офлайн): Система анализирует Query Log, отслеживая, как пользователи переформулируют запросы, содержащие этот Концепт. Например, часто ли за запросом "New York Times Puzzle" следует "New York Times Crossword".
  • Генерация Правил: Если частота переформулировок превышает порог, система генерирует контекстно-зависимое правило замены: "Puzzle" -> "Crossword" (в контексте: "New York Times").
  • Применение (Онлайн): При получении нового запроса система использует эти правила для его расширения или переписывания.

Актуальность для SEO

Высокая. Понимание контекста и точная интерпретация запросов являются ядром современных поисковых систем. Использование сущностей (которые являются формой Concepts) для определения контекста — это фундаментальный принцип, который получил развитие в алгоритмах, основанных на трансформерах (BERT, MUM). Этот патент описывает эффективный механизм интеграции сущностей в процесс генерации синонимов.

Важность для SEO

Патент имеет высокое значение (85/100). Он объясняет, как Google генерирует высокоточные, контекстно-зависимые синонимы. Это напрямую влияет на то, как система интерпретирует запрос и какие документы считает релевантными. SEO-специалистам необходимо понимать, что значение ключевого слова может радикально меняться в зависимости от окружающих его Concepts. Стратегии, основанные на общих синонимах, будут неэффективны в нишах с четко определенными Концептами.

Детальный разбор

Термины и определения

Concept (Концепт)
Запросный термин или последовательность последовательных запросными терминов, представляющих специфическое значение при их комбинации. Это группа слов, имеющая коллективное значение (collective meaning), отличное от значения отдельных слов (например, "New York Times"). Система обрабатывает Концепт как единый элемент для определения контекста.
Context (Контекст)
Условия, при которых применяется правило замены. В данном патенте Контекст определяется наличием одного или нескольких Concepts в запросе, часто в определенной позиции относительно заменяемого термина.
Query Log (Лог запросов)
Репозиторий, хранящий данные об использовании поисковой системы, включая последовательности запросов пользователей. Используется для сбора данных о заменах (query term substitution data).
Substitution Rule (Правило замены)
Правило, указывающее, что один термин может быть заменен или дополнен другим термином. Правила могут быть общими или контекстно-зависимыми.
Query Reviser Engine (Механизм пересмотра запросов)
Компонент системы, который генерирует пересмотренные (revised) запросы на основе исходного запроса путем добавления, замены или удаления терминов, используя правила замены.
Substitution Engine (Механизм замен)
Компонент, который анализирует логи запросов, идентифицирует Концепты, генерирует и предоставляет правила замены для Query Reviser Engine.
Collection of Concepts (Коллекция Концептов)
База данных, хранящая предопределенные Concepts.

Ключевые утверждения (Анализ Claims)

Claim 1 (Независимый пункт): Описывает метод сбора данных и принятия решения о замене на основе Концептов.

  1. Система получает набор терминов (первый, второй, третий).
  2. Определяется, что фраза, включающая эти термины, имеет коллективное значение (collective meaning), отличное от значений отдельных терминов. (Это определение Концепта).
  3. В ответ на это определение система выполняет следующие действия:
    1. Идентифицирует в коллекции логов исходный запрос, который содержит (i) эту фразу (Концепт) и (ii) дополнительный исходный термин.
    2. Определяет количество раз (number of times), когда за этим исходным запросом следовал пересмотренный запрос, содержащий (i) ту же фразу (Концепт) и (ii) дополнительный пересмотренный термин (отличный от исходного).
    3. На основе этого количества раз (частоты) принимается решение, следует ли пересматривать последующие полученные запросы, содержащие Концепт и исходный термин, чтобы включить в них пересмотренный термин.

Ядром изобретения является использование факта наличия Концепта (фразы с коллективным значением) как триггера для анализа логов запросов и последующего принятия решения о генерации контекстно-зависимой замены на основе наблюдаемого поведения пользователей (частоты переформулировок).

Claim 2 (Зависимый от 1): Уточняет, что на основе частоты (number of times) и коллективного значения фразы (Концепта) принимается решение о генерации Substitution Rule, которое затем сохраняется.

Claim 3 (Зависимый от 2): Уточняет, что правило генерируется, если частота (number of times) удовлетворяет пороговому значению (frequency threshold).

Где и как применяется

Изобретение применяется в основном на этапе понимания запросов и влияет на этап ранжирования через механизм переписывания запросов.

QUNDERSTANDING – Понимание Запросов

Это основной этап применения патента. Он включает два процесса:

  1. Офлайн-анализ и генерация правил:
    • Substitution Engine анализирует Query Logs для выявления паттернов переформулирования запросов.
    • Система взаимодействует с Collection of Concepts (аналог Knowledge Graph или базы сущностей) для идентификации Концептов в логах.
    • На основе частотного анализа генерируются и сохраняются контекстно-зависимые Substitution Rules.
  2. Онлайн-обработка запроса:
    • При получении запроса система идентифицирует Концепты.
    • Query Reviser Engine проверяет наличие соответствующих Substitution Rules для данного контекста.
    • Генерируются пересмотренные запросы (Revised Queries).

RANKING – Ранжирование

Search Engine получает как исходный запрос, так и пересмотренные запросы и использует их для поиска и ранжирования результатов в Index Database. Наличие точных контекстных замен улучшает релевантность найденных документов.

Входные данные:

  • Исходный запрос пользователя.
  • Query Logs (для офлайн-анализа).
  • Collection of Concepts (база знаний о Концептах).
  • Collection of Substitution Rules (для онлайн-применения).

Выходные данные:

  • Новые контекстно-зависимые Substitution Rules (офлайн).
  • Пересмотренные запросы (Revised Queries) (онлайн).

На что влияет

  • Специфические запросы: Наибольшее влияние оказывается на запросы, содержащие многословные сущности, бренды, названия продуктов, географические объекты или устоявшиеся фразы (т.е. Concepts).
  • Точность интерпретации: Влияет на то, как Google интерпретирует слова рядом с сущностями. Например, слово "Rate" рядом с Концептом "Social Security Tax" интерпретируется как "Calculation", а не как "Benefit" или "Speed".
  • Коммерческие и информационные запросы: Влияет на запросы, где точность контекста критична для удовлетворения интента пользователя.

Когда применяется

  • Условия работы алгоритма: Алгоритм активируется, когда в запросе идентифицирован один или несколько Concepts.
  • Триггеры активации (Офлайн): Идентификация Концепта в логах запросов запускает процесс сбора данных о заменах (substitution data collection) для соседних терминов.
  • Пороговые значения (Офлайн): Генерация правила происходит, когда частота (frequency) переформулирования запроса (с Термина А на Термин Б в контексте Концепта) превышает определенный порог.
  • Временные рамки: Генерация правил происходит офлайн путем анализа агрегированных данных за период. Применение правил происходит онлайн в реальном времени при обработке запроса.

Пошаговый алгоритм

Процесс разделен на две части: офлайн-генерация правил и онлайн-обработка запроса.

Процесс А: Офлайн-генерация правил замены

  1. Получение запроса (из лога): Система анализирует запрос из Query Log.
  2. Идентификация терминов: Исходный запрос разбивается на термины.
  3. Идентификация Концептов: Система ищет последовательности терминов, которые соответствуют записям в Collection of Concepts. Проверяется, имеют ли эти последовательности коллективное значение (collective meaning).
  4. Определение Контекста: Если Концепт(ы) найдены, они определяют контекст для остальных терминов запроса. Патент описывает разные варианты:
    • Один Концепт: Контекст для термина справа или слева.
    • Два раздельных Концепта: Контекст для термина между ними (например, "New York" [Yankees] "Stadium").
    • Два смежных Концепта: Объединенный контекст для термина справа или слева (например, "Social Security Tax" [Rate]).
  5. Сбор данных о заменах: Система начинает сбор query term substitution data для последующих запросов в логе, которые включают идентифицированный Концепт(ы). Отслеживается, как часто пользователи меняют исходный термин на другой (пересмотренный) термин в этом контексте.
  6. Анализ частоты: Агрегированные данные анализируются. Определяется number of times (частота) замен.
  7. Генерация и сохранение правила: Если частота превышает frequency threshold, система генерирует Substitution Rule (Термин А -> Термин Б в Контексте X) и сохраняет его в Collection of Substitution Rules.

Процесс Б: Онлайн-обработка запроса

  1. Получение запроса: Пользователь вводит исходный запрос.
  2. Передача в Query Reviser Engine: Запрос поступает в механизм пересмотра.
  3. Идентификация Контекста: Substitution Engine идентифицирует Концепты в запросе.
  4. Поиск правил замены: Система ищет применимые Substitution Rules в базе данных, соответствующие идентифицированному контексту.
  5. Генерация пересмотренных запросов: Query Reviser Engine генерирует один или несколько Revised Queries, добавляя или заменяя термины согласно правилам.
  6. Поиск: Исходный и пересмотренные запросы отправляются в Search Engine.
  7. Агрегация и выдача: Результаты объединяются, ранжируются и предоставляются пользователю.

Какие данные и как использует

Данные на входе

Патент фокусируется на использовании данных о поведении пользователей и предопределенных знаний о языке.

  • Поведенческие факторы (Ключевые данные):
    • Query Logs: Агрегированные данные о запросах пользователей.
    • Последовательности запросов (Sessions): Данные о том, как пользователи переформулируют запросы в рамках одной сессии (когда за исходным запросом следует пересмотренный запрос).
    • Взаимодействие с результатами: В патенте упоминается, что данные об использовании (usage data) могут включать взаимодействие с результатами, что может использоваться для определения оценки уверенности (confidence score) для правил замены.
  • Структурированные данные / Базы знаний:
    • Collection of Concepts: Предопределенный набор фраз с коллективным значением. Эти данные могут быть собраны автоматически (например, парсинг словарей, индексов) или через анализ логов (например, термины, часто заключаемые в кавычки).

Какие метрики используются и как они считаются

  • Collective Meaning (Коллективное значение): Метрика или статус, определяющий, является ли фраза Концептом. Основана на том, отличается ли значение фразы от значений отдельных слов.
  • Number of Times / Frequency (Частота переформулировок): Ключевая метрика для генерации правил. Подсчитывается количество раз, когда запрос [Концепт + Термин А] был заменен пользователем на [Концепт + Термин Б] в логах запросов.
  • Frequency Threshold (Порог частоты): Минимальное значение Frequency, необходимое для генерации Substitution Rule.
  • Confidence Score (Оценка уверенности): В патенте упоминается возможность маркировки замен оценкой уверенности. Она может определяться на основе взаимодействия пользователей с результатами, полученными по пересмотренному запросу (например, клики на новые результаты, пропуск высокоранжированных результатов).

Выводы

  1. Концепты (Сущности) как основа контекста: Патент подчеркивает переход от анализа соседних слов (N-грамм) к анализу соседних Концептов (сущностей или устоявшихся фраз) для понимания контекста запроса. Это позволяет Google интерпретировать запросы гораздо точнее.
  2. Синонимы не универсальны: Значение слова и его синонимы строго зависят от контекста, определяемого Концептами. Общее правило замены может быть подавлено контекстно-зависимым правилом (например, "Puzzle" обычно синоним "Jigsaw", но в контексте "New York Times" это "Crossword").
  3. Эффективность вычислений: Обработка многословных Концептов как единых элементов является ключевым техническим решением для преодоления вычислительной сложности анализа длинных контекстов (N-грамм).
  4. Генерация правил на основе поведения пользователей: Система генерации синонимов является динамической и основана на реальных данных из Query Logs. Google учится тому, как пользователи уточняют и переформулируют запросы в специфических контекстах.
  5. Важность предопределенных знаний: Эффективность системы зависит от качества и полноты Collection of Concepts. Чем лучше Google распознает сущности и фразы, тем точнее будет контекст.

Практика

Best practices (это мы делаем)

  • Идентификация ключевых Концептов в нише: Необходимо определить, какие сущности, бренды, технические термины и устоявшиеся фразы Google распознает как Concepts в вашей тематике. Это основа для понимания контекста, в котором ранжируется ваш контент.
  • Анализ контекстуальных синонимов: Изучайте SERP и блоки "Related Searches", чтобы понять, как Google интерпретирует запросы, содержащие ваши ключевые Концепты. Не полагайтесь на общие словари синонимов. Важно понять, какие замены Google считает релевантными именно в этом специфическом контексте.
  • Создание контента, соответствующего контекстуальному значению: Если пользователи ищут "Apple Security" (где Apple — Концепт/Бренд), контент должен быть о кибербезопасности продуктов Apple, а не о безопасности фруктов. Контент должен соответствовать тем заменам, которые Google генерирует на основе Концептов.
  • Укрепление распознавания собственных сущностей (Бренда): Работайте над тем, чтобы ваш бренд и названия продуктов стали распознаваемыми Concepts. Это позволит Google точнее определять контекст запросов, связанных с вами, и генерировать релевантные замены.

Worst practices (это делать не надо)

  • Использование общих синонимов без учета контекста: Попытки оптимизировать страницу под все возможные синонимы ключевого слова неэффективны. Если контекст страницы не соответствует специфическому значению, которое Google выводит на основе Concepts в запросе, страница не будет ранжироваться.
  • Игнорирование сущностей в запросе: Рассмотрение запроса как набора ключевых слов без учета их коллективного значения (collective meaning). Необходимо анализировать запрос через призму Концептов.
  • Создание размытого контента: Попытка охватить слишком много разных контекстов на одной странице. Если страница релевантна общему значению слова, но не его значению в специфическом контексте запроса, она может быть проигнорирована.

Стратегическое значение

Этот патент подтверждает стратегическую важность Entity-Oriented Search. Понимание запроса строится вокруг распознанных сущностей (Concepts). Для SEO это означает, что построение авторитетности в рамках определенного набора Концептов (Topical Authority) и четкое позиционирование контента относительно этих Концептов является ключом к релевантности. Система генерации синонимов Google — это не просто лингвистический инструмент, а механизм, управляемый данными о поведении пользователей и знаниями о мире (Collection of Concepts).

Практические примеры

Сценарий: Оптимизация страницы под запрос с изменяющимся контекстом

Рассмотрим термин "Rate".

  1. Анализ Контекстов:
    • Запрос 1: "Interest Rate" (Концепт: Interest). Контекстуальное значение "Rate" связано с финансами (например, процентная ставка, ставка ЦБ).
    • Запрос 2: "Heart Rate" (Концепт: Heart). Контекстуальное значение "Rate" связано с медициной (например, пульс, ЧСС).
    • Запрос 3: "Social Security Tax Rate" (Концепты: Social Security, Tax). Как указано в патенте, Google на основе анализа логов мог определить, что в этом контексте пользователи часто заменяют "Rate" на "Calculation".
  2. Действия SEO-специалиста: При оптимизации страницы под Запрос 3 недостаточно просто использовать термин "Rate". Необходимо убедиться, что контент соответствует контекстуальному значению "Calculation".
  3. Реализация: Включить в текст фразы, связанные с расчетом налога, формулы, калькуляторы. Заголовки могут включать "How to calculate Social Security Tax".
  4. Ожидаемый результат: Страница будет признана высокорелевантной не только по прямому вхождению "Rate", но и по соответствию контекстуальной замене "Calculation", которую Google может использовать при расширении запроса.

Вопросы и ответы

В чем ключевое отличие «Концепта» (Concept) от Сущности (Entity) в контексте этого патента?

В данном патенте термин Concept используется шире, чем современное понимание именованных сущностей (Named Entities). Concept определяется как любая последовательность слов, имеющая коллективное значение (collective meaning), отличное от суммы значений отдельных слов. Это могут быть как именованные сущности ("New York Times"), так и устоявшиеся фразы или технические термины. Главная функция Концепта здесь — служить единым элементом для эффективного определения контекста.

Как этот патент влияет на исследование ключевых слов (Keyword Research)?

Он радикально меняет подход к подбору синонимов. Недостаточно использовать общие инструменты типа Thesaurus. Необходимо анализировать контекст, в котором используется ключевое слово, и идентифицировать окружающие его Concepts. Исследование должно фокусироваться на выявлении тех специфических замен, которые пользователи реально используют в данном контексте, как это делает Google, анализируя Query Logs.

Как система определяет, является ли фраза Концептом?

Патент указывает на использование предопределенной базы данных (Collection of Concepts). Эта коллекция может формироваться различными способами, которые также упоминаются в патенте: автоматический парсинг справочников, словарей, индексов книг, или анализ логов запросов (например, выявление фраз, которые пользователи часто заключают в кавычки или объединяют оператором AND). На практике это соответствует данным из Knowledge Graph и другим базам знаний Google.

Почему Google просто не анализирует все соседние слова (N-граммы) для контекста?

Патент прямо указывает причину: вычислительная сложность (computation complexity). Анализ всех возможных комбинаций N-грамм (особенно при N>2) требует огромных ресурсов. Обработка многословного Concept как единого элемента позволяет учитывать богатый контекст без экспоненциального роста сложности вычислений.

Может ли система использовать несколько Концептов для определения контекста?

Да, патент явно описывает такие сценарии. Система может использовать два раздельных Концепта для определения контекста слова между ними (например, "New York" [Yankees] "Stadium"). Также она может объединять два смежных Концепта (например, "Social Security" + "Tax") для формирования единого, более точного контекста для последующих слов.

Откуда Google берет варианты для замен (синонимы)?

Основной источник, описанный в патенте, — это поведение пользователей, зафиксированное в Query Logs. Система отслеживает, как пользователи переформулируют свои запросы в рамках одной сессии. Если многие пользователи меняют Термин А на Термин Б в присутствии Концепта X, система учится, что Б является хорошей заменой для А в данном контексте.

Как я могу узнать, какие контекстные замены Google использует в моей нише?

Патент не предоставляет инструментов для внешнего анализа. Однако можно использовать косвенные методы: анализировать выдачу по запросам, содержащим ключевые Концепты, изучать блоки "Related Searches" и "People Also Ask". Также полезно анализировать собственный Search Console на предмет запросов, по которым показывается сайт, но которые не содержат прямых вхождений целевых ключей.

Влияет ли этот механизм на ранжирование напрямую?

Сам механизм напрямую не рассчитывает факторы ранжирования. Он работает на этапе Query Understanding и отвечает за генерацию пересмотренных запросов (Revised Queries). Однако эти пересмотренные запросы затем используются Search Engine для поиска и ранжирования. Более точные замены приводят к нахождению более релевантных документов, что косвенно значительно улучшает качество ранжирования.

Связан ли этот патент с алгоритмами типа BERT или MUM?

Патент был подан до появления BERT. Он описывает более ранний, но очень эффективный метод учета контекста, основанный на дискретных Concepts и анализе логов. Современные модели, такие как BERT и MUM, учитывают контекст на более глубоком уровне, используя механизмы внимания (attention) для всего предложения. Однако фундаментальная идея — что контекст критически важен для определения значения слова — остается общей, и данные, собранные механизмом из патента, могут использоваться для обучения или валидации нейронных сетей.

Что делать, чтобы мой бренд или продукт стал «Концептом»?

Чтобы фраза стала Concept, она должна быть узнаваемой и иметь устоявшееся коллективное значение. Для этого необходимо работать над узнаваемостью бренда, использовать консистентное написание названий продуктов, получать упоминания в авторитетных источниках (Википедия, СМИ), использовать микроразметку Schema.org для сущностей. Это поможет Google включить вашу фразу в Collection of Concepts.

Похожие патенты

Как Google использует клики пользователей для определения составных фраз (N-грамм) в запросах
Google анализирует, какие результаты поиска выбирают пользователи, чтобы понять, являются ли последовательные слова в запросе единой фразой (например, "Нью Йорк") или отдельными терминами. Если пользователи преимущественно кликают на результаты, содержащие эту последовательность как неразрывную фразу, система определяет ее как составную (Compound) и использует это знание для улучшения ранжирования и понимания запроса.
  • US8086599B1
  • 2011-12-27
  • Семантика и интент

  • Поведенческие сигналы

  • SERP

Как Google использует анализ многословных фраз для улучшения подбора синонимов с учетом грамматического согласования
Google анализирует, как пользователи одновременно меняют несколько слов в запросе (например, при изменении числа или рода). Подтверждая, что каждое измененное слово является лексическим или семантическим вариантом оригинала, Google идентифицирует «синонимы с N-граммным согласованием». Это позволяет системе улучшить понимание синонимов отдельных слов, даже если эти слова редко меняются поодиночке в определенных контекстах.
  • US7925498B1
  • 2011-04-12
  • Семантика и интент

  • Поведенческие сигналы

Как Google использует данные о кликах и пропусках для валидации и удаления неэффективных синонимов в поиске
Google постоянно тестирует правила подстановки (синонимы) для расширения запросов. Этот патент описывает механизм оценки эффективности этих правил с помощью анализа поведения пользователей (клики и пропуски результатов). Если пользователи часто пропускают результаты, содержащие подставленный термин, система автоматически удаляет это правило, очищая понимание запросов от нерелевантных синонимов.
  • US8965875B1
  • 2015-02-24
  • Поведенческие сигналы

  • Семантика и интент

  • EEAT и качество

Как Google определяет, какие последовательности слов являются значимыми фразами, используя структуру документа и оценку подфраз
Патент описывает алгоритм для автоматического извлечения миллионов значимых фраз (концепций) из корпуса документов. Система анализирует семантические границы в тексте (заголовки, пунктуацию, форматирование) и применяет механизм оценки подфраз (Devolution). Это позволяет отличить устоявшиеся словосочетания от случайных комбинаций слов и построить индекс на основе концепций, а не только отдельных терминов.
  • US8166045B1
  • 2012-04-24
  • Индексация

  • Семантика и интент

Как Google извлекает ключевые концепции и сущности, анализируя контекст вокруг повторяющихся цитат и отрывков текста
Google анализирует, как одни и те же отрывки текста (например, цитаты) используются в разных документах. Система собирает весь окружающий текст (контекст) вокруг каждого вхождения отрывка и использует статистический анализ (например, TF-IDF), чтобы определить ключевые термины, сущности и концепции, связанные с этим отрывком. Это позволяет связывать документы по смыслу и улучшать навигацию.
  • US9323827B2
  • 2016-04-26
  • Семантика и интент

  • Индексация

  • Knowledge Graph

Популярные патенты

Как Google определяет язык поискового запроса, используя язык интерфейса, статистику слов и поведение пользователей
Google использует вероятностную модель для точной идентификации языка поискового запроса. Система комбинирует три ключевых фактора: статистику частотности слов в разных языках, язык интерфейса пользователя (например, Google.fr) и исторические данные о том, на какие результаты пользователи кликали ранее. Это позволяет корректно обрабатывать многоязычные и неоднозначные запросы для применения правильных синонимов и стемминга.
  • US8442965B2
  • 2013-05-14
  • Мультиязычность

  • Поведенческие сигналы

Как Google фильтрует персонализированные предложения запросов на основе контента просматриваемой страницы
Google использует механизм для генерации предложений следующего запроса после того, как пользователь покинул страницу выдачи. Система создает кандидатов на основе истории поиска пользователя, а затем фильтрует их, проверяя релевантность контенту страницы, которую пользователь просматривает в данный момент. Это гарантирует, что предложения соответствуют как интересам пользователя, так и текущему контексту просмотра.
  • US8392435B1
  • 2013-03-05
  • Персонализация

  • Поведенческие сигналы

  • SERP

Как Google использует данные о реальных повторных посещениях (Quality Visit Measure) и социальных взаимодействиях для ранжирования локального бизнеса
Google использует данные о физических посещениях пользователей для оценки качества локального бизнеса. Система рассчитывает «Quality Visit Measure», придавая значительно больший вес местам, куда люди возвращаются повторно, приводят друзей или посещают по рекомендации. Этот показатель используется как сильный сигнал качества для ранжирования в локальном поиске и Google Maps, снижая зависимость от онлайн-отзывов.
  • US10366422B2
  • 2019-07-30
  • Поведенческие сигналы

  • Local SEO

Как Google рассчитывает авторитетность страниц на основе их близости к доверенным сайтам-источникам (Seed Sites)
Google использует метод ранжирования страниц, основанный на измерении «расстояния» в ссылочном графе от набора доверенных исходных сайтов (Seed Sites) до целевой страницы. Чем короче путь от доверенных источников до страницы, тем выше ее рейтинг авторитетности. Длина ссылки увеличивается (а ее ценность падает), если исходная страница имеет большое количество исходящих ссылок. Этот механизм позволяет эффективно рассчитывать показатели доверия (Trust) в масштабах всего веба.
  • US9165040B1
  • 2015-10-20
  • Ссылки

  • EEAT и качество

  • Антиспам

Как Google переносит авторитетность бренда и описательные термины между страницами одного сайта для улучшения ранжирования
Google использует механизмы для улучшения релевантности страниц путем переноса сигналов внутри сайта. Система распространяет "авторитетные" термины (например, бренд) с главной страницы на внутренние разделы и, наоборот, поднимает "высокоописательные" термины (например, адреса, категории, уникальные слова) с внутренних страниц на главную. Это позволяет ранжировать наиболее подходящую страницу сайта, даже если нужные ключевые слова на ней отсутствуют.
  • US7933890B2
  • 2011-04-26
  • Структура сайта

  • Техническое SEO

  • Индексация

Как Google персонализирует сниппеты и заголовки в выдаче на основе истории поиска и интересов пользователя
Google может динамически изменять сниппеты и заголовки (Title) результатов поиска, чтобы выделить ту часть контента на странице, которая соответствует известным интересам пользователя (история поиска, демография, недавний контекст). Это позволяет сделать представление выдачи более персонализированным, не обязательно изменяя ранжирование документов.
  • US9235626B2
  • 2016-01-12
  • Персонализация

  • SERP

  • Семантика и интент

Как Google использует тематические списки предпочтительных и нежелательных сайтов (Editorial Opinion) для корректировки ранжирования
Google может заранее определять "Темы запросов" (Query Themes) и назначать для них списки "Предпочтительных" (Favored) и "Нежелательных" (Non-Favored) источников. Если запрос пользователя соответствует теме, система корректирует ранжирование: повышает предпочтительные источники и понижает нежелательные, используя "Параметр редакторского мнения" (Editorial Opinion Parameter).
  • US7096214B1
  • 2006-08-22
  • EEAT и качество

  • Антиспам

  • SERP

Как Google Assistant адаптирует выдачу на лету, позволяя пользователям навигировать по результатам и запоминать предпочтения по источникам и темам
Google использует механизм для диалоговых систем (например, Google Assistant), позволяющий пользователям взаимодействовать с поисковой выдачей через естественный язык. Система предоставляет результаты последовательно и адаптирует порядок выдачи в ответ на команды навигации (например, «Вернись к новости о Кафе»). Кроме того, система фиксирует отношение пользователя к атрибутам контента (например, «Не показывай новости из Источника 1») и использует эти данные для фильтрации или изменения ранжирования в текущих и будущих сессиях.
  • US10481861B2
  • 2019-11-19
  • Персонализация

  • Семантика и интент

  • Поведенческие сигналы

Как Google динамически перестраивает выдачу, если пользователь игнорирует результаты, связанные с определенной сущностью
Google использует механизм уточнения интента пользователя в реальном времени при обработке неоднозначных запросов. Система группирует результаты поиска по связанным сущностям. Если пользователь демонстрирует отсутствие интереса к одной из групп (например, прокручивает или смахивает результаты), система динамически модифицирует выдачу, понижая или удаляя все результаты, связанные с этой отклоненной сущностью.
  • US9348945B2
  • 2016-05-24
  • Семантика и интент

  • SERP

  • Поведенческие сигналы

Как Google использует связанные запросы и временный «бустинг» для обнаружения и тестирования релевантных документов, которые ранжируются низко
Патент описывает механизм улучшения поиска путем перемещения документов на более высокие позиции. Google идентифицирует документы, которые высоко ранжируются по связанным запросам (например, с синонимами, уточнениями или исправленными ошибками), но низко по исходному запросу, и повышает их. Цель — протестировать истинную релевантность этих документов и собрать пользовательский отклик (клики) для улучшения будущего ранжирования.
  • US8521725B1
  • 2013-08-27
  • Поведенческие сигналы

  • SERP

  • Семантика и интент

seohardcore