Close Menu
    Telegram
    SEO HARDCORE
    • Разборы патентов
      • Патенты Google
      • Патенты Яндекс
    • Скоро
      SEO инструменты
    • Скоро
      SEO аналитика
    SEO HARDCORE
    Разборы патентов • Патенты Google

    Как Google использует данные о кликах для определения значимости отдельных слов в запросе (Word-Score)

    SELECTION AND DISPLAY OF ONLINE CONTENT ITEMS (Выбор и отображение элементов онлайн-контента)
    • US8868570B1
    • Google LLC
    • 2014-10-21
    • 2011-06-14
    2011 Индексация Патенты Google Поведенческие сигналы Семантика и интент

    Google рассчитывает метрику «Word-Score» для оценки значимости слова в запросе. Метрика основана на сравнении historical CTR контента, найденного по ключевым словам, включающим это слово (Keep-Count), и CTR контента, найденного по ключевым словам, исключающим его (Drop-Count). Эта оценка используется для фильтрации и выбора наиболее релевантных ключевых слов для поиска контента.

    • Описание
    • Детальный разбор
    • Выводы
    • Практика
    • Вопросы и ответы
    • Наверх

    Описание

    Какую задачу решает

    Патент решает задачу точного определения значимости отдельных слов в поисковом запросе для эффективного извлечения релевантных ключевых слов (keywords). Традиционные методы, основанные только на частоте встречаемости слов (например, IDF), не учитывают поведение пользователей или коммерческую ценность термина. Изобретение предлагает метод оценки значимости слова на основе исторических данных о взаимодействии пользователей (кликов, CTR), что позволяет системе лучше понять, какие слова критичны для интента, а какие можно игнорировать или переписать.

    Что запатентовано

    Запатентована система для расчета метрики значимости слова (Word-Score) на основе исторических данных о взаимодействии пользователей с контентом. Эта метрика определяется путем сравнения показателей взаимодействия (кликов или CTR), когда слово сохраняется в производном ключевом слове (Keep-Count), и когда оно удаляется (Drop-Count). Полученный Word-Score используется для фильтрации и выбора наиболее релевантных производных ключевых слов из запроса.

    Как это работает

    Система работает в двух режимах: офлайн и онлайн.

    • Офлайн (Расчет): Система анализирует исторические логи запросов (Query Session Logs). Для каждого слова она подсчитывает, насколько часто пользователи взаимодействовали с контентом, найденным по ключевым словам, включающим это слово (Keep-Count), и по ключевым словам, исключающим его (Drop-Count). Word-Score рассчитывается как отношение Keep-Count к Drop-Count.
    • Онлайн (Применение): При получении нового запроса система генерирует список потенциальных производных ключевых слов. Затем она использует предварительно рассчитанные Word-Scores для фильтрации этого списка. Ключевые слова, которые удаляют слова с высоким Word-Score, с большей вероятностью будут отброшены. Оставшиеся ключевые слова используются для поиска релевантного контента.

    Актуальность для SEO

    Высокая. Концепция использования поведенческих сигналов (кликов, CTR) для понимания значимости терминов в запросе остается фундаментальной для информационного поиска. Хотя современные нейросетевые системы (BERT, MUM) используют более сложные механизмы для интерпретации контекста, базовый принцип, описанный в патенте — оценка важности слова на основе реакции пользователей — по-прежнему актуален для систем Query Understanding и, возможно, используется на этапах быстрого отбора кандидатов.

    Важность для SEO

    Патент имеет высокое значение для SEO (8/10). Он демонстрирует конкретный механизм, с помощью которого Google определяет, какие слова в запросе являются критически важными, а какие — второстепенными, основываясь на поведении пользователей, а не только на частотности. Хотя патент в основном описывает применение в контексте рекламы, он прямо указывает на применимость к органическим результатам поиска (search result snippets). Это влияет на стратегию ключевых слов, подчеркивая необходимость фокусироваться на терминах,驱动ющих вовлеченность.

    Детальный разбор

    Термины и определения

    Word-Score (Оценка слова)
    Метрика, указывающая на типичную значимость слова для смысла запросов. Рассчитывается на основе исторических данных о взаимодействии пользователей. Обычно определяется как отношение Keep-Count к Drop-Count.
    Keep-Count (W.KC) (Счетчик сохранения)
    Агрегированный показатель частоты взаимодействия пользователей (клики, CTR, конверсии) с контентом, который был найден по ключевым словам, включающим (сохранившим) данное слово.
    Drop-Count (W.DC) (Счетчик удаления/отбрасывания)
    Агрегированный показатель частоты взаимодействия пользователей с контентом, который был найден по ключевым словам, исключающим (удалившим) данное слово из исходного запроса.
    Keyword (Ключевое слово)
    Последовательность слов, производная от исходного запроса (путем удаления, переписывания или перестановки слов). Используется для поиска соответствующего контента.
    Keyword Filtering Model (Модель фильтрации ключевых слов)
    Система (часто основанная на машинном обучении), которая классифицирует производные ключевые слова как хорошие или плохие соответствия запросу. Использует Word-Scores в качестве одного из входных сигналов.
    Query Session Logs (Логи сессий запросов)
    Хранилище исторических данных, включающее исходные запросы, ключевые слова, по которым был показан контент, и данные о взаимодействии пользователя с этим контентом.
    Content Item (Элемент контента)
    Данные, предоставляемые по сети. В патенте это реклама (Advertisement) и сниппеты результатов поиска (Search result snippet).

    Ключевые утверждения (Анализ Claims)

    Claim 1 (Независимый пункт): Описывает основной метод работы системы.

    1. Система получает первый запрос.
    2. Определяется оценка (Score) для слова в этом запросе.
    3. Эта оценка основана на сравнении: (i) количества взаимодействий с контентом, показанным в ответ на прошлые запросы, включавшие это слово (first count of activities), и (ii) количества взаимодействий с контентом, показанным в ответ на прошлые запросы, не включавшие это слово (second count of activities).
    4. На основе этой оценки выбирается ключевое слово, производное от первого запроса.
    5. С помощью выбранного ключевого слова идентифицируются кандидаты в элементы контента.

    Claim 6 (Зависимый от 1): Конкретизирует расчет оценки на основе кликов по производным ключевым словам, что соответствует механизму Keep-Count/Drop-Count.

    Определение оценки включает:

    1. Подсчет первого количества кликов на контент, связанный с ключевыми словами, производными от прошлого запроса, которые включали это слово (Keep-Count).
    2. Подсчет второго количества кликов на контент, связанный с ключевыми словами, производными от прошлого запроса, которые не включали (удалили) это слово (Drop-Count).

    Claim 7 (Зависимый от 6): Определяет формулу расчета.

    Оценка определяется как отношение первого количества (Keep-Count) ко второму количеству (Drop-Count).

    Claim 8 (Зависимый от 1): Описывает альтернативный метод расчета оценки с использованием Click Through Rate (CTR) вместо абсолютного числа кликов для нормализации данных по показам.

    Где и как применяется

    Изобретение является ключевым компонентом этапа понимания запросов и влияет на последующий поиск кандидатов.

    INDEXING / Офлайн-анализ данных
    На этом этапе происходит анализ исторических логов запросов (Query Session Logs) для расчета и обновления метрик Word-Score. Это процесс извлечения признаков для самих слов.

    QUNDERSTANDING – Понимание Запросов
    Основное применение патента. В реальном времени система использует предварительно рассчитанные Word-Scores для работы Keyword Filtering Model. Это позволяет быстро оценить, какие производные ключевые слова (keywords) лучше всего отражают интент пользователя, и отфильтровать неэффективные варианты.

    RANKING – Ранжирование (L1 Retrieval)
    Отфильтрованный список ключевых слов используется для быстрого отбора кандидатов (рекламы или органических результатов) из индекса.

    Входные данные:

    • Исходный запрос пользователя (онлайн).
    • Предварительно рассчитанные Word-Scores (онлайн).
    • Исторические логи запросов и кликов (офлайн).

    Выходные данные:

    • Отфильтрованный список производных ключевых слов (онлайн).
    • Обновленные значения Word-Scores (офлайн).

    На что влияет

    • Специфические запросы: Наибольшее влияние оказывается на многословные (long-tail) запросы и запросы, содержащие модификаторы (например, «дешевый», «лучший», стоп-слова). Система определяет, несет ли модификатор существенную смысловую нагрузку или его можно игнорировать.
    • Типы контента: Применимо как к выбору рекламы (Advertisements), так и к выбору органических результатов поиска (search result snippets), что прямо указано в патенте (например, Claim 5).
    • Коммерческая ценность: Поскольку Word-Score основан на кликах и может учитывать конверсии, он эффективно измеряет коммерческую значимость слова, в отличие от частотных метрик (IDF).

    Когда применяется

    • Временные рамки (Офлайн): Расчет Word-Score происходит периодически (ежедневно, еженедельно и т.д.) по мере накопления новых данных в логах.
    • Триггеры активации (Онлайн): Применение рассчитанных Word-Scores происходит в реальном времени при обработке практически каждого пользовательского запроса на этапе генерации и фильтрации ключевых слов.

    Пошаговый алгоритм

    Процесс А: Обработка запроса в реальном времени (Онлайн)

    1. Получение запроса: Система получает запрос от пользователя.
    2. Извлечение слов и оценок: Слова из запроса извлекаются, и для каждого из них извлекается соответствующий Word-Score.
    3. Генерация кандидатов: Генерируется список потенциальных производных ключевых слов путем удаления (dropping), переписывания (rewriting) или перестановки (reordering) слов исходного запроса.
    4. Фильтрация ключевых слов: Keyword Filtering Model оценивает каждый кандидат. Оценка основана на Word-Scores слов, которые были сохранены или удалены. Удаление слова с высоким Word-Score может привести к отбраковке кандидата.
    5. Идентификация контента: Отфильтрованные ключевые слова используются для поиска соответствующих элементов контента.
    6. Выбор и предоставление: Кандидаты ранжируются (например, на основе Allocation Scores или predicted CTR), и лучшие из них предоставляются пользователю.
    7. Логирование: Данные о запросе, использованных ключевых словах и взаимодействии пользователя записываются в Query Session Logs.

    Процесс Б: Офлайн-расчет Word-Score

    1. Открытие логов: Система открывает логи сессий запросов.
    2. Чтение записи запроса: Считывается историческая запись (Query Record).
    3. Итерация по словам: Для каждого слова (w) в запросе:
      1. Расчет Keep-Count (W.KC): Определяется вклад текущей записи в Keep-Count (клики, когда слово было сохранено). Новый W.KC обновляется с использованием цифрового фильтра для сглаживания данных во времени. Формула: W.KC = f(W.KC) + g(count(w)).
      2. Расчет Drop-Count (W.DC): Определяется вклад текущей записи в Drop-Count (клики, когда слово было удалено). Новый W.DC обновляется аналогично: W.DC = u(W.DC) + v(count(w)).
      3. Определение Word-Score: Новый Word-Score рассчитывается как отношение обновленных W.KC и W.DC. Формула: W.Score = h(W.KC / W.DC).
    4. Завершение: Процесс повторяется для всех записей в логах.

    Какие данные и как использует

    Данные на входе

    Патент фокусируется на использовании поведенческих данных для понимания запросов.

    • Поведенческие факторы (Критически важные): Используются исторические логи запросов (Query Session Logs). Ключевые данные включают:
      • Клики (user clicks) на предоставленный контент.
      • Click Through Rate (CTR).
      • Конверсии (conversions), например, совершение покупки после клика.
      • Показы (Impressions) (используются при расчете CTR).
    • Контентные факторы: Сами слова, содержащиеся в запросах и производных ключевых словах.

    Какие метрики используются и как они считаются

    • Keep-Count (W.KC): Агрегированная метрика взаимодействий с контентом, найденным по ключевым словам, сохранившим слово. Рассчитывается с применением рекурсивных цифровых фильтров для учета истории и сглаживания (Уравнение 1 в патенте).
    • Drop-Count (W.DC): Агрегированная метрика взаимодействий с контентом, найденным по ключевым словам, удалившим слово. Рассчитывается аналогично (Уравнение 2 в патенте).
    • Word-Score: Основная метрика значимости слова. Рассчитывается как отношение W.KC / W.DC (Уравнение 3 в патенте). Может применяться масштабирование или логарифмирование.
    • Keyword Score (в модели фильтрации): Метрика качества производного ключевого слова. Зависит от Word-Scores сохраненных и удаленных слов. Модель также может учитывать другие факторы, такие как Inverse Document Frequency (IDF) и метрики качества переписывания слов.

    Выводы

    1. Значимость слов определяется поведением, а не только частотностью: Ключевой вывод заключается в том, что Google рассчитывает значимость слова (Word-Score) на основе реальных действий пользователей (кликов/CTR), а не на основе частоты его встречаемости в индексе (как IDF). Слово считается важным, если его присутствие коррелирует с более высоким уровнем взаимодействия.
    2. Механизм «Keep vs. Drop»: Система активно сравнивает результаты, когда слово сохраняется (Keep-Count) и когда оно удаляется (Drop-Count). Это позволяет количественно оценить вклад каждого слова в намерение пользователя и определить «шумовые» слова.
    3. Оптимизация Query Understanding: Исключая слова с низким Word-Score, система может лучше сфокусироваться на основном интенте запроса, что приводит к более релевантной выдаче.
    4. Применимость к органическому поиску: Механизм явно применим к идентификации search result snippets (органических результатов), а не только рекламы. Это означает, что интерпретация запросов для органического поиска также использует оценку значимости отдельных слов на основе поведения.
    5. Динамическая и адаптивная оценка: Word-Scores не статичны. Они периодически пересчитываются с использованием цифровых фильтров, что позволяет системе адаптироваться к изменениям в трендах и поведении пользователей.

    Практика

    Best practices (это мы делаем)

    • Фокус на ключевых интентах и терминах,驱动ющих вовлеченность: Приоритезируйте оптимизацию под термины, которые представляют ядро тематики и, вероятно, имеют высокий Word-Score. Анализируйте данные GSC и PPC (CTR, Конверсии), чтобы понять, какие термины в вашей нише действительно значимы для пользователей, а не просто частотны.
    • Оптимизация под поведенческие факторы (CTR): Поскольку Word-Score напрямую зависит от исторических данных CTR, работа над повышением кликабельности сниппетов (Title, Description) критически важна. Высокий CTR по целевым запросам подтверждает значимость этих слов для Google.
    • Построение тематического авторитета вокруг основных концепций: Сосредоточьтесь на создании контента, который глубоко раскрывает основные темы (слова с высоким Word-Score), вместо того чтобы чрезмерно оптимизировать страницы под незначительные модификаторы (слова с низким Word-Score).
    • Использование точных и специфичных терминов: Специфичные термины с меньшей вероятностью будут отброшены системой как шум, так как их удаление радикально меняет смысл запроса (высокий Keep-Count по сравнению с Drop-Count).

    Worst practices (это делать не надо)

    • Чрезмерная оптимизация под общие модификаторы: Полагаться на модификаторы (такие как «лучший», «дешевый», «2025 год»), если они имеют низкий Word-Score в вашей нише. Google может просто проигнорировать эти слова при поиске, фокусируясь на основном интенте.
    • Keyword Stuffing и использование филлерных слов: Насыщение текста словами с низкой значимостью не поможет улучшить релевантность, так как система фильтрации на этапе Query Understanding может их игнорировать.
    • Игнорирование интента ради текстового соответствия: Создание контента, который формально содержит все слова из запроса, но не отвечает на основной интент. Система сфокусируется на словах с высоким Word-Score, и формальное соответствие не обеспечит релевантности.

    Стратегическое значение

    Патент подтверждает стратегический приоритет Google на понимание намерений пользователя через анализ больших данных о поведении. Он подчеркивает, что интерпретация запроса — это не просто лексический разбор, а процесс взвешивания каждого слова на основе его ценности (коммерческой или информационной), подтвержденной реакцией пользователей. Для долгосрочной SEO-стратегии это означает необходимость глубокого понимания того, какие именно термины являются драйверами вовлечения в вашей нише.

    Практические примеры

    Сценарий: Определение значимости модификатора в E-commerce

    1. Исходный запрос: «дешевые авиабилеты в Нью-Йорк».
    2. Анализ (Офлайн): Google анализирует исторические данные.
      • Пользователи часто кликают на результаты по производному ключевому слову «авиабилеты в Нью-Йорк» (слово «дешевые» исключено). Drop-Count для «дешевые» высокий.
      • Пользователи редко кликают на результаты по производному ключевому слову «дешевые авиабилеты» (слово «Нью-Йорк» исключено). Drop-Count для «Нью-Йорк» низкий.
    3. Расчет Word-Score:
      • Word-Score для «дешевые» будет низким.
      • Word-Score для «Нью-Йорк» будет высоким.
    4. Применение (Онлайн): Когда поступает новый запрос.
      • Кандидат «авиабилеты в Нью-Йорк» получит высокий приоритет (исключено слово с низким Score).
      • Кандидат «дешевые авиабилеты» получит низкий приоритет (исключено слово с высоким Score).
    5. Результат для SEO: Оптимизация под основной интент («авиабилеты в Нью-Йорк») важнее, чем фокус на модификаторе («дешевые»).

    Вопросы и ответы

    Чем описанный Word-Score отличается от Inverse Document Frequency (IDF)?

    IDF — это статическая метрика, основанная на том, как часто слово встречается в корпусе документов. Она показывает уникальность слова в индексе. Word-Score — это поведенческая метрика, основанная на исторических данных о кликах (CTR) и конверсиях. Она измеряет, насколько слово значимо для пользователя при интерпретации запроса и поиске релевантного контента.

    Как рассчитывается Word-Score?

    Он рассчитывается путем сравнения двух метрик: Keep-Count (как часто пользователи взаимодействуют с результатами, когда слово сохранено в производном ключевом слове) и Drop-Count (как часто взаимодействуют, когда слово отброшено). Word-Score обычно является отношением Keep-Count к Drop-Count. Расчет происходит периодически в офлайн-режиме.

    Влияет ли этот патент только на рекламу или на органический поиск тоже?

    Он влияет на оба типа поиска. Патент явно указывает (например, в Claim 5), что выбираемые элементы контента могут быть как рекламными объявлениями (advertisements), так и сниппетами результатов поиска (search result snippets). Механизм определения значимости слов является универсальным для этапа понимания запросов.

    Как SEO-специалист может узнать или оценить Word-Score для своих ключевых слов?

    Прямого доступа к этой метрике нет. Однако можно использовать косвенные методы: анализ CTR в Google Search Console для разных формулировок запросов и изучение данных из Google Ads по эффективности ключевых слов. Термины, которые являются неотъемлемой частью запросов с высоким CTR и конверсиями, вероятно, имеют высокий Word-Score.

    Что произойдет, если у слова низкий Word-Score?

    Слова с низким Word-Score (например, малозначимые модификаторы, стоп-слова) с большей вероятностью будут отброшены системой на этапе генерации и фильтрации производных ключевых слов. Это означает, что система может проигнорировать это слово и сфокусироваться на других, более значимых терминах в запросе.

    Может ли Word-Score меняться со временем?

    Да. Патент описывает использование цифровых фильтров (рекурсивных функций) для периодического обновления Word-Score на основе новых данных о поведении пользователей. Это позволяет системе адаптироваться к изменениям в трендах и интенте пользователей.

    Как система обрабатывает новые слова, для которых еще нет Word-Score?

    Патент упоминает, что если для слова нет сохраненного Word-Score (например, это новое или очень редкое слово), может использоваться значение по умолчанию (например, 1). По мере накопления данных о взаимодействиях система рассчитает фактический Word-Score.

    Использует ли система только клики для расчета Word-Score?

    Нет, патент указывает, что помимо кликов и CTR могут использоваться и другие типы взаимодействий, включая конверсии (например, покупки, регистрации). Использование данных о конверсиях делает Word-Score сильным индикатором коммерческой значимости слова.

    Как этот механизм влияет на стратегию использования «длинного хвоста» (long-tail keywords)?

    Он критически важен для long-tail запросов. Word-Score помогает системе определить, какие слова в длинном запросе формируют основной интент, а какие можно игнорировать. Это позволяет системе предоставлять релевантные результаты, даже если они не оптимизированы под точную формулировку запроса, но соответствуют основным терминам с высоким Word-Score.

    Заменяют ли современные модели типа BERT этот механизм?

    Современные NLP-модели (BERT, MUM) используют более сложные механизмы (например, attention weights) для определения значимости слова в контексте конкретного запроса. Однако Word-Score представляет собой глобальную, предварительно рассчитанную оценку, основанную на исторических данных. Эти подходы могут дополнять друг друга: Word-Score может использоваться для быстрого отбора кандидатов (L1 Retrieval), а нейронные сети — для глубокого ранжирования (L3).

    Навигация
    • Описание
    • Детальный разбор
    • Выводы
    • Практика
    • Вопросы и ответы
    • Наверх
    Telegram
    © 2025 SEO HARDCORE

    Type above and press Enter to search. Press Esc to cancel.