
Google использует систему для определения значимости слов в поисковом запросе в зависимости от их контекста. Анализируя историю запросов, система выявляет, меняется ли выдача при добавлении определенного слова. Если выдача остается схожей, слово признается малозначимым в данном контексте. При обработке запроса такие слова становятся опциональными (необязательными для нахождения в документе) и получают пониженный вес при ранжировании.
Патент решает проблему снижения качества поиска из-за включения пользователями в запрос "лишних слов" — терминов с низкой информационной значимостью (terms of little significance). Такие термины часто сужают область поиска (снижают полноту), исключая релевантные документы, не содержащие этих слов, и искажают ранжирование, придавая избыточный вес этим словам при расчете score. Существующие методы (стоп-слова, общие слова на основе TF/IDF) неэффективны, так как значимость термина часто зависит от контекста (например, слово "information" в запросах "information about mazda cars" и "information technology practices").
Запатентована система, которая определяет значимость термина в зависимости от его контекста в запросе. Система использует офлайн-анализ логов запросов (query logs) для построения таблицы (Query Term Table), фиксирующей, в каких контекстах термин является значимым, а в каких — малозначимым. Во время выполнения запроса система проверяет эту таблицу и модифицирует логику поиска для малозначимых терминов.
Система работает в двух режимах:
Офлайн-анализ:
query logs и находит пары запросов, отличающихся одним термином (Запрос А и Запрос А + Термин Х).Query Term Table.Обработка запроса (Runtime):
Query Term Table, используя наиболее специфичный совпадающий контекст.down weight) при расчете score документа.Высокая. Понимание запросов и определение истинного интента пользователя остаются центральными задачами поиска. Описанный механизм контекстно-зависимой оценки значимости терминов является фундаментальным для обработки сложных и длинных запросов. Хотя современные нейросетевые модели (BERT, MUM) используют более продвинутые методы для понимания контекста, базовая идея, что не все слова в запросе одинаково важны и их важность зависит от окружения, актуальна как никогда.
Патент имеет высокое значение (8/10) для понимания принципов работы поиска. Он описывает конкретный механизм, как Google может игнорировать или понижать вес определенных слов в запросе в зависимости от контекста. Это напрямую влияет на стратегию подбора семантики и оптимизации контента: фокус должен быть на ключевых терминах, определяющих интент, а не на общих модификаторах, которые могут быть признаны малозначимыми.
(.)), указывая на общую значимость термина независимо от окружения.score) документа при ранжировании. Термин вносит меньший вклад, чем другие термины запроса, но все же больший нуля.document selection) его наличие в документе не является обязательным.search results), которые были идентифицированы для этих запросов, и последовательности запросов (сессии).Context(s) of Little Significance) или высокую значимость (Significant Context(s)).Claim 17 (Независимый пункт): Описывает офлайн-метод определения значимости терминов.
query logs для идентификации пар запросов, отличающихся одним дополнительным термином (extra term).extra term как термина с little significance, если группа пар связана с первым пороговым количеством общих результатов.extra term как термина, который является significant, если группа пар связана со вторым пороговым количеством различных результатов.Claim 1 (Независимый пункт): Описывает основной метод обработки поискового запроса (онлайн).
little significance, если анализ логов показал высокое сходство результатов.little significance (т.е. он становится опциональным при отборе).Claim 27 (Независимый пункт): Описывает процесс ранжирования (Scoring).
scores). При расчете оценки малозначимый термин вносит вклад, который больше нуля, но меньше, чем вклад значимого термина (Down-weighting).Claim 4, 6, 19, 22 (Зависимые): Детализируют поиск контекстуальных исключений.
Система не только определяет общую значимость термина, но и ищет контексты, где правило нарушается. Например, если термин в целом малозначим, система ищет контексты, где его добавление сильно меняет выдачу (делая его значимым в этом контексте), и наоборот.
Claim 7 и 23 (Зависимые): Описывают альтернативный сигнал — поведение пользователя (реформулировка запроса).
Система анализирует последовательности запросов. Если пользователь часто вводит Запрос 1 (с термином), а сразу за ним Запрос 2 (без термина), и это превышает порог (например, 1%), термин идентифицируется как имеющий little significance.
Изобретение затрагивает несколько этапов поиска, разделяясь на офлайн-обработку и обработку запроса в реальном времени.
QUNDERSTANDING – Понимание Запросов (Офлайн-обработка)
Система (Query Term Analyzer) работает в офлайн-режиме. Он использует данные из Query Logs для анализа влияния терминов на результаты поиска.
Вход: Query Logs (история запросов и SERP).
Выход: Query Term Table.
QUNDERSTANDING – Понимание Запросов (Онлайн)
На этом этапе система (Query Analyzer) в реальном времени анализирует входящий запрос, используя Query Term Table. Определяется контекст каждого термина и его значимость.
Вход: Поисковый запрос, Query Term Table.
Выход: Аннотированный запрос с указанием значимости/весов терминов.
RANKING – Ранжирование (Этап Retrieval/Отбор кандидатов)
Компонент Search Logic выполняет отбор документов. Если термин помечен как малозначимый, он рассматривается как опциональный (optional). Документ не обязан содержать этот термин для попадания в набор кандидатов.
Вход: Аннотированный запрос.
Выход: Набор документов-кандидатов.
RANKING – Ранжирование (Этап Scoring/Оценка)
Компонент Scoring Logic рассчитывает оценку релевантности (IR score). Если термин помечен как малозначимый, применяется понижение веса (down-weighting).
Вход: Документы-кандидаты, веса терминов.
Выход: Документы с рассчитанными scores.
Query Term Table как имеющий little significance в контексте данного запроса.most specific context) совпадение в таблице. Если термин обычно малозначим, но в данном конкретном контексте значим, он будет считаться значимым.Процесс А: Офлайн-генерация Таблицы Поисковых Терминов (Query Term Table)
Query Logs.extra term).extra term идентифицируется как в целом малозначимый.extra term идентифицируется как в целом значимый.Query Term Table.Процесс Б: Обработка запроса в реальном времени
Query Term Table. Система ищет наиболее специфичный совпадающий контекст для определения значимости термина.little significance в данном контексте.optional). Документы отбираются, даже если не содержат эти термины.down-weight) (например, 0.25).scores) для отобранных документов с учетом присвоенных весов. Документы, содержащие малозначимый термин, получают небольшое преимущество перед теми, что его не содержат.sequences of queries) для анализа реформулировок.Патент не упоминает использование контентных, технических или ссылочных факторов для определения значимости термина.
Система использует несколько ключевых метрик и порогов в офлайн-анализе:
В процессе обработки запроса используются:
IR score. Малозначимые термины получают пониженный вес (дробное значение меньше стандартного веса значимых терминов).TF/IDF. Слово может быть признано малозначимым в одном контексте и критически важным в другом (например, "automobile" в "ford automobile" vs "hybrid automobile").Query Logs.down-weighting) при ранжировании. Это уменьшает их влияние на итоговый score, но сохраняет небольшое преимущество для документов, где они есть (вес > 0).Query Term Table. Это позволяет корректно обрабатывать исключения из общих правил.Этот патент подчеркивает важность глубокого понимания семантики и контекста в поисковых системах. Он демонстрирует, что Google стремится понять истинную информационную потребность пользователя, отфильтровывая шум в запросе. Для SEO это означает переход от буквального соответствия ключевых слов к удовлетворению интента. Стратегия должна базироваться на анализе того, какие термины являются определяющими (significant) в конкретных тематиках и контекстах, и обеспечении максимальной релевантности именно этим терминам.
Сценарий 1: Оптимизация страницы обзора автомобиля (Пример из патента)
little significance. Оно становится опциональным и получает пониженный вес.Сценарий 2: Использование слова "Бесплатно" (Free) (Пример из патента)
little significance.Как система определяет, является ли термин значимым или нет?
Основной метод — это анализ исторических логов запросов (Query Logs). Система находит пары запросов, отличающиеся одним словом (А и А+Х), и сравнивает их результаты поиска. Если результаты очень похожи, значит, слово Х не сильно влияет на выдачу и является малозначимым. Если результаты сильно отличаются, слово Х значимо. Также используется анализ поведения пользователей: если они часто удаляют слово из запроса и повторяют поиск, это сигнал низкой значимости.
Значит ли это, что Google игнорирует малозначимые слова?
Не полностью игнорирует, а применяет двойной подход. Во-первых, при отборе документов (retrieval) это слово становится опциональным — документы без него могут попасть в выдачу. Во-вторых, при ранжировании (scoring) вес этого слова понижается (down-weighting). Оно вносит вклад в score (больше нуля), но значительно меньший, чем значимые термины.
Как система учитывает контекст?
Система не просто определяет общую значимость слова, но и ищет исключения. Например, слово "Free" может быть признано в целом малозначимым. Но система может обнаружить, что в контексте "Sugar Free" оно критически важно (так как сильно меняет выдачу). Эта информация хранится в Query Term Table. При обработке запроса используется наиболее специфичный совпадающий контекст.
Как это влияет на подбор семантического ядра?
Это подчеркивает необходимость разделения ядра на основные термины, определяющие интент, и второстепенные модификаторы. Нужно убедиться, что сайт хорошо ранжируется по основным терминам. Не стоит полагаться на длинные запросы, состоящие из множества потенциально малозначимых слов, так как их вес может быть сильно понижен.
Стоит ли использовать общие слова типа "информация", "обзор", "гайд" в тексте и заголовках?
Если эти слова естественно вписываются в контент, их можно использовать. Однако не стоит ожидать, что они дадут значительный прирост в ранжировании, если система определит их как малозначимые в данном контексте. Они, скорее всего, станут опциональными и получат пониженный вес. Фокус всегда должен быть на терминах, несущих основную смысловую нагрузку.
Как я могу узнать, какие слова Google считает малозначимыми в моей нише?
Патент предлагает метод, который можно эмулировать вручную: сравните SERP для пар запросов (А и А+Х). Если Топ-10 выдачи по запросу с модификатором и без него практически идентичен (например, совпадает на 70-80%), вероятно, этот модификатор имеет низкую значимость в данном контексте. Если выдача кардинально разная, термин значим.
Влияет ли этот патент на обработку стоп-слов?
Да, этот механизм является более продвинутой и гибкой альтернативой традиционным спискам стоп-слов. Вместо жесткого игнорирования слова во всех ситуациях, система оценивает его значимость в зависимости от контекста и применяет мягкое понижение веса или опциональность.
Что такое Query Term Table и как она используется?
Это база данных, создаваемая в офлайн-режиме на основе анализа логов. Она хранит информацию о терминах и контекстах, в которых они значимы или малозначимы. Во время выполнения запроса система обращается к этой таблице, чтобы быстро определить, как обрабатывать каждое слово в запросе пользователя (как обязательное или опциональное, с полным весом или пониженным).
Как этот механизм помогает пользователям?
Он помогает в ситуациях, когда пользователи перегружают запрос лишними словами. Система автоматически определяет, какие слова важны, а какие нет. Это позволяет вернуть более качественные результаты, которые могли бы быть отсеяны, если бы все слова запроса считались обязательными и равнозначными.
Актуален ли этот механизм в эпоху нейронных сетей (BERT, MUM)?
Базовая концепция контекстной значимости остается крайне актуальной. Хотя современные модели ИИ могут определять значимость слов более сложными способами (например, через механизмы внимания в трансформерах), идея, описанная в патенте (анализ влияния на SERP и модификация весов/опциональности), заложила фундамент для систем понимания запросов.

Семантика и интент

Поведенческие сигналы
Семантика и интент
EEAT и качество

Семантика и интент
SERP

Семантика и интент

Семантика и интент

Ссылки
Индексация
Краулинг

EEAT и качество
Семантика и интент

Knowledge Graph
SERP
Семантика и интент

Семантика и интент
Поведенческие сигналы
Персонализация

Knowledge Graph
Семантика и интент
Ссылки

Ссылки
EEAT и качество
Антиспам

Поведенческие сигналы
Мультимедиа
SERP

EEAT и качество
Семантика и интент
SERP

Персонализация
Поведенческие сигналы
Local SEO

Персонализация
Поведенческие сигналы
Local SEO
