
Google использует систему для улучшения ранжирования, комбинируя стандартную текстовую релевантность с оценкой соответствия категории. Система определяет, насколько сильно документ принадлежит к определенным категориям и насколько сильно запрос соответствует этим же категориям. Если и документ, и запрос сильно совпадают по категории, результат получает повышение в ранжировании. Это особенно важно для E-commerce и контента с четкой структурой.
Патент решает проблему ограничений стандартного текстового поиска (text matching), который интерпретирует запросы буквально, может упускать релевантный контент и страдает от неоднозначности запросов. Изобретение направлено на улучшение качества (а не только количества) совпадений, особенно для контента, который трудно ранжировать традиционными методами (например, из-за нехватки ссылок, короткого времени жизни или повторяемости), такого как страницы товаров в E-commerce или реклама. Цель — предоставить механизм качественной оценки результатов путем включения взвешенных категорий в процесс ранжирования.
Запатентована система и метод определения композитной оценки (Composite Score) для ранжирования документов. Суть изобретения заключается в дополнении стандартной оценки текстового соответствия (Text Match Score) оценкой категориального соответствия (Category Match Score). Эта категориальная оценка вычисляется путем анализа того, насколько сильно документ связан с определенными категориями (Document-Categories Score) и насколько сильно поисковый запрос связан с этими же категориями (Query-Categories Score). Итоговый рейтинг определяется путем смешивания (blending) текстовой и категориальной оценок.
Система работает в два этапа: предварительная обработка и обработка запроса.
Association Strength). Также слова и фразы ассоциируются с категориями с определенной силой связи.Text Match Score. Параллельно она вычисляет Query-Categories Score (насколько запрос релевантен категориям) и извлекает Document-Categories Score (насколько найденные документы релевантны категориям).Query-Categories Score и Document-Categories Score (например, через скалярное произведение векторов). Высокий балл получается, только если и запрос, и документ сильно соответствуют одним и тем же категориям.Text Match Score и Category Match Score объединяются (например, через взвешенную линейную комбинацию) для получения финального Composite Score.Высокая. Хотя патент старый, описанные в нем принципы фундаментальны для поиска в структурированных данных. Механизмы категоризации и совмещения оценок текстовой и тематической (категориальной) релевантности критически важны для Google Shopping, Google News, а также для разрешения неоднозначности запросов в основном поиске. Современные системы используют более сложные модели (например, нейронные сети), но базовая логика совмещения разных типов оценок релевантности остается актуальной.
Патент имеет высокое значение (8/10), особенно для E-commerce, новостных сайтов и контентных проектов с четкой структурой. Он подчеркивает, что для успешного ранжирования недостаточно простого совпадения ключевых слов. Необходимо, чтобы контент был корректно классифицирован системой (попадал в нужную категорию) и чтобы эта категория четко соответствовала интенту запроса. Неправильная категоризация может привести к низкому Category Match Score и, как следствие, к потере позиций.
Document-Categories Score и Query-Categories Score.Text Match Score и Category Match Score для получения Composite Score.Document-Categories Score и Query-Categories Score.Category Match Score.Association Strengths.Association Strengths.Association Strengths слов в запросе.Text Match Score.Association Strengths.Claim 1 (Независимый пункт): Описывает основную систему скоринга.
search criteria).Text Match Score для каждого документа на основе степени соответствия документу и критерию поиска.Document-Categories Score для каждой категории на основе степени соответствия между документом и категорией.Search Criteria-Categories Score (эквивалент Query-Categories Score) для каждой категории на основе степени соответствия между критерием поиска и категорией.Category Match Score для каждого документа путем комбинирования Document-Categories Score и Search Criteria-Categories Score.Overall Score / Composite Score) для каждого документа на основе его Text Match Score и Category Match Score.Claim 11 (Зависимый от 1): Уточняет, что функция смешивания является взвешенной комбинацией Text Match Score и Category Match Score.
Claim 12 (Зависимый от 11): Определяет формулу смешивания как линейную комбинацию: S=αSt+βSc, где S — итоговая оценка, St — Text Match Score, Sc — Category Match Score, α и β — весовые коэффициенты.
Claim 13 (Зависимый от 11): Определяет альтернативную формулу смешивания с интерактивным членом: S=αSt+βSc+γStSc. Добавление γStSc работает как функция «мягкого логического И» (soft logical AND), требуя наличия как достаточно высокой текстовой, так и категориальной оценки для получения высокого итогового балла.
Claim 10 (Зависимый от 9, который зависит от 1): Уточняет, что Category Match Score (называемый в Claim 9 aggregate category match score) рассчитывается с использованием скалярного произведения (dot product) Document-Categories Score и Search Criteria-Categories Score.
Изобретение затрагивает этапы индексирования и ранжирования поисковой архитектуры.
INDEXING – Индексирование и извлечение признаков
На этом этапе происходит основная предварительная работа. Система должна классифицировать контент:
Association Strength, которая сохраняется как Document-Categories Score. Это может делаться вручную, автоматически (например, с помощью классификатора Naïve Bayes) или комбинированным способом.Association Strength.RANKING – Ранжирование
На этом этапе система применяется в реальном времени для оценки кандидатов.
Text Scorer вычисляет Text Match Score для документов-кандидатов.Category Scorer вычисляет Query-Categories Score для входящего запроса, используя предварительно рассчитанные Association Strengths терминов. Затем он извлекает Document-Categories Score для документов-кандидатов и вычисляет Category Match Score.Blending Function объединяет Text Match Score и Category Match Score в финальный Composite Score, который используется для сортировки результатов.Входные данные:
Document Mappings и Association Strengths (Document-Categories Scores).Word and Word Phrase Associations и Association Strengths.Выходные данные:
Composite Scores для каждого документа-кандидата.Алгоритм применяется, когда система поиска имеет доступ к базе данных категорий и предварительно рассчитанным связям между документами/терминами и этими категориями. Он может применяться как основной механизм ранжирования для специализированных вертикалей (например, Google Shopping) или как дополнительный сигнал ранжирования в основном веб-поиске для улучшения качества результатов в определенных сценариях.
Этап 1: Предварительные вычисления (Офлайн / Индексирование)
Association Strengths для каждой пары термин-категория.Association Strengths (Document-Categories Score) для каждой пары документ-категория.Document Mappings и Word/Phrase Associations в хранилище.Этап 2: Обработка запроса (Онлайн / Ранжирование)
Indexer выполняет поиск по текстовому корпусу для нахождения релевантных документов.Text Scorer вычисляет Text Match Score (St) для каждого документа-кандидата.Category Scorer определяет Query-Categories Score (C) на основе Association Strengths терминов в запросе.Category Scorer извлекает предварительно рассчитанные Document-Categories Score (D) для каждого документа-кандидата.Category Scorer вычисляет Category Match Score (Sc). В патенте предлагается использовать скалярное произведение векторов D и C: Sc=D⋅C.Blending Function комбинирует St и Sc для получения Composite Score (S), используя одну из формул, например: S=αSt+βSc+γStSc.Composite Score.Патент не детализирует все возможные факторы, но опирается на следующие типы данных:
Text Match Score и для предварительной классификации документов (Document Mappings). Слова и фразы из документов используются для создания Word/Phrase Associations.system logs) для определения того, какие категории наиболее часто ассоциируются с определенным словом или фразой при формировании Word/Phrase Associations.Система использует несколько ключевых метрик:
Association Strengths документа по отношению к разным категориям.Association Strengths запроса по отношению к разным категориям, основанный на терминах запроса.D⋅C=∑i=1ndici
Где n — количество категорий (или топ-N категорий), di — оценка документа для категории i, ci — оценка запроса для категории i.
Blending Function. Используются взвешенные комбинации St и Sc (формулы приведены в разборе Claims 12 и 13).Category Match Score. Недостаточно, чтобы документ принадлежал к какой-либо категории, и недостаточно, чтобы запрос соответствовал какой-либо категории. Высокий балл получается только тогда, когда и запрос, и документ сильно коррелируют с *одними и теми же* категориями (что достигается через скалярное произведение).Document Mappings). Если документ классифицирован неверно или имеет низкую Association Strength с релевантной категорией, его Category Match Score будет низким, что негативно скажется на ранжировании.Document-Categories Score.google_product_category). Это напрямую предоставляет данные для Document Mappings и помогает установить сильные Association Strengths.Association Strength.Word/Phrase Association Strength).Document-Categories Score. Система не сможет установить сильную связь ни с одной из категорий.Category Match Score.Text Match Score) без обеспечения соответствия основной категории запроса (для Category Match Score) не даст максимального результата, особенно если используется функция смешивания "Soft AND".Патент подчеркивает важность перехода от анализа ключевых слов к анализу тематик и категорий. Для Google важно не только то, что текст соответствует запросу, но и то, что документ находится в правильном тематическом контексте (категории), который соответствует контексту запроса. Это фундаментальный принцип для построения качественного поиска в структурированных данных. Стратегия SEO должна включать работу над тем, чтобы помочь Google максимально точно классифицировать контент сайта.
Сценарий: Ранжирование товаров в E-commerce
Сайт продает Метлу (Broom) и Садовую фигурку Гнома с метлой (Gnome with Broom). Поступает запрос "Метла".
Query-Categories Score для этой категории).Document-Categories Score).Document-Categories Score для [Метлы]).Category Match Score.Category Match Score.Text Match Score у обоих товаров одинаковый (оба содержат слово "Метла"), товар "Метла" получит значительно более высокий Composite Score за счет высокого Category Match Score и будет ранжироваться выше.Что такое Category Match Score и почему он важен?
Category Match Score — это оценка, которая показывает, насколько хорошо совпадают категории, релевантные для документа, с категориями, релевантными для запроса. Он важен, потому что является независимым сигналом ранжирования, дополняющим стандартную текстовую релевантность. Высокий Category Match Score может значительно повысить итоговый рейтинг документа, особенно в E-commerce или при неоднозначных запросах.
Как рассчитывается Category Match Score согласно патенту?
Патент предлагает использовать скалярное произведение (dot product) двух векторов: Document-Categories Score (насколько документ соответствует разным категориям) и Query-Categories Score (насколько запрос соответствует разным категориям). Это означает, что высокий балл получается только в том случае, если и документ, и запрос имеют высокие оценки для одних и тех же категорий.
Что такое функция смешивания (Blending Function) и как она влияет на ранжирование?
Это формула, которая объединяет Text Match Score (St) и Category Match Score (Sc) в итоговый рейтинг. Патент предлагает два варианта: простую линейную комбинацию или комбинацию с интерактивным членом (St⋅Sc). Второй вариант работает как "мягкое И", требуя, чтобы обе оценки были высокими для достижения максимального рейтинга.
Как SEO-специалист может повлиять на Document-Categories Score?
Этот показатель рассчитывается на этапе индексирования и показывает, насколько сильно документ связан с категорией. SEO-специалист может повлиять на него, обеспечивая четкую структуру сайта (таксономию), используя релевантную терминологию в контенте, внедряя "хлебные крошки" и используя структурированные данные (например, Schema.org/Product или фиды Merchant Center) для явного указания категории.
Применяется ли этот патент только для E-commerce?
Хотя E-commerce является основным примером в патенте (из-за четкой таксономии товаров), механизм может применяться в любых областях, где контент можно структурировать по категориям. Это включает новостные сайты (Google News), каталоги, доски объявлений, а также может использоваться в основном поиске для классификации веб-страниц по темам или жанрам.
Что произойдет, если мой контент будет неправильно классифицирован Google?
Если Google ассоциирует ваш документ с неверной категорией, Document-Categories Score для релевантной категории будет низким. При поступлении запроса, соответствующего релевантной категории, итоговый Category Match Score также будет низким (даже при высоком Query-Categories Score). Это значительно снизит шансы документа на высокое ранжирование по этому запросу.
Как Google определяет, какие слова связаны с какими категориями (Word/Phrase Associations)?
Патент упоминает несколько способов. Это может быть сделано путем анализа документов в текстовом корпусе, которые уже принадлежат к определенным категориям, или путем анализа системных логов (вероятно, логов запросов и кликов), чтобы увидеть, какие категории наиболее часто ассоциируются с конкретными словами или фразами пользователей.
Может ли страница ранжироваться высоко только за счет Text Match Score, если Category Match Score низкий?
Это зависит от используемой функции смешивания (Blending Function) и весовых коэффициентов (α, β, γ). Если вес текстовой оценки (α) значительно выше веса категориальной (β), то да. Однако, если используется функция "мягкого И" и вес интерактивного члена (γ) высок, то низкий Category Match Score сильно ограничит максимальный итоговый рейтинг.
Как этот патент помогает бороться с неоднозначностью запросов?
Он помогает через расчет Query-Categories Score. Для неоднозначного запроса (например, "Ягуар") система может определить несколько потенциальных категорий (Автомобили, Животные). Если контекст запроса или другие сигналы указывают на предпочтение одной категории, Query-Categories Score для неё будет выше. В результате документы, принадлежащие к этой предпочтительной категории, получат бустинг.
Что важнее для SEO в контексте этого патента: структура сайта или контент страницы?
Оба элемента критически важны и работают вместе. Контент страницы необходим для достижения высокого Text Match Score и для того, чтобы автоматические классификаторы правильно определили категорию документа. Структура сайта (таксономия, навигация) помогает подтвердить эту классификацию и обеспечить корректный расчет Document-Categories Score.

Ссылки
SERP
Поведенческие сигналы

Семантика и интент
SERP
Персонализация

Семантика и интент
SERP

Семантика и интент
Поведенческие сигналы

Local SEO
Семантика и интент
SERP

Семантика и интент
Ссылки
SERP

Ссылки
Индексация
Техническое SEO

SERP
EEAT и качество
Поведенческие сигналы

Персонализация
Индексация
Поведенческие сигналы

SERP
EEAT и качество
Поведенческие сигналы

SERP
Поведенческие сигналы

Поведенческие сигналы

Персонализация
Семантика и интент
Local SEO

Персонализация
Поведенческие сигналы
SERP

Индексация
Краулинг
Ссылки
