
Этот патент описывает продвинутую технику машинного обучения, используемую Google для комбинирования различных типов сигналов (запрос, история пользователя, контекст) при ранжировании. Он использует метод иерархического взвешивания (тензорные произведения и слои), который гарантирует точность системы, даже если часть информации (например, история пользователя) отсутствует, отдавая приоритет фундаментальной релевантности над сложными взаимодействиями.
Патент решает фундаментальную проблему в машинном обучении: снижение точности сложных прогнозных моделей (prediction models), использующих большое количество признаков, когда входные данные являются разреженными (sparse). В контексте поиска и рекомендательных систем это происходит, когда система имеет мало информации о пользователе (скудная история поиска) или текущем контексте сессии. Изобретение направлено на создание модели, которая остается надежной и точной независимо от количества доступных признаков для конкретного события прогнозирования.
Запатентован метод адаптации и использования прогнозной модели в средах с богатым набором признаков, но разреженными событиями. Суть изобретения заключается в специфическом способе структурирования и обучения модели с использованием шаблонов признаков (feature templates), вычисления тензорных произведений (tensor products) их комбинаций, организации этих произведений в иерархические слои и применения строгого ограничения на весовые коэффициенты: веса более простых комбинаций признаков должны быть не меньше весов более сложных комбинаций.
Система структурирует модель следующим образом:
Feature Templates), например: A=Запрос, B=История пользователя, C=Контекст.Power Set) и их взаимодействия через Tensor Product (например, A⊗B, A⊗B⊗C).Layers) от простых (Слой 1: A, B, C) к сложным (Слой 3: A⊗B⊗C).Loss Function) с критическим ограничением: вес более простого слоя должен быть больше или равен весу более сложного слоя, который его включает (например, Вес(A) ≥ Вес(A⊗B) ≥ Вес(A⊗B⊗C)). Это штрафует сложность и обеспечивает надежность модели при отсутствии данных (например, если B отсутствует).Высокая. Хотя конкретные методы машинного обучения постоянно развиваются, проблема обработки разреженных данных остается центральной задачей в крупномасштабных системах персонализации и ранжирования, таких как Google Search и YouTube (который упоминается в патенте как пример применения). Описанные методы тензорного произведения и иерархического обучения актуальны для современных архитектур глубокого обучения.
Влияние на SEO низкое (3/10). Это инфраструктурный патент, описывающий математический метод обучения моделей машинного обучения, а не конкретный алгоритм ранжирования или новые факторы. Он не дает прямых рекомендаций по оптимизации контента. Однако он предоставляет важное понимание того, как Google может взвешивать сигналы персонализации относительно базовой релевантности запроса, предполагая, что из-за иерархических ограничений базовая релевантность остается доминирующей.
Feature Templates. Если шаблоны A, B, C, то Power Set включает {A}, {B}, {C}, {A,B}, {A,C}, {B,C}, {A,B,C}.Prediction Event доступно только небольшое количество из всех возможных признаков модели.Transformed Feature Vector Space.Это изобретение относится к области машинного обучения и его применению в поисковых системах.
Claim 1 (Независимый пункт): Описывает метод предоставления релевантных результатов поиска пользователю.
Prediction Model.Ключевая часть Claim 1 детально описывает, как именно была адаптирована (обучена) эта Prediction Model:
Power Set шаблонов признаков (комбинации Запроса, Истории, Контекста).Tensor Product для каждой комбинации, создавая Transformed Feature Vector Space.Layers (Слои) по сложности (где слой x+1 сложнее слоя x).Weight Vector на основе Loss Function с критическим ограничением: вес для слоя x не больше, чем вес для слоя x-1 (т.е. веса уменьшаются или остаются равными по мере увеличения сложности).Claim 11 (Независимый пункт): Описывает сам метод адаптации Prediction Model в обобщенном виде (не привязываясь строго к поиску).
Feature Templates.Prediction Event и соответствующих признаков.Power Set, вычисления Tensor Product, организации в Layers и определения Weight Vector с тем же иерархическим ограничением (вес слоя x ≤ вес слоя x-1).Ядром изобретения является специфический метод обучения (адаптации) модели машинного обучения. Использование иерархической структуры тензорных произведений и применение ограничения на веса (штраф за сложность) позволяет модели оставаться эффективной даже при недостатке входных данных (разреженности), что критично для систем персонализации.
Изобретение описывает технику машинного обучения, которая может применяться на различных этапах поисковой архитектуры, где используются прогнозные модели.
INDEXING – Индексирование и извлечение признаков
На этом этапе извлекаются признаки, которые затем будут использоваться в Feature Templates (например, признаки контента, признаки авторов).
RANKING / RERANKING – Ранжирование и Переранжирование
Основное применение. Prediction Model, обученная с использованием описанной техники, используется для оценки релевантности результатов поиска или рекомендаций. Система получает доступные признаки для текущего Prediction Event (Запрос, История, Контекст) и использует модель для генерации прогноза (например, Ranking Score).
Взаимодействие компонентов:
Tensor Products, оптимизация Weight Vector).Model Datastore для быстрого выполнения прогнозов во время ранжирования.Входные данные (для модели):
Prediction Event Features), соответствующие определенным шаблонам (Query, User History, Context).Выходные данные (от модели):
video search website, например, YouTube) и поиска документов (document search website). Техника особенно полезна для рекомендательных систем.Weight Vector для минимизации Loss Function.Алгоритм описывает процесс адаптации (обучения) прогнозной модели.
Feature Templates (например, Ф = {f1=Запрос, f2=История, f3=Контекст}).Prediction Event (например, пользователь выполнил поиск и кликнул на результат) и соответствующие признаки.Transformed Feature Vector Space.Loss Function с применением регуляризации и строгого иерархического ограничения: вес любого элемента должен быть не больше веса элементов на предыдущем слое, которые его включают. Это гарантирует, что более сложные взаимодействия штрафуются сильнее.Патент фокусируется на методологии машинного обучения, но приводит конкретные примеры данных, используемых в контексте поиска (особенно видео/документов):
Патент описывает математическую основу для обучения модели.
sparsity). Это критически важно для персонализации, так как история пользователя часто бывает неполной.Query, User History и Context (текущая сессия) являются ключевыми входными данными для моделей прогнозирования релевантности в поиске и рекомендательных системах (например, YouTube).Хотя патент носит инфраструктурный характер, он подтверждает важность фундаментальных принципов SEO:
Query Template), что дает наибольший вес при ранжировании.Context), может помочь в оптимизации внутренней перелинковки и рекомендательных блоков, чтобы соответствовать моделям, которые используют контекст сессии.sparsity), полагаясь на базовые слои модели.Патент демонстрирует уровень сложности инфраструктуры машинного обучения Google, направленной на масштабируемую и надежную персонализацию. Стратегически он подтверждает, что Google придерживается консервативного подхода к взвешиванию сложных сигналов: базовая релевантность является основой, а персонализация и контекст — это улучшения, которые не должны нарушать эту основу. Это подчеркивает важность долгосрочной стратегии построения авторитетности и качества контента.
Патент не дает прямых примеров для SEO, но описывает сценарий применения в рекомендательных системах (например, YouTube).
Сценарий: Рекомендация следующего видео на YouTube
Что такое "Шаблоны признаков" (Feature Templates) в контексте этого патента?
Это способ организации входных данных в логические группы. Вместо того чтобы рассматривать сотни признаков по отдельности, система группирует их. В патенте приводятся примеры трех ключевых шаблонов для поиска и рекомендаций: "Запрос" (Query), "История пользователя" (User History) и "Контекст" (Context – текущая сессия).
Что такое "Тензорное произведение" (Tensor Product) и зачем оно нужно?
Тензорное произведение — это математическая операция, которая позволяет вычислить взаимодействия между различными шаблонами признаков. Например, она позволяет модели понять не только важность Запроса и Истории по отдельности, но и их совместное влияние (Запрос ⊗ История). Это необходимо для создания более точных и персонализированных прогнозов.
В чем заключается основная новизна этого патента?
Новизна заключается в способе обучения модели с использованием иерархических слоев (Layers) и применением строгого ограничения на веса. Вес более сложной комбинации признаков (например, Запрос ⊗ История) не может превышать вес более простой комбинации, которая в нее входит (например, Запрос). Это делает модель устойчивой к недостатку данных (sparsity).
Что означает "штраф за сложность" или иерархическое ограничение весов для SEO?
Это означает, что система спроектирована так, чтобы отдавать предпочтение фундаментальной релевантности. Соответствие контента запросу (простой признак) имеет больший или равный вес, чем сложные сигналы персонализации. Для SEO это подтверждает, что нельзя полагаться на персонализацию для компенсации слабой релевантности контента.
Решает ли этот патент проблему "холодного старта" (новых пользователей)?
Да, в значительной степени. Поскольку модель обучается быть устойчивой к разреженности данных (когда история пользователя отсутствует), она может эффективно ранжировать контент для новых пользователей, полагаясь на доступные данные, такие как Запрос и Контекст текущей сессии.
Применяется ли эта технология только в Google Поиске?
Нет. В патенте явно упоминаются "video search website" и "document search website". Эта техника машинного обучения универсальна и, вероятно, используется в различных продуктах Google, где важна персонализация и рекомендации, особенно в YouTube.
Описывает ли этот патент конкретные факторы ранжирования?
Нет. Патент описывает математический метод комбинирования и взвешивания факторов, а не сами факторы. Хотя он упоминает Запрос, Историю и Контекст как входные данные, он не детализирует, как именно они измеряются или какие элементы внутри них наиболее важны.
Как этот патент связан с E-E-A-T или качеством контента?
Прямой связи в тексте патента нет. E-E-A-T и сигналы качества контента, вероятно, являются частью входных признаков (например, в шаблоне Контекста или как общие признаки документа), которые затем обрабатываются этой моделью для прогнозирования релевантности. Модель определяет, как эти сигналы взаимодействуют с запросом и историей пользователя.
Стоит ли мне менять свою SEO-стратегию на основе этого патента?
Патент не требует изменения стратегии, но он укрепляет уверенность в том, что фундаментальная оптимизация под интент запроса является наиболее важной. Если ваша стратегия основана на создании высокорелевантного контента, этот патент подтверждает правильность такого подхода, так как базовая релевантность имеет приоритетный вес в описанной модели.
Является ли этот патент доказательством того, что Google активно использует историю просмотров для ранжирования?
Да, патент явно указывает "User History" (включая ранее просмотренные видео/документы и предыдущие запросы) как один из ключевых шаблонов признаков, используемых прогнозной моделью для определения релевантных результатов поиска. Это подтверждает использование истории пользователя в системах ранжирования и рекомендаций.

Поведенческие сигналы

SERP
Поведенческие сигналы

Персонализация
Поведенческие сигналы
SERP

Семантика и интент
Мультимедиа
SERP

Персонализация
Поведенческие сигналы
Семантика и интент

Семантика и интент
SERP
Поведенческие сигналы

Knowledge Graph
SERP
Семантика и интент

Поведенческие сигналы
Мультимедиа
SERP

Поведенческие сигналы
Семантика и интент
Мультимедиа

SERP
Семантика и интент
EEAT и качество

Knowledge Graph
Семантика и интент
Персонализация

Knowledge Graph
EEAT и качество
Семантика и интент

Семантика и интент
Персонализация
EEAT и качество

Поведенческие сигналы
Семантика и интент
Антиспам

Поведенческие сигналы
Мультиязычность
Персонализация
