
Патент описывает систему, преимущественно для голосовых ассистентов, которая определяет, что пользователь сформулировал запрос грамматически некорректно («плохо сформированная фраза») на неродном для него языке. Вместо выполнения команды система предлагает корректный вариант («хорошо сформированную фразу»), используя для этого предварительно рассчитанные векторные представления (embeddings) и анализ языковой компетентности пользователя.
Патент решает проблему обработки запросов, которые содержат грамматические ошибки, неправильное использование терминов или неестественные формулировки (not well-formed phrase), особенно когда пользователь взаимодействует с системой (например, автоматизированным ассистентом) на языке, не являющемся для него основным (non-primary language). Цель — улучшить взаимодействие, избежать неправильной интерпретации команды и способствовать обучению пользователя, предлагая корректную альтернативу. Это экономит вычислительные ресурсы, предотвращая выполнение неверных задач или обработку повторных попыток пользователя.
Запатентован метод идентификации плохо сформированных фраз и подбора хорошо сформированных альтернатив. Система может заранее (офлайн) определять некорректные фразы и находить для них корректные варианты с тем же намерением, используя, в частности, embeddings. В момент получения запроса (онлайн) система проверяет уровень владения языком пользователя. Если фраза некорректна и уровень владения низкий (или язык не основной), система предлагает подобранную альтернативу.
Система работает в двух основных режимах:
Офлайн (Подготовка, например, Claim 1):
perplexity score).embeddings) и поиск семантически близких фраз в векторном пространстве.Онлайн (Обработка запроса):
language proficiency measure) ниже порога.Высокая. Патент опубликован в 2024 году. Технологии обработки естественного языка (NLP), векторные представления (embeddings) и определение намерений являются фундаментальными для современных поисковых систем и ассистентов. Улучшение мультиязычного взаимодействия является приоритетным направлением.
Влияние на традиционное SEO минимальное (3/10). Патент не описывает механизмы ранжирования или оценки качества контента на сайтах. Он сосредоточен на интерфейсе взаимодействия пользователя с автоматизированным ассистентом (automated assistant interface) и улучшении понимания запросов с ошибками. Для SEO специалистов он представляет интерес как пример использования Google векторных представлений (embeddings) для определения семантической близости и методов оценки «естественности» языка.
Патент содержит ключевые независимые пункты (1, 11, 14), которые описывают офлайн и онлайн процессы.
Claim 1 (Независимый пункт): Описывает полный цикл работы системы, включающий предварительную подготовку (офлайн) и реакцию на запрос пользователя (онлайн).
Часть А: Офлайн-процесс (выполняется ДО получения запроса пользователя):
not well-formed.well-formed фраз.embedding. Этот embedding сравнивается в векторном пространстве с ранее сгенерированными embeddings других фраз. Альтернативы идентифицируются на основе этого сравнения (близости).score), и выбирается лучшая.Часть Б: Онлайн-процесс (выполняется ПОСЛЕ выбора альтернативы):
primary language) для пользователя.refraining) от визуального отображения ответа на исходную фразу.particular language response).primary language response).Система использует предварительно вычисленные данные (определение плохих фраз и их альтернатив через embeddings) для быстрой реакции в реальном времени. Механизм активируется только для пользователей, использующих неродной язык, и модифицирует интерфейс, скрывая результат исходного запроса и предлагая замену с последующим двуязычным ответом.
Claim 11 (Независимый пункт): Описывает альтернативный вариант, где весь процесс (включая поиск альтернатив) происходит в реальном времени в ответ на запрос пользователя.
non-primary language).language proficiency measure пользователя для этого языка.not well-formed.language proficiency measure не достигает порога.embeddings, как описано в Claim 1).В отличие от Claim 1, здесь идентификация альтернатив происходит после получения запроса, а триггером служит конкретная мера компетентности пользователя ниже порога.
Изобретение в первую очередь относится к системам обработки запросов в автоматизированных ассистентах (голосовой поиск), а не к традиционному веб-поиску.
INDEXING / Офлайн-обработка данных
Значительная часть работы может происходить офлайн (как описано в Claim 1 и 14). Система анализирует большие объемы данных.
well-formed, а какие нет. Это включает анализ исторических логов запросов носителей языка, анализ авторитетных текстовых корпусов (например, новостных сайтов) и вычисление Perplexity Scores.not well-formed фраз ищутся well-formed альтернативы путем сравнения их embeddings.QUNDERSTANDING – Понимание Запросов
Основной этап применения патента в реальном времени.
Primary Language пользователя или вычисляет Language Proficiency Measure (на основе прошлых взаимодействий, настроек аккаунта, запросов на перевод и т.д.).not well-formed (путем поиска в базе данных или анализа в реальном времени).RERANKING / Уровень UI
Патент влияет на этот этап тем, что модифицирует пользовательский интерфейс: он может заблокировать отображение ответа на исходный запрос (refraining) и отобразить предложение альтернативного запроса.
Входные данные:
Embeddings) фраз.Выходные данные:
not well-formed.Primary Language пользователя ИЛИ Language Proficiency Measure пользователя для этого языка ниже определенного порога.Процесс А: Офлайн-генерация базы данных (Claim 1, 14)
well-formed. Методы включают: проверку частоты использования носителями языка, анализ в авторитетных (trusted) источниках, расчет Perplexity Score, синтаксический анализ.not well-formed фраз поиск кандидатов путем поиска фраз, чьи embeddings находятся на расстоянии, не превышающем пороговое значение, от embedding исходной фразы.Процесс Б: Обработка запроса в реальном времени (Claim 1)
not well-formed (например, путем поиска в базе данных).well-formed ИЛИ язык основной: обработать запрос стандартно.not well-formed И язык не основной: перейти к шагу 5.Система использует разнообразные данные для офлайн-анализа и онлайн-обработки.
trusted documents) на разных языках (например, новостные сайты). Используются как эталон для определения того, насколько естественно звучит фраза.historical interaction records) пользователей. Особое внимание уделяется логам носителей языка для определения стандартов well-formed фраз.Primary Language).Perplexity Score: рассчитывается языковой моделью. Если оценка превышает порог, фраза считается плохо сформированной.embeddings фраз. Если расстояние меньше порога, фразы считаются семантически близкими.Well-Formed Score альтернативы, ее семантическую близость к оригиналу (Distance Metric) и схожесть используемых терминов.embeddings, поиск альтернатив) для обеспечения быстрой работы в реальном времени, но также способна выполнять анализ на лету.embeddings) в общем пространстве. Это подтверждает центральную роль векторных технологий в задачах NLP Google.Language Proficiency Measure). Исправление ошибок активируется только для не носителей языка или пользователей с низким уровнем владения.Perplexity Score).Патент имеет низкое практическое значение для стандартных задач SEO, таких как оптимизация контента для веб-поиска или линкбилдинг. Он описывает внутренние процессы обработки запросов в интерфейсе автоматизированного ассистента.
Однако он предоставляет важный контекст о том, как Google оценивает естественность языка и использует векторные технологии.
Perplexity Score, сравнение с авторитетными источниками) для определения not well-formed контента. Контент на сайте должен быть написан естественно и корректно, чтобы соответствовать ожиданиям этих систем.embeddings. SEO-стратегия должна фокусироваться на создании контента, который семантически богат и покрывает намерения пользователей, обеспечивая близость в векторном пространстве к целевым запросам.well-formed), которые система легко распознает как стандартные команды или вопросы.Perplexity Score. Системы Google, способные определить not well-formed запросы, вероятно, также способны определить и not well-formed контент на страницах.not well-formed, что потенциально может повлиять на восприятие качества контента системами Google.Практических примеров для применения в SEO нет, так как патент описывает функционал интерфейса голосового ассистента.
Пример работы механизма (в контексте Ассистента):
not well-formed, а "What time is it?" — корректная альтернатива (их embeddings близки).not well-formed и что английский не является основным языком пользователя.Влияет ли этот патент на ранжирование сайтов в Google Поиске?
Нет, этот патент не описывает механизмы ранжирования веб-документов. Он сосредоточен на обработке запросов пользователей в интерфейсе автоматизированных ассистентов (например, Google Assistant). Его цель — исправить грамматически некорректные команды пользователя, особенно если он использует неродной язык, а не оценить качество контента на сайтах.
Что такое «плохо сформированная фраза» (not well-formed phrase) по этому патенту?
Это фраза, которая содержит грамматические или синтаксические ошибки, неправильное использование слов или звучит неестественно для носителя языка. Система определяет это, анализируя, как часто такие фразы используют носители языка, проверяя авторитетные источники (например, новости) или используя языковые модели для расчета метрики перплексивности (Perplexity Score).
Как Google использует Embeddings в этом патенте?
Embeddings (векторные представления) используются как основной механизм для поиска альтернативных фраз. Система преобразует исходную (плохую) фразу в вектор и ищет в векторном пространстве хорошо сформированные фразы, которые находятся поблизости. Близость векторов указывает на семантическую схожесть и схожесть намерений (intent).
Будет ли Google исправлять любой некорректный запрос?
Нет. Механизм, описанный в патенте, активируется только при выполнении двух условий: фраза является not well-formed, И пользователь взаимодействует на языке, который не является для него основным (или его уровень владения языком низкий). Если носитель языка использует некорректную фразу (например, сокращение), система обработает ее стандартно.
Как система определяет уровень владения языком пользователя (Language Proficiency Measure)?
Патент упоминает несколько методов: анализ прошлых взаимодействий пользователя (грамматические ошибки, произношение, словарный запас), настройки аккаунта (указанный основной язык), а также активность пользователя, связанная с изучением языка (запросы на перевод, использование обучающих приложений).
Что такое Perplexity Score и как он связан с SEO?
Perplexity Score — это метрика, показывающая, насколько предсказуемой или «естественной» является последовательность слов с точки зрения языковой модели. Высокий балл означает неестественность. Хотя в этом патенте он используется для анализа запросов, наличие таких систем у Google подчеркивает важность написания естественного, грамматически корректного контента на сайте и избегания переоптимизации (keyword stuffing).
Происходит ли анализ фраз в реальном времени?
Патент описывает оба варианта. В одном варианте (Claim 1) идентификация плохих фраз и поиск альтернатив происходят заранее (офлайн). В реальном времени система только предлагает готовую альтернативу. В другом варианте (Claim 11) весь процесс, включая поиск альтернатив, может происходить в реальном времени после получения запроса.
Какое значение этот патент имеет для международной SEO-стратегии?
Он косвенно подчеркивает важность качественной локализации. Если контент сайта переведен плохо и содержит not well-formed фразы, он не будет соответствовать стандартам качества языка, которые Google активно измеряет. Необходимо привлекать носителей языка для создания и проверки контента.
Что произойдет, если пользователь введет плохо сформированный запрос?
Согласно патенту, если механизм активируется, система может воздержаться (refrain) от предоставления ответа на исходный запрос. Вместо этого она покажет хорошо сформированную альтернативу в качестве предложения. Только если пользователь выберет эту альтернативу, система выполнит команду или предоставит ответ.
Может ли этот механизм использоваться для оценки качества контента на сайтах?
Патент не описывает использование этого механизма для оценки сайтов. Однако технологии, лежащие в его основе (анализ грамматики, Perplexity Score, сравнение с авторитетными источниками), безусловно, могут применяться Google для оценки качества и естественности языка в контенте веб-страниц в рамках других алгоритмов.

Семантика и интент

Семантика и интент

Мультиязычность
Семантика и интент

Семантика и интент


Поведенческие сигналы
SERP

Поведенческие сигналы
Семантика и интент
Мультимедиа

Семантика и интент
Безопасный поиск
Поведенческие сигналы

Семантика и интент
SERP
Поведенческие сигналы

Ссылки
SERP
Семантика и интент

Индексация
Ссылки
Техническое SEO

Поведенческие сигналы
Персонализация
Семантика и интент

Семантика и интент
Поведенческие сигналы

Поведенческие сигналы
SERP

SERP
Поведенческие сигналы
