
Google использует механизм для преобразования контента, выделенного пользователем на экране (например, жестом обводки), в оптимизированный поисковый запрос. Система генерирует несколько кандидатов и оценивает их вероятность. Ключевая особенность — нормализация оценок по длине запроса. Это позволяет системе отдавать предпочтение более длинным и точным запросам, а не коротким и частотным, улучшая релевантность выдачи при использовании функций типа "Circle to Search".
Патент решает несколько ключевых проблем, возникающих при инициировании поиска через взаимодействие с контентом на экране (особенно на мобильных устройствах):
Запатентована система (в частности, компонент Query Selector), которая преобразует данные о жесте пользователя (Gesture Data) в релевантный поисковый запрос. Суть изобретения заключается в методе оценки и нормализации кандидатов в запросы. Система рассчитывает вероятность (Likelihood Score) для каждого кандидата, а затем корректирует эту оценку с помощью Normalization Factor, основанного на длине запроса (количестве символов и/или слов). Это позволяет повысить приоритет более длинных и специфичных запросов.
Система работает следующим образом:
Gesture Data, включающие выделенный контент и контекст (proximal content).Query Selector анализирует контент и генерирует набор кандидатов в поисковые запросы (Candidate Search Queries).Likelihood Score, основанный на частоте его использования в исторических логах поиска или частоте встречаемости в корпусе документов.Normalization Factor, основанный на длине запроса (например, насколько часто встречаются запросы именно такой длины).Likelihood Score делится на Normalization Factor. Это уменьшает влияние популярности коротких запросов и повышает вес длинных.Высокая. С развитием мобильного поиска и внедрением функций типа "Circle to Search" (Обвести и найти) и Google Lens, механизмы точного преобразования визуального и текстового контекста в поисковый запрос стали критически важными. Принципы интерпретации интента и компенсации смещения в сторону коротких запросов остаются фундаментальными для систем понимания запросов (Query Understanding).
Влияние на SEO умеренное (4/10). Патент не описывает алгоритмы ранжирования, а фокусируется на пользовательском интерфейсе (UI) и понимании запросов (Query Understanding). Однако он имеет важное стратегическое значение: Google активно развивает методы, позволяющие пользователям легко формулировать (или системе формулировать за них) длинные и точные запросы. Это подчеркивает важность оптимизации контента под специфичные (long-tail) интенты и использования структурированных данных, поскольку Semantic Signals и Meta Information используются для уточнения выбора запроса.
Likelihood Score. Основана на длине запроса (количестве символов/слов). Служит для компенсации смещения в сторону более коротких запросов.Gesture Data, генерацию, оценку и выбор финального поискового запроса.Claim 1 (Независимый пункт): Описывает основной метод работы системы.
Gesture Data, определяющих взаимодействие пользователя с частью отображаемого контента.Gesture Data.Candidate Search Queries.Likelihood Score (вероятность того, что это и есть предполагаемый запрос).Likelihood Score с использованием Normalization Factor. Ключевой момент: Normalization Factor основан на количестве символов в кандидате.Claim 4 (Зависимый): Уточняет, что исходный Likelihood Score основан на количестве вхождений этого запроса в наборе ранее полученных поисковых запросов (исторические логи).
Claim 5 и 7 (Зависимые): Детализируют расчет Normalization Factor. Он основан на количестве поисковых запросов в исторических логах, которые имеют такое же количество символов (Claim 5) и/или такое же количество слов (Claim 7), что и кандидат.
Claim 8 (Зависимый): Уточняет механизм корректировки. Скорректированная оценка определяется как соотношение (ratio) между Likelihood Score и Normalization Factor (т.е. деление).
Claim 9 (Зависимый): Описывает дополнительный бустинг. Если для кандидата идентифицирован Semantic Signal (указывающий на конкретное семантическое значение), его скорректированная оценка повышается.
Claim 10 (Зависимый): Описывает другой дополнительный бустинг. Если кандидат соответствует Meta Information Label, связанному с исходным документом, его скорректированная оценка повышается.
Claim 11 (Зависимый): Предоставляет конкретный пример расчета для кандидата с 'n' словами и 'x' символами.
Normalization Factor определяется как вероятность получения любого поискового запроса, имеющего 'n' слов и 'x' символов.Likelihood Score кандидата) / (Normalization Factor).Изобретение применяется преимущественно на этапе понимания запроса, используя исторические данные и данные, полученные при индексировании.
INDEXING – Индексирование и извлечение признаков
На этом этапе система собирает данные, которые могут использоваться для оценки кандидатов:
Likelihood Score).Meta Information Labels из документов.Semantic Signals и сущностей в контенте.QUNDERSTANDING – Понимание Запросов
Это основной этап применения патента. Query Selector выполняет следующие функции:
Gesture Data (выделенный контент и proximal content), полученных от пользователя в реальном времени.Candidate Search Queries.Likelihood Scores с использованием Historical Data (логов запросов).Normalization Factor для корректировки оценок по длине запроса.Semantic Signals и Meta Information.RANKING – Ранжирование
Система ранжирования получает на вход уже оптимизированный запрос, выбранный Query Selector, и выполняет стандартный поиск.
Входные данные:
Gesture Data (выделенный контент, proximal content).Historical Data (частотность запросов, частотность длин запросов).Meta Information Labels).Выходные данные:
Candidate Search Queries, передаваемых поисковой системе.Этап 1: Сбор данных и инициализация
Gesture Data от устройства пользователя, указывающие на выделенный контент.proximal content (контекст).Этап 2: Генерация кандидатов
Candidate Search Queries. Это может включать удаление стоп-слов, исправление орфографии, использование синонимов или генерацию N-грамм.Этап 3: Исходная оценка вероятности
Likelihood Score.Historical Data (логах поиска) или частоты встречаемости фразы в корпусе документов.Этап 4: Нормализация по длине
Normalization Factor. Это значение представляет собой общую вероятность того, что система получит любой запрос длины (n, x), на основе Historical Data.Adjusted Likelihood Score) путем деления исходного Likelihood Score на Normalization Factor. Этап 5: Дополнительные корректировки (Бустинг)
Semantic Signal (например, является ли кандидат адресом, названием продукта). Если да, скорректированная оценка повышается.Meta Information Label исходного документа. Если да, скорректированная оценка повышается.Этап 6: Выбор и выполнение
Proximal content (текст, расположенный в непосредственной близости), используемый для контекста.Meta Information Labels (метки метаинформации), связанные с исходным документом или медиафайлами (изображениями, видео) на странице.Historical Data (журналы запросов). Они критически важны для определения как частотности конкретных запросов (для Likelihood Score), так и частотности запросов определенной длины (для Normalization Factor).Normalization Factor, чем короткие.Likelihood Score) / (Normalization Factor). Это ключевая метрика для выбора финального запроса.Normalization Factor, основанный на количестве символов и слов, является ядром изобретения. Он позволяет сравнивать запросы разной длины на равных условиях, повышая вес long-tail запросов.proximal content) и, что более важно для SEO, использование Semantic Signals (сущностей, типов данных) и Meta Information для повышения уверенности в выборе правильного запроса.Semantic Signal повышает оценку кандидата в запросы.Meta Information Label также повышает его оценку.proximal content) для ключевых фраз, чтобы система могла правильно интерпретировать контекст.Semantic Signals, что может привести к выбору менее оптимального запроса при взаимодействии пользователя с контентом.Патент подтверждает стратегию Google по переходу от буквального понимания запросов к глубокому пониманию интента и контекста. Для SEO это означает, что создание авторитетного контента, отвечающего на специфические и детальные вопросы пользователей, становится все более приоритетным. Механизмы, подобные описанному, позволяют Google направлять трафик по более сложным и конверсионным запросам, даже если пользователь изначально не планировал их вводить. Это также подчеркивает важность мобильной оптимизации и UX.
Сценарий: Использование "Circle to Search" на странице обзора техники
Likelihood Score из-за высокой частотности в логах.Normalization Factor (запросы такой длины очень часты). Их относительная оценка снижается.Normalization Factor (запросы такой длины редки). Его относительная оценка значительно возрастает.Semantic Signal для Кандидата 3 (Название продукта). Оценка повышается еще больше.Что такое Normalization Factor и почему он так важен в этом патенте?
Normalization Factor — это коэффициент, основанный на длине запроса (количестве слов и символов). Он отражает, насколько часто встречаются запросы именно такой длины в общей массе. Он критически важен, потому что компенсирует естественное смещение в сторону коротких запросов. Деление исходной оценки вероятности на этот фактор позволяет более длинным и точным запросам конкурировать с короткими и популярными, улучшая тем самым релевантность поиска.
Означает ли этот патент, что Google предпочитает длинные запросы коротким?
Не совсем. Google предпочитает точность и релевантность. Поскольку пользователи склонны вводить короткие запросы (особенно на мобильных), этот механизм помогает системе выявить более длинный и точный интент из контекста взаимодействия. Если короткий запрос является наиболее релевантным, он будет выбран. Но если есть более точный длинный кандидат, система не будет его игнорировать только из-за его низкой общей частотности.
Что такое Semantic Signal и как это влияет на SEO?
Semantic Signal — это индикатор того, что система распознала во фразе конкретную сущность или тип данных (например, адрес, имя человека, название продукта). Если сигнал обнаружен, вероятность выбора этой фразы в качестве запроса повышается. Для SEO это подчеркивает критическую важность использования микроразметки (Schema.org) и четкого структурирования контента для помощи Google в идентификации ключевых сущностей на странице.
Как Meta Information Label используется в этом алгоритме?
Meta Information Label (например, заголовки, мета-теги документа или alt-тексты изображений) используется как дополнительный сигнал подтверждения. Если сгенерированный кандидат в запросы совпадает с метаданными исходного документа, система повышает его оценку вероятности. Это подтверждает важность точной и релевантной оптимизации метаданных на сайте.
Применяется ли этот алгоритм только для текста?
Патент в основном описывает обработку текста, выделенного жестом. Однако он упоминает, что выделенный контент может включать текст, изображения, видео. Для медиаконтента система может использовать связанную с ним метаинформацию (например, alt-текст или подписи) и контекст для генерации и оценки кандидатов в запросы.
Какое отношение этот патент имеет к функции "Circle to Search"?
Этот патент описывает базовую технологию, которая лежит в основе современных функций, таких как "Circle to Search" (Обвести и найти) или "Touch to Search". Он предоставляет механизм для интерпретации того, что именно пользователь обвел на экране, и преобразования этого в наиболее эффективный поисковый запрос, используя описанные методы нормализации и оценки.
Как SEO-специалист может оптимизировать контент под этот механизм?
Ключевая стратегия — использование естественного языка, включающего полные и описательные фразы. Вместо того чтобы просто упоминать ключевые слова, интегрируйте их в предложения, которые сами по себе могут служить точными поисковыми запросами. Это повышает вероятность того, что при выделении текста пользователем система сгенерирует релевантный long-tail запрос.
Использует ли система контекст вокруг выделенного текста?
Да, патент упоминает идентификацию контента, проксимального к жесту (proximal content). Например, если пользователь выделил одно слово, система может проанализировать слова до и после него в предложении, чтобы лучше понять контекст и сгенерировать более точные кандидаты в запросы.
Насколько сильно повышается оценка при наличии Semantic Signal или Meta Match?
Патент не указывает конкретных числовых значений или коэффициентов для этого бустинга. Он лишь утверждает, что скорректированная оценка вероятности улучшается (improving/adjusting the adjusted likelihood score) при выполнении этих условий. Логично предположить, что это дает существенное преимущество при выборе финального запроса.
Зависит ли работа алгоритма от исторических данных пользователя?
Да, в одном из вариантов реализации упоминается, что кандидаты, которые ранее отправлялись конкретным пользователем (пороговое число раз), могут быть также повышены в приоритете. Однако основные механизмы расчета Likelihood Score и Normalization Factor полагаются на агрегированные исторические данные всех пользователей (Historical Data).

Семантика и интент
Мультимедиа
Персонализация

Семантика и интент

Поведенческие сигналы
SERP

Персонализация
Поведенческие сигналы
SERP

Семантика и интент
SERP

SERP
Семантика и интент
Ссылки

Семантика и интент
Поведенческие сигналы
SERP

Мультиязычность
Поведенческие сигналы
Персонализация

Семантика и интент
Поведенческие сигналы
Knowledge Graph

Мультимедиа
EEAT и качество
Семантика и интент

EEAT и качество
Ссылки

Персонализация
Поведенческие сигналы
SERP

Ссылки
Мультимедиа
Поведенческие сигналы

Поведенческие сигналы
SERP

Local SEO
Поведенческие сигналы
