
Google анализирует логи веб-поиска (введенные ключевые слова и последующие клики по результатам), чтобы понять, как пользователи интуитивно классифицируют бизнесы. Эти данные используются для автоматического построения динамической иерархической структуры категорий. Эта структура затем применяется для улучшения точности поиска, в частности, для оптимизации моделей распознавания речи в голосовых системах.
Патент решает проблему низкой точности распознавания названий компаний в автоматизированных голосовых справочных системах (например, службы типа 411). Распознавание конкретного названия среди тысяч возможных вариантов в крупном городе является сложной задачей. Кроме того, патент устраняет проблему жестких, предопределенных таксономий (как в Желтых Страницах), которые часто не совпадают с тем, как пользователи интуитивно классифицируют бизнесы.
Запатентована система для улучшения голосового поиска бизнес-листингов. Ключевое изобретение — это метод сбора пар "категория-бизнес" (category-business pairs) на основе поведения пользователей, включая логи веб-поиска (Search logs) и логи звонков (Call logs), и автоматическое построение динамической иерархической структуры (Hierarchical tree of clustered category nodes). Каждый узел этой структуры связан со специализированной моделью распознавания речи (speech recognition language model). При голосовом запросе система использует категорию, названную пользователем, для выбора наиболее точной модели распознавания названия бизнеса.
Система работает в двух режимах: офлайн и онлайн.
Search logs (какие ключевые слова вводили пользователи и на какие ссылки они кликали) и Call logs. Анализируя эти данные, система извлекает ассоциации между категориями и конкретными бизнесами. Category clustering module автоматически группирует эти ассоциации в иерархическое дерево, используя метрики энтропии (entropy) и сходства (similarity measure). Для каждого узла дерева создается специализированная модель распознавания речи.Mapping module находит узел в иерархическом дереве, наиболее соответствующий названной категории. Speech recognition engine использует специализированную модель этого узла для точного распознавания названия бизнеса.Высокая. Хотя конкретные технологии распознавания речи, упомянутые в патенте (например, N-grams), могли устареть, фундаментальная концепция использования логов веб-поиска и пользовательского поведения (кликов) для понимания и классификации сущностей (бизнесов) критически важна для современного поиска, Knowledge Graph и работы голосовых ассистентов.
Патент имеет высокое стратегическое значение (85/100), особенно для Local SEO и Entity SEO. Он прямо указывает (Claim 13), что Google использует данные веб-поиска (запросы и клики) для определения того, к каким категориям принадлежит бизнес. Это подчеркивает важность не только ранжирования по релевантным запросам, но и обеспечения того, чтобы пользователи кликали на ваш сайт при поиске по этим категориям, так как это напрямую влияет на классификацию вашей бизнес-сущности системой.
Category-business pairs и строит/обновляет Hierarchical tree, используя алгоритмы кластеризации.Similarity scores.Search logs для определения связи между ключевыми словами в запросе и выбранным пользователем результатом поиска (кликом), извлекая Category-business pairs.N-grams), используемая для предсказания последовательности слов в речи. В патенте эти модели специализированы для каждого узла дерева.Claim 1 (Независимый пункт): Описывает основной метод создания системы распознавания речи на основе данных.
speech recognition language model), специализированной для распознавания бизнесов, связанных с этими категориями.Ядро изобретения — это автоматическое создание структуры, связывающей категории со специализированными языковыми моделями на основе собранных данных.
Claim 8 (Зависимый от 1): Детализирует алгоритм построения структуры данных.
entropy values) существующих узлов.Система использует энтропию для автоматической кластеризации. Если узел слишком разнообразен (высокая энтропия), он разбивается на более специфичные узлы.
Claim 12 и 13 (Зависимые от 1): Определяют источник данных для построения структуры.
search log) (Claim 12).keyword searches) и последующем выборе результатов поиска (кликах) пользователями (Claim 13).Это критически важный пункт для SEO. Он юридически закрепляет использование данных веб-поиска (запрос + клик) как механизма для понимания того, как пользователи классифицируют сущности (бизнесы).
Изобретение затрагивает несколько этапов поисковой архитектуры, хотя его основное применение описано в контексте специализированной системы голосового поиска.
CRAWLING & Data Acquisition (Сбор данных)
Система активно собирает данные не путем сканирования веба, а путем логирования взаимодействий пользователей:
Search logs (запросы и клики) через Pairing module.Call logs.INDEXING & Feature Extraction (Индексирование и извлечение признаков)
На этом этапе происходит основная офлайн-обработка:
Category clustering module анализирует собранные пары категория-бизнес.Hierarchical tree of clustered category nodes. Это процесс создания индекса категорий, основанного на поведении пользователей.speech recognition language models.QUNDERSTANDING / RANKING (Понимание запросов / Ранжирование)
В контексте голосовой системы, это этап распознавания речи:
Mapping module использует иерархическое дерево для определения наиболее релевантного узла (и соответствующей языковой модели) на основе Similarity score.Speech recognition engine использует эту модель для распознавания названия бизнеса.Входные данные (Офлайн):
Search logs (Keyword queries, Selected links/Clicks).Call logs.Выходные данные (Офлайн):
Hierarchical tree of clustered category nodes.speech recognition language models.Search logs и Call logs.Процесс А: Построение Иерархического Дерева (Офлайн)
Similarity measure), например, TF-IDF.language models) для каждого узла в финальном дереве.Процесс Б: Обработка Голосового Запроса (Онлайн)
Similarity scores) между категорией T1 и узлами в иерархическом дереве.Патент фокусируется на использовании поведенческих данных для построения структуры классификации.
Search logs): Ключевые слова, введенные пользователями (используются как категории), и результаты поиска, которые они выбрали (клики), указывающие на конкретный бизнес.Call logs): Категории и названия бизнесов, распознанные в ходе предыдущих голосовых взаимодействий.Система использует статистические методы и теорию информации для кластеризации.
Hierarchical tree с помощью алгоритмов кластеризации (используя Entropy и TF-IDF), отражая реальное, интуитивное восприятие пользователей.Pairing module, который анализирует запрос и последующий клик для создания пары категория-бизнес, является формой обучения, где клик служит сигналом подтверждения релевантности и ассоциации.Search logs.Этот патент является одним из ранних и четких подтверждений того, что Google использует поведенческие данные из веб-поиска для построения своего графа знаний о сущностях (в данном случае, о бизнесе). Он показывает, что классификация не является статической, а динамически обучается на основе совокупного поведения пользователей. Стратегически это означает, что SEO-специалисты должны фокусироваться на управлении тем, как их бизнес воспринимается пользователями в поиске, так как это восприятие (выраженное через клики) становится реальностью для алгоритмов Google.
Сценарий: Улучшение классификации локального бизнеса
Задача: Кофейня хочет, чтобы Google ассоциировал её не только с категорией "кофейня", но и с "лучшее место для завтрака".
Pairing module фиксирует эти взаимодействия и создает пары ("место для завтрака", "[Название кофейни]"). Category clustering module использует эти пары для обновления Hierarchical tree, помещая кофейню в кластер, связанный с завтраками. Это улучшает понимание сущности системой.Как именно Google узнает, к какой категории отнести мой бизнес, согласно этому патенту?
Google не использует предопределенный список категорий. Вместо этого система анализирует логи веб-поиска (Search logs): какие ключевые слова вводили пользователи и на какие сайты они после этого кликали (Claim 13). Если многие пользователи ищут "ремонт айфонов" и кликают на ваш сайт, система создает пару ("ремонт айфонов", "Ваш Бизнес") и использует её для автоматической классификации вашего бизнеса.
Что такое "Иерархическое дерево кластеризованных узлов категорий"?
Это динамическая структура данных, которая организует бизнесы и категории на основе того, как пользователи их ассоциируют. Она строится автоматически с помощью алгоритмов кластеризации. Например, узел "Рестораны" может иметь дочерние узлы "Итальянские рестораны" и "Суши-бары". Эта структура отражает интуитивное понимание пользователей, а не жесткую таксономию.
Какое значение имеют клики (CTR) в контексте этого патента?
Клики имеют критическое значение. В патенте клик по результату поиска после ввода ключевого слова интерпретируется как подтверждение того, что пользователь ассоциирует этот бизнес с введенной категорией. Таким образом, высокий CTR по релевантным категориальным запросам напрямую влияет на то, как Google классифицирует вашу сущность.
Что такое Энтропия (Entropy) и как она используется?
Энтропия используется в процессе кластеризации как мера разнообразия внутри узла дерева. Если узел содержит слишком много разных типов бизнесов (высокая энтропия), система автоматически разделяет его на более специфичные подузлы (низкая энтропия). Это позволяет создавать точные и узкоспециализированные категории.
Как этот патент связан с голосовым поиском?
Патент напрямую направлен на улучшение голосового поиска. Созданная иерархическая структура категорий используется для выбора специализированной модели распознавания речи. Когда пользователь говорит категорию (например, "Суши-бар"), система активирует модель, которая лучше распознает названия суши-баров, что значительно повышает точность определения названия компании.
Влияет ли этот механизм на обычный веб-поиск или только на голосовой?
Хотя конечная цель патента — улучшение голосового поиска, механизм сбора данных и классификации основан на анализе логов веб-поиска. Это означает, что система формирует понимание о вашем бизнесе (его сущности и категориях) на основе поведения пользователей в обычном веб-поиске. Это понимание затем используется во всех сервисах Google.
Что делать, если Google неправильно классифицирует мой бизнес?
Необходимо скорректировать сигналы, которые вы отправляете. Проанализируйте, по каким запросам пользователи кликают на ваш сайт (используя GSC). Убедитесь, что контент сайта и мета-теги четко соответствуют желаемой категории. Необходимо стимулировать клики по правильным категориальным запросам, чтобы "научить" систему новым ассоциациям.
Упоминаются ли в патенте TF-IDF?
Да, в описании патента упоминается использование TF (Term Frequency) и IDF (Inverse Document Frequency) как части меры сходства (Similarity measure). Это используется для определения того, насколько близки новая пара категория-бизнес к существующему узлу в дереве, а также для сопоставления запроса пользователя с узлами.
Актуален ли этот патент, учитывая его возраст?
Да, патент высоко актуален стратегически. Хотя конкретные технологии распознавания речи могли эволюционировать, фундаментальный принцип использования массовых поведенческих данных из веб-поиска для классификации сущностей лежит в основе современных систем Google, включая Knowledge Graph.
Как этот патент влияет на стратегию Local SEO?
Он подчеркивает, что Local SEO — это не только управление листингом в Google Business Profile. Необходимо активно работать над тем, чтобы ваш сайт получал клики по локальным категориальным запросам в веб-поиске, так как это напрямую формирует понимание системой того, чем занимается ваш бизнес и к каким категориям он относится.

Local SEO
Поведенческие сигналы
Семантика и интент

Local SEO
Семантика и интент
SERP

Local SEO
Индексация
SERP

Семантика и интент

Local SEO
Семантика и интент

Семантика и интент
Техническое SEO
EEAT и качество

Семантика и интент
EEAT и качество
Индексация

Персонализация
Семантика и интент
Поведенческие сигналы

Поведенческие сигналы
SERP
Семантика и интент

Local SEO
SERP
Ссылки

Поведенческие сигналы

Knowledge Graph
Семантика и интент
EEAT и качество

Поведенческие сигналы
Ссылки
SERP

Индексация
Ссылки
Техническое SEO

Поведенческие сигналы
Семантика и интент
SERP
