Close Menu
    Telegram
    SEO HARDCORE
    • Разборы патентов
      • Патенты Google
      • Патенты Яндекс
    • Скоро
      SEO инструменты
    • Скоро
      SEO аналитика
    SEO HARDCORE
    Разборы патентов • Патенты Google

    Как Google использует анализ отзывов и веб-страниц для определения категории бизнеса по неявным локальным запросам

    ANSWERING REQUESTS RELATED TO PLACES OF INTEREST (Ответы на запросы, связанные с местами интереса)
    • US20160203177A1
    • Google LLC
    • 2016-07-14
    • 2013-01-15
    2013 SERP Патенты Google Поведенческие сигналы Семантика и интент

    Google использует систему для понимания локальных запросов, которые явно не указывают категорию места (например, «где поесть рис с бобами?»). Система анализирует тексты веб-страниц и отзывы, чтобы связать фразы (N-граммы) с конкретными категориями бизнеса (например, «рис с бобами» = «Мексиканский ресторан»). Это позволяет точно интерпретировать интент пользователя и предоставлять релевантные локальные результаты.

    • Описание
    • Детальный разбор
    • Выводы
    • Практика
    • Вопросы и ответы
    • Наверх

    Описание

    Какую задачу решает

    Патент решает проблему интерпретации неоднозначных или неявных запросов, касающихся локальных мест или бизнесов (places of interest), особенно в диалоговых системах. Часто пользователи ищут конкретные продукты, услуги или атрибуты, не указывая явную категорию бизнеса (например, ищут «рис и бобы», а не «мексиканский ресторан»). Система призвана точно определить категорию места, которое ищет пользователь, чтобы предоставить релевантные локальные результаты.

    Что запатентовано

    Запатентована система, которая классифицирует запрос как локальный (place-triggering request) и определяет релевантную категорию бизнеса на основе фраз (N-grams) в запросе. Ключевым элементом является использование заранее созданной базы данных (N-gram category repository), которая связывает фразы с категориями на основе анализа документов (например, отзывов, веб-страниц), связанных с различными местами.

    Как это работает

    Система работает в двух режимах:

    • Офлайн (Индексирование): Система анализирует документы (отзывы, сайты), определяет их категорию и извлекает N-grams. На основе частоты встречаемости фразы в документах определенной категории вычисляется Category Score. Эта связь сохраняется в репозитории.
    • Онлайн (Обработка запроса): При получении запроса система определяет, является ли он локальным (place-triggering). Если да, из запроса извлекаются N-grams. Система ищет эти N-grams в репозитории и определяет наиболее вероятную категорию на основе Category Scores, превышающих порог уверенности. Затем выполняется поиск мест, соответствующих этой категории.

    Актуальность для SEO

    Высокая. Понимание неявных локальных запросов критически важно для Google Maps, локального поиска и голосовых ассистентов. Механизм, описывающий, как анализ контента (особенно пользовательского, такого как отзывы) напрямую влияет на понимание того, какие услуги предлагает бизнес и по каким запросам его показывать, остается фундаментальным для локального SEO.

    Важность для SEO

    Патент имеет высокое значение (85/100) для локального SEO (Local SEO). Он демонстрирует механизм, посредством которого Google связывает язык, используемый в отзывах и на веб-сайтах бизнеса, с конкретными категориями. Это подчеркивает, что ранжирование в локальном поиске зависит не только от явно указанных категорий в Google Business Profile, но и от контента, описывающего продукты, услуги и атрибуты бизнеса. Для SEO-специалистов это означает необходимость стратегической работы с текстами отзывов и контентом сайта.

    Детальный разбор

    Термины и определения

    Place-triggering request (Запрос, инициирующий поиск места)
    Запрос (вопрос, утверждение или команда), который система классифицирует как поиск локального места интереса (бизнеса, адреса). Часто содержит триггеры, такие как «где», «рядом», «мне нужно».
    N-gram (N-грамма)
    Фраза, состоящая из N слов. В контексте патента это ключевые фразы, извлекаемые как из документов (отзывов, сайтов), так и из запросов пользователя.
    Category of places of interest (Категория мест интереса)
    Классификация бизнеса или места (например, «Мексиканский ресторан», «Автосервис»).
    Category Score (Оценка категории)
    Метрика, отражающая силу связи между N-gram и определенной категорией. Вычисляется на основе частоты появления N-gram в документах, принадлежащих к этой категории.
    N-gram category repository (Репозиторий категорий N-грамм)
    База данных, хранящая связи между N-grams, категориями и соответствующими Category Scores.
    Dialog system (Диалоговая система)
    Система, обрабатывающая запросы пользователя (часто голосовые) и предоставляющая ответы.
    Similarity threshold (Порог схожести/уверенности)
    Минимальное значение Category Score, необходимое для того, чтобы считать связь между N-gram и категорией достаточно надежной для использования в ответе.
    Normalization (Нормализация)
    Процесс объединения схожих категорий (например, «Мексиканский ресторан» и «Мексиканская кухня») в одну репрезентативную категорию и корректировка их Category Scores.

    Ключевые утверждения (Анализ Claims)

    Claim 1 (Независимый пункт): Описывает основной метод обработки запроса для идентификации места интереса.

    1. Система получает запрос.
    2. Определяется, классифицируется ли запрос как place-triggering request (т.е. требует ли ответ идентификации места интереса).
    3. В случае положительного ответа генерируются множественные N-grams (каждая состоит из двух или более слов) из запроса.
    4. Для КАЖДОЙ сгенерированной N-gram идентифицируется ЕДИНСТВЕННАЯ категория-кандидат. Эта категория должна быть (i) связана с N-gram и (ii) иметь наивысший Category Score (отражающий наибольшее количество раз, когда N-gram встречалась в документах этой категории).
    5. Для КАЖДОЙ N-gram сравнивается Category Score ее категории-кандидата с similarity threshold.
    6. Выбирается конкретная категория из числа кандидатов, чей Category Score удовлетворяет порогу.
    7. Выбираются одно или несколько мест интереса, соответствующие этой конкретной категории.
    8. Предоставляется ответ, идентифицирующий выбранные места.

    Ядром изобретения является механизм точного определения категории бизнеса по неоднозначному запросу. Он опирается на предварительно вычисленные статистические ассоциации (Category Scores), полученные путем анализа корпуса документов (например, отзывов), и использует пороговые значения для обеспечения точности интерпретации.

    Где и как применяется

    Изобретение затрагивает несколько этапов поиска, связывая индексирование контента с пониманием запросов для улучшения локального поиска.

    INDEXING – Индексирование и извлечение признаков
    На этом этапе происходит ключевая офлайн-работа. Система сканирует и анализирует документы (веб-страницы, отзывы, бизнес-листинги). Происходит извлечение признаков: определение категории документа и извлечение N-grams. Вычисляются Category Scores, связывающие фразы с категориями. Результаты сохраняются в N-gram category repository.

    QUNDERSTANDING – Понимание Запросов
    Это основная область применения патента в реальном времени. Система выполняет классификацию интента и семантический анализ:

    1. Классификация Интента: Определяется, является ли запрос локальным (place-triggering).
    2. Извлечение Категории: Если интент локальный, система пытается преобразовать N-grams из запроса в конкретную бизнес-категорию, используя N-gram category repository и проверяя Category Scores.

    RANKING – Ранжирование (Локальный поиск)
    Результат этапа QUNDERSTANDING (идентифицированная категория) используется для формирования фактического поискового запроса к локальному индексу (например, Google Maps). Вместо поиска по исходному запросу «где рис и бобы», система выполняет поиск по категории «Мексиканский ресторан» в локации пользователя.

    Входные данные:

    • Офлайн: Документы, связанные с местами интереса (отзывы, веб-страницы).
    • Онлайн: Запрос пользователя; N-gram category repository; местоположение пользователя.

    Выходные данные:

    • Офлайн: Заполненный N-gram category repository с Category Scores.
    • Онлайн: Идентифицированная категория места интереса; финальный ответ пользователю с перечнем мест.

    На что влияет

    • Конкретные типы контента: Критически влияет на отзывы пользователей (UGC) и контент на сайтах локальных бизнесов (описания услуг, меню, статьи в блогах). Именно этот контент является источником данных для обучения системы.
    • Специфические запросы: Наибольшее влияние оказывается на неявные информационные и коммерческие локальные запросы, где пользователь описывает потребность, продукт или атрибут, но не называет категорию.
    • Конкретные ниши или тематики: Влияет на все локальные ниши, особенно те, где услуги или продукты имеют устоявшиеся названия или сленг (рестораны, медицина, автосервисы, ритейл).

    Когда применяется

    • Триггеры активации: Алгоритм активируется, когда запрос классифицирован как place-triggering request. Это часто происходит при наличии слов, указывающих на местоположение («где», «рядом», «найти место», «я хочу») или при использовании мобильного устройства с активной геолокацией.
    • Условия работы: Алгоритм применяется, если N-grams из запроса могут быть сопоставлены с категориями в репозитории с уровнем уверенности (Category Score) выше установленного similarity threshold.

    Пошаговый алгоритм

    Процесс А: Офлайн-генерация репозитория (Индексирование)

    1. Сбор данных: Идентификация документов, содержащих информацию о местах интереса (например, страницы отзывов, официальные сайты).
    2. Идентификация категории: Определение одной или нескольких категорий, связанных с каждым документом.
    3. Извлечение N-грамм: Извлечение фраз (N-grams) из текста документа. Может включать исключение стоп-слов и стемминг (приведение слов к основе).
    4. Расчет оценок: Генерация или обновление Category Scores для каждой пары (N-gram, категория). Оценка увеличивается каждый раз, когда N-gram встречается в документе данной категории.
    5. Нормализация категорий: Идентификация схожих категорий (например, «Мексиканский ресторан» и «Мексиканская кухня»). Выбор одной представительной категории и корректировка ее Category Score на основе оценок всех схожих категорий.
    6. Выбор и сохранение: Для каждой N-gram выбор категории с наивысшим Category Score в качестве основной ассоциации и сохранение данных в N-gram category repository.

    Процесс Б: Обработка запроса в реальном времени (Поиск)

    1. Получение запроса: Система получает запрос от пользователя.
    2. Классификация интента: Определение того, является ли запрос place-triggering request.
    3. Извлечение N-грамм из запроса: Если запрос локальный, из него извлекаются N-grams. Триггерные слова могут быть исключены.
    4. Поиск соответствий: Сравнение извлеченных N-grams с данными в N-gram category repository.
    5. Идентификация кандидатов: Для каждой N-gram определяется единственная категория-кандидат с наивысшим Category Score.
    6. Фильтрация по порогу: Сравнение Category Scores кандидатов с similarity threshold.
    7. Выбор категории: Выбор итоговой категории из числа кандидатов, прошедших фильтрацию.
    8. Выполнение поиска: Использование выбранной категории (в сочетании с геолокацией пользователя) для поиска релевантных мест интереса в локальном индексе.
    9. Формирование ответа: Предоставление пользователю списка найденных мест.

    Какие данные и как использует

    Данные на входе

    Патент фокусируется на использовании текстовых данных для построения ассоциаций между фразами и категориями.

    • Контентные факторы: Текст документов, связанных с местами интереса. Это включает пользовательский контент (отзывы, обзоры) и контент, предоставленный владельцами (официальные веб-страницы, бизнес-листинги). Из этого текста извлекаются N-grams.
    • Структурные факторы (Косвенно): Данные, позволяющие определить категорию документа на этапе индексирования (например, теги, метаданные).
    • Географические факторы: На этапе выполнения поиска система использует геолокацию пользователя для нахождения ближайших мест, соответствующих найденной категории.

    Какие метрики используются и как они считаются

    • Category Score (Оценка категории): Ключевая метрика. Отражает силу ассоциации между N-gram и категорией. Рассчитывается на основе частотности: количества документов данной категории, в которых встретилась эта N-gram.
    • Similarity Threshold (Порог схожести): Пороговое значение для Category Score, используемое для валидации связи между фразой и категорией на этапе обработки запроса.
    • Нормализация оценок: При объединении схожих категорий Category Scores могут агрегироваться (например, усредняться, суммироваться или выбираться максимальное значение) для создания оценки представительной категории.
    • Методы анализа текста (NLP): Упоминается использование стемминга (приведение слов к основе) и удаление стоп-слов для повышения точности извлечения и сопоставления N-grams.

    Выводы

    1. Контент и отзывы определяют понимание категории: Патент явно показывает, что Google активно использует текст веб-страниц и, что особенно важно, отзывы пользователей (UGC), чтобы понять, к какой категории относится бизнес и какие услуги он предлагает. Система учится на языке пользователей.
    2. Важность специфических N-грамм (продуктов и услуг): Ассоциации строятся на конкретных фразах. Наличие в контенте уникальных, специфичных для ниши терминов, названий продуктов или услуг напрямую влияет на способность системы правильно классифицировать бизнес по неявным запросам.
    3. Механизм неявного локального поиска: Патент описывает конкретный алгоритм преобразования запроса о продукте/услуге в запрос о категории бизнеса (Query Transformation). Это объясняет, как Google обрабатывает запросы типа «хочу суши» или «нужен ибупрофен».
    4. Category Score как мера уверенности: Система использует Category Score, основанный на частоте упоминаний, для оценки надежности ассоциации. Чем чаще фраза встречается в контексте определенной категории, тем выше уверенность системы.
    5. Нормализация категорий: Google агрегирует схожие категории (например, «Автомойка» и «Детейлинг»), что позволяет системе иметь более широкое понимание тематики, даже если пользователи и владельцы используют разные термины.

    Практика

    Best practices (это мы делаем)

    • Стратегическая работа с отзывами (Review Management): Активно стимулируйте клиентов оставлять подробные отзывы, которые упоминают конкретные продукты, услуги и атрибуты. Согласно патенту, текст отзывов является ключевым источником данных для N-gram category repository. Чем больше релевантных N-grams в отзывах, тем точнее система свяжет бизнес с запросами пользователей.
    • Оптимизация контента сайта и GBP под услуги и продукты: Убедитесь, что на сайте бизнеса и в Google Business Profile (в описании, услугах, меню, постах) используется естественный язык, описывающий то, что ищут пользователи. Внедряйте специфичные N-grams, чтобы помочь системе построить сильные ассоциации (высокий Category Score) с вашей категорией.
    • Анализ языка целевой аудитории и конкурентов: Изучайте, как пользователи описывают ваши услуги в своих запросах и отзывах о конкурентах. Используйте эти фразы в своем контенте для улучшения связи между запросом и вашей категорией.
    • Мониторинг локальной выдачи по неявным запросам: Проверяйте, появляется ли ваш бизнес в локальной выдаче (Local Pack/Maps) по запросам, связанным с вашими продуктами/услугами, но не содержащим название категории. Отсутствие видимости может указывать на слабые ассоциации в N-gram category repository.

    Worst practices (это делать не надо)

    • Игнорирование содержания отзывов: Рассматривать отзывы только как фактор репутации (звездочки) и игнорировать их текстовое содержание — это упущенная возможность. Текст отзывов напрямую обучает поисковую систему.
    • Создание переоптимизированного или общего контента: Использование только общих фраз или неестественное насыщение текста ключевыми словами категории (например, «лучшая пиццерия в Москве») менее эффективно для этого механизма, чем естественное описание конкретных предложений (например, «пицца пепперони на тонком тесте»).
    • Отсутствие на сайте детализации услуг/продуктов: Если на сайте или в GBP не упоминаются конкретные услуги или товары, система не сможет извлечь релевантные N-grams и связать их с вашим бизнесом, полагаясь только на отзывы.

    Стратегическое значение

    Патент подтверждает стратегическую важность контент-маркетинга и управления репутацией (ORM) в локальном поиске. Он демонстрирует переход от простого сопоставления ключевых слов к семантическому пониманию услуг бизнеса, основанному на анализе больших объемов текстовых данных (особенно UGC). Для долгосрочной стратегии в Local SEO необходимо фокусироваться на том, чтобы контент, ассоциированный с бизнесом, максимально точно и полно описывал его деятельность на языке клиентов.

    Практические примеры

    Сценарий: Оптимизация кофейни для привлечения посетителей, ищущих конкретный тип кофе.

    1. Анализ (Офлайн-процесс Google): Google анализирует отзывы о кофейнях. Он видит, что фраза (N-gram) «лучший флэт уайт» часто встречается в отзывах категории «Кофейня». Google присваивает этой паре высокий Category Score.
    2. Действия SEO-специалиста:
      • Стимулировать отзывы: Просить бариста предлагать гостям, заказавшим флэт уайт, оставить отзыв, если им понравился напиток.
      • Оптимизация сайта и GBP: Добавить в меню на сайте и в GBP раздел с описанием фирменного флэт уайта.
    3. Обработка запроса (Онлайн-процесс Google): Пользователь вводит запрос «где найти лучший флэт уайт рядом со мной?».
    4. Работа алгоритма:
      • Система определяет запрос как place-triggering («где», «рядом»).
      • Извлекается N-gram «лучший флэт уайт».
      • Система проверяет репозиторий и находит, что эта N-gram имеет высокий Category Score с категорией «Кофейня», превышающий порог.
    5. Ожидаемый результат: Система выполняет поиск «Кофейня» рядом с пользователем. Кофейни, в отзывах и на сайте которых часто упоминается «флэт уайт» (и которые были оптимизированы специалистом), получат дополнительное преимущество в ранжировании по этому конкретному запросу.

    Вопросы и ответы

    Как этот патент влияет на выбор категорий в Google Business Profile (GBP)?

    Патент показывает, что Google не полагается исключительно на категории, выбранные владельцем в GBP. Система активно пытается определить релевантные категории на основе анализа контента (отзывов и сайта). Это означает, что даже если вы выбрали правильную основную категорию, вам необходимо подтверждать ее и смежные категории через контент, чтобы система точно понимала ваши услуги и могла ранжировать вас по неявным запросам.

    Насколько важен текст отзывов согласно этому патенту?

    Текст отзывов критически важен. Патент описывает механизм, который использует документы, включая отзывы (restaurant reviews), как основной источник данных для обучения (построения N-gram category repository). Подробные отзывы, упоминающие конкретные услуги или продукты, напрямую помогают Google связать эти термины (N-grams) с вашим бизнесом и его категорией.

    Что такое Category Score и как на него повлиять?

    Category Score — это мера уверенности системы в том, что определенная фраза связана с конкретной категорией. Она рассчитывается на основе частоты упоминаний этой фразы в контексте категории. Чтобы повысить этот показатель, необходимо увеличить частоту естественного упоминания релевантных фраз (названий услуг, продуктов) в контенте, связанном с вашим бизнесом — на вашем сайте и в отзывах клиентов.

    Применяется ли этот механизм только к голосовому поиску (Dialog system)?

    Хотя патент упоминает диалоговую систему в качестве примера реализации, описанный механизм понимания запросов является фундаментальным. Преобразование неявных запросов в конкретные категории актуально как для голосового, так и для текстового поиска, особенно в Google Maps и локальной выдаче (Local Pack).

    Как система определяет, что запрос является «place-triggering»?

    Патент предполагает использование списка терминов, связанных с локальным поиском. Если запрос содержит такие слова, как «где», «рядом», «поблизости», «место», «я хочу» или «мне нужно», система классифицирует его как place-triggering request. Это является триггером для активации описанного механизма поиска категорий по N-grams.

    Как система обрабатывает многозначные фразы (N-grams)?

    Система использует Category Scores для разрешения неоднозначности. Если фраза связана с несколькими категориями, система выберет ту, у которой наивысший Category Score, при условии, что он превышает порог уверенности (similarity threshold). Например, если у фразы оценка 0.8 для категории А и 0.4 для категории Б, будет выбрана категория А.

    Что такое нормализация категорий и как она влияет на SEO?

    Нормализация — это процесс объединения схожих категорий (например, «Автомастерская» и «Ремонт автомобилей») в одну представительную категорию, объединяя их Category Scores. Для SEO это означает, что система может ранжировать ваш бизнес по синонимичным категориям, если контент подтверждает релевантность, что расширяет охват.

    Учитывает ли система морфологию слов?

    Да, в патенте упоминается возможность использования стемминга (stemming). Это означает, что система приводит слова к их основе (стему) и обрабатывает разные формы слова как одну сущность (например, «ремонт телефона» и «ремонтировать телефоны» могут быть распознаны как одна и та же N-грамма).

    Что важнее для этого алгоритма: контент на моем сайте или отзывы на сторонних площадках?

    Патент указывает, что анализируются различные источники информации, включая официальные веб-страницы бизнеса и отзывы. Оба источника важны. Отзывы часто содержат более естественный язык и конкретные названия продуктов, что ценно для обучения системы. Контент на сайте позволяет вам стратегически контролировать используемую терминологию и полноту описания услуг.

    Как использовать этот патент для анализа конкурентов?

    Изучите корпус отзывов ваших конкурентов. Определите, какие N-grams (продукты, услуги, атрибуты) упоминаются наиболее часто. Это даст вам представление о том, какие фразы Google уже прочно ассоциирует с вашей категорией (имеют высокий Category Score). Эту информацию можно использовать для улучшения собственного контента и понимания ожиданий пользователей.

    Навигация
    • Описание
    • Детальный разбор
    • Выводы
    • Практика
    • Вопросы и ответы
    • Наверх
    Telegram
    © 2025 SEO HARDCORE

    Type above and press Enter to search. Press Esc to cancel.