SEO HARDCORE
  • Разборы патентов
    • Патенты Google
  • Скоро SEO инструменты
  • Скоро SEO аналитика
  • seohardcore
SEO HARDCORE
назад

Как Google использует поведение пользователей в веб-поиске для динамической категоризации локальных бизнесов

BUSINESS LISTING SEARCH (Поиск по бизнес-каталогу)
  • US8041568B2
  • Google LLC
  • 2006-10-13
  • 2011-10-18
  • Local SEO
  • Поведенческие сигналы
  • Семантика и интент
  • Описание
  • Разбор
  • Выводы
  • Практика
  • FAQ
  • Похожие

Google динамически формирует категории для бизнесов, основываясь на том, как пользователи ищут их (используемые ключевые слова и клики) в веб-поиске и голосовом поиске. Эти данные формируют иерархическое понимание типов бизнеса. Эта структура затем используется для повышения точности распознавания названий компаний в голосовых запросах.

Описание

Какую проблему решает

Патент решает две основные задачи. Первая — повышение точности распознавания речи в автоматизированных системах поиска по каталогам (например, голосовых справочных службах). Точность снижается, когда системе необходимо распознать название конкретного бизнеса среди огромного количества вариантов. Вторая задача — преодоление ограничений жестких систем классификации (как в Желтых страницах), которые часто не совпадают с интуитивным пониманием категорий пользователями.

Что запатентовано

Запатентована система голосового поиска, которая запрашивает у пользователя не только название компании и местоположение, но и тип бизнеса (категорию). Полученная категория используется для смещения (biasing) механизма распознавания речи в сторону специализированных языковых моделей (language models), что повышает точность распознавания названия компании. Критически важным компонентом является механизм построения этих категорий, основанный на анализе поведения пользователей в логах веб-поиска (Search logs) и логах голосовых вызовов (Call logs).

Как это работает

Система работает в двух режимах:

  • Офлайн (Построение категорий): Система анализирует Search logs, фиксируя, какие ключевые слова пользователи вводили и на какие бизнес-листинги они затем кликали (click-through data). Это формирует пары "категория-бизнес" (category-business pair). Эти пары кластеризуются в иерархическое дерево (Hierarchical tree of clustered category nodes), отражающее интуитивную классификацию бизнесов пользователями.
  • Онлайн (Обработка запроса): Во время голосового вызова система запрашивает категорию и местоположение. Она находит наиболее подходящий узел в иерархическом дереве и использует связанную с ним языковую модель для распознавания названия конкретного бизнеса.

Актуальность для SEO

Высокая. Хотя конкретное приложение (голосовые справочные службы) устарело, базовые принципы патента фундаментальны для современного поиска. Механизм улучшения распознавания речи с помощью контекста критически важен для Google Assistant. Что еще более важно для SEO, механизм обучения классификации сущностей (бизнесов) на основе поведения пользователей (запросы и клики) является центральным элементом работы Knowledge Graph и Локального поиска в 2025 году.

Важность для SEO

Патент имеет значительное стратегическое значение (7/10) для Local SEO и оптимизации сущностей (Entity Optimization). Он детально раскрывает, как Google использует логи веб-поиска (Search logs) для автоматического определения и кластеризации категорий бизнеса. Это подтверждает, что ассоциация между поисковым запросом и кликом по листингу компании помогает Google определить релевантность этого бизнеса к определенным категориям, выходя за рамки официальных классификаций (например, категорий GMB).

Детальный разбор

Термины и определения

Category-business pair (Пара категория-бизнес)
Связь между типом бизнеса (категорией или ключевым словом) и конкретным бизнесом (сущностью). Формируется на основе данных из Call logs и Search logs (например, запрос + клик).
Call logs (Логи вызовов)
Данные, собранные из прошлых голосовых взаимодействий. Включают информацию о том, как пользователи устно классифицировали компании.
Search logs (Логи поиска)
Данные, собранные из прошлых веб-поисков. Включают введенные ключевые слова и последующие действия пользователя (например, клики по ссылкам на бизнес-листинги – click-through data).
Hierarchical tree of clustered category nodes (Иерархическое дерево кластеризованных узлов категорий)
Структура данных, организующая бизнес-категории от общих к частным. Строится динамически на основе анализа Category-business pairs и отражает интуитивную классификацию бизнесов пользователями.
Language models (Языковые модели)
Статистические модели, используемые для распознавания речи. Для каждого узла в иерархическом дереве создается специализированная модель, настроенная (biased) на распознавание названий бизнесов именно этой категории.
Mapping module (Модуль сопоставления)
Компонент, который в реальном времени определяет, какой узел в иерархическом дереве (и, следовательно, какую Language model) использовать на основе категории, предоставленной пользователем.
Similarity measure (Мера сходства)
Метрика для определения релевантности. Используется для кластеризации пар и для сопоставления запроса с узлом дерева. Патент упоминает использование вариантов TF-IDF (Term-Frequency, Inverse Document Frequency).
Entropy (Энтропия)
Мера вариативности или неопределенности данных внутри узла иерархического дерева. Используется в процессе кластеризации для определения того, какие узлы следует разделить дальше.

Ключевые утверждения (Анализ Claims)

Патент фокусируется на методе улучшения распознавания речи путем использования категории бизнеса в качестве контекста.

Claim 1 (Независимый пункт): Описывает основной метод работы голосовой системы.

  1. Система предлагает пользователю предоставить тип бизнеса (категорию) и идентификатор (название).
  2. Система получает голосовой ввод.
  3. Система распознает тип бизнеса из голосового ввода.
  4. Система выбирает модуль распознавания речи (speech recognition module) на основе распознанного типа бизнеса.
  5. Система распознает идентификатор, используя выбранный специализированный модуль.

Ядром изобретения является использование категории для выбора специализированного модуля распознавания речи. Это сужает пространство возможных вариантов названий, которые система должна рассмотреть, тем самым повышая точность распознавания конкретного названия бизнеса.

Claim 11 (Независимый пункт): Описывает расширенный метод, включающий географию.

  1. Система запрашивает географическое местоположение, категорию и название сущности (entity).
  2. Система получает голосовой ввод.
  3. Система распознает местоположение и категорию.
  4. Система выбирает модуль распознавания речи на основе местоположения и категории.
  5. Система распознает название, используя выбранный модуль.

Здесь для выбора специализированной языковой модели и повышения точности распознавания используется комбинация географического контекста и категориального контекста.

Где и как применяется

Изобретение затрагивает инфраструктуру обработки данных и процесс обслуживания запросов, преимущественно в контексте голосового и локального поиска.

CRAWLING / INDEXING (Сбор данных и Офлайн-обработка)
Это ключевой этап для SEO-значимости патента. Система постоянно собирает данные из Search Logs (поведение в веб-поиске: запросы и клики) и Call Logs.

  • Извлечение признаков (Entity Association): Анализ логов для извлечения Category-business pairs. Это процесс понимания того, как пользователи связывают ключевые слова с сущностями через свои запросы и клики.
  • Индексирование (Кластеризация): Category clustering module использует эти пары для построения Hierarchical tree of clustered category nodes. Это формирует индекс категорий, основанный на поведении пользователей.

QUNDERSTANDING (Понимание запросов в реальном времени)
В реальном времени система должна понять голосовой запрос пользователя.

  • Система распознает контекст (местоположение и категорию).
  • Mapping module использует распознанную категорию для навигации по Hierarchical tree и выбора наиболее релевантных Language models.

RANKING/RETRIEVAL (в контексте голосового поиска)
Система использует выбранные (смещенные) Language models для распознавания названия конкретного бизнеса. Это не ранжирование веб-результатов, а ранжирование вероятностей того, какое именно название было произнесено пользователем.

Входные данные (Офлайн):

  • Search Logs (Ключевые слова, Клики).
  • Call Logs.

Выходные данные (Офлайн):

  • Hierarchical tree of clustered category nodes.
  • Специализированные Language models.

На что влияет

  • Конкретные типы контента и Ниши: Влияет на локальный поиск (Local Search) и понимание сущностей (Entity Understanding), особенно для коммерческих организаций. Также применимо к некоммерческим организациям и людям.
  • Специфические запросы: Влияет на то, как Google интерпретирует связь между категорийными запросами (например, "итальянский ресторан") и брендовыми/навигационными запросами (например, "Il Fornaio").

Когда применяется

  • Офлайн-процесс (Построение дерева): Происходит непрерывно или периодически для обновления классификации бизнеса на основе свежих логов поиска и звонков.
  • Онлайн-процесс (Голосовой поиск): Применяется во время любого голосового поиска по бизнес-директории, когда пользователь предоставляет информацию о категории для уточнения названия бизнеса.

Пошаговый алгоритм

Процесс А: Офлайн-построение иерархического дерева (Критично для SEO)

  1. Сбор данных: Получение Category-Business Pairs из Call Logs и Search Logs (анализ ключевых слов и кликов).
  2. Инициализация: Все пары назначаются корневому узлу дерева.
  3. Итеративная кластеризация:
    1. Идентификация кандидата на разделение: Поиск узла с наибольшей вариативностью (Entropy).
    2. Выбор категории для нового узла: Определение типа бизнеса с наибольшей частотностью (Count) в этом узле.
    3. Создание нового узла: Создание дочернего узла, ассоциированного с этим типом бизнеса.
    4. Рекластеризация: Перераспределение оставшихся пар между родительским и дочерним узлами на основе Similarity Measure (например, TF-IDF).
  4. Завершение: Процесс повторяется до тех пор, пока энтропия во всех конечных узлах не упадет ниже порога.
  5. Генерация моделей: Обновление Language Models для каждого узла.

Процесс Б: Обработка голосового запроса в реальном времени

  1. Сбор контекста: Запрос и распознавание местоположения и категории бизнеса.
  2. Сбор названия: Запрос и получение речевого ввода, представляющего название.
  3. Сопоставление (Mapping): Определение оценок сходства (Similarity scores) между указанной категорией/локацией и узлами Hierarchical Tree. Поиск узла с наивысшей оценкой.
  4. Выбор моделей: Выбор Language Model, связанной с этим узлом (и, возможно, с родительскими узлами для обеспечения гибкости).
  5. Распознавание названия: Использование выбранных моделей для распознавания названия бизнеса из речевого ввода.
  6. Поиск и результат: Поиск информации (например, номера телефона) о распознанном бизнесе и предоставление результата пользователю.

Какие данные и как использует

Данные на входе

Патент фокусируется на использовании поведенческих данных для построения системы классификации.

  • Поведенческие факторы (Ключевые для SEO):
    • Search Logs: Логи веб-поиска. Система анализирует, какие ключевые слова (keywords) вводят пользователи и какие ссылки они выбирают (click-through data). Если клик ведет на страницу конкретного бизнеса, система формирует связь (category-business pair) между ключевым словом и этим бизнесом.
    • Call Logs: Логи голосовых взаимодействий. Система анализирует, какие категории пользователи называют для конкретных бизнесов.
  • Географические факторы: Местоположение (город, штат). Используется для создания как общих (generic), так и локализованных (location-specific) иерархических деревьев и языковых моделей.

Какие метрики используются и как они считаются

  • Counts (Частотность): Количество раз, когда Category-Business Pair появляется в логах. Используется для определения важности ассоциации и инициализации новых узлов.
  • Similarity Measure (Мера сходства): Используется для кластеризации пар и для маппинга запроса к узлу. В патенте упоминается использование TF-IDF:
    • Term-Frequency (TF): Частота термина (категории или названия бизнеса) внутри узла.
    • Inverse Document Frequency (IDF): Логарифм общего числа узлов, деленный на количество узлов, содержащих данный термин.
  • Entropy (Энтропия): Статистическая мера вариативности данных внутри узла. Используется для принятия решения о разделении узла. Рассчитывается как отрицательная сумма по всем парам в узле произведения вероятности пары на логарифм вероятности этой пары: −∑(P(pair)∗log(P(pair)))- \sum (P(pair) * log(P(pair))).

Выводы

  1. Классификация бизнеса основана на поведении пользователей: Это ключевой вывод для SEO. Google активно использует логи веб-поиска (Search Logs) для понимания и классификации бизнеса. То, как пользователи ищут (ключевые слова) и на что они кликают (click-through data), определяет категорию бизнеса в глазах системы.
  2. Подтверждение важности связи "Запрос-Клик": Патент явно описывает использование связи между введенным ключевым словом и последующим кликом на бизнес-листинг как механизма для формирования Category-business pairs. Это подтверждает, что поведенческие сигналы в веб-поиске напрямую влияют на понимание релевантности бизнеса к определенным категориям.
  3. Динамическая и интуитивная классификация: Система не полагается на жесткие категории. Hierarchical Tree строится динамически, чтобы отразить интуитивное понимание пользователей. Если пользователи ищут "хозяйственный магазин", а кликают на продавца сотовых телефонов, Google изучает эту ассоциацию.
  4. Гибкость в классификации (Мультикатегорийность): Система учитывает, что разные пользователи могут по-разному классифицировать один и тот же бизнес (например, Walmart как "Grocery store" или "Pharmacy"). Динамическое дерево позволяет бизнесу принадлежать к нескольким узлам одновременно.
  5. Использование TF-IDF для кластеризации сущностей: Патент описывает применение классических методов Information Retrieval (TF-IDF) для кластеризации и определения сходства между бизнесами и категориями на основе поведенческих данных.

Практика

Best practices (это мы делаем)

Хотя патент направлен на улучшение голосового поиска, механизм использования логов веб-поиска для классификации бизнеса дает прямые рекомендации для Локального SEO и оптимизации сущностей.

  • Оптимизация под реальный локальный интент и CTR: Необходимо гарантировать, что ваш бизнес показывается и получает клики по тем категорийным запросам, с которыми вы хотите ассоциироваться. Повышение кликабельности (CTR) вашего листинга по небрендовым целевым запросам напрямую увеличивает частотность соответствующих Category-Business Pairs в Search Logs, улучшая вашу классификацию.
  • Анализ и соответствие пользовательской категоризации: Анализируйте данные Search Console и GMB Insights, чтобы увидеть, какие запросы приводят к кликам. Эти запросы определяют вашу категорию в глазах Google. Убедитесь, что контент на сайте соответствует этим категориям, по которым пользователи реально ищут и находят ваш бизнес.
  • Расширение тематической релевантности (Topical Authority): Четко описывайте все предлагаемые услуги и продукты. Поскольку пользователи могут использовать разнообразные ключевые слова (категории) для поиска вашего бизнеса, полное покрытие укрепляет ассоциации с несколькими узлами в Hierarchical Tree.

Worst practices (это делать не надо)

  • Игнорирование данных о реальных запросах: Полагаться исключительно на выбранные основные категории в GMB недостаточно. Понимание Google шире и основано на поведении пользователей (Search logs), а не только на самоопределении бизнеса.
  • Игнорирование CTR по категорийным запросам: Фокусироваться только на позициях без учета кликов неэффективно. Если ваш бизнес ранжируется высоко, но не получает кликов по определенным запросам, ассоциация с этими категориями будет ослабевать согласно механизму подсчета Counts.
  • Манипуляции с поведенческими факторами: Попытки искусственно накрутить клики по определенным запросам для изменения классификации рискованны и могут привести к санкциям, хотя сам механизм патента полагается на эти данные.

Стратегическое значение

Патент подтверждает, что Локальное SEO и классификация сущностей в значительной степени зависят от поведенческих сигналов. Google доверяет "мудрости толпы" (агрегированным логам поиска), чтобы понять, чем на самом деле занимается бизнес. Классификация сущности напрямую связана с запросами, которые приводят пользователей к этой сущности. Это подчеркивает отход от статических директорий к динамическому, основанному на интенте пониманию локального рынка.

Практические примеры

Сценарий 1: Укрепление ассоциации локального бизнеса с новой категорией

  • Задача: Кофейня "Зерно" хочет укрепить свою ассоциацию с категорией "коворкинг кафе" в Москве.
  • Действия (на основе патента): Необходимо стимулировать пользователей искать "коворкинг кафе Москва" и кликать на "Зерно" в результатах поиска (Maps/Local Pack).
    1. Оптимизировать GBP и сайт: Добавить контент, подчеркивающий удобство работы (розетки, Wi-Fi).
    2. Стимулировать отзывы: Просить посетителей упоминать в отзывах, что они работали в кафе.
    3. Локальная реклама: Запустить таргетированную рекламу по запросам, связанным с коворкингом, чтобы увеличить количество кликов на профиль.
  • Ожидаемый результат: В Search Logs Google увеличится количество «category-business pairs» ("коворкинг кафе", "Зерно"). Это приведет к тому, что в Location-specific hierarchical tree для Москвы кофейня "Зерно" будет иметь больший вес (Count) в узле, связанном с коворкингами.

Сценарий 2: Оптимизация пиццерии с услугой кейтеринга

  1. Анализ данных: SEO-специалист замечает в GSC, что пользователи ищут "кейтеринг для мероприятий [город]" и переходят на сайт пиццерии, хотя "Кейтеринг" не является основной категорией.
  2. Интерпретация: Google начал ассоциировать пиццерию с категорией "Кейтеринг" на основе этих поведенческих данных (Category-Business Pair).
  3. Действие: Создается отдельная посадочная страница, посвященная услугам кейтеринга, и добавляется соответствующий раздел услуг в GMB для усиления ассоциации.
  4. Ожидаемый результат: Увеличение количества Category-Business Pairs ("Кейтеринг", Пиццерия) в логах Google, что приведет к улучшению позиций по запросам, связанным с кейтерингом.

Вопросы и ответы

Какое значение этот патент о голосовом поиске имеет для обычного веб-поиска и SEO?

Ключевое значение заключается в описании механизма построения Hierarchical Tree (Иерархического дерева). Патент прямо указывает, что это дерево, которое классифицирует бизнес, строится на основе Search Logs — данных о том, какие ключевые слова пользователи вводят в веб-поиске и на какие бизнесы они затем кликают. Это доказывает, что Google классифицирует ваш бизнес на основе поведения пользователей, а не только на основе вашего контента или выбранных категорий GMB.

Что такое "Category-Business Pair" и почему это важно?

Это связь между запросом (категорией) и компанией (бизнесом), установленная через действие пользователя (клик). Например, если 100 человек искали "лучший кофе навынос" и кликнули на "Starbucks", это создает 100 записей пары ("лучший кофе навынос", "Starbucks"). Частота этих пар определяет, насколько сильно Google ассоциирует ваш бизнес с определенной категорией или интентом.

Подтверждает ли этот патент, что CTR влияет на ранжирование в локальном поиске?

Патент не описывает алгоритмы ранжирования. Однако он подтверждает, что данные о кликах (CTR) из веб-поиска (Search logs) используются для категоризации бизнеса. Правильная категоризация является необходимым условием для ранжирования по релевантным запросам. Таким образом, поведенческие факторы в веб-поиске косвенно влияют на локальную видимость через механизм классификации сущностей.

Как я могу повлиять на то, как Google классифицирует мой бизнес согласно этому патенту?

Вы влияете на это, оптимизируя свой сайт и GMB листинг так, чтобы привлекать клики по целевым небрендовым запросам. Чем выше ваш CTR по запросу "ремонт холодильников", тем сильнее Google будет классифицировать вас как специалиста по ремонту холодильников. Это подчеркивает важность оптимизации сниппетов и соответствия контента интенту пользователя.

Патент упоминает, что классификация строится интуитивно. Что это значит?

Это означает, что Google не использует заранее заданные жесткие категории. Если пользователи ищут "место для дня рождения ребенка", а кликают на местный боулинг-клуб, Google начнет классифицировать этот боулинг-клуб как "место для дня рождения ребенка". Система адаптируется под реальное поведение и интент пользователей, даже если он отличается от традиционной классификации.

Как используются метрики TF-IDF и Entropy в этом патенте?

Это статистические методы, используемые для автоматического построения иерархии категорий. TF-IDF (Similarity measure) помогает определить, насколько тесно конкретная пара категория-бизнес связана с определенным узлом кластера. Entropy (Энтропия) измеряет вариативность внутри узла; узлы с высокой энтропией разделяются на более мелкие подкатегории.

Может ли мой бизнес принадлежать к нескольким узлам в дереве?

Да. Поскольку разные пользователи могут классифицировать один и тот же бизнес по-разному (например, Walmart как "Продуктовый магазин", "Аптека" или "Магазин электроники"), бизнес может быть ассоциирован с несколькими различными узлами в иерархическом дереве, отражая его многогранность.

Применимы ли выводы к обычному текстовому локальному поиску?

Да. Хотя механизм повышения точности распознавания речи применим только к голосовому поиску, лежащая в его основе система категоризации (Hierarchical tree), построенная на данных веб-поиска, является общей инфраструктурой для понимания локальных сущностей. Эта категоризация используется во всех типах поиска (веб, карты, голос).

Актуален ли этот патент 2006 года подачи сегодня?

Методология использования поведенческих данных для классификации сущностей остается фундаментальной для Google. Хотя конкретные алгоритмы могли эволюционировать (например, с использованием нейронных сетей вместо TF-IDF), базовая концепция обучения на основе Search Logs для понимания того, что представляет собой бизнес, по-прежнему крайне актуальна.

Что важнее для построения дерева: логи звонков или логи веб-поиска?

Патент не указывает приоритет, но учитывая огромный объем данных веб-поиска по сравнению с голосовыми справочными службами, можно обоснованно предположить, что Search logs играют доминирующую роль в формировании структуры категорий в современных системах Google.

Похожие патенты

Как Google использует данные веб-поиска и клики пользователей для классификации бизнесов и построения иерархии категорий
Google анализирует логи веб-поиска (введенные ключевые слова и последующие клики по результатам), чтобы понять, как пользователи интуитивно классифицируют бизнесы. Эти данные используются для автоматического построения динамической иерархической структуры категорий. Эта структура затем применяется для улучшения точности поиска, в частности, для оптимизации моделей распознавания речи в голосовых системах.
  • US7840407B2
  • 2010-11-23
  • Поведенческие сигналы

  • Семантика и интент

  • Структура сайта

Как Google предлагает категории для уточнения запроса на основе анализа топа выдачи (особенно в локальном поиске)
Google анализирует категории (например, из бизнес-справочников), к которым принадлежат топовые результаты по запросу пользователя. Наиболее релевантные или часто встречающиеся категории предлагаются пользователю для уточнения или сужения поиска, что особенно актуально для локальных запросов и поиска организаций.
  • US7523099B1
  • 2009-04-21
  • Local SEO

  • Семантика и интент

  • SERP

Как Google автоматически категоризирует локальный контент и историю пользователя для контекстного поиска по неявным запросам
Патент Google, описывающий технологию для локального (Desktop) или персонализированного поиска. Система отслеживает взаимодействие пользователя с контентом (события) и использует «схемы событий» для автоматической категоризации файлов, электронных писем и истории просмотров. Эти категории затем используются для предоставления релевантных результатов в ответ на неявные запросы, генерируемые системой на основе текущего контекста пользователя.
  • US7788274B1
  • 2010-08-31
  • Персонализация

  • Поведенческие сигналы

  • Local SEO

Как Google классифицирует запросы в бизнес-категории с помощью статистических моделей и разнообразных данных для обучения
Google использует систему для автоматического определения релевантных бизнес-категорий (например, «Желтые страницы») для поискового запроса. Система основана на статистической модели (например, Naïve Bayes), которая обучается на различных источниках данных: каталогах, веб-сайтах компаний, логах запросов и рекламном трафике. Это позволяет сопоставлять запросы с категориями, даже если они не имеют общих слов.
  • US20100191768A1
  • 2010-07-29
  • Семантика и интент

Как Google классифицирует веб-страницы и персонализирует выдачу, используя историю запросов и поведенческие данные
Google использует итеративный метод для тематической классификации веб-страниц, не анализируя их контент напрямую. Система анализирует исторические логи запросов и данные о кликах. Классификация известных страниц переносится на запросы, в результатах которых они появляются, а затем классификация этих запросов переносится на новые страницы. Эти данные используются для построения профилей пользователей и персонализации поисковой выдачи.
  • US8185544B2
  • 2012-05-22
  • Персонализация

  • Поведенческие сигналы

  • SERP

Популярные патенты

Как Google рассчитывает «VisualRank» для изображений и медиафайлов, используя виртуальные ссылки на основе схожести и поведения пользователей
Google использует алгоритм (концептуально называемый VisualRank) для ранжирования изображений и других медиафайлов путем создания «виртуальных ссылок» между ними. Эти ссылки основаны на визуальной схожести контента, данных о кликах пользователей и контексте размещения (URL analysis). Это позволяет оценить качество и авторитетность медиафайлов даже без явных гиперссылок, при этом система активно избегает показа слишком похожих (дублирующихся) результатов.
  • US8732187B1
  • 2014-05-20
  • Ссылки

  • Мультимедиа

  • Поведенческие сигналы

Как Google использует анализ многословных фраз для улучшения подбора синонимов с учетом грамматического согласования
Google анализирует, как пользователи одновременно меняют несколько слов в запросе (например, при изменении числа или рода). Подтверждая, что каждое измененное слово является лексическим или семантическим вариантом оригинала, Google идентифицирует «синонимы с N-граммным согласованием». Это позволяет системе улучшить понимание синонимов отдельных слов, даже если эти слова редко меняются поодиночке в определенных контекстах.
  • US7925498B1
  • 2011-04-12
  • Семантика и интент

  • Поведенческие сигналы

Как Google предсказывает следующий запрос пользователя на основе контента текущей страницы и исторических данных
Google использует машинное обучение для анализа логов поведения пользователей, чтобы понять, что они ищут после посещения определенного контента. Система создает совместное векторное пространство (joint embedding) для документов и запросов, где близость отражает семантическую связь и вероятность совместной встречаемости. Это позволяет предлагать релевантные последующие запросы (query suggestions) в реальном времени, даже если ключевые слова для этих запросов на странице отсутствуют.
  • US9594851B1
  • 2017-03-14
  • Семантика и интент

  • Поведенческие сигналы

  • Персонализация

Как Google использует данные о поведении пользователей для генерации и ранжирования Sitelinks (Дополнительных ссылок сайта)
Патент описывает механизм генерации Sitelinks (дополнительных ссылок под основным результатом поиска). Google анализирует логи доступа пользователей (частоту кликов, время на странице) и другие факторы качества, чтобы определить наиболее важные внутренние страницы сайта. Эти страницы затем отображаются в виде ранжированного списка для ускорения навигации пользователя.
  • US7996391B2
  • 2011-08-09
  • Ссылки

  • Поведенческие сигналы

  • SERP

Как Google объединяет данные о ссылках и кликах для расчета авторитетности страниц (Query-Independent Score)
Google использует механизм расчета независимой от запроса оценки авторитетности (Query-Independent Score) с помощью дополненного графа ресурсов. Этот граф объединяет традиционные ссылки между страницами с данными о поведении пользователей, такими как клики по результатам поиска (CTR). Авторитетность передается не только через ссылки, но и через запросы, позволяя страницам с высоким уровнем вовлеченности пользователей набирать авторитет, даже если у них мало обратных ссылок.
  • US8386495B1
  • 2013-02-26
  • Поведенческие сигналы

  • Ссылки

  • SERP

Как Google персонализирует мобильную выдачу, повышая в ранжировании приложения, которые пользователь часто использует (Affinity Score)
Google рассчитывает «Affinity Score» для мобильных приложений на основе того, как часто и долго пользователь их использует (относительное вовлечение). При поиске с мобильного устройства система повышает в ранжировании результаты (deep links), ведущие в приложения с высоким Affinity Score, делая выдачу более персонализированной.
  • US10248698B2
  • 2019-04-02
  • Персонализация

  • Поведенческие сигналы

  • SERP

Как Google итеративно распознает сущности на страницах и рассчитывает их важность с помощью PageRank
Google использует итеративный процесс для распознавания и устранения неоднозначности сущностей (людей, мест, понятий) в документах. Система начинает с известных фактов, находит упоминающие сущность документы, анализирует сопутствующие термины для уточнения модели распознавания и автоматически обнаруживает новые признаки. Патент также описывает расчет важности сущности путем суммирования PageRank ссылающихся документов, взвешенного на вероятность ссылки.
  • US8122026B1
  • 2012-02-21
  • Семантика и интент

  • Ссылки

  • Knowledge Graph

Как Google рассчитывает репутационную значимость организаций и людей, используя данные из внешних источников для ранжирования
Google использует систему для оценки репутации и престижа сущностей (например, организаций или людей). Система не полагается только на предоставленные данные, а активно ищет «Дополнительные Аспекты» из внешних источников (например, профессиональные сети, СМИ). На основе этих данных рассчитываются две метрики: «Репутационная Значимость» (престиж относительно аналогов) и «Двустороннее Соответствие» (взаимная привлекательность), которые используются для ранжирования результатов поиска и рекомендаций.
  • US10878048B2
  • 2020-12-29
  • EEAT и качество

  • SERP

  • Knowledge Graph

Как Google использует контекст пользователя в реальном времени и машинное обучение для переранжирования результатов поиска
Google использует систему для прогнозирования истинного намерения пользователя на основе его текущего контекста (местоположение, время, среда, недавние действия) и исторических данных о поведении других пользователей в аналогичных ситуациях. Система переранжирует стандартные результаты поиска, чтобы выделить информацию (особенно "Search Features"), которая наиболее соответствует прогнозируемому намерению.
  • US10909124B2
  • 2021-02-02
  • Семантика и интент

  • Персонализация

  • SERP

Как Google находит, оценивает и показывает «интересные факты» о сущностях в поиске
Google идентифицирует «уникальные» или «интересные» факты о сущностях, анализируя документы, на которые ссылаются с использованием триггеров (например, «fun facts»). Система извлекает предложения, кластеризует их для поиска лучшей формулировки и оценивает качество факта на основе авторитетности источника, уникальности терминов и топикальности. Эти факты затем показываются в выдаче в виде специальных блоков.
  • US11568274B2
  • 2023-01-31
  • Knowledge Graph

  • Семантика и интент

  • EEAT и качество

seohardcore