SEO HARDCORE
  • Разборы патентов
    • Патенты Google
  • Скоро SEO инструменты
  • Скоро SEO аналитика
  • seohardcore
SEO HARDCORE
назад

Как Google использует данные веб-поиска и клики пользователей для классификации бизнесов и построения иерархии категорий

BUSINESS LISTING SEARCH (Поиск по бизнес-листингам)
  • US7840407B2
  • Google LLC
  • 2006-10-13
  • 2010-11-23
  • Поведенческие сигналы
  • Семантика и интент
  • Структура сайта
  • Описание
  • Разбор
  • Выводы
  • Практика
  • FAQ
  • Похожие

Google анализирует логи веб-поиска (введенные ключевые слова и последующие клики по результатам), чтобы понять, как пользователи интуитивно классифицируют бизнесы. Эти данные используются для автоматического построения динамической иерархической структуры категорий. Эта структура затем применяется для улучшения точности поиска, в частности, для оптимизации моделей распознавания речи в голосовых системах.

Описание

Какую проблему решает

Патент решает проблему низкой точности распознавания названий компаний в автоматизированных голосовых справочных системах (например, службы типа 411). Распознавание конкретного названия среди тысяч возможных вариантов в крупном городе является сложной задачей. Кроме того, патент устраняет проблему жестких, предопределенных таксономий (как в Желтых Страницах), которые часто не совпадают с тем, как пользователи интуитивно классифицируют бизнесы.

Что запатентовано

Запатентована система для улучшения голосового поиска бизнес-листингов. Ключевое изобретение — это метод сбора пар "категория-бизнес" (category-business pairs) на основе поведения пользователей, включая логи веб-поиска (Search logs) и логи звонков (Call logs), и автоматическое построение динамической иерархической структуры (Hierarchical tree of clustered category nodes). Каждый узел этой структуры связан со специализированной моделью распознавания речи (speech recognition language model). При голосовом запросе система использует категорию, названную пользователем, для выбора наиболее точной модели распознавания названия бизнеса.

Как это работает

Система работает в двух режимах: офлайн и онлайн.

  • Офлайн (Обучение): Система собирает данные из Search logs (какие ключевые слова вводили пользователи и на какие ссылки они кликали) и Call logs. Анализируя эти данные, система извлекает ассоциации между категориями и конкретными бизнесами. Category clustering module автоматически группирует эти ассоциации в иерархическое дерево, используя метрики энтропии (entropy) и сходства (similarity measure). Для каждого узла дерева создается специализированная модель распознавания речи.
  • Онлайн (Обработка запроса): Голосовая система запрашивает у пользователя локацию, категорию и название бизнеса. Mapping module находит узел в иерархическом дереве, наиболее соответствующий названной категории. Speech recognition engine использует специализированную модель этого узла для точного распознавания названия бизнеса.

Актуальность для SEO

Высокая. Хотя конкретные технологии распознавания речи, упомянутые в патенте (например, N-grams), могли устареть, фундаментальная концепция использования логов веб-поиска и пользовательского поведения (кликов) для понимания и классификации сущностей (бизнесов) критически важна для современного поиска, Knowledge Graph и работы голосовых ассистентов.

Важность для SEO

Патент имеет высокое стратегическое значение (85/100), особенно для Local SEO и Entity SEO. Он прямо указывает (Claim 13), что Google использует данные веб-поиска (запросы и клики) для определения того, к каким категориям принадлежит бизнес. Это подчеркивает важность не только ранжирования по релевантным запросам, но и обеспечения того, чтобы пользователи кликали на ваш сайт при поиске по этим категориям, так как это напрямую влияет на классификацию вашей бизнес-сущности системой.

Детальный разбор

Термины и определения

Category-business pair (Пара категория-бизнес)
Ассоциация между типом бизнеса (категорией) и конкретным бизнесом (сущностью), извлеченная из пользовательских данных. Пример: ("sushi", "Sushitomi").
Category clustering module (Модуль кластеризации категорий)
Компонент системы, который обрабатывает Category-business pairs и строит/обновляет Hierarchical tree, используя алгоритмы кластеризации.
Call logs (Логи звонков)
Данные, собранные из прошлых голосовых взаимодействий, фиксирующие, какие категории пользователи называли при поиске конкретных бизнесов.
Entropy (Энтропия)
Метрика, используемая для измерения степени вариативности (разнообразия) категорий и бизнесов внутри узла кластера. Высокая энтропия указывает на необходимость дальнейшего разделения узла на более специфичные подузлы.
Hierarchical tree of clustered category nodes (Иерархическое дерево кластеризованных узлов категорий)
Основная структура данных патента. Динамическая таксономия бизнесов, построенная на основе пользовательского поведения. Каждый узел представляет кластер категорий и связан со специализированной моделью распознавания речи.
Mapping module (Модуль сопоставления)
Компонент, который в реальном времени сопоставляет категорию, названную пользователем, с наиболее релевантным узлом в иерархическом дереве, используя Similarity scores.
Pairing module (Модуль сопряжения)
Компонент, анализирующий Search logs для определения связи между ключевыми словами в запросе и выбранным пользователем результатом поиска (кликом), извлекая Category-business pairs.
Search logs (Логи поиска)
Данные о прошлых веб-поисках, включая введенные ключевые слова и последующий выбор пользователем результатов поиска (клики).
Similarity measure / Similarity score (Мера сходства / Оценка сходства)
Метрика для определения релевантности. В описании патента упоминается использование TF (Term Frequency) и IDF (Inverse Document Frequency).
Speech recognition language model (Модель распознавания речи)
Статистическая модель (например, N-grams), используемая для предсказания последовательности слов в речи. В патенте эти модели специализированы для каждого узла дерева.

Ключевые утверждения (Анализ Claims)

Claim 1 (Независимый пункт): Описывает основной метод создания системы распознавания речи на основе данных.

  1. Получение пар категория-бизнес.
  2. Установление (с помощью компьютера) структуры данных (например, дерева) с узлами на основе этих пар.
  3. Каждый узел ассоциируется с одной или несколькими категориями И моделью распознавания речи (speech recognition language model), специализированной для распознавания бизнесов, связанных с этими категориями.
  4. Распознавание речи с использованием этой структуры.

Ядро изобретения — это автоматическое создание структуры, связывающей категории со специализированными языковыми моделями на основе собранных данных.

Claim 8 (Зависимый от 1): Детализирует алгоритм построения структуры данных.

  1. Установление новых узлов основывается на значениях энтропии (entropy values) существующих узлов.
  2. Энтропия узла указывает на степень вариативности (разнообразия) категорий и/или бизнесов, связанных с этим узлом.

Система использует энтропию для автоматической кластеризации. Если узел слишком разнообразен (высокая энтропия), он разбивается на более специфичные узлы.

Claim 12 и 13 (Зависимые от 1): Определяют источник данных для построения структуры.

  1. Получение информации (пар категория-бизнес) включает получение информации из логов поиска (search log) (Claim 12).
  2. Это включает логирование информации о поиске по ключевым словам (keyword searches) и последующем выборе результатов поиска (кликах) пользователями (Claim 13).

Это критически важный пункт для SEO. Он юридически закрепляет использование данных веб-поиска (запрос + клик) как механизма для понимания того, как пользователи классифицируют сущности (бизнесы).

Где и как применяется

Изобретение затрагивает несколько этапов поисковой архитектуры, хотя его основное применение описано в контексте специализированной системы голосового поиска.

CRAWLING & Data Acquisition (Сбор данных)

Система активно собирает данные не путем сканирования веба, а путем логирования взаимодействий пользователей:

  • Веб-поиск: Сбор данных из Search logs (запросы и клики) через Pairing module.
  • Голосовой поиск: Сбор данных из Call logs.

INDEXING & Feature Extraction (Индексирование и извлечение признаков)

На этом этапе происходит основная офлайн-обработка:

  • Category clustering module анализирует собранные пары категория-бизнес.
  • Происходит автоматическое построение и обновление Hierarchical tree of clustered category nodes. Это процесс создания индекса категорий, основанного на поведении пользователей.
  • Для каждого узла генерируются и обновляются специализированные speech recognition language models.

QUNDERSTANDING / RANKING (Понимание запросов / Ранжирование)

В контексте голосовой системы, это этап распознавания речи:

  • Система получает голосовой ввод категории.
  • Mapping module использует иерархическое дерево для определения наиболее релевантного узла (и соответствующей языковой модели) на основе Similarity score.
  • Speech recognition engine использует эту модель для распознавания названия бизнеса.

Входные данные (Офлайн):

  • Search logs (Keyword queries, Selected links/Clicks).
  • Call logs.

Выходные данные (Офлайн):

  • Hierarchical tree of clustered category nodes.
  • База данных специализированных speech recognition language models.

На что влияет

  • Конкретные типы контента: В первую очередь влияет на бизнес-листинги (Local SEO) и сущности, которые пользователи ищут через голосовые интерфейсы.
  • Специфические запросы: Голосовые запросы, направленные на поиск конкретных организаций или локальных услуг.
  • Определенные форматы контента: Влияет на то, как система понимает и классифицирует веб-страницы, на которые пользователи кликают после ввода категориальных запросов.

Когда применяется

  • Триггеры активации (Офлайн): Периодическое обновление иерархического дерева при накоплении новых данных в Search logs и Call logs.
  • Триггеры активации (Онлайн): Каждый раз, когда пользователь взаимодействует с голосовой системой поиска бизнес-листингов и предоставляет информацию о категории.
  • Пороговые значения: Кластеризация продолжается до тех пор, пока энтропия (разнообразие) в конечных узлах не упадет ниже определенного порога.

Пошаговый алгоритм

Процесс А: Построение Иерархического Дерева (Офлайн)

  1. Сбор данных: Получение пар категория-бизнес из логов поиска и звонков.
  2. Инициализация: Присвоение всех пар корневому узлу дерева.
  3. Определение вариативности: Вычисление энтропии для всех узлов. Нахождение узла с наивысшей энтропией (наибольшим разнообразием).
  4. Выбор категории для разделения: В узле с наивысшей энтропией находится тип бизнеса (категория) с наибольшим количеством упоминаний (counts).
  5. Создание нового узла: Создание нового дочернего узла, ассоциированного с выбранной категорией.
  6. Перераспределение (Reclustering): Перераспределение оставшихся пар категория-бизнес между существующими узлами на основе меры сходства (Similarity measure), например, TF-IDF.
  7. Проверка условий остановки: Проверка, есть ли узлы с энтропией выше порогового значения.
    • Если ДА: Повторить шаги 3-6.
    • Если НЕТ: Перейти к шагу 8.
  8. Обновление моделей: Обновление специализированных моделей распознавания речи (language models) для каждого узла в финальном дереве.

Процесс Б: Обработка Голосового Запроса (Онлайн)

  1. Получение ввода: Получение от пользователя информации о типе бизнеса (категории) T1.
  2. Вычисление сходства: Определение оценок сходства (Similarity scores) между категорией T1 и узлами в иерархическом дереве.
  3. Выбор узла: Нахождение узла с наивысшей оценкой сходства.
  4. Активация модели: Использование языковой модели, ассоциированной с этим узлом (и, возможно, его предками), для распознавания названия бизнеса, произнесенного пользователем.

Какие данные и как использует

Данные на входе

Патент фокусируется на использовании поведенческих данных для построения структуры классификации.

  • Поведенческие факторы (Критические):
    • Логи веб-поиска (Search logs): Ключевые слова, введенные пользователями (используются как категории), и результаты поиска, которые они выбрали (клики), указывающие на конкретный бизнес.
    • Логи звонков (Call logs): Категории и названия бизнесов, распознанные в ходе предыдущих голосовых взаимодействий.
  • Контентные факторы: Косвенно используются, так как система анализирует термины (слова) в названиях категорий и бизнесов для расчета мер сходства (TF-IDF).

Какие метрики используются и как они считаются

Система использует статистические методы и теорию информации для кластеризации.

  • Counts (Счетчики): Количество раз, когда пара категория-бизнес встречается в логах. Используется для определения наиболее популярных категорий для создания новых узлов.
  • Entropy (Энтропия): Метрика вариативности узла. Рассчитывается как отрицательная сумма по всем парам в узле: вероятность пары * логарифм вероятности пары.

Выводы

  1. Поведение пользователей определяет классификацию сущностей: Патент явно демонстрирует механизм, с помощью которого Google использует логи веб-поиска (запросы и клики) для понимания того, как пользователи классифицируют бизнесы. Это не предположение, а задокументированный процесс (Claim 13).
  2. Динамическая, а не статическая таксономия: Система не полагается на предопределенные категории. Вместо этого она автоматически строит и обновляет Hierarchical tree с помощью алгоритмов кластеризации (используя Entropy и TF-IDF), отражая реальное, интуитивное восприятие пользователей.
  3. Связь между веб-поиском и пониманием сущностей: Данные, собранные из веб-поиска, напрямую используются для построения структуры знаний о бизнесе. Успех в веб-поиске (получение кликов по релевантным запросам) усиливает понимание вашей сущности системой.
  4. Важность категориальных запросов: Патент подчеркивает значимость того, как бизнес ассоциируется с общими категориальными запросами (например, "лучший суши-бар"), а не только с брендовыми запросами.
  5. Автоматизированное обучение на основе кликов: Механизм Pairing module, который анализирует запрос и последующий клик для создания пары категория-бизнес, является формой обучения, где клик служит сигналом подтверждения релевантности и ассоциации.

Практика

Best practices (это мы делаем)

  • Оптимизация под интент и обеспечение кликов: Необходимо не просто ранжироваться по категориальным запросам, но и гарантировать, что сниппет привлекателен и соответствует интенту, чтобы пользователь совершил клик. Согласно патенту, именно комбинация "запрос + клик" используется для классификации бизнеса.
  • Мониторинг и использование реальных пользовательских категорий: Анализируйте данные GSC, чтобы понять, по каким именно запросам пользователи находят и кликают на ваш сайт. Используйте эти формулировки в контенте и мета-тегах, так как Google использует их для построения своей динамической таксономии.
  • Усиление тематического авторитета в категории: Создавайте контент, который четко позиционирует бизнес внутри релевантных категорий. Если вы суши-бар, убедитесь, что система четко видит ассоциации вашего бренда с терминами "суши", "японский ресторан", "роллы" через контент и поведение пользователей.
  • Локальное SEO и управление сущностью: Убедитесь, что ваша бизнес-сущность четко определена (Google Business Profile, Schema.org, согласованность NAP). Это помогает гарантировать, что клики корректно атрибутируются к вашей сущности при анализе Search logs.

Worst practices (это делать не надо)

  • Использование кликбейта для нерелевантных запросов: Привлечение кликов по запросам, которые не соответствуют вашей реальной категории, может привести к неправильной классификации бизнеса в иерархическом дереве или к тому, что эти данные будут отфильтрованы как шумные.
  • Игнорирование поведенческих факторов (CTR): Рассматривать CTR только как метрику трафика. В контексте этого патента, CTR по категориальным запросам является сигналом для классификации сущности.
  • Ориентация только на предопределенные категории: Полагаться исключительно на категории, предлагаемые в стандартных справочниках или Google Business Profile, игнорируя то, как пользователи реально ищут и классифицируют ваш бизнес.

Стратегическое значение

Этот патент является одним из ранних и четких подтверждений того, что Google использует поведенческие данные из веб-поиска для построения своего графа знаний о сущностях (в данном случае, о бизнесе). Он показывает, что классификация не является статической, а динамически обучается на основе совокупного поведения пользователей. Стратегически это означает, что SEO-специалисты должны фокусироваться на управлении тем, как их бизнес воспринимается пользователями в поиске, так как это восприятие (выраженное через клики) становится реальностью для алгоритмов Google.

Практические примеры

Сценарий: Улучшение классификации локального бизнеса

Задача: Кофейня хочет, чтобы Google ассоциировал её не только с категорией "кофейня", но и с "лучшее место для завтрака".

  1. Анализ данных: SEO-специалист анализирует GSC и видит, что пользователи редко кликают на сайт кофейни по запросам, связанным с завтраками.
  2. Действия:
    • Создается и оптимизируется страница "Завтраки в [Название кофейни]".
    • Обновляются мета-теги и сниппеты главной страницы и страницы меню, чтобы явно указывать на предложение завтраков и привлекать клики.
    • Запускается локальная контент-кампания, подчеркивающая качество завтраков.
  3. Ожидаемый результат: Пользователи, ищущие "место для завтрака [город]", начинают чаще видеть и кликать на сайт кофейни.
  4. Механизм патента: Pairing module фиксирует эти взаимодействия и создает пары ("место для завтрака", "[Название кофейни]"). Category clustering module использует эти пары для обновления Hierarchical tree, помещая кофейню в кластер, связанный с завтраками. Это улучшает понимание сущности системой.

Вопросы и ответы

Как именно Google узнает, к какой категории отнести мой бизнес, согласно этому патенту?

Google не использует предопределенный список категорий. Вместо этого система анализирует логи веб-поиска (Search logs): какие ключевые слова вводили пользователи и на какие сайты они после этого кликали (Claim 13). Если многие пользователи ищут "ремонт айфонов" и кликают на ваш сайт, система создает пару ("ремонт айфонов", "Ваш Бизнес") и использует её для автоматической классификации вашего бизнеса.

Что такое "Иерархическое дерево кластеризованных узлов категорий"?

Это динамическая структура данных, которая организует бизнесы и категории на основе того, как пользователи их ассоциируют. Она строится автоматически с помощью алгоритмов кластеризации. Например, узел "Рестораны" может иметь дочерние узлы "Итальянские рестораны" и "Суши-бары". Эта структура отражает интуитивное понимание пользователей, а не жесткую таксономию.

Какое значение имеют клики (CTR) в контексте этого патента?

Клики имеют критическое значение. В патенте клик по результату поиска после ввода ключевого слова интерпретируется как подтверждение того, что пользователь ассоциирует этот бизнес с введенной категорией. Таким образом, высокий CTR по релевантным категориальным запросам напрямую влияет на то, как Google классифицирует вашу сущность.

Что такое Энтропия (Entropy) и как она используется?

Энтропия используется в процессе кластеризации как мера разнообразия внутри узла дерева. Если узел содержит слишком много разных типов бизнесов (высокая энтропия), система автоматически разделяет его на более специфичные подузлы (низкая энтропия). Это позволяет создавать точные и узкоспециализированные категории.

Как этот патент связан с голосовым поиском?

Патент напрямую направлен на улучшение голосового поиска. Созданная иерархическая структура категорий используется для выбора специализированной модели распознавания речи. Когда пользователь говорит категорию (например, "Суши-бар"), система активирует модель, которая лучше распознает названия суши-баров, что значительно повышает точность определения названия компании.

Влияет ли этот механизм на обычный веб-поиск или только на голосовой?

Хотя конечная цель патента — улучшение голосового поиска, механизм сбора данных и классификации основан на анализе логов веб-поиска. Это означает, что система формирует понимание о вашем бизнесе (его сущности и категориях) на основе поведения пользователей в обычном веб-поиске. Это понимание затем используется во всех сервисах Google.

Что делать, если Google неправильно классифицирует мой бизнес?

Необходимо скорректировать сигналы, которые вы отправляете. Проанализируйте, по каким запросам пользователи кликают на ваш сайт (используя GSC). Убедитесь, что контент сайта и мета-теги четко соответствуют желаемой категории. Необходимо стимулировать клики по правильным категориальным запросам, чтобы "научить" систему новым ассоциациям.

Упоминаются ли в патенте TF-IDF?

Да, в описании патента упоминается использование TF (Term Frequency) и IDF (Inverse Document Frequency) как части меры сходства (Similarity measure). Это используется для определения того, насколько близки новая пара категория-бизнес к существующему узлу в дереве, а также для сопоставления запроса пользователя с узлами.

Актуален ли этот патент, учитывая его возраст?

Да, патент высоко актуален стратегически. Хотя конкретные технологии распознавания речи могли эволюционировать, фундаментальный принцип использования массовых поведенческих данных из веб-поиска для классификации сущностей лежит в основе современных систем Google, включая Knowledge Graph.

Как этот патент влияет на стратегию Local SEO?

Он подчеркивает, что Local SEO — это не только управление листингом в Google Business Profile. Необходимо активно работать над тем, чтобы ваш сайт получал клики по локальным категориальным запросам в веб-поиске, так как это напрямую формирует понимание системой того, чем занимается ваш бизнес и к каким категориям он относится.

Похожие патенты

Как Google использует поведение пользователей в веб-поиске для динамической категоризации локальных бизнесов
Google динамически формирует категории для бизнесов, основываясь на том, как пользователи ищут их (используемые ключевые слова и клики) в веб-поиске и голосовом поиске. Эти данные формируют иерархическое понимание типов бизнеса. Эта структура затем используется для повышения точности распознавания названий компаний в голосовых запросах.
  • US8041568B2
  • 2011-10-18
  • Local SEO

  • Поведенческие сигналы

  • Семантика и интент

Как Google предлагает категории для уточнения запроса на основе анализа топа выдачи (особенно в локальном поиске)
Google анализирует категории (например, из бизнес-справочников), к которым принадлежат топовые результаты по запросу пользователя. Наиболее релевантные или часто встречающиеся категории предлагаются пользователю для уточнения или сужения поиска, что особенно актуально для локальных запросов и поиска организаций.
  • US7523099B1
  • 2009-04-21
  • Local SEO

  • Семантика и интент

  • SERP

Как Google связывает локальные бизнес-данные (адреса и телефоны) с веб-сайтами для показа в результатах поиска
Google использует систему для интеграции локальной информации (адреса, телефоны) непосредственно в основную поисковую выдачу. Система сопоставляет структурированные данные о бизнесе из локальной базы данных с соответствующими URL в веб-индексе, разрешая конфликты и неоднозначности. Это позволяет показывать контактную информацию и ссылки на карты прямо в сниппете результата поиска.
  • US7624101B2
  • 2009-11-24
  • Local SEO

  • Индексация

  • SERP

Как Google классифицирует запросы в бизнес-категории с помощью статистических моделей и разнообразных данных для обучения
Google использует систему для автоматического определения релевантных бизнес-категорий (например, «Желтые страницы») для поискового запроса. Система основана на статистической модели (например, Naïve Bayes), которая обучается на различных источниках данных: каталогах, веб-сайтах компаний, логах запросов и рекламном трафике. Это позволяет сопоставлять запросы с категориями, даже если они не имеют общих слов.
  • US20100191768A1
  • 2010-07-29
  • Семантика и интент

Как Google связывает названия бизнесов с категориями для локального расширения запросов
Google использует систему для анализа названий и категорий бизнесов в конкретных географических регионах. Система определяет, можно ли однозначно связать название бизнеса (или его часть) с определенной категорией услуг. Если связь установлена, Google расширяет запросы, содержащие это название, добавляя соответствующую категорию. Это позволяет обобщать локальный поиск от конкретного бренда к общей услуге в данном регионе.
  • US8983956B1
  • 2015-03-17
  • Local SEO

  • Семантика и интент

Популярные патенты

Как Google использует «Фразовую модель» (Phrase Model) для прогнозирования качества сайта на основе статистики использования N-грамм
Google прогнозирует оценку качества сайта, анализируя, какие фразы (N-граммы) используются и как часто они распределены по страницам сайта. Система создает «Фразовую модель», изучая известные высококачественные и низкокачественные сайты, а затем применяет эту модель для оценки новых сайтов по их лингвистическим паттернам.
  • US9767157B2
  • 2017-09-19
  • Семантика и интент

  • Техническое SEO

  • EEAT и качество

Как Google извлекает готовые ответы из авторитетных источников для формирования Featured Snippets
Google использует систему для предоставления прямых ответов на естественном языке (в виде абзацев или списков) на запросы с четким намерением. Система заранее анализирует авторитетные источники, извлекает пары «заголовок-текст», соответствующие популярным шаблонам вопросов, и сохраняет их в специальной базе данных. При получении соответствующего запроса система извлекает готовый ответ из этой базы и отображает его в выдаче.
  • US9448992B2
  • 2016-09-20
  • Семантика и интент

  • EEAT и качество

  • Индексация

Как Google использует фразы и тематические кластеры из истории пользователя для персонализации результатов поиска
Google может строить модель интересов пользователя, анализируя семантически значимые фразы и тематические кластеры в контенте, который пользователь потребляет (просматривает, сохраняет, печатает). При последующих запросах система повышает в ранжировании те документы, которые содержат фразы, одновременно релевантные запросу и присутствующие в профиле интересов пользователя.
  • US7580929B2
  • 2009-08-25
  • Персонализация

  • Семантика и интент

  • Поведенческие сигналы

Как Google кластеризует похожие страницы, анализируя, куда пользователи переходят дальше (Co-visitation)
Google анализирует навигационные пути пользователей для определения схожести документов. Если после просмотра Страницы А и Страницы Б пользователи часто переходят к одному и тому же набору последующих страниц, Google считает Страницу А и Страницу Б похожими и объединяет их в кластер. Этот механизм позволяет определять тематическую близость на основе поведения пользователей.
  • US8650196B1
  • 2014-02-11
  • Поведенческие сигналы

  • SERP

  • Семантика и интент

Как Google идентифицирует и верифицирует локальные бизнесы для показа карт и адресов в органической выдаче
Google использует этот механизм для улучшения органических результатов. Система определяет, связана ли веб-страница с одним конкретным бизнесом. Затем она верифицирует ее локальную значимость, проверяя, ссылаются ли на нее другие топовые результаты по тому же запросу. Если страница верифицирована, Google дополняет стандартную «синюю ссылку» интерактивными локальными данными, такими как адреса и превью карт.
  • US9418156B2
  • 2016-08-16
  • Local SEO

  • SERP

  • Ссылки

Как Google использует распределение кликов по разным типам запросов для оценки общего качества сайта (Website Quality Score)
Google оценивает качество сайта не по общему CTR, а по тому, в ответ на какие запросы он получает клики. Система сегментирует пользовательский фидбек (клики, CTR) по различным параметрам запроса (например, конкурентность, длина, популярность). Сайт считается качественным, если он получает много кликов в ответ на высококонкурентные и популярные запросы, а не только на низкочастотные или нечеткие.
  • US8615514B1
  • 2013-12-24
  • Поведенческие сигналы

Как Google запоминает вопросы без авторитетного ответа и автономно сообщает его позже через Ассистента
Патент Google описывает механизм для обработки запросов, на которые в момент поиска нет качественного или авторитетного ответа. Система запоминает информационную потребность и продолжает мониторинг. Когда появляется информация, удовлетворяющая критериям качества (например, в Knowledge Graph), Google автономно доставляет ответ пользователю, часто встраивая его в следующий диалог с Google Assistant, даже если этот диалог не связан с исходным вопросом.
  • US11238116B2
  • 2022-02-01
  • Knowledge Graph

  • Семантика и интент

  • EEAT и качество

Как Google объединяет данные о ссылках и кликах для расчета авторитетности страниц (Query-Independent Score)
Google использует механизм расчета независимой от запроса оценки авторитетности (Query-Independent Score) с помощью дополненного графа ресурсов. Этот граф объединяет традиционные ссылки между страницами с данными о поведении пользователей, такими как клики по результатам поиска (CTR). Авторитетность передается не только через ссылки, но и через запросы, позволяя страницам с высоким уровнем вовлеченности пользователей набирать авторитет, даже если у них мало обратных ссылок.
  • US8386495B1
  • 2013-02-26
  • Поведенческие сигналы

  • Ссылки

  • SERP

Как Google проверяет работоспособность Deep Links и обратную совместимость перед индексированием контента мобильных приложений
Google использует автоматизированную систему верификации для индексирования контента мобильных приложений. Перед добавлением в индекс система эмулирует запуск приложения по Deep Link, проверяя корректность загрузки, отсутствие ошибок и соответствие контента связанной веб-странице. Также система тестирует обратную совместимость ссылок при обновлениях приложения, гарантируя, что в поиск попадают только функциональные результаты.
  • US9645980B1
  • 2017-05-09
  • Индексация

  • Ссылки

  • Техническое SEO

Как Google использует "ложные пропуски" (Fake Skips) для точной оценки качества своих правил синонимов
Google анализирует поведение пользователей для оценки качества синонимов, используемых при переписывании запросов. Патент вводит метрику "Fake Skip" (Ложный пропуск). Она фиксируется, если пользователь пропустил результат с синонимом, но кликнул на результат ниже, который также содержит этот синоним и исходный термин. Это позволяет точнее калибровать систему синонимов и не пессимизировать хорошие правила из-за неоднозначного поведения пользователей.
  • US8909627B1
  • 2014-12-09
  • Поведенческие сигналы

  • Семантика и интент

  • SERP

seohardcore