SEO HARDCORE
  • Разборы патентов
    • Патенты Google
  • Скоро SEO инструменты
  • Скоро SEO аналитика
  • seohardcore
SEO HARDCORE
назад

Как Google использует всплески локальных запросов для быстрого обнаружения и индексации новых бизнесов

DETECTING NEW BUSINESSES WITH UNRECOGNIZED QUERY TERMS (Обнаружение новых бизнесов с помощью нераспознанных поисковых терминов)
  • US9218420B1
  • Google LLC
  • 2013-02-26
  • 2015-12-22
  • Local SEO
  • Индексация
  • Поведенческие сигналы
  • Свежесть контента
  • Описание
  • Разбор
  • Выводы
  • Практика
  • FAQ
  • Похожие

Google анализирует логи локальных поисковых запросов для обнаружения новых бизнесов. Система отслеживает термины, отсутствующие в текущей базе данных. Если частота использования такого термина в определенном регионе резко возрастает по сравнению с историческим уровнем, система идентифицирует его как название нового бизнеса и инициирует процесс его проверки (включая анализ отзывов) и добавления в индекс.

Описание

Какую проблему решает

Патент решает проблему поддержания актуальности баз данных бизнес-листингов (например, Google Maps/Local). Традиционные методы обновления (ручной обход территорий, покупка данных) медленны и дороги, из-за чего база быстро устаревает. Изобретение предлагает автоматизированный и экономически эффективный способ обнаружения новых бизнесов на основе анализа поведения пользователей.

Что запатентовано

Запатентована система (new-business detector) для автоматического обнаружения новых бизнесов путем анализа логов поисковых запросов. Система идентифицирует термины, которые не соответствуют известным бизнесам, и отслеживает частоту их появления в локальных запросах. Резкое увеличение частоты использования термина по сравнению с его историческим базовым уровнем (шум, опечатки) интерпретируется как сигнал о появлении нового бизнеса.

Как это работает

Система работает следующим образом:

  • Гео-кластеризация: Запросы из логов группируются по географическому признаку (local search queries).
  • Обнаружение новых терминов: В каждом локальном логе выявляются термины, отсутствующие в существующем бизнес-листинге (business listing).
  • Частотный анализ: Для каждого нового термина рассчитывается историческая частота (Historical Rate, включая среднее значение и вариативность) и недавняя частота (Recent Rate).
  • Сравнение: Система сравнивает Recent Rate с пороговым значением (Threshold Rate), основанным на Historical Rate (например, превышение на несколько стандартных отклонений).
  • Идентификация: Если Recent Rate значительно превышает порог, термин помечается как потенциальное название нового бизнеса.
  • Валидация: Кандидаты проверяются автоматически (например, поиском упоминаний в отзывах, как указано в Claim 1) или вручную перед добавлением в индекс.

Актуальность для SEO

Высокая. Автоматическое обнаружение и индексация новых локальных сущностей критически важны для поддержания качества локального поиска и карт. Использование поискового поведения пользователей как механизма сбора данных (Data Acquisition) является фундаментальным подходом Google для индексации физического мира.

Важность для SEO

Патент имеет высокое значение (7.5/10) для Local SEO и стратегического понимания процессов индексации сущностей. Он демонстрирует, что локализованный поисковый спрос (Search Interest) напрямую управляет процессом обнаружения и индексации новых бизнес-объектов. Для SEO-специалистов это означает, что генерация реального поискового интереса к новому бизнесу является ключевым фактором для его быстрого и корректного появления в Google Maps и локальной выдаче.

Детальный разбор

Термины и определения

Business Listing (Бизнес-листинг)
База данных, содержащая названия и местоположение известных компаний. Используется для ответов на запросы и геокодирования.
Historical Rate (Историческая частота)
Базовая частота появления нераспознанного термина в запросах за длительный период. Характеризуется мерой центральной тенденции (например, средним значением) и мерой вариативности (например, стандартным отклонением).
Local Search Queries (Локальные поисковые запросы)
Поисковые запросы, сгруппированные по географическому признаку (например, по городу, почтовому индексу или динамическому кластеру).
New Term (Новый термин / Unrecognized query term)
Термин (слово или фраза) из поискового запроса, который не соответствует названию ни одного бизнеса в существующем Business Listing.
Query Log (Лог запросов)
Хранилище отправленных пользователями поисковых запросов, включающее метки времени и геолокационные данные.
Recent Rate (Недавняя частота)
Частота появления нераспознанного термина в запросах за короткий недавний период (например, последние 7 или 30 дней). Может рассчитываться для нескольких временных окон.
Threshold Rate (Пороговая частота)
Значение, которое должна превысить Recent Rate, чтобы термин был идентифицирован как новый бизнес. Рассчитывается на основе Historical Rate и его вариативности.

Ключевые утверждения (Анализ Claims)

Claim 1 (Независимый пункт): Описывает основной метод идентификации нового бизнеса, включая автоматическую валидацию.

  1. Система получает лог local search queries.
  2. Идентифицирует термин, отсутствующий в business listing.
  3. Определяет количество недавних и исторических запросов с этим термином.
  4. Определяет Threshold Rate на основе исторических запросов.
  5. Определяет, что Recent Rate превышает Threshold Rate.
  6. Идентифицирует термин как название нового бизнеса.
  7. [Автоматическая валидация] В ответ на это система ищет термин в отзывах (reviews) о новых бизнесах.
  8. Определяет, что название появляется в отзывах.
  9. Идентифицирует термин как подтвержденный новый бизнес.

Ядро изобретения — использование статистического анализа временных рядов (изменение частоты запросов) для обнаружения новых локальных сущностей, с последующей автоматической валидацией через другой источник данных (отзывы).

Claim 4 (Зависимый от 1): Подчеркивает важность локализации.

Поисковые запросы сначала кластеризуются по географическому местоположению. Новый термин идентифицируется внутри конкретного географического кластера. Это помогает отличить локальный бизнес от глобальных трендов или шума.

Claim 5 и 6 (Зависимые от 1) и Claim 17 (Независимый): Описывают ручной путь валидации.

Термин добавляется в список задач (work-list) для проверки человеком (асессором), который может использовать мобильное устройство (Claim 17). С термином ассоциируется географическая область, определенная на основе контекста локальных запросов (геолокация пользователя, упоминание адресов), чтобы облегчить проверку (Claim 6).

Claim 12 и 13 (Зависимые от 1): Определяют статистический метод расчета порога.

Threshold Rate определяется на основе дисперсии (variance) и меры центральной тенденции (central tendency) исторической частоты. Конкретный пример: порог устанавливается более чем на два стандартных отклонения выше среднего значения.

Claim 15 (Зависимый от 1) и Claim 18 (Независимый): Описывают использование нескольких временных окон.

  1. Рассчитывается несколько Recent Rates для разных периодов (например, неделя, месяц, полгода).
  2. Проверяется, превышает ли какая-либо из них соответствующий порог.
  3. Пороги для более длительных периодов ниже, чем для коротких.

Это позволяет обнаруживать не только резкие всплески (короткий период, высокий порог), но и постепенный, устойчивый рост интереса (длинный период, низкий порог).

Где и как применяется

Изобретение является ключевым компонентом системы сбора данных Google для локального поиска и карт.

CRAWLING – Сканирование и Сбор данных (Data Acquisition)
Основное применение патента. Система использует логи поисковых запросов как источник данных для обнаружения новых сущностей (бизнесов), которые еще не известны поисковой системе. Это механизм сбора данных, основанный на поведении пользователей.

INDEXING – Индексирование и извлечение признаков
После обнаружения и подтверждения (автоматически через отзывы или вручную) новый бизнес добавляется в Business Listing (Индекс локальных сущностей / Knowledge Graph). На этом этапе извлекаются признаки, такие как местоположение и категория.

Входные данные:

  • Query Log (запросы с метками времени).
  • Геолокационные данные запросов (IP, GPS, видимая область карты (viewport), упоминание локаций в тексте).
  • Существующий Business Listing.
  • Отзывы о бизнесах (для валидации).

Выходные данные:

  • Идентифицированные названия и предполагаемые местоположения новых бизнесов.
  • Список задач (work-list) для ручной проверки.
  • Обновленный Business Listing.

На что влияет

  • Конкретные типы контента: Бизнес-листинги, профили компаний (Google Business Profile), точки интереса (POI) на картах.
  • Специфические запросы: Локальные запросы и брендовые запросы новых компаний.
  • Конкретные ниши или тематики: Наибольшее влияние в нишах с высокой динамикой открытия новых точек: ритейл, общественное питание, услуги.

Когда применяется

  • Условия работы алгоритма: Алгоритм работает непрерывно, анализируя логи запросов.
  • Триггеры активации: Статистически значимый всплеск частоты использования нераспознанного термина в конкретном географическом кластере. Всплеск должен превысить Threshold Rate.
  • Временные рамки: Анализ проводится в разных временных окнах (неделя, месяц и т.д.) для обнаружения как быстрых, так и постепенных изменений.

Пошаговый алгоритм

Этап 1: Подготовка данных и обнаружение терминов

  1. Сбор и кластеризация запросов: Данные из Query Log группируются по географическому признаку для создания логов локальных поисковых запросов (Claim 4).
  2. Идентификация новых терминов: Каждый термин сравнивается с Business Listing. Термины, отсутствующие в листинге, помечаются как New Terms.
  3. Фильтрация шума: Удаляются стоп-слова, общие термины и запросы, для которых пользователь выбрал исправление орфографии (подтвержденные опечатки, Claim 3).

Этап 2: Расчет и сравнение частот

  1. Расчет исторической частоты (Historical Rate): Для каждого New Term анализируются исторические данные. Рассчитывается средняя частота и стандартное отклонение.
  2. Расчет недавней частоты (Recent Rate): Рассчитывается частота термина за один или несколько недавних периодов (например, 7 дней, 30 дней) (Claims 15, 18).
  3. Нормализация: Частоты могут быть нормализованы с учетом общего объема запросов за соответствующие периоды, чтобы исключить влияние сезонности или роста аудитории (Claim 14).
  4. Расчет пороговой частоты (Threshold Rate): Для каждого временного окна определяется порог на основе исторической вариативности (Claims 12, 13). Например: Threshold=MeanHistorical+N∗SDHistoricalThreshold = Mean_{Historical} + N*SD_{Historical}Threshold=MeanHistorical​+N∗SDHistorical​ (где N может быть 2, 3 или 4).
  5. Сравнение: Recent Rate сравнивается с Threshold Rate. Если порог превышен, система переходит к Этапу 3.

Этап 3: Идентификация и валидация

  1. Идентификация кандидата: Термин идентифицируется как потенциальное название нового бизнеса. Может быть рассчитана оценка уверенности (Confidence Score).
  2. Определение местоположения: Анализируется контекст запросов (геолокация пользователей, упоминаемые адреса), чтобы определить вероятное местоположение бизнеса (Claims 6, 9).
  3. Валидация:
    • Автоматическая (Claim 1): Система ищет упоминания термина в отзывах. Если найдено достаточно отзывов, бизнес считается подтвержденным.
    • Ручная (Claim 5, 17): Термин и предполагаемое местоположение добавляются в work-list для проверки ревизором.
  4. Обновление индекса: После подтверждения новый бизнес добавляется в Business Listing.

Какие данные и как использует

Данные на входе

  • Поведенческие факторы: Логи поисковых запросов (Query Log) — основной источник данных. Анализируется текст, частота, временные метки и действия пользователя (например, отказ в пользу исправления орфографии, Claim 3).
  • Географические факторы: Критически важны для кластеризации и локализации. Используются IP-адреса, GPS-сигналы мобильных устройств, видимая область карты (map extent/viewport) у пользователя, а также названия локаций, упомянутые в тексте запроса.
  • Контентные факторы (Внешние): Текст отзывов (reviews) используется на этапе автоматической валидации для подтверждения существования бизнеса (Claim 1).

Какие метрики используются и как они считаются

  • Historical Rate (Историческая частота): Среднее количество появлений термина за единицу времени в прошлом.
  • Standard Deviation/Variance (Стандартное отклонение/Дисперсия): Мера вариативности Historical Rate. Используется для определения статистической значимости изменений.
  • Recent Rate (Недавняя частота): Количество появлений термина за недавний период. Рассчитывается для нескольких временных окон.
  • Threshold Rate (Пороговая частота): Динамически рассчитываемый порог. Функция от Historical Rate и его вариативности (например, среднее + N стандартных отклонений).
  • Normalization Factors (Факторы нормализации): Общий объем поисковых запросов за анализируемые периоды. Используются для нормировки частот (Claim 14).

Выводы

  1. Поисковый спрос как драйвер индексации локальных сущностей: Патент демонстрирует, как Google использует анализ поведения пользователей (поисковые запросы) в качестве основного механизма для обнаружения новых локальных бизнесов. Реальный всплеск интереса инициирует процесс индексации.
  2. Важность локализации сигналов: Система специально кластеризует запросы географически (Claim 4). Всплеск интереса должен быть локализован, чтобы отличить открытие нового местного бизнеса от общих трендов или случайных опечаток.
  3. Статистический подход к обнаружению аномалий: Обнаружение основано на выявлении статистически значимых отклонений (Recent Rate vs Historical Rate). Система ищет сигналы, которые не могут быть объяснены случайными флуктуациями (Claims 12, 13).
  4. Многоуровневый анализ временных рядов: Использование нескольких временных окон с адаптивными порогами (Claims 15, 18) позволяет системе быть чувствительной как к резким, так и к постепенным изменениям в поисковом поведении.
  5. Обязательная валидация через разные источники: Google не полагается только на анализ запросов. Обнаруженные кандидаты проходят проверку: автоматическую через анализ отзывов (Claim 1) или ручную (Claim 5, 17). Это подчеркивает важность наличия сигналов о бизнесе в разных источниках (запросы + отзывы).

Практика

Best practices (это мы делаем)

  • Генерация локального поискового спроса при открытии: При запуске нового бизнеса или локации критически важно стимулировать реальный локальный поисковый интерес к бренду и адресу. Это напрямую активирует описанный механизм и ускоряет обнаружение и индексацию. Используйте локальный PR, рекламу, мероприятия.
  • Стимулирование ранних отзывов: Поскольку анализ отзывов является методом автоматической валидации (Claim 1), необходимо мотивировать клиентов оставлять отзывы сразу после открытия. Наличие отзывов с упоминанием названия компании поможет системе быстрее подтвердить новый бизнес.
  • Выбор уникального названия (Brand Uniqueness): Используйте уникальное название. Общие названия (например, "Лучшая кофейня") имеют высокую базовую частоту (Historical Rate), и всплеск интереса к новой точке может быть статистически незначимым на общем фоне. Уникальное название имеет низкий Historical Rate, делая всплеск более заметным.
  • Обеспечение консистентности NAP и локационного контекста: Убедитесь, что NAP консистентны на сайте и в соцсетях. В маркетинговых коммуникациях четко указывайте адрес, чтобы стимулировать запросы типа [Бренд + Улица]. Это поможет системе быстрее определить местоположение.

Worst practices (это делать не надо)

  • Имитация поискового спроса (Накрутка запросов): Попытки манипулировать системой путем генерации фейковых локальных запросов неэффективны. Система использует статистический анализ и многофакторную валидацию (отзывы, ручная проверка). Аномальное поведение без подтверждения из других источников будет отфильтровано.
  • Пассивное ожидание индексации ("Тихое открытие"): Не стоит полагаться на то, что Google самостоятельно обнаружит новый бизнес, если о нем никто не ищет и не пишет. Отсутствие поискового интереса замедлит процесс обнаружения.

Стратегическое значение

Этот патент подтверждает стратегию Google по использованию поведения пользователей как основного источника данных о реальном мире (Ground Truth). Для Local SEO это означает, что факторы популярности и известности (Prominence) начинают играть роль еще до момента индексации бизнеса. Стратегия продвижения нового локального бизнеса должна включать маркетинговые активности, направленные на генерацию реального локализованного спроса, как неотъемлемую часть SEO.

Практические примеры

Сценарий: Ускорение индексации новой кофейни

  1. Задача: Открывается новая кофейня "Зерно дня" по адресу ул. Ленина, 10. Нужно максимально быстро появиться в Google Maps.
  2. Действия: Запускается таргетированная локальная реклама и посты в соцсетях. Проводится мероприятие в день открытия. Гостей мотивируют искать маршрут по названию ("Зерно дня Ленина 10") и активно оставлять отзывы сразу после посещения.
  3. Как работает система (по патенту):
    • Система фиксирует рост запросов с термином "Зерно дня" в соответствующем географическом кластере.
    • New-term detector определяет, что "Зерно дня" отсутствует в Business Listing.
    • Rate-comparison module фиксирует, что Recent Rate (за неделю открытия) значительно превышает Historical Rate (близкий к нулю). Триггер срабатывает.
    • Система определяет вероятное местоположение (ул. Ленина, 10) на основе текста запросов и геолокации пользователей.
    • Система ищет валидацию и находит свежие отзывы о "Зерно дня" (Claim 1).
  4. Результат: Бизнес обнаруживается, автоматически валидируется через отзывы и быстро добавляется в индекс Google Maps.

Вопросы и ответы

Что является главным триггером для обнаружения нового бизнеса согласно патенту?

Главным триггером является статистически значимое увеличение частоты поисковых запросов, содержащих название нового бизнеса, в определенной географической области. Система сравнивает недавнюю частоту (Recent Rate) с историческим уровнем (Historical Rate) и реагирует на резкий всплеск.

Как система отличает название нового бизнеса от опечатки?

Патент описывает два механизма. Во-первых, частота опечаток обычно стабильна во времени (постоянный Historical Rate), тогда как открытие нового бизнеса вызывает резкий всплеск запросов. Во-вторых, система может отфильтровывать запросы, для которых пользователь выбрал предложенное Google исправление орфографии (Claim 3), считая их подтвержденными опечатками.

Насколько важна геолокация в этом процессе?

Геолокация критически важна (Claim 4). Система кластеризует запросы по географическому признаку. Всплеск частоты должен быть локализован, чтобы отличить открытие местного бизнеса от общих трендов. Также геолокация запросов помогает системе определить вероятное местоположение нового бизнеса.

Как Google проверяет, что обнаруженный бизнес реален?

Патент описывает два пути валидации. Автоматический путь (Claim 1) предполагает поиск упоминаний названия бизнеса в отзывах (reviews). Если отзывы найдены, это служит подтверждением. Ручной путь (Claim 5, 17) предполагает добавление кандидата в список задач для проверки человеком (ревизором).

Как этот патент влияет на стратегию Local SEO для нового бизнеса?

Он подчеркивает необходимость активного маркетинга при открытии. Для быстрого попадания в индекс Local SEO стратегия должна включать генерацию реального локального поискового спроса на бренд и стимулирование ранних отзывов. Пассивное ожидание индексации неэффективно.

Что означает использование нескольких временных окон для анализа (Claim 15/18)?

Система анализирует частоту запросов за разные периоды (например, неделя, месяц, полгода) и применяет к ним разные пороги срабатывания. Это позволяет улавливать как резкие всплески интереса (характерные для громкого открытия), так и более медленный, но устойчивый рост популярности бизнеса.

Как этот патент влияет на выбор названия для нового локального бизнеса?

Он подчеркивает важность выбора уникального названия. Если вы используете общее название (например, «Автосервис»), системе будет сложно идентифицировать всплеск интереса именно к вашему бизнесу на фоне высокого Historical Rate этих терминов. Уникальное название делает всплеск запросов статистически более значимым.

Заменяет ли этот механизм необходимость регистрации в Google Business Profile (GBP)?

Нет. Регистрация в GBP остается лучшей практикой для управления информацией. Этот патент описывает, как Google обнаруживает бизнесы автономно. Цель SEO — использовать этот механизм для ускорения первичной индексации, а затем взять точку под контроль через GBP.

Как система определяет местоположение бизнеса, если в запросе нет адреса?

Система использует агрегированные контекстуальные данные, связанные с запросами (Claims 6, 9). Сюда входят геолокация устройств пользователей (GPS, IP), видимая область карты (viewport) в момент запроса. Если много людей ищут термин, находясь в определенном радиусе, система предполагает местоположение в центре этого кластера.

Что такое нормализация частот и зачем она нужна?

Нормализация (Claim 14) — это корректировка частоты использования термина с учетом общего объема поисковых запросов за период. Это необходимо, чтобы избежать ложных срабатываний, вызванных общим ростом трафика (например, в праздники или из-за роста популярности поиска), а не открытием конкретного нового бизнеса.

Похожие патенты

Как Google использует отзывы пользователей для обнаружения спама и фейковых компаний в локальном поиске (Google Maps)
Google анализирует текст отзывов о компаниях для выявления спама в бизнес-листингах. Система ищет стоп-слова (например, "фейк", "не существует"), выявляет нерелевантные термины для категории бизнеса и сравнивает отзывы с базой известного спама. При превышении порога подозрительных сигналов листинг помечается как спам.
  • US8621623B1
  • 2013-12-31
  • Антиспам

  • Local SEO

  • EEAT и качество

Как Google использует историю запросов, сделанных на Картах, для ранжирования локальных результатов и рекламы
Google анализирует, что пользователи ищут, когда просматривают определенную географическую область на карте (Viewport). Эта агрегированная история запросов используется для определения популярности локальных бизнесов и контента в этом конкретном районе. Результаты, которые часто запрашивались в этой области, особенно недавно, получают значительное повышение в ранжировании.
  • US9129029B1
  • 2015-09-08
  • Local SEO

  • Поведенческие сигналы

  • Свежесть контента

Как Google выявляет всплески поискового интереса и определяет тренды в реальном времени
Google использует систему для определения "Исключительных запросов" — тем, интерес к которым резко и неожиданно возрастает в короткий промежуток времени (менее 30 минут). Система сравнивает текущую частоту запроса с прогнозируемой моделью, основанной на исторических данных. Если фактическая активность значительно превышает прогноз, запрос помечается как трендовый. Это позволяет выявлять актуальные события, а не просто самые популярные запросы.
  • US8140562B1
  • 2012-03-20
  • Свежесть контента

  • Поведенческие сигналы

Как Google использует упоминания бренда в вебе (Webscore) для определения популярности и ранжирования локальных бизнесов
Google рассчитывает метрику «Webscore» для локальных компаний, основанную на количестве упоминаний их названия в интернете. Эта оценка используется для определения «Популярности» (Prominence) бизнеса и влияет на ранжирование в локальном поиске, часто отдавая предпочтение известным компаниям перед теми, что просто находятся ближе. Алгоритм учитывает длину названия и корректирует оценки для сетевых бизнесов.
  • US8122013B1
  • 2012-02-21
  • Local SEO

  • EEAT и качество

  • SERP

Как Google использует данные о запросах маршрутов и готовность пользователей путешествовать для ранжирования в локальном поиске
Google использует историю запросов маршрутов (Directions Queries) для определения реальной популярности местных бизнесов. Система учитывает, как часто люди ищут маршрут до конкретного места, как далеко они готовы ехать (Historical Travel Distance), а также время суток и день недели. Эти данные о реальном поведении используются как ключевой сигнал для ранжирования в локальном поиске наряду с близостью.
  • US8538973B1
  • 2013-09-17
  • Local SEO

  • Поведенческие сигналы

Популярные патенты

Как Google использует модель предвзятости представления (Presentation Bias), чтобы отделить клики по релевантности от кликов по позиции
Google использует механизм для интерпретации поведения пользователей (CTR), который учитывает, как именно представлены результаты поиска. Система рассчитывает ожидаемый CTR для конкретной позиции и визуального оформления (сниппет, выделение). Чтобы получить буст от поведенческих факторов, реальный CTR документа должен значительно превышать этот ожидаемый уровень. Это позволяет отфильтровать клики, обусловленные высокой позицией или привлекательным сниппетом, и выделить сигналы истинной релевантности.
  • US8938463B1
  • 2015-01-20
  • Поведенческие сигналы

  • SERP

Как Google определяет, действительно ли новость посвящена сущности, и строит хронологию событий
Google использует систему для определения релевантности новостей конкретным объектам (сущностям, событиям, темам). Система анализирует кластеры новостных статей (коллекции), оценивая общий интерес к объекту (поисковые запросы, социальные сети) и значимость объекта внутри коллекции (упоминания в заголовках, центральность в тексте). Ключевой механизм — оценка уместности событий: система проверяет, соответствует ли событие типу объекта (например, «новый метод лечения» для болезни), чтобы отфильтровать мимолетные упоминания и создать точную хронологию новостей.
  • US9881077B1
  • 2018-01-30
  • Семантика и интент

  • Поведенческие сигналы

Как Google определяет свежесть документа, анализируя возраст ссылающихся страниц и динамику появления ссылок (Link Velocity)
Google использует методы для оценки свежести документа, когда дата его обновления неизвестна или ненадежна. Система анализирует даты обновления страниц, которые ссылаются на документ, а также историю появления и удаления этих ссылок (Link Velocity). Если на документ ссылаются недавно обновленные страницы или количество ссылок растет, он считается свежим.
  • US7797316B2
  • 2010-09-14
  • Свежесть контента

  • Ссылки

  • Техническое SEO

Как Google использует контекст внешних страниц для понимания и идентификации видео и аудио контента
Google анализирует внешние веб-страницы, которые ссылаются на медиафайлы или встраивают их (например, видео YouTube). Система извлекает метаданные из контекста этих страниц — заголовков, окружающего текста, URL. Надежность данных проверяется частотой их повторения на разных сайтах. Эта информация используется для улучшения понимания содержания медиафайла и повышения эффективности систем идентификации контента (Content ID).
  • US10318543B1
  • 2019-06-11
  • Ссылки

  • Индексация

  • Мультимедиа

Как Google использует анализ параллельных анкорных текстов и кликов пользователей для перевода запросов и кросс-язычного поиска
Google использует механизм для автоматического перевода запросов с одного языка или набора символов на другой. Система создает вероятностный словарь, анализируя, как анкорные тексты на разных языках ссылаются на одни и те же страницы (параллельные анкоры). Вероятности перевода затем уточняются на основе того, на какие результаты кликают пользователи. Это позволяет осуществлять кросс-язычный поиск (CLIR).
  • US8706747B2
  • 2014-04-22
  • Мультиязычность

  • Семантика и интент

  • Ссылки

Как Google кластеризует похожие страницы, анализируя, куда пользователи переходят дальше (Co-visitation)
Google анализирует навигационные пути пользователей для определения схожести документов. Если после просмотра Страницы А и Страницы Б пользователи часто переходят к одному и тому же набору последующих страниц, Google считает Страницу А и Страницу Б похожими и объединяет их в кластер. Этот механизм позволяет определять тематическую близость на основе поведения пользователей.
  • US8650196B1
  • 2014-02-11
  • Поведенческие сигналы

  • SERP

  • Семантика и интент

Как Google классифицирует интент запросов (например, поиск порнографии), анализируя историю использования фильтров (SafeSearch)
Google использует данные о том, как часто пользователи включают или отключают фильтры контента (например, SafeSearch) при вводе конкретного запроса. Анализируя нормализованное соотношение фильтрованных и нефильтрованных поисковых операций, система классифицирует запрос как целенаправленно ищущий определенный тип контента (например, adult). Эта классификация затем используется для повышения или понижения релевантности соответствующего контента в выдаче.
  • US9152701B2
  • 2015-10-06
  • Семантика и интент

  • Безопасный поиск

  • Поведенческие сигналы

Как Google использует личную историю поиска и профиль интересов для персонализации подсказок Autocomplete
Google персонализирует поисковые подсказки (Autocomplete), используя профиль интересов пользователя, созданный на основе его прошлых запросов и кликов. Система сравнивает тематику потенциальных подсказок с интересами пользователя и повышает в списке те варианты, которые соответствуют его предпочтениям, с учетом актуальности этих интересов.
  • US20140108445A1
  • 2014-04-17
  • Персонализация

  • Поведенческие сигналы

  • Семантика и интент

Как Google автоматически определяет и отображает обратные ссылки (цитирования) между независимыми веб-страницами
Патент Google, описывающий фундаментальный механизм автоматического обнаружения ссылок между веб-страницами разных авторов. Когда система обнаруживает, что Страница B ссылается на Страницу A, она может автоматически встроить представление (например, ссылку) Страницы B в Страницу A при её показе пользователю. Это технология для построения и визуализации графа цитирований в Интернете.
  • US8032820B1
  • 2011-10-04
  • Ссылки

  • Индексация

  • Краулинг

Как Google определяет интент запроса, анализируя классификацию контента, который кликают пользователи
Google использует данные о поведении пользователей для классификации запросов. Система определяет, какой контент пользователи считают наиболее релевантным для запроса (на основе кликов и времени пребывания). Затем она анализирует классификацию этого контента (например, «продукт», «новости», «взрослый контент») и присваивает доминирующую классификацию самому запросу. Это позволяет уточнить интент и скорректировать ранжирование.
  • US8838587B1
  • 2014-09-16
  • Семантика и интент

  • Поведенческие сигналы

  • SERP

seohardcore