SEO HARDCORE
  • Разборы патентов
    • Патенты Google
  • Скоро SEO инструменты
  • Скоро SEO аналитика
  • seohardcore
SEO HARDCORE
назад

Как Google использует данные из Local Search и Google Maps для распознавания географических названий в основном поиске

USING A QUERY LOG FROM A TWO-BOX INTERFACE TO IDENTIFY STANDALONE LOCATIONS (Использование журнала запросов из двух-окошечного интерфейса для идентификации автономных местоположений)
  • US8782030B1
  • Google LLC
  • 2007-04-20
  • 2014-07-15
  • Local SEO
  • Семантика и интент
  • Поведенческие сигналы
  • Описание
  • Разбор
  • Выводы
  • Практика
  • FAQ
  • Похожие

Google анализирует поведение пользователей в интерфейсах с отдельными полями ввода "Что?" и "Где?" (например, в Google Maps). На основе этой статистики система определяет, является ли термин однозначным названием местоположения ("Нью-Йорк") или нет ("Пицца"). Это позволяет поиску отличать локальные запросы от общих и формировать "черные списки" для терминов, которые похожи на города, но ими не являются (например, "Орландо Блум").

Описание

Какую проблему решает

Патент решает проблему семантической неоднозначности (ambiguity) терминов, которые могут выступать как географическими названиями, так и объектами другого типа. Система должна уметь отличать локальный интент (например, "new york pizza", где "new york" — локация) от общего интента (например, "orange juice", где "orange" — не локация, хотя такой город существует). Также патент решает задачу фильтрации ложных срабатываний локального поиска для терминов, содержащих топонимы, но не относящихся к географии (например, "Orlando Bloom" или "Victoria's Secret").

Что запатентовано

Запатентован метод автоматической идентификации Standalone Locations (автономных местоположений) и генерации Location Blacklist (черного списка локаций). Метод основан на анализе журналов запросов (Query Logs) из специализированного интерфейса (Two-Box Interface), где пользователи явно разделяют ввод на "Что" (Non-Location Box) и "Где" (Location Box).

Как это работает

Система собирает статистику использования терминов в Two-Box Interface. Для каждого термина (t) подсчитывается, как часто он вводился в поле "Где" (формируя Location Score SL(t)S_L(t)) и как часто в поле "Что" (формируя Non-Location Score SN(t)S_N(t)). Затем вычисляется нормализованный индикатор (Normalized Location Indicator PL(t)P_L(t)). Если этот индикатор высок (выше порога TH_STANDALONE), термин считается Standalone Location. Если он очень низок (ниже порога TH_BLACKLIST), но содержит признаки локации, он попадает в Location Blacklist.

Актуальность для SEO

Средняя/Высокая. Хотя патент подан в 2007 году и специфический метод сбора данных через Two-Box Interface может быть менее актуален сегодня, базовая проблема (распознавание географических сущностей и локального интента) критически важна для современного поиска. Принцип использования данных из специализированных локальных сервисов (например, Google Maps) для обучения основного поиска остается фундаментальным. Вероятно, эти данные использовались как обучающая выборка для более сложных NLP-моделей.

Важность для SEO

Влияние на SEO значительно (7/10). Патент описывает механизм, относящийся к этапу Понимания Запросов (Query Understanding). От того, как Google классифицирует термин — как локацию или нет — зависит активация локальных алгоритмов ранжирования, показ Local Pack и общая интерпретация интента. Это имеет прямое влияние на стратегии Local SEO и управление брендами, чьи названия пересекаются с географическими объектами.

Детальный разбор

Термины и определения

Standalone Location (Автономное местоположение)
Местоположение, которое может быть однозначно идентифицировано только по его названию, без дополнительных уточнений (например, "San Francisco" является, "Washington" может не являться).
Two-Box Interface (Двух-окошечный интерфейс)
Интерфейс поисковой системы с двумя (или более) полями ввода: одно для того, "что" ищет пользователь, и другое для указания географического местоположения ("где").
Non-Location Box (Поле "Что")
Поле для ввода терминов, описывающих предмет поиска.
Location Box (Поле "Где")
Поле для ввода терминов, указывающих географическое местоположение.
Query Log (Журнал запросов)
Запись пользовательских вводов в Two-Box Interface, используемая для анализа частоты появления терминов в разных полях.
Location Score (SL(t)S_L(t))
Метрика, показывающая, как часто термин (t) появляется в Location Box.
Non-Location Score (SN(t)S_N(t))
Метрика, показывающая, как часто термин (t) появляется в Non-Location Box.
Normalized Location Indicator (PL(t)P_L(t)) (Нормализованный индикатор местоположения)
Метрика (от 0 до 1), рассчитываемая на основе SL(t)S_L(t) и SN(t)S_N(t) для определения вероятности того, что термин является локацией.
Location Blacklist (Черный список локаций)
Список терминов, которые содержат компонент, похожий на местоположение, но на самом деле не относятся к нему (например, "Orlando Bloom", "Victoria's Secret").
Location Extraction Server (LES) (Сервер извлечения местоположений)
Компонент системы, который определяет, содержит ли термин географическое название. Используется для валидации при формировании Location Blacklist.
TH_STANDALONE и TH_BLACKLIST
Пороговые значения, используемые для классификации термина на основе PL(t)P_L(t).

Ключевые утверждения (Анализ Claims)

Claim 1 (Независимый пункт): Описывает основной метод идентификации Standalone Location.

  1. Система получает термин для оценки.
  2. Извлекается Non-Location Score на основе логов (log data), показывающих частоту ввода термина в Non-Location Input Box ("Что").
  3. Извлекается Location Score на основе логов, показывающих частоту ввода термина в Location Input Box ("Где").
  4. На основе этих двух оценок система определяет, является ли термин Standalone Location.

Claim 6 (Независимый пункт): Описывает метод идентификации термина для Location Blacklist.

  1. Система получает термин для оценки.
  2. Извлекаются Non-Location Score и Location Score (аналогично Claim 1).
  3. На основе этих двух оценок система определяет, принадлежит ли термин к Location Blacklist (критерий: термин содержит название географического места, но не относится к нему).

Claim 16 (Зависимый от 1) и Claim 18 (Зависимый от 6): Детализируют математический подход к принятию решения.

  • Вычисляется Normalized Location Indicator (PL(t)P_L(t)) как отношение Location Score к сумме Location Score и Non-Location Score.
  • Для Standalone Location (Claim 16): PL(t)P_L(t) должен быть выше порога (standalone threshold).
  • Для Location Blacklist (Claim 18): PL(t)P_L(t) должен быть ниже порога (blacklist threshold).

Claim 5 и Claim 8 (Зависимые): Описывают использование Location Extraction Server (LES) или location-extraction engine для уточнения Location Blacklist.

Для попадания в Location Blacklist может требоваться не только низкий PL(t)P_L(t), но и подтверждение от LES, что термин действительно содержит компонент, похожий на название локации. Это позволяет отфильтровать обычные слова (например, "Пицца"), у которых PL(t)P_L(t) низкий, но которые не являются географически неоднозначными.

Где и как применяется

Изобретение охватывает сбор данных, их офлайн-обработку и применение результатов для понимания запросов в реальном времени.

CRAWLING – Сканирование и Сбор данных
Система собирает Query Logs из специализированного интерфейса (Two-Box Interface). Это процесс сбора явной обратной связи от пользователей о том, как они классифицируют термины.

INDEXING – Индексирование и извлечение признаков (Офлайн-обработка)
На этом этапе происходит анализ накопленных логов. Система (Standalone Location/Blacklist Generator) вычисляет метрики для терминов и формирует списки Standalone Locations и Location Blacklist. Эти списки сохраняются и становятся доступными для поисковой системы.

QUNDERSTANDING – Понимание Запросов (Онлайн-применение)
Основной этап применения. При получении пользовательского запроса система использует созданные списки для интерпретации терминов. Это определяет, будет ли запрос классифицирован как локальный и следует ли игнорировать потенциальные географические сигналы (если термин в Location Blacklist).

RANKING – Ранжирование
Если запрос идентифицирован как локальный благодаря распознаванию Standalone Location, система использует информацию о местоположении при ранжировании результатов (например, активируя Local Pack или предпочитая локализованные результаты).

Входные данные:

  • Query Logs из Two-Box Interface (частоты L и N).
  • Термины для оценки (t).
  • (Опционально) Ответ от Location Extraction Server (LES).

Выходные данные:

  • List of Standalone Locations.
  • Location Blacklist.

На что влияет

  • Специфические запросы: В первую очередь влияет на локальные запросы и запросы, содержащие географические названия или термины с географической омонимией.
  • Конкретные ниши или тематики: Критически важно для Local SEO, а также для брендов, организаций и персон, чьи названия совпадают с топонимами.
  • Языковые и географические ограничения: В патенте явно указано, что метод применим к различным языкам, включая китайский, японский, корейский и английский.

Когда применяется

  • Временные рамки: Анализ логов и генерация списков происходит периодически в офлайн-режиме. Использование списков происходит в реальном времени при обработке каждого запроса.
  • Пороговые значения: Классификация зависит от сравнения PL(t)P_L(t) с порогами TH_STANDALONE и TH_BLACKLIST, которые могут динамически корректироваться.

Пошаговый алгоритм

Процесс офлайн-генерации списков:

  1. Сбор данных и агрегация: Система получает термин (t) для анализа. Из Query Logs извлекаются счетчики: Location Count (L) — сколько раз термин появился в Location Box, и Non-Location Count (N) — сколько раз в Non-Location Box.
  2. Вычисление базовых оценок: Рассчитываются Location Score SL(t)S_L(t) и Non-Location Score SN(t)S_N(t). Используется логарифмическое сглаживание: SL(t)=log(L+1)S_L(t) = log(L+1) и SN(t)=log(N+1)S_N(t) = log(N+1).
  3. Вычисление индикатора: Рассчитывается Normalized Location Indicator PL(t)P_L(t). Формула: PL(t)=SL(t)

    Выводы

    1. Использование явных поведенческих сигналов для обучения QUnderstanding: Патент демонстрирует, как Google использует данные, где пользователи самостоятельно размечают интент (явно разделяя "Что" и "Где"), для обучения систем понимания запросов. Это пример кросс-платформенного обучения (данные из Local Search/Maps улучшают основной поиск).
    2. Автоматизация распознавания и классификации географических сущностей: Описан конкретный статистический метод для автоматического определения того, является ли термин однозначным географическим названием (Standalone Location).
    3. Борьба с неоднозначностью (Disambiguation): Ключевая задача — различение контекста использования слова. Система учится понимать разницу между географическим объектом и другими сущностями с тем же названием (город vs. бренд, имя человека).
    4. Критичность формирования черных списков (Blacklists): Система активно формирует списки исключений (Location Blacklist). Это критически важно для предотвращения ложных срабатываний локального поиска для нерелевантных запросов (например, брендовых или именных).
    5. Валидация через Location Extraction Server (LES): Использование LES для подтверждения наличия географического компонента в термине перед добавлением в Location Blacklist повышает точность системы и предотвращает попадание в список обычных слов.

    Практика

    Best practices (это мы делаем)

    • Четкое указание локации для неоднозначных названий (Local SEO): Если бизнес находится в городе с названием, которое часто встречается или совпадает с обычными словами (например, "Springfield", "Washington", "Orange"), критически важно всегда использовать полные географические спецификаторы (штат, страна, регион) в контенте, метаданных, микроразметке и Google Business Profile. Нельзя полагаться на то, что Google автоматически распознает название города как Standalone Location.
    • Укрепление идентичности бренда при пересечении с топонимами: Если название бренда совпадает или содержит название города (например, "Boston Market"), необходимо усиленно работать над развитием бренда как сущности (Entity) в Knowledge Graph. Это помогает системе понять доминирующий интент и корректно поместить термин в Location Blacklist, избегая нерелевантной активации локального поиска по брендовым запросам.
    • Интеграция Local SEO и Web SEO: Патент подтверждает, что данные из локальных сервисов (Google Maps/GBP) влияют на понимание запросов в основном поиске. Необходимо обеспечить сильное присутствие и активность в локальных сервисах для укрепления географических ассоциаций.

    Worst practices (это делать не надо)

    • Игнорирование географической неоднозначности: Создание контента, оптимизированного только под название города без учета его возможной неоднозначности. Если система не считает название города Standalone Location, такой контент может не ранжироваться по локальным запросам.
    • Недооценка влияния Google Maps на основной поиск: Рассматривать оптимизацию в Google Maps как отдельную задачу неверно. Поведенческие данные из карт напрямую используются для обучения основного поиска интерпретации локального интента.

    Стратегическое значение

    Патент подчеркивает фундаментальную важность этапа Понимания Запросов (Query Understanding) и классификации интента. То, как Google интерпретирует ключевые слова в запросе — как местоположение или как объект/субъект, — определяет всю дальнейшую логику ранжирования (активацию локального поиска vs. глобального). Долгосрочная SEO-стратегия должна учитывать эти механизмы интерпретации, особенно при работе с локальным бизнесом и сущностями, имеющими географические названия.

    Практические примеры

    Сценарий 1: Оптимизация для бизнеса в городе с неоднозначным названием.

    1. Ситуация: Ресторан в городе Springfield (распространенное название в США).
    2. Анализ патента: Из-за неоднозначности Google может не считать "Springfield" как Standalone Location (у него будет средний PL(t)P_L(t), так как пользователи часто уточняют штат).
    3. Действие SEO-специалиста: Обеспечить максимальное присутствие полного адреса (например, "Springfield, Illinois") на всех страницах сайта, в Title/Description, в GBP и локальных каталогах.
    4. Ожидаемый результат: Улучшение видимости по локальным запросам для пользователей, ищущих ресторан именно в этом городе.

    Сценарий 2: Работа с брендом, содержащим название города (Location Blacklist).

    1. Ситуация: Анализ видимости бренда одежды "Boston Proper".
    2. Анализ патента: Система определяет, что пользователи вводят этот термин в поле "Что", а не "Где" (низкий PL(t)P_L(t)). При этом LES распознает слово "Boston". Термин попадает в Location Blacklist.
    3. Действие SEO-специалиста: Убедиться, что по запросу "Boston Proper" доминирует официальный сайт бренда, а не результаты, связанные с городом Бостон. Фокусироваться на развитии бренда как сущности (Entity).
    4. Ожидаемый результат: Корректная обработка брендового трафика без подмешивания нерелевантных локальных результатов.

    Вопросы и ответы

    Что такое "Standalone Location" простыми словами?

    Это географическое название, которое однозначно идентифицирует местоположение без дополнительных уточнений. Например, "San Francisco" или "Берлин" обычно являются Standalone Locations. В отличие от них, "Washington" или "Орёл" могут требовать уточнения (штат, округ или контекст), так как эти названия неоднозначны или имеют другие распространенные значения.

    Как Google собирает данные для работы этого алгоритма, если интерфейс с двумя полями ("Что" и "Где") сейчас редкость?

    Патент описывает конкретный источник данных (Two-Box Interface), который был популярен ранее. Сегодня Google может собирать аналогичные сигналы из других источников, например, анализируя поведение пользователей в Google Maps (поиск "X рядом с Y"). Кроме того, данные, собранные этим методом в прошлом, могли послужить ценной обучающей выборкой для современных NLP-моделей.

    Что такое "Location Blacklist" и зачем он нужен?

    Это список терминов, которые содержат название города или места, но по факту не относятся к географии. Примеры: "Orlando Bloom" (актер) или "Victoria's Secret" (бренд). Он необходим для предотвращения ошибочной активации локального поиска (Local Pack, карты) и подмешивания нерелевантных локальных результатов для таких запросов.

    Как рассчитывается вероятность того, что термин является локацией (Normalized Location Indicator)?

    Он рассчитывается на основе соотношения того, как часто термин появлялся в поле "Где" (Location Score), по сравнению с общей частотой его использования в обоих полях ("Что" + "Где"). Формула: PL(t)=SL(t)/(SL(t)+SN(t))P_L(t) = S_L(t) / (S_L(t) + S_N(t)). Чем ближе значение к 1, тем выше вероятность, что это локация.

    Как система определяет, что термин нужно добавить в Blacklist, а не просто считать его обычным словом?

    Для этого используется дополнительная проверка через Location Extraction Server (LES). Если индикатор PL(t)P_L(t) низкий (пользователи не используют его как локацию), но LES подтверждает, что термин содержит компонент, похожий на топоним (например, "Orlando" в "Orlando Bloom"), термин добавляется в Location Blacklist. Обычные слова (например, "Пицца") не вызовут срабатывания LES.

    Как этот патент влияет на локальное SEO?

    Он напрямую влияет на то, будет ли активирован локальный поиск по конкретному запросу. Если название вашего города не распознается как Standalone Location из-за неоднозначности, системе сложнее понять локальный интент пользователя. В таких случаях критически важно использовать полные географические спецификаторы (штат, регион) в контенте и GBP.

    Что делать, если мой бренд совпадает с названием города и Google путает их?

    Необходимо усилить сигналы, указывающие на тип вашей сущности (что это компания, а не город). Работайте над развитием Knowledge Graph для бренда, используйте соответствующую микроразметку (Organization). Цель — показать Google, что доминирующий интент при поиске вашего названия связан с брендом, а не с географией.

    Почему в формулах расчета оценок используется логарифм (log(L+1))?

    Использование логарифма log()log() позволяет сгладить частотные данные и уменьшить влияние экстремально высоких значений. Добавление +1 (Laplace smoothing) гарантирует, что даже при нулевом количестве использований результат будет определен (log(1)=0), что предотвращает ошибки деления на ноль при расчете PL(t)P_L(t).

    Применяется ли этот метод к русскому языку?

    В патенте явно упоминаются английский, китайский, японский и корейский языки. Однако принципы, описанные в патенте, универсальны и основаны на статистике использования интерфейса, а не на лингвистике. Логично предположить, что аналогичные механизмы используются для всех языков, где доступны сервисы типа Google Maps.

    Является ли этот патент основным способом распознавания локаций в 2025 году?

    Вероятно, нет. Современные системы Google используют гораздо более сложные методы машинного обучения (BERT, MUM) и данные из Knowledge Graph для распознавания сущностей и контекста. Описанный метод, скорее всего, является одним из исторических подходов или используется как один из множества сигналов в современной архитектуре.

    Похожие патенты

    Как Google использует контекст запроса, местоположение и язык пользователя для распознавания неоднозначных названий локаций
    Патент Google описывает систему для определения того, когда неоднозначная фраза в запросе (например, "Orange") относится к местоположению. Система анализирует сопутствующие слова (используя "Location Factors"), местоположение пользователя ("Origin Factor") и язык запроса ("Language Factor"). Это позволяет Google показывать локальные результаты (например, карты) для запросов со скрытым локальным интентом.
    • US7987195B1
    • 2011-07-26
    • Local SEO

    • Семантика и интент

    Как Google использует "Белые списки" для определения локального интента и подмешивания локальных результатов, если город в запросе не указан
    Google применяет систему для выявления неявного локального интента в запросах без указания местоположения (например, "пицца"). Система проверяет запрос по двум разным "Белым спискам" (Whitelists). В зависимости от того, известно ли местоположение пользователя (из профиля или cookie), система либо автоматически добавляет локальные результаты (Local Pack), либо сначала запрашивает у пользователя его локацию.
    • US8359300B1
    • 2013-01-22
    • Local SEO

    • Семантика и интент

    • SERP

    Как Google определяет релевантность локальных результатов и решает, когда показывать их первыми в выдаче
    Google анализирует запрос, чтобы предсказать, ищет ли пользователь локальную информацию. Если да, система автоматически использует текущее или сохраненное местоположение пользователя для генерации локальных результатов. Затем, используя "белые" (Whitelist) и "черные" (Blacklist) списки запросов, Google решает, насколько высоко ранжировать эти локальные результаты по сравнению с обычными веб-результатами или когда следует запросить у пользователя уточнение местоположения.
    • US8005822B2
    • 2011-08-23
    • Local SEO

    • Семантика и интент

    Как Google разбирает локальные запросы на «Что» и «Где» для повышения точности выдачи
    Google использует механизм для интерпретации локальных запросов, введенных в одну строку. Система генерирует различные комбинации разделения запроса на тему («Что») и местоположение («Где»), отправляет их в разные базы данных (например, Карты, Локальный поиск) и использует оценки уверенности (Confidence Scores) для выбора наилучшей интерпретации.
    • US7917490B2
    • 2011-03-29
    • Local SEO

    • Семантика и интент

    Как Google определяет географическую релевантность документа, анализируя неоднозначные термины и названия мест
    Google использует классификатор местоположений для определения географической привязки документа, даже если в нем нет точного адреса. Система анализирует неоднозначные термины (например, названия районов или улиц) и использует профили георелевантности (гистограммы), показывающие, где эти термины чаще всего используются. Перемножая эти профили, Google разрешает неоднозначность и вычисляет наиболее вероятное местоположение контента.
    • US7716162B2
    • 2010-05-11
    • Local SEO

    • Семантика и интент

    • Индексация

    Популярные патенты

    Как Google использует позиционный CTR (Selection Rate) для ранжирования и группировки вертикалей в Универсальном поиске
    Google использует механизм для структурирования поисковой выдачи путем группировки результатов по категориям (вертикалям), таким как Новости, Видео или Веб. Система определяет порядок этих категорий, основываясь на ожидаемой частоте кликов (Selection Rate/CTR) тех позиций, которые занимают результаты категории в исходном смешанном ранжировании. Это определяет структуру Универсального поиска (Universal Search).
    • US8498984B1
    • 2013-07-30
    • SERP

    • Поведенческие сигналы

    Как Google кластеризует похожие страницы, анализируя, куда пользователи переходят дальше (Co-visitation)
    Google анализирует навигационные пути пользователей для определения схожести документов. Если после просмотра Страницы А и Страницы Б пользователи часто переходят к одному и тому же набору последующих страниц, Google считает Страницу А и Страницу Б похожими и объединяет их в кластер. Этот механизм позволяет определять тематическую близость на основе поведения пользователей.
    • US8650196B1
    • 2014-02-11
    • Поведенческие сигналы

    • SERP

    • Семантика и интент

    Как Google использует контекст и анализ офлайн-поведения (Read Ranking) для соединения физических документов с цифровыми копиями
    Система идентифицирует цифровой контент по сканированному фрагменту из физического мира, используя не только текст, но и обширный контекст (время, местоположение, историю пользователя). Патент также вводит концепцию «Read Ranking» — отслеживание популярности физических документов на основе того, что люди сканируют, как потенциальный сигнал ранжирования.
    • US20110295842A1
    • 2011-12-01
    • Поведенческие сигналы

    • Персонализация

    • Семантика и интент

    Как Google использует исторические данные о кликах по Сущностям для ранжирования нового или редко посещаемого контента
    Google решает проблему «холодного старта» для новых страниц, у которых нет собственных поведенческих данных. Система агрегирует историю кликов на уровне Сущностей (Entities). Если сущности, упомянутые на новой странице, исторически имеют высокий CTR по целевому запросу, страница получает бустинг в ранжировании, наследуя поведенческие сигналы через эти сущности.
    • US10303684B1
    • 2019-05-28
    • Поведенческие сигналы

    • Семантика и интент

    • SERP

    Как Google использует контент веб-страниц для генерации, верификации и адаптации AI-ответов в поиске (SGE/AI Overviews)
    Google использует Большие Языковые Модели (LLM) для создания генеративных сводок (AI Overviews/SGE). Для обеспечения точности система не полагается только на знания LLM, а обрабатывает контент из актуальных результатов поиска (SRDs). Патент описывает архитектуру этого процесса: как выбираются источники, как генерируется сводка на их основе (Grounding), как проверяется информация для добавления ссылок (Verification), и как ответ адаптируется под контекст и действия пользователя.
    • US20250005303A1
    • 2025-01-02
    • SERP

    • EEAT и качество

    • Персонализация

    Как Google использует социальные связи для обнаружения ссылочного спама и накрутки кликов
    Google может анализировать связи между владельцами сайтов в социальных сетях, чтобы оценить независимость ссылок между их ресурсами. Если владельцы тесно связаны (например, друзья), ссылки между их сайтами могут получить меньший вес в ранжировании, а клики по рекламе могут быть классифицированы как спам (накрутка).
    • US8060405B1
    • 2011-11-15
    • Антиспам

    • Ссылки

    • SERP

    Как Google понижает в выдаче результаты, которые пользователь уже видел или проигнорировал в рамках одной поисковой сессии
    Google использует механизм для улучшения пользовательского опыта во время длительных поисковых сессий. Если пользователь вводит несколько связанных запросов подряд, система идентифицирует результаты, которые уже появлялись в ответ на предыдущие запросы. Эти повторяющиеся результаты понижаются в ранжировании для текущего запроса, чтобы освободить место для новых, потенциально более полезных страниц. Понижение контролируется порогом релевантности, чтобы не скрывать важный контент.
    • US8051076B1
    • 2011-11-01
    • SERP

    • Поведенческие сигналы

    Как Google использует машинное обучение и поведение пользователей для понимания скрытого намерения в коммерческих запросах
    Google использует систему машинного обучения для анализа того, какие товары пользователи выбирают после ввода широких или неоднозначных запросов. Изучая скрытые атрибуты (метаданные) этих выбранных товаров, система определяет «скрытое намерение» запроса. Это позволяет автоматически переписывать будущие неоднозначные запросы в структурированный формат, ориентированный на атрибуты товара, а не только на ключевые слова.
    • US20180113919A1
    • 2018-04-26
    • Семантика и интент

    • SERP

    • Поведенческие сигналы

    Как Google определяет, действительно ли новость посвящена сущности, и строит хронологию событий
    Google использует систему для определения релевантности новостей конкретным объектам (сущностям, событиям, темам). Система анализирует кластеры новостных статей (коллекции), оценивая общий интерес к объекту (поисковые запросы, социальные сети) и значимость объекта внутри коллекции (упоминания в заголовках, центральность в тексте). Ключевой механизм — оценка уместности событий: система проверяет, соответствует ли событие типу объекта (например, «новый метод лечения» для болезни), чтобы отфильтровать мимолетные упоминания и создать точную хронологию новостей.
    • US9881077B1
    • 2018-01-30
    • Семантика и интент

    • Поведенческие сигналы

    Как Google модифицирует PageRank, используя модель «Разумного серфера» для взвешивания ссылок на основе вероятности клика
    Google использует машинное обучение для прогнозирования вероятности клика по ссылкам на основе их характеристик (позиция, размер шрифта, анкор) и реального поведения пользователей. Эта модель («Разумный серфер») модифицирует алгоритм PageRank, придавая больший вес ссылкам, которые с большей вероятностью будут использованы, и уменьшая вес игнорируемых ссылок.
    • US7716225B1
    • 2010-05-11
    • Ссылки

    • Поведенческие сигналы

    • SERP

    seohardcore