SEO HARDCORE
  • Разборы патентов
    • Патенты Google
  • Скоро SEO инструменты
  • Скоро SEO аналитика
  • seohardcore
SEO HARDCORE
назад

Как Google использует «Оценку Неожиданности» (Surprisingness Value) для выявления и фильтрации переспама в названиях компаний в локальном поиске

SYSTEMS AND METHODS OF DETECTING KEYWORD-STUFFED BUSINESS TITLES (Системы и методы обнаружения названий компаний, перенасыщенных ключевыми словами)
  • US8473491B1
  • Google LLC
  • 2010-12-03
  • 2013-06-25
  • Антиспам
  • Local SEO
  • Описание
  • Разбор
  • Выводы
  • Практика
  • FAQ
  • Похожие

Google использует статистический анализ для борьбы со спамом в названиях компаний (например, в Google Maps). Система анализирует корпус легитимных названий, чтобы понять естественные комбинации слов. Затем для проверяемого названия вычисляется «Оценка Неожиданности» (Surprisingness Value). Если сочетание слов слишком маловероятно (например, «Ресторан Слесарь»), листинг помечается как спам и исключается из выдачи.

Описание

Какую проблему решает

Патент решает проблему манипуляции поисковой выдачей, особенно в локальном поиске и картах, путем «keyword-stuffing» (перенасыщения ключевыми словами) в названиях компаний. Он направлен против спамеров (hijackers), которые добавляют в названия своих бизнесов популярные ключевые слова, услуги, локации или названия других известных брендов, чтобы повысить видимость своего листинга по нерелевантным или высокочастотным запросам.

Что запатентовано

Запатентована система для автоматического определения того, является ли название бизнеса легитимным или мошенническим (переспамленным). Ключевым элементом является расчет «Surprisingness Value» (Оценки Неожиданности) для комбинаций слов в названии. Эта оценка основана на статистическом анализе (матрице совместной встречаемости слов), построенном на базе корпуса заведомо легитимных названий компаний.

Как это работает

Система работает в несколько этапов:

  • Обучение модели: Формируется список заведомо легитимных названий бизнесов (List of Legitimate Business Titles).
  • Генерация матрицы: Создается матрица совместной встречаемости слов (Word Co-occurrence Matrix), показывающая, как часто пары слов встречаются вместе.
  • Нормализация: Матрица нормализуется для получения Surprisingness Values. Низкое значение означает типичное сочетание (например, «Бургер Ресторан»), высокое — необычное (например, «Слесарь Ресторан»).
  • Оценка листинга: Для проверяемого названия бизнеса вычисляется его Surprisingness Value (S).
  • Фильтрация: Если S превышает пороговое значение (Threshold Value), листинг помечается как мошеннический и может быть исключен из результатов поиска.

Актуальность для SEO

Высокая. Манипуляции с названиями в Google Business Profile (GBP) остаются одной из самых распространенных и проблемных тактик спама в локальном SEO. Этот патент описывает фундаментальный, масштабируемый и лингвистически независимый (статистический) подход к автоматическому обнаружению этого типа нарушений, который, вероятно, лежит в основе текущих систем фильтрации Google.

Важность для SEO

Патент имеет критическое значение для стратегий локального SEO (Local SEO). Он напрямую описывает механизм, который Google использует для контроля за одним из самых важных факторов ранжирования в локальном поиске — названием бизнеса. Понимание этого механизма определяет границы допустимых практик при работе с GBP и подчеркивает высокие риски использования любых ключевых слов в поле названия, кроме реального имени бренда.

Детальный разбор

Термины и определения

Average Surprisingness Value (A) (Средняя Оценка Неожиданности)
Среднее значение Surprisingness Value, рассчитанное для нескольких листингов, идентифицированных как принадлежащие одному и тому же бизнесу. Используется для выявления аномальных отклонений.
Entity Information (Информация о сущности)
Данные, связанные с листингом бизнеса, включая название, категорию, геолокацию, URL, отзывы и т.д.
Keyword-Stuffing (Перенасыщение ключевыми словами)
Практика добавления нерелевантных ключевых слов или названий других брендов в название бизнеса с целью манипуляции поисковым ранжированием.
List of Legitimate Business Titles (Список легитимных названий бизнесов)
База данных заведомо корректных названий компаний, используемая как эталон (ground truth) для построения статистической модели.
Normalization (Нормализация)
Процесс преобразования данных матрицы совместной встречаемости в стандартизированный формат (например, шкалу от 0 до 1) для получения Surprisingness Values. Упоминаются методы TF-IDF и латентно-семантический анализ (LSA).
Surprisingness Value (S) (Оценка Неожиданности)
Числовая метрика, показывающая, насколько маловероятно (неожиданно) встретить определенную комбинацию слов в названии бизнеса. Высокое значение указывает на потенциальный спам.
Threshold Value (X) (Пороговое значение)
Заданный уровень Surprisingness Value, при превышении которого название считается мошенническим или переспамленным.
Word Co-occurrence Matrix (Матрица совместной встречаемости слов)
Структура данных, хранящая количество раз, когда два конкретных слова встречаются вместе в одном названии в эталонном списке.

Ключевые утверждения (Анализ Claims)

Патент описывает два основных метода применения: абсолютный (сравнение с глобальным порогом) и относительный (сравнение со средним значением для сущности).

Claim 1 (Независимый пункт): Описывает базовый (абсолютный) метод определения легитимности листинга.

  1. Доступ к списку легитимных названий бизнесов (≥2 слов).
  2. Генерация матрицы Surprisingness Values. Этот процесс включает: (i) идентификацию пар слов в легитимных названиях, (ii) подсчет совместной встречаемости (count value), и (iii) нормализацию подсчетов для создания матрицы, где каждое значение показывает, насколько маловероятно появление данной пары слов.
  3. Сохранение матрицы в памяти.
  4. Выбор конкретного листинга для проверки.
  5. Определение Surprisingness Value (S) для названия этого листинга на основе сохраненной матрицы.
  6. Определение легитимности: листинг легитимен, если S меньше порогового значения (Threshold Value).

Claim 4 (Независимый пункт): Описывает относительный метод для анализа нескольких листингов, относящихся к одному бизнесу.

  1. [Шаги 1-3 аналогичны Claim 1].
  2. Идентификация множества листингов, соответствующих одному конкретному бизнесу.
  3. Расчет Surprisingness Value (S) для каждого из них.
  4. Расчет Average Surprisingness Value (A) для всего множества листингов этого бизнеса.
  5. Выбор конкретного листинга из множества.
  6. Определение его легитимности на основе того, меньше ли его S, чем среднее значение плюс порог (S < A + Threshold Value).

Этот метод позволяет выявить аномалии: если один из вариантов названия значительно отличается от среднего для этого бизнеса, он помечается как спам, даже если глобальный порог не превышен.

Claim 9 (Независимый пункт): Описывает применение метода в процессе предоставления результатов поиска (фильтрация в реальном времени).

  1. [Шаги 1-2 аналогичны Claim 1].
  2. Получение поискового запроса.
  3. Идентификация результатов поиска, включающих листинг бизнеса.
  4. Определение Surprisingness Value (S) для этого листинга.
  5. Принятие решения о передаче этого листинга пользователю на основе сравнения S с пороговым значением. (Claims 11 и 12 уточняют, что листинг исключается, если S превышает порог).

Где и как применяется

Изобретение применяется в инфраструктуре локального поиска (Local Search, Google Maps) и затрагивает этапы индексирования и ранжирования.

INDEXING – Индексирование и извлечение признаков

  • Офлайн-обработка: На этом этапе система выполняет ресурсоемкие задачи: сбор List of Legitimate Business Titles, генерацию и нормализацию Word Co-occurrence Matrix для создания Surprisingness Matrix.
  • Оценка листингов: Система может периодически анализировать существующие листинги (Entity Information) или оценивать новые/обновленные листинги, рассчитывать их Surprisingness Value (S) и сохранять эту оценку в индексе. Также на этом этапе может применяться сравнительный метод (Claim 4).

RANKING / RERANKING – Ранжирование и Переранжирование

  • Фильтрация выдачи: При получении поискового запроса система идентифицирует кандидатов. Перед отправкой результатов пользователю система проверяет листинги (используя предварительно рассчитанные S или рассчитывая их на лету, как в Claim 9). Если S превышает порог, листинг исключается из финальной выдачи (withheld, excluded, removed from search results).

Входные данные:

  • List of Legitimate Business Titles (для обучения модели).
  • Entity Information, в частности, название бизнеса (для оценки).
  • Предварительно вычисленная Surprisingness Matrix.

Выходные данные:

  • Surprisingness Value (S) для листинга.
  • Метка легитимности/мошенничества.
  • Отфильтрованный набор результатов поиска (SERP).

На что влияет

  • Конкретные типы контента: Патент напрямую влияет на листинги бизнесов (Business Listings), которые отображаются в локальном поиске (Google Maps, Local Pack).
  • Конкретные ниши или тематики: Наибольшее влияние оказывается на локальные ниши, подверженные высокому уровню спама (например, сантехники, слесари, эвакуаторы, юридические услуги), где манипуляции с названиями для повышения ранжирования распространены.
  • Языковые и географические ограничения: Метод является статистическим и основан на совместной встречаемости слов, а не на семантическом понимании языка. Следовательно, он лингвистически независим и может применяться глобально, при условии наличия достаточного количества легитимных названий для обучения модели в данном регионе/языке.

Когда применяется

  • Условия применения: Алгоритм применяется при обработке названий бизнесов, состоящих из двух или более слов.
  • Временные рамки: Применяется в двух режимах: 1) Периодически в офлайн-режиме для анализа базы и обновления матрицы. 2) В реальном времени (on-demand) при индексации нового контента или в ответ на поисковый запрос для фильтрации результатов.
  • Триггеры активации: Активируется, когда Surprisingness Value названия превышает установленное пороговое значение (Threshold Value) или значительно отклоняется от среднего значения для данного бизнеса (Average Surprisingness Value).

Пошаговый алгоритм

Процесс А: Генерация Матрицы Неожиданности (Офлайн)

  1. Сбор эталонных данных: Получение доступа к списку заведомо легитимных названий бизнесов.
  2. Подсчет совместной встречаемости: Для каждой пары слов в эталонном списке подсчитывается, сколько раз они встречаются вместе в одном названии.
  3. Генерация матрицы: Создание Word Co-occurrence Matrix на основе этих подсчетов.
  4. Нормализация: Преобразование матрицы в Surprisingness Matrix. Используются методы вроде TF-IDF или LSA для приведения значений к стандартной шкале (например, от 0 до 1).
  5. Хранение: Сохранение нормализованной матрицы в памяти.
  6. Определение порога: Установка Threshold Value (X) вручную или автоматически. Патент (Claim 18) описывает автоматический метод: порог выбирается так, чтобы максимизировать отношение A/F (Обнаруженный спам / Ложные срабатывания) на тестовом наборе данных.

Процесс Б: Оценка Листинга и Фильтрация Выдачи (Реал-тайм)

  1. Получение запроса: Система получает поисковый запрос от пользователя.
  2. Идентификация кандидатов: Определяется набор результатов поиска, включающий бизнес-листинги.
  3. Расчет Оценки Неожиданности: Для названия каждого листинга определяется Surprisingness Value (S) на основе сохраненной матрицы (или извлекается из индекса).
  4. Сравнение с порогом: S сравнивается с пороговым значением (X).
  5. Принятие решения:
    • Если S≥XS \geq X: Листинг идентифицируется как мошеннический. Система передает результаты поиска, исключая этот листинг.
    • Если S<XS < X: Листинг считается легитимным и включается в выдачу.
  6. Передача результатов: Отфильтрованный набор результатов отправляется пользователю.

Какие данные и как использует

Данные на входе

  • Контентные факторы: Основные данные — это названия бизнесов (Business Titles). Система анализирует пары слов в этом поле. Патент также упоминает (в описании), что могут использоваться другие типы информации из листинга, такие как описательная информация (descriptive information) или информация о категории (category information), для определения неожиданных комбинаций слов.
  • Системные данные: List of Legitimate Business Titles. Это критически важный набор данных, используемый как эталон для определения «нормальности» словосочетаний.

Какие метрики используются и как они считаются

  • Word Co-occurrence Count (Счетчик совместной встречаемости слов): Базовая метрика, подсчитывающая частоту появления пар слов в эталонном корпусе.
  • Surprisingness Value (S): Основная метрика патента. Рассчитывается путем нормализации счетчиков совместной встречаемости. Патент предлагает шкалу от 0 до 1, где 1 означает максимальную неожиданность.
  • Average Surprisingness Value (A): Среднее арифметическое S для группы листингов одного бизнеса (используется в Claim 4).
  • Threshold Value (X): Значение, используемое для классификации. Определяется автоматически (максимизация A/F) или вручную.
  • Методы нормализации: Упоминаются TF-IDF (term frequency-inverse document frequency) и латентно-семантический анализ (LSA) как возможные методы преобразования сырых частот в Surprisingness Values.

Выводы

  1. Статистический подход к борьбе со спамом: Патент демонстрирует, как Google может бороться с переспамом, не полагаясь на глубокое понимание языка или ручные правила. Метод, основанный на Word Co-occurrence Matrix, является лингвистически независимым и масштабируемым.
  2. «Неожиданность» как индикатор спама: Ключевая идея заключается в том, что keyword-stuffing создает комбинации слов, которые статистически маловероятны в реальных названиях. Surprisingness Value количественно измеряет эту маловероятность.
  3. Важность эталонных данных: Эффективность системы напрямую зависит от качества и полноты List of Legitimate Business Titles. Эта база определяет, что считается «нормальным» названием.
  4. Два режима обнаружения: Система использует как глобальный фильтр (сравнение с общим порогом), так и детектор аномалий на уровне сущности (сравнение со средним значением для конкретного бизнеса), что повышает точность выявления спама и взлома.
  5. Активная фильтрация выдачи: Патент описывает не просто понижение в ранжировании, а полное исключение (withholding/excluding) переспамленных листингов из результатов поиска, что подчеркивает серьезность нарушения.

Практика

Best practices (это мы делаем)

  • Использование реального названия бренда: Необходимо использовать только официальное, юридически зарегистрированное или используемое в реальном мире (на вывесках) название бизнеса в Google Business Profile. Это минимизирует Surprisingness Value и снижает риск фильтрации.
  • Обеспечение консистентности NAP (Name, Address, Phone): Название бизнеса должно быть одинаковым на сайте, в GBP и во всех внешних каталогах. Это помогает системе корректно рассчитать Average Surprisingness Value (Claim 4) и снижает вероятность ложных срабатываний из-за вариативности данных.
  • Размещение ключевых слов в категориях и описаниях: Ключевые слова, описывающие услуги и местоположение, должны использоваться в предназначенных для этого полях (категории, услуги, описание, посты), а не в названии.

Worst practices (это делать не надо)

  • Добавление гео-модификаторов в название: Добавление названия города, района или улицы в название бизнеса (если это не часть бренда) создает неестественные комбинации слов и значительно увеличивает Surprisingness Value.
  • Добавление услуг или категорий в название: Включение ключевых слов услуг (например, «Ремонт холодильников», «Круглосуточный эвакуатор») в поле названия является прямым таргетом для этого алгоритма.
  • Использование названий чужих брендов (Hijacking): Попытка ассоциировать свой бизнес с более известным брендом путем включения его имени в свое название будет иметь экстремально высокий Surprisingness Value и приведет к быстрой фильтрации (как в примере с Locksmith и Marriott в патенте).
  • Создание виртуальных офисов с переспамленными названиями: Создание множества фейковых листингов с названиями типа «[Услуга] + [Локация]» будет эффективно обнаруживаться этой системой как статистическая аномалия.

Стратегическое значение

Патент подтверждает стратегию Google по жесткому контролю качества данных в локальном поиске. Для SEO-специалистов это означает, что манипуляции с полем названия бизнеса в GBP являются высокорискованной тактикой, которая может привести к полному исключению из выдачи или блокировке профиля. Стратегия локального SEO должна фокусироваться на построении реального бренда и использовании легитимных методов оптимизации, а не на краткосрочных тактиках переспама названия.

Практические примеры

Сценарий: Очистка названия GBP для сантехнической компании

  1. Исходное название в GBP (Спам): «Лучший Сантехник Москва Круглосуточно - Ремонт труб Иванов и Ко»
  2. Анализ: Реальное название бренда — «Иванов и Ко». Остальные слова являются ключевыми словами.
  3. Оценка риска (на основе патента): Комбинации слов («Сантехник», «Москва»), («Москва», «Круглосуточно»), («Ремонт», «Иванов») вероятно имеют высокий Surprisingness Value, так как редко встречаются одновременно в легитимных названиях брендов. Система Google может отфильтровать этот листинг.
  4. Действие: Изменить название в GBP на «Иванов и Ко».
  5. Результат: Surprisingness Value снижается до минимума. Риск фильтрации или блокировки листинга уменьшается. Ранжирование теперь зависит от других факторов (категории, отзывы, близость, сайт), а не от спама в названии.

Вопросы и ответы

Применяется ли этот алгоритм только к английскому языку?

Нет. Описанный метод основан на статистическом анализе совместной встречаемости слов (Word Co-occurrence), а не на семантическом понимании языка. Это делает его лингвистически независимым. Он может работать на любом языке, при условии, что у Google есть достаточно большая база легитимных названий на этом языке для построения матрицы.

Как Google формирует «Список легитимных названий бизнесов» (List of Legitimate Business Titles)?

Патент не детализирует процесс сбора, указывая, что он может быть выбран вручную как исходный список (seed list) или получен из авторитетных источников (например, Yellow Pages, правительственные сайты). На практике это могут быть данные из официальных государственных реестров или листинги, прошедшие строгую верификацию.

Что делать, если у моего бизнеса действительно необычное (surprising) название?

Если название легитимно, но имеет высокий Surprisingness Value, критически важно обеспечить максимальное подтверждение этого названия в реальном мире и в интернете (консистентность NAP). Наличие сильного бренда, официальной регистрации, вывесок и упоминаний в авторитетных источниках поможет подтвердить легитимность. Механизм Average Surprisingness Value также помогает учесть такие случаи, если название используется консистентно.

Может ли этот патент быть причиной блокировки (suspension) Google Business Profile?

Да, напрямую. Патент описывает механизм идентификации мошеннических или переспамленных названий с целью их исключения из результатов поиска. На практике нарушение правил Google по именованию бизнеса (которое этот алгоритм выявляет) часто приводит к жестким мерам, включая блокировку профиля.

Как работает механизм Average Surprisingness Value и зачем он нужен?

Он используется, когда Google находит несколько листингов для одного и того же бизнеса (например, из разных каталогов). Система рассчитывает среднюю оценку неожиданности (A) для всех вариантов названия. Если один из вариантов сильно отклоняется от среднего (S > A + Порог), он помечается как спам. Это позволяет бороться со спамом или взломом, не наказывая бизнес за небольшие естественные вариации в написании его названия в разных источниках.

Влияет ли этот алгоритм на обычное веб-ранжирование или только на локальный поиск?

Патент сфокусирован исключительно на business listings и business titles. Это указывает на применение в системах локального поиска, таких как Google Maps и Local Pack, где названия бизнесов играют ключевую роль. На стандартное ранжирование веб-страниц этот механизм прямого влияния не оказывает.

Как система определяет оптимальное пороговое значение (Threshold Value)?

Патент предлагает автоматизированный метод (Claim 18). Система тестирует различные пороги на размеченном наборе данных, чтобы найти баланс, который максимизирует отношение обнаруженного спама (истинно положительные результаты) к ложным срабатываниям на легитимных названиях (ложноположительные результаты). Это позволяет настроить чувствительность фильтра.

Если я уберу ключевые слова из названия GBP, мои позиции упадут?

В краткосрочной перспективе это возможно, так как спам в названии является сильным (хотя и запрещенным) фактором ранжирования. Однако сохранение спама ведет к высокому риску фильтрации или блокировки листинга описанным алгоритмом. Долгосрочная стратегия требует использования легитимного названия и оптимизации других факторов (категории, отзывы, сайт).

Анализирует ли система только название или другие поля листинга тоже?

Основной фокус патента — на названиях бизнесов. Однако в описании упоминается, что другие типы информации, включенные в листинг, такие как описательная информация (descriptive information) или категории (category information), также могут быть использованы для определения неожиданных комбинаций слов. Это может означать кросс-проверку релевантности между полями.

Актуален ли этот патент, учитывая современные нейросетевые модели?

Хотя патент использует более простые статистические методы (совместная встречаемость, TF-IDF), описанный принцип остается актуальным. Современные модели могут использовать более сложные методы (например, эмбеддинги) для оценки естественности языка, но конечная цель та же: выявить неестественные, переоптимизированные названия и присвоить им метрику, аналогичную Surprisingness Value.

Похожие патенты

Как Google использует отзывы пользователей для обнаружения спама и фейковых компаний в локальном поиске (Google Maps)
Google анализирует текст отзывов о компаниях для выявления спама в бизнес-листингах. Система ищет стоп-слова (например, "фейк", "не существует"), выявляет нерелевантные термины для категории бизнеса и сравнивает отзывы с базой известного спама. При превышении порога подозрительных сигналов листинг помечается как спам.
  • US8621623B1
  • 2013-12-31
  • Антиспам

  • Local SEO

  • EEAT и качество

Как Google выявляет спам в Локальном Поиске, анализируя частоту изменений в листингах и коммерческую ценность ключевых слов
Google использует систему для выявления спама в локальной выдаче (например, на Картах). Система анализирует, насколько часто определенные термины появляются в обновлениях бизнес-листингов (Flux) и какова их потенциальная коммерческая ценность (Monetary Value). Если высокодоходные термины часто изменяются или добавляются, система помечает эти термины и использующие их листинги как потенциальный спам и понижает их в ранжировании.
  • US20150154612A1
  • 2015-06-04
  • Антиспам

  • Local SEO

Как Google борется со спамом в бизнес-профилях (Local SEO), используя контекстуальный анализ и калибровку оценок спама
Google использует систему для обнаружения спамных бизнес-листингов (Local SEO), сравнивая данные из доверенных и ненадежных источников в рамках конкретных бизнес-контекстов (например, «сантехники» против «юристов»). Система выявляет характеристики, статистически связанные со спамом в данной нише, генерирует оценку спама и калибрует её в вероятность с помощью логистической регрессии для точной фильтрации.
  • US8738557B1
  • 2014-05-27
  • Антиспам

  • Local SEO

  • EEAT и качество

Как Google использует закон Ципфа для выявления спама и манипуляций с названиями в локальных листингах
Google анализирует все известные названия (Titles), связанные с локальным бизнесом. Система сравнивает распределение частотности слов в этих названиях с двумя моделями: равномерным распределением (характерно для легитимных данных из разных источников) и распределением по закону Ципфа (характерно для маркетинговых текстов и спама). Если распределение ближе к закону Ципфа, листинг помечается как потенциальный спам и понижается в локальной выдаче.
  • US9483566B2
  • 2016-11-01
  • Антиспам

  • Local SEO

Как Google использует анализ аномалий в показах и кликах для выявления фейковых локальных бизнес-листингов (Map Spam)
Google анализирует статистику взаимодействий (кликов) для групп связанных бизнес-листингов (Common Business). Система вычисляет статистически нормальный уровень активности и устанавливает порог (Anomaly Detection Threshold). Резкий всплеск активности выше этого порога (например, на два стандартных отклонения) сигнализирует о наличии фейковых или спамных листингов, созданных для манипуляции локальной выдачей.
  • US20150154610A1
  • 2015-06-04
  • Local SEO

  • Антиспам

  • Поведенческие сигналы

Популярные патенты

Как Google определяет язык поискового запроса, используя язык интерфейса, статистику слов и поведение пользователей
Google использует вероятностную модель для точной идентификации языка поискового запроса. Система комбинирует три ключевых фактора: статистику частотности слов в разных языках, язык интерфейса пользователя (например, Google.fr) и исторические данные о том, на какие результаты пользователи кликали ранее. Это позволяет корректно обрабатывать многоязычные и неоднозначные запросы для применения правильных синонимов и стемминга.
  • US8442965B2
  • 2013-05-14
  • Мультиязычность

  • Поведенческие сигналы

Как Google использует поведение пользователей для определения синонимичности фраз в запросах, связанных с сущностями
Google анализирует поведение пользователей (клики по результатам поиска), чтобы определить, означают ли разные фразы одно и то же, когда они связаны с одним типом сущности (например, «достопримечательности в <Город>» против «места для посещения в <Город>»). Если пользователи кликают на одни и те же документы для разных фраз, система считает эти фразы эквивалентными, что помогает Google понимать синонимы и улучшать результаты поиска.
  • US10073882B1
  • 2018-09-11
  • Семантика и интент

  • Поведенческие сигналы

Как Google использует контекст текущей сессии и поведение похожих пользователей для персонализации и переранжирования выдачи
Google анализирует недавнюю активность пользователя (запросы и клики в рамках сессии), чтобы определить его краткосрочный интерес. Система сравнивает, как другие пользователи с таким же интересом взаимодействовали с результатами по текущему запросу, по сравнению с общим поведением. Если предпочтения статистически значимо различаются, Google переранжирует выдачу, повышая результаты, предпочитаемые «похожей» аудиторией, учитывая при этом время взаимодействия с контентом (Dwell Time).
  • US8972391B1
  • 2015-03-03
  • Персонализация

  • Поведенческие сигналы

  • SERP

Как Google использует контекст и анализ офлайн-поведения (Read Ranking) для соединения физических документов с цифровыми копиями
Система идентифицирует цифровой контент по сканированному фрагменту из физического мира, используя не только текст, но и обширный контекст (время, местоположение, историю пользователя). Патент также вводит концепцию «Read Ranking» — отслеживание популярности физических документов на основе того, что люди сканируют, как потенциальный сигнал ранжирования.
  • US20110295842A1
  • 2011-12-01
  • Поведенческие сигналы

  • Персонализация

  • Семантика и интент

Как Google использует машинное обучение для оптимизации обхода Knowledge Graph и поиска связанных концепций
Google оптимизирует обход Knowledge Graph для эффективного поиска семантически связанных фраз. Вместо анализа всех связей сущности система использует ML-модели для выбора только тех отношений (свойств), которые вероятнее всего приведут к ценным результатам. Этот выбор основан на истории поисковых запросов и контексте пользователя, что позволяет экономить вычислительные ресурсы и повышать релевантность предложений.
  • US10140286B2
  • 2018-11-27
  • Knowledge Graph

  • Семантика и интент

  • Персонализация

Как Google определяет скрытый локальный интент в запросах для повышения релевантности местных результатов
Google использует механизм для определения того, подразумевает ли запрос (например, «ресторан») поиск локальной информации, даже если местоположение не указано. Система анализирует агрегированное поведение пользователей для расчета «степени неявной локальной релевантности» запроса. Если этот показатель высок, Google повышает в ранжировании результаты, соответствующие местоположению пользователя.
  • US8200694B1
  • 2012-06-12
  • Local SEO

  • Поведенческие сигналы

  • Семантика и интент

Как Google использует генеративный ИИ для создания динамических и гиперперсонализированных бизнес-профилей
Google разрабатывает систему, которая заменяет статические бизнес-профили динамическими «курируемыми профилями», генерируемыми ИИ (например, LLM). Эти профили адаптируются в реальном времени под конкретного пользователя, учитывая его запрос, предпочтения, историю поиска и демографию, чтобы показать наиболее релевантный контент, продукты и описания бренда.
  • US20250054045A1
  • 2025-02-13
  • Персонализация

  • Поведенческие сигналы

  • Семантика и интент

Как Google автоматически добавляет текст существующих объявлений к сайтлинкам (Sitelinks) для повышения CTR
Google использует систему для автоматического улучшения сайтлинков в рекламных объявлениях. Система анализирует существующие текстовые объявления (креативы) рекламодателя и определяет их конечные целевые страницы, игнорируя параметры отслеживания. Затем она сопоставляет их с URL сайтлинков и добавляет наиболее релевантный и эффективный текст креатива к сайтлинку для повышения кликабельности (CTR).
  • US10650066B2
  • 2020-05-12
  • Ссылки

  • SERP

Как Google использует визуальный анализ кликов по картинкам для понимания интента запроса и переранжирования выдачи
Google анализирует визуальное содержимое изображений, которые пользователи чаще всего выбирают в ответ на определенный запрос. На основе этого анализа (наличие лиц, текста, графиков, доминирующих цветов) система определяет категорию запроса (например, «запрос о конкретном человеке» или «запрос на определенный цвет»). Эти категории затем используются для переранжирования будущих результатов поиска, повышая изображения, которые визуально соответствуют выявленному интенту.
  • US9836482B2
  • 2017-12-05
  • Семантика и интент

  • Поведенческие сигналы

  • SERP

Как Google перенаправляет пользователей на «идеальные» запросы (KHRQ), анализируя поведение и удовлетворенность
Google анализирует логи запросов, чтобы определить «известные высокоранжированные запросы» (KHRQ) — те, которые пользователи вводят часто и которыми остаются довольны (редко переформулируют или долго изучают результаты). Система вычисляет вероятность того, что исходный запрос пользователя лучше заменить на KHRQ, основываясь на сходстве запросов и исторических цепочках переформулировок. Это позволяет направлять пользователей к наиболее эффективным формулировкам.
  • US7870147B2
  • 2011-01-11
  • Семантика и интент

  • Поведенческие сигналы

  • SERP

seohardcore