SEO HARDCORE
  • Разборы патентов
    • Патенты Google
  • Скоро SEO инструменты
  • Скоро SEO аналитика
  • seohardcore
SEO HARDCORE
назад

Как Google использует отзывы пользователей для обнаружения спама и фейковых компаний в локальном поиске (Google Maps)

METHOD AND SYSTEM FOR IDENTIFYING BUSINESS RECORDS (Метод и система для идентификации бизнес-записей)
  • US8621623B1
  • Google LLC
  • 2012-07-06
  • 2013-12-31
  • Антиспам
  • Local SEO
  • EEAT и качество
  • Описание
  • Разбор
  • Выводы
  • Практика
  • FAQ
  • Похожие

Google анализирует текст отзывов о компаниях для выявления спама в бизнес-листингах. Система ищет стоп-слова (например, "фейк", "не существует"), выявляет нерелевантные термины для категории бизнеса и сравнивает отзывы с базой известного спама. При превышении порога подозрительных сигналов листинг помечается как спам.

Описание

Какую проблему решает

Патент решает проблему наличия фейковых или спамных бизнес-листингов (spam business listings или false records) на платформах, агрегирующих информацию о компаниях (например, Google Maps, Local Search). Такие листинги могут создаваться для обмана пользователей, распространения вредоносного ПО или создания фейковых витрин. Изобретение направлено на улучшение качества локальной выдачи («signal-to-noise» ratio) путем автоматического выявления этого спама.

Что запатентовано

Запатентована система и метод автоматического обнаружения спама в бизнес-листингах путем интеллектуального анализа (mining) связанных с ними пользовательских отзывов (business reviews). Система использует комбинацию методов: поиск по ключевым словам, анализ релевантности контента категории бизнеса и сравнение с известными образцами спама. На основе этих сигналов вычисляется оценка спамности (spam count).

Как это работает

Система анализирует текст отзывов, связанных с бизнес-листингом, используя три основных подхода:

  • Поиск сигнальных слов: Ищутся фразы, указывающие на спам или неактуальность (например, "спам", "не существует", "закрыто").
  • Категориальный анализ: Система определяет категорию бизнеса и ищет в отзывах термины, которые редко встречаются или нерелевантны для этой категории (например, "рецептурные лекарства" в отзыве на слесаря).
  • Сравнение с известным спамом: Текст отзыва сравнивается с базой отзывов из known spam business listings. Ищутся совпадения текста, характерные ошибки или контактные данные (URL, телефоны, email).

При обнаружении этих сигналов увеличивается spam count. Если он превышает установленный порог, листинг помечается как потенциальный спам.

Актуальность для SEO

Высокая. Спам в локальном поиске и на картах (Local SEO) остается критически важной и актуальной проблемой. Использование пользовательского контента (UGC), такого как отзывы, для модерации, контроля качества и выявления мошенничества является стандартной и развивающейся практикой Google.

Важность для SEO

Патент имеет критическое значение (8/10) для Local SEO и управления репутацией (ORM). Он демонстрирует, как текст отзывов — как негативных, так и фейковых положительных — может напрямую привести к пометке или удалению бизнес-листинга. Это подчеркивает важность мониторинга отзывов, стимулирования подлинного и релевантного UGC, а также высокие риски использования накруток и шаблонных отзывов.

Детальный разбор

Термины и определения

Business Listing / Business Record (Бизнес-листинг / Бизнес-запись)
Запись в базе данных, содержащая информацию о компании (название, адрес, URL и т.д.). Пример: профиль компании в Google Maps.
Business Reviews (Отзывы о бизнесе)
Пользовательский контент (UGC), содержащий критику или иную информацию о бизнес-листинге, предоставленную третьей стороной.
Category of Business Listings (Категория бизнес-листингов)
Классификация листинга по типу бизнеса (например, слесарь, ресторан, авторемонт).
Characteristic Database (База данных характеристик)
Хранилище информации для обнаружения спама, включающее ключевые слова, категории и данные об известном спаме.
Known Spam Listings (Известные спам-листинги)
Набор бизнес-листингов, ранее идентифицированных как спам. Их отзывы используются как эталон для сравнения.
Spam Count (Оценка спамности)
Метрика, агрегирующая подозрительные сигналы, обнаруженные в отзывах. Используется для определения вероятности того, что листинг является спамом.
Spam Keywords (Спам-ключевые слова)
Список слов и фраз, наличие которых в отзыве предполагает, что листинг может быть спамом (например, "spam", "closed", "no store", "doesn't exist", "scam").
Spam Listing Detection Module (Модуль обнаружения спам-листингов)
Компонент системы, выполняющий логику анализа отзывов и идентификации спама.

Ключевые утверждения (Анализ Claims)

Claim 1 (Независимый пункт): Описывает основной метод идентификации бизнес-записей.

  1. Система получает множество отзывов для бизнес-листинга, принадлежащего к определенной категории.
  2. Система анализирует отзывы и увеличивает spam count при обнаружении одного или нескольких из следующих признаков:
    • Термины, соответствующие списку spam keywords.
    • Термины, которые редко встречаются (infrequently appear) в отзывах о валидных бизнесах в этой же категории.
    • Орфографические или грамматические ошибки, найденные в отзывах ранее идентифицированных спам-листингов.
    • Контактная информация, найденная в отзывах ранее идентифицированных спам-листингов.
  3. Система помечает (flagging) бизнес-листинг как спам, если spam count превышает установленный порог.

Claim 2 (Зависимый от 1): Детализирует обработку редко встречающихся терминов.

Система определяет, связан ли редко встречающийся термин с категорией бизнеса. Spam count увеличивается, только если этот термин не связан с категорией бизнеса. Это механизм защиты от ложных срабатываний на релевантные, но редкие термины.

Claim 3 и 4 (Зависимые): Описывают механизм самообучения системы (обратная связь).

Если идентифицирован редко встречающийся и нерелевантный термин, он (и его варианты) добавляется в список spam keywords для будущего использования.

Claim 5 (Зависимый от 1): Уточняет типы контактной информации.

Контактная информация включает встроенные URL-ссылки, номера телефонов или адреса электронной почты.

Claim 6 (Зависимый от 1): Описывает взвешивание сигналов.

Spam count увеличивается на разную величину (by different amounts) в зависимости от типа обнаруженного признака. Это означает, что система использует взвешенную модель, где одни сигналы считаются более сильными индикаторами спама, чем другие.

Где и как применяется

Изобретение применяется в системах, управляющих базами данных бизнес-листингов, таких как Google Maps и Local Search.

CRAWLING – Сканирование и Сбор данных
На этом этапе система собирает пользовательские отзывы (business reviews), связанные с бизнес-листингами.

INDEXING – Индексирование и извлечение признаков
Основной этап работы алгоритма. Spam Listing Detection Module анализирует собранные отзывы. Происходит:

  • Анализ текста отзывов на наличие spam keywords.
  • Определение категории бизнеса и расчет частотности терминов для этой категории (для выявления редких терминов).
  • Сравнение отзывов с базой known spam listings.
  • Вычисление и сохранение spam count для листинга.
  • Обновление списка spam keywords (самообучение).

RANKING / RERANKING – Ранжирование / Переранжирование
Рассчитанный spam count используется на этапе ранжирования локальных результатов для фильтрации или понижения листингов, помеченных как спам. Если spam count превышает порог, листинг может быть отправлен на ручную модерацию или автоматически удален.

Входные данные:

  • Бизнес-листинг и его категория.
  • Текст связанных с ним отзывов.
  • Characteristic Database (список spam keywords, данные о частотности терминов по категориям, база known spam listings).

Выходные данные:

  • Spam count для бизнес-листинга.
  • Флаг (пометка) листинга как потенциального спама.
  • Обновленный список spam keywords.

На что влияет

  • Конкретные типы контента: Влияет на видимость бизнес-листингов (например, в Google Maps) и связанный с ними пользовательский контент (отзывы).
  • Специфические запросы: Локальные запросы (например, "ресторан рядом", "услуги электрика").
  • Конкретные ниши или тематики: Наибольшее влияние в категориях, подверженных высокому уровню спама и мошенничества. В патенте упоминаются слесари (locksmiths), оценщики, аренда оборудования, авторемонт, электрики.

Когда применяется

  • Условия работы алгоритма: Применяется к бизнес-листингам, у которых есть ассоциированные отзывы.
  • Триггеры активации: Анализ может запускаться при получении нового отзыва или периодически для переоценки существующих листингов.
  • Пороговые значения: Алгоритм активирует пометку спама только тогда, когда агрегированная оценка spam count превышает заранее определенный порог.

Пошаговый алгоритм

Процесс анализа отзывов для выявления спам-листинга:

  1. Сбор данных: Получение бизнес-листинга, определение его категории и извлечение всех связанных с ним отзывов.
  2. Анализ по ключевым словам: Поиск в тексте отзывов терминов из предопределенного списка spam keywords (например, "спам", "фейк", "не существует").
  3. Категориальный анализ:
    • Определение частотности терминов в валидных отзывах для данной категории бизнеса.
    • Идентификация терминов в анализируемых отзывах, которые встречаются редко (infrequent).
    • Определение, являются ли эти редкие термины нерелевантными (irrelevant) для категории (Claim 2).
  4. Сравнение с известным спамом: Сравнение текста отзывов с базой отзывов из known spam listings. Поиск:
    • Точных или частичных совпадений текста (copy/paste).
    • Характерных орфографических и грамматических ошибок (Claim 1).
    • Совпадений контактной информации: URL, email, телефон (Claim 5).
  5. Расчет оценки (Spam Count): При обнаружении любого из вышеперечисленных сигналов система увеличивает spam count листинга. Разные сигналы имеют разный вес (Claim 6).
  6. Принятие решения: Сравнение итогового spam count с пороговым значением.
  7. Действие: Если порог превышен, листинг помечается (flagged) как потенциальный спам. Он может быть отправлен на ручную проверку или обработан автоматически.
  8. Обучение системы: Выявленные редкие и нерелевантные термины добавляются в список spam keywords (Claim 3, 4).

Какие данные и как использует

Данные на входе

Патент фокусируется на анализе контента отзывов и структурных данных о листинге.

  • Контентные факторы: Текст отзывов (Business Reviews). Это основной источник данных для анализа.
  • Структурные факторы: Категория бизнес-листинга (Category of Business Listings). Используется для контекстуального анализа релевантности терминов.
  • Системные данные:
    • Список spam keywords.
    • База данных known spam listings и связанных с ними отзывов.
    • Данные о частотности терминов в разрезе категорий.

Какие метрики используются и как они считаются

  • Spam Count: Агрегированная числовая оценка вероятности спама. Рассчитывается путем суммирования взвешенных сигналов, обнаруженных в отзывах.
  • Частотность терминов (Term Frequency): Статистический расчет частоты появления конкретных слов в отзывах внутри определенной категории бизнеса. Используется для выявления редких (infrequent) терминов.
  • Релевантность термина категории (Term Relevance): Оценка того, насколько термин связан с типом бизнеса. Патент не уточняет метод расчета, но указывает на необходимость этой оценки (Claim 2).
  • Сходство текстов (Text Similarity): Сравнение анализируемого отзыва с эталонными спам-отзывами для выявления совпадений текста, ошибок и контактных данных.
  • Взвешивание сигналов: Применение разных весовых коэффициентов к разным типам сигналов (например, совпадение с известным спамом имеет больший вес, чем наличие одного редкого термина) (Claim 6).
  • Порог (Threshold): Предопределенное значение spam count, при превышении которого листинг помечается как спам.

Выводы

  1. Отзывы как инструмент контроля качества: Google активно использует пользовательский контент (UGC) для валидации и модерации своих индексов в локальном поиске. Отзывы служат прямым источником сигналов о спаме и фейковых компаниях.
  2. Критичность контекста категории: Система оценивает текст отзыва в контексте категории бизнеса. Нерелевантный контент в отзывах (термины, которые редко встречаются и не связаны с категорией) является сильным индикатором спама.
  3. Борьба с шаблонным спамом и накрутками: Значительная часть патента направлена на выявление повторяющегося контента. Система ищет паттерны (текст, характерные ошибки, контактные данные) из known spam reviews для идентификации сетей спам-листингов.
  4. Взвешенная оценка спама: Система использует spam count, который агрегирует различные сигналы с разными весами (Claim 6). Это позволяет более точно оценивать вероятность спама и приоритизировать модерацию.
  5. Самообучение и адаптация: Механизм позволяет системе адаптироваться к новым видам спама путем автоматического пополнения списка spam keywords терминами, которые были идентифицированы как редкие и нерелевантные для конкретных категорий (Claim 3, 4).

Практика

Best practices (это мы делаем)

  • (Local SEO) Активный мониторинг отзывов: Регулярно отслеживайте отзывы о вашем бизнесе. Обращайте внимание на негатив, указывающий на проблемы с актуальностью данных (например, "они переехали", "по адресу ничего нет", "закрыто"), так как это прямые spam keywords, которые могут активировать алгоритм.
  • (Local SEO) Стимулирование релевантных и естественных отзывов: Поощряйте клиентов оставлять развернутые отзывы, содержащие естественные ключевые слова, связанные с вашими услугами и категорией бизнеса. Это помогает системе сформировать правильный лексический профиль и снижает риск ложных срабатываний на нерелевантный UGC.
  • (ORM) Быстрое реагирование на подозрительные отзывы: Если вы обнаружили отзыв, содержащий нерелевантный контент, спам-ссылки, чужие контактные данные или ложные утверждения о фейковости вашего бизнеса (возможно, атака конкурентов), немедленно сообщайте о нем в службу поддержки (например, Google Business Profile).
  • Поддержание актуальности листинга: Убедитесь, что вся информация в вашем бизнес-профиле точна. Несоответствие данных реальному положению дел провоцирует отзывы, которые активируют этот алгоритм.

Worst practices (это делать не надо)

  • Накрутка шаблонных или фейковых отзывов: Это крайне рискованная практика. Система специально ищет скопированный контент, повторяющиеся грамматические и орфографические ошибки, а также неестественные фразы (например, "A++"), характерные для known spam reviews.
  • Использование нерелевантного контента или ссылок в отзывах: Публикация отзывов (даже положительных), которые не имеют отношения к категории бизнеса или содержат сторонние URL/контакты, увеличивает spam count. Система идентифицирует это как аномалию на уровне категории.
  • Игнорирование пользовательских отзывов: Накопление отзывов, утверждающих, что бизнес фейковый, закрыт или является спамом, и отсутствие реакции на них приведет к срабатыванию алгоритма и пометке листинга.
  • Использование контактных данных, связанных со спамом: Если телефон, email или URL вашего бизнеса ранее использовались в спамных активностях, их появление в отзывах или самом листинге может стать триггером для пессимизации.

Стратегическое значение

Патент подтверждает стратегическую важность подлинности (Authenticity) и управления репутацией (ORM) в Local SEO. Работа с отзывами — это не просто улучшение ранжирования, а необходимая мера для обеспечения видимости и защиты бизнес-профиля от анти-спам алгоритмов. Системы Google полагаются на сигналы от пользователей для валидации данных о бизнесе в масштабе.

Практические примеры

Сценарий 1: Категориальный анализ и нерелевантные термины

  1. Ситуация: Бизнес-листинг в категории "Слесарь" (Locksmith).
  2. Отзыв пользователя: "Я кликнул на ссылку в описании, и меня перебросило на странный сайт, продающий рецептурные лекарства (prescription drugs)".
  3. Анализ системы: Система определяет, что термины "сайт" и "рецептурные лекарства" редко встречаются и нерелевантны для категории "Слесарь".
  4. Результат: Spam count листинга увеличивается. Термин "рецептурные лекарства" может быть добавлен в базу spam keywords.

Сценарий 2: Использование шаблонных спам-отзывов (Накрутка)

  1. Ситуация: Владелец нескольких фейковых листингов накручивает отзывы.
  2. Отзыв (накрученный): "The best, Hihly I recommend. A++".
  3. Анализ системы: Система сравнивает этот текст с базой known spam reviews. Она находит совпадения по фразе "A++", а также идентифицирует характерную орфографическую ошибку ("Hihly" вместо "Highly") и грамматику, которые уже встречались в подтвержденном спаме.
  4. Результат: Spam count значительно увеличивается (сильный вес сигнала согласно Claim 6), листинг помечается как спам.

Вопросы и ответы

Насколько опасно использовать накрутку и шаблонные положительные отзывы для Local SEO?

В контексте этого патента это крайне опасно. Патент прямо описывает механизм сравнения текста отзывов с базой известного спама (known spam reviews). Если отзывы скопированы, содержат одинаковые ошибки, неестественные фразы (например, "A++") или контактные данные, это значительно увеличит spam count и может привести к удалению листинга.

Как система определяет, какие слова являются "редкими" или "нерелевантными" для моей категории бизнеса?

Система проводит статистический частотный анализ всех отзывов в рамках вашей категории. Если термин редко встречается в этой выборке, система затем проверяет, связан ли он с услугами категории (Claim 2). Если нет (например, "криптовалюта" в отзыве на ресторан), он будет считаться подозрительным сигналом.

Могут ли конкуренты использовать этот механизм, чтобы навредить моему бизнесу?

Теоретически да. Если они организуют кампанию по публикации отзывов, содержащих сильные сигналы спама, например, прямо напишут "это фейк" (spam keyword) или вставят нерелевантный текст/ссылки. Поэтому критически важно мониторить отзывы и оперативно сообщать в Google о подозрительной активности и атаках.

Что важнее для этого алгоритма: количество отзывов или их содержание?

Содержание является критичным. Патент указывает (Claim 6), что разные сигналы имеют разный вес (вносят разный вклад в spam count). Даже один отзыв с сильными индикаторами спама (например, точное совпадение с известным спам-отзывом) может привести к превышению порога и активации проверки листинга.

Учитывает ли система авторитетность пользователя, оставившего отзыв (например, локального эксперта)?

В данном патенте не упоминается анализ профиля или авторитетности автора отзыва. Система фокусируется исключительно на анализе текста самого отзыва, его релевантности категории бизнеса и его схожести с известными образцами спама.

Что такое механизм самообучения, описанный в патенте?

Это механизм обратной связи (Claims 3 и 4). Когда система обнаруживает термин, который является одновременно редким и нерелевантным для данной категории, она не только увеличивает spam count текущего листинга, но и добавляет этот термин (и его варианты) в глобальный список spam keywords для более быстрого обнаружения в будущем.

Если мой бизнес временно закрыт и люди пишут об этом в отзывах, меня пометят как спам?

Это возможно, так как "closed" (закрыто) упоминается в патенте как пример spam keyword. Хотя существует риск неверной интерпретации, рекомендуется использовать официальные функции бизнес-профиля (например, в Google Business Profile) для указания статуса "временно закрыто", чтобы минимизировать негативные сигналы из отзывов.

Как защитить свой листинг от ложного срабатывания этого алгоритма?

Ключевая стратегия защиты — обеспечение максимальной актуальности данных в листинге и активное управление репутацией. Необходимо стимулировать реальных клиентов оставлять подлинные и релевантные отзывы о ваших услугах, а также регулярно мониторить новые отзывы на предмет негатива или спам-атак.

Как система обрабатывает орфографические ошибки в отзывах?

Система специально ищет орфографические и грамматические ошибки, которые характерны для known spam reviews (Claim 1). Это используется не для оценки грамотности, а как индикатор того, что отзыв мог быть скопирован, сгенерирован или создан тем же источником спама, что и ранее идентифицированные фейковые отзывы.

В каких нишах этот алгоритм наиболее активен?

Патент упоминает ниши, где часто встречается спам: слесари (locksmiths), оценщики, аренда оборудования, авторемонт, электрики. Это часто ниши срочных услуг или Service Area Businesses (SAB). В этих категориях система, вероятно, применяет более строгие пороги и агрессивно анализирует отзывы.

Похожие патенты

Как Google борется со спамом в бизнес-профилях (Local SEO), используя контекстуальный анализ и калибровку оценок спама
Google использует систему для обнаружения спамных бизнес-листингов (Local SEO), сравнивая данные из доверенных и ненадежных источников в рамках конкретных бизнес-контекстов (например, «сантехники» против «юристов»). Система выявляет характеристики, статистически связанные со спамом в данной нише, генерирует оценку спама и калибрует её в вероятность с помощью логистической регрессии для точной фильтрации.
  • US8738557B1
  • 2014-05-27
  • Антиспам

  • Local SEO

  • EEAT и качество

Как Google использует анализ аномалий в показах и кликах для выявления фейковых локальных бизнес-листингов (Map Spam)
Google анализирует статистику взаимодействий (кликов) для групп связанных бизнес-листингов (Common Business). Система вычисляет статистически нормальный уровень активности и устанавливает порог (Anomaly Detection Threshold). Резкий всплеск активности выше этого порога (например, на два стандартных отклонения) сигнализирует о наличии фейковых или спамных листингов, созданных для манипуляции локальной выдачей.
  • US20150154610A1
  • 2015-06-04
  • Local SEO

  • Антиспам

  • Поведенческие сигналы

Как Google использует закон Ципфа для выявления спама и манипуляций с названиями в локальных листингах
Google анализирует все известные названия (Titles), связанные с локальным бизнесом. Система сравнивает распределение частотности слов в этих названиях с двумя моделями: равномерным распределением (характерно для легитимных данных из разных источников) и распределением по закону Ципфа (характерно для маркетинговых текстов и спама). Если распределение ближе к закону Ципфа, листинг помечается как потенциальный спам и понижается в локальной выдаче.
  • US9483566B2
  • 2016-11-01
  • Антиспам

  • Local SEO

Как Google использует «Оценку Неожиданности» (Surprisingness Value) для выявления и фильтрации переспама в названиях компаний в локальном поиске
Google использует статистический анализ для борьбы со спамом в названиях компаний (например, в Google Maps). Система анализирует корпус легитимных названий, чтобы понять естественные комбинации слов. Затем для проверяемого названия вычисляется «Оценка Неожиданности» (Surprisingness Value). Если сочетание слов слишком маловероятно (например, «Ресторан Слесарь»), листинг помечается как спам и исключается из выдачи.
  • US8473491B1
  • 2013-06-25
  • Антиспам

  • Local SEO

Как Google использует всплески локальных запросов для быстрого обнаружения и индексации новых бизнесов
Google анализирует логи локальных поисковых запросов для обнаружения новых бизнесов. Система отслеживает термины, отсутствующие в текущей базе данных. Если частота использования такого термина в определенном регионе резко возрастает по сравнению с историческим уровнем, система идентифицирует его как название нового бизнеса и инициирует процесс его проверки (включая анализ отзывов) и добавления в индекс.
  • US9218420B1
  • 2015-12-22
  • Local SEO

  • Индексация

  • Поведенческие сигналы

Популярные патенты

Как Google использует время просмотра (Watch Time) для ранжирования видео и другого контента
Google измеряет, сколько времени пользователи тратят на потребление контента (особенно видео) после клика по результату поиска и во время последующей сессии. Ресурсы, которые удерживают внимание пользователей дольше, получают повышение в ранжировании (Boost), а ресурсы с коротким временем просмотра понижаются. Система учитывает не только клики, но и фактическое вовлечение пользователя в рамках всей сессии просмотра.
  • US9098511B1
  • 2015-08-04
  • Поведенческие сигналы

  • Мультимедиа

  • SERP

Как Google использует анализ сопутствующих ссылок (co-citation) и нормализацию веса для определения связанных сайтов и конкурентов
Google анализирует структуру ссылок для поиска сайтов, связанных с выбранным документом и находящихся на том же уровне обобщения (например, конкурентов). Система определяет, на какие еще сайты ссылаются источники, цитирующие исходный документ (co-citation). Для повышения точности вес ссылок нормализуется: снижается влияние множественных ссылок с одного хоста и ссылок со страниц-каталогов (хабов).
  • US6754873B1
  • 2004-06-22
  • Ссылки

  • SERP

  • Техническое SEO

Как Google фильтрует поведенческие сигналы, используя совместимость языков и стран пользователей
Google уточняет ранжирование, анализируя, откуда (страна) и на каком языке (язык пользователя) поступали исторические клики по документу. Если эти характеристики считаются «несовместимыми» с текущим пользователем, поведенческие сигналы (клики) от этих групп могут быть исключены или понижены в весе. Это предотвращает искажение релевантности данными от кардинально отличающихся аудиторий.
  • US8498974B1
  • 2013-07-30
  • Поведенческие сигналы

  • Мультиязычность

  • Персонализация

Как Google фильтрует персонализированные предложения запросов на основе контента просматриваемой страницы
Google использует механизм для генерации предложений следующего запроса после того, как пользователь покинул страницу выдачи. Система создает кандидатов на основе истории поиска пользователя, а затем фильтрует их, проверяя релевантность контенту страницы, которую пользователь просматривает в данный момент. Это гарантирует, что предложения соответствуют как интересам пользователя, так и текущему контексту просмотра.
  • US8392435B1
  • 2013-03-05
  • Персонализация

  • Поведенческие сигналы

  • SERP

Как Google создает и наполняет Панели Знаний (Knowledge Panels), используя шаблоны сущностей и популярность фактов
Google использует систему для отображения Панелей Знаний (Knowledge Panels) рядом с результатами поиска. Когда запрос относится к конкретной сущности (человеку, месту, компании), система выбирает соответствующий шаблон и наполняет его контентом из разных источников. Выбор фактов для отображения основан на том, как часто пользователи искали эту информацию в прошлом.
  • US9268820B2
  • 2016-02-23
  • Knowledge Graph

  • SERP

  • Семантика и интент

Как Google использует паттерны просмотра пользователей (co-visitation) для определения связанности документов и улучшения поиска
Google использует систему для определения того, насколько тесно связаны два документа, основываясь на агрегированных данных о поведении пользователей. Система рассчитывает вероятность того, что пользователь просмотрит Документ B в течение определенного времени после того, как Документ А был показан ему в результатах поиска. Эти данные используются для персонализации выдачи, предложения рекомендаций и улучшения релевантности на основе контекста сессии пользователя.
  • US8447760B1
  • 2013-05-21
  • Поведенческие сигналы

  • Персонализация

  • Семантика и интент

Как Google использует данные о кликах разных групп пользователей (популяций) для локализации и персонализации ранжирования
Google адаптирует результаты поиска, анализируя, как разные группы пользователей (популяции), определяемые по местоположению, языку или демографии, взаимодействуют с выдачей. Система рассчитывает «Сигнал Популяции» (Population Signal) на основе исторических кликов группы и корректирует ранжирование. Также используется механизм сглаживания для компенсации нехватки данных по конкретным группам.
  • US7454417B2
  • 2008-11-18
  • Персонализация

  • Поведенческие сигналы

  • SERP

Как Google использует пользовательский контент (UGC) и историю поиска для сбора структурированных отзывов
Google анализирует пользовательский контент (фотографии, посты, метаданные) и историю поиска, чтобы определить, с какими объектами (места, продукты, услуги) взаимодействовал пользователь. Система проактивно предлагает оставить структурированный отзыв, используя шаблон, который может быть предварительно заполнен на основе тональности исходного UGC. Это направлено на увеличение объема и подлинности отзывов.
  • US20190278836A1
  • 2019-09-12
  • Семантика и интент

  • Персонализация

  • EEAT и качество

Как Google использует "ложные пропуски" (Fake Skips) для точной оценки качества своих правил синонимов
Google анализирует поведение пользователей для оценки качества синонимов, используемых при переписывании запросов. Патент вводит метрику "Fake Skip" (Ложный пропуск). Она фиксируется, если пользователь пропустил результат с синонимом, но кликнул на результат ниже, который также содержит этот синоним и исходный термин. Это позволяет точнее калибровать систему синонимов и не пессимизировать хорошие правила из-за неоднозначного поведения пользователей.
  • US8909627B1
  • 2014-12-09
  • Поведенческие сигналы

  • Семантика и интент

  • SERP

Как Google использует реальные данные о скорости загрузки страниц (RUM) для повышения быстрых и понижения медленных сайтов в выдаче
Google собирает данные о времени загрузки страниц у реальных пользователей (RUM) и использует их для корректировки ранжирования. Система сравнивает скорость сайта с глобальными порогами, основанными на процентилях. Если сайт медленнее большинства других (например, медленнее 85% или 96%), его рейтинг понижается. Очень быстрые сайты могут получать повышение. Оценка скорости учитывает географию и тип устройства пользователя.
  • US8645362B1
  • 2014-02-04
  • Техническое SEO

  • Поведенческие сигналы

  • SERP

seohardcore