Close Menu
    Telegram
    SEO HARDCORE
    • Разборы патентов
      • Патенты Google
      • Патенты Яндекс
    • Скоро
      SEO инструменты
    • Скоро
      SEO аналитика
    SEO HARDCORE
    Разборы патентов • Патенты Яндекс

    Как Яндекс обнаруживает источники «флешмобов» (review bombing) и нейтрализует накрученные оценки, используя историю браузера пользователей

    СПОСОБ И СИСТЕМА ДЛЯ ОПРЕДЕЛЕНИЯ АНОМАЛЬНОЙ КРАУДСОРСИНГОВОЙ МЕТКИ (Method and system for detecting an abnormal crowdsourcing label)
    • RU2775591C2
    • Yandex LLC
    • 2022-07-05
    • 2019-08-22
    2022 Антиспам Краудсорсинг Патенты Яндекс Яндекс Браузер

    Яндекс патентует систему для защиты от «флешмобов» и накрутки оценок (review bombing). Система анализирует аномальные всплески оценок и сравнивает историю браузера пользователей, оставивших эти оценки. Это позволяет выявить внешний веб-ресурс (например, вирусный пост или обзор), спровоцировавший аномалию. Оценки от пользователей, посетивших этот ресурс, понижаются в весе или удаляются.

    • Описание
    • Детальный разбор
    • Выводы
    • Практика
    • Вопросы и ответы
    • Наверх

    Описание

    Какую задачу решает

    Патент решает задачу поддержания целостности и достоверности пользовательских сигналов (рейтингов, отзывов, голосов) в условиях внешних манипулятивных кампаний, которые в патенте называются «флешмобами» (аналог термина «review bombing»). Проблема заключается в том, что пользователи могут оставлять предвзятые оценки под влиянием внешнего события (например, вирусного обзора блогера), а не на основе реального опыта взаимодействия с продуктом или сервисом. Патент направлен на обнаружение не только самих аномальных оценок, но и на выявление веб-источника (источник внешнего инициирующего события), который спровоцировал эту аномалию.

    Что запатентовано

    Запатентована система и способ обнаружения источника аномальных краудсорсинговых оценок. Суть изобретения заключается в использовании истории просмотра веб-страниц пользователей для выявления причинно-следственной связи между посещением определенного внешнего веб-ресурса и последующим выставлением аномальной оценки. Это позволяет идентифицировать источник влияния и применить корректирующие действия к затронутым оценкам.

    Как это работает

    Система анализирует распределение оценок для цифрового элемента. При обнаружении аномального всплеска (пиковые тенденции), отличающегося от типичного распределения, система активирует анализ. Пользователи, оставившие оценки в этот период, делятся на две группы: те, кто оставил аномальные оценки (например, резко негативные), и остальные. Затем система сравнивает историю просмотра этих двух групп, используя данные из журнала просмотра веб-страниц. Если первая группа статистически значимо чаще посещала определенный веб-ресурс по сравнению со второй группой, этот ресурс идентифицируется как источник влияния. Оценки, оставленные пользователями из первой группы, могут быть удалены или им назначается уменьшающий весовой коэффициент.

    Актуальность для SEO

    Высокая. В условиях информационных войн, конкурентной борьбы и вирусного маркетинга, защита от «review bombing» критически важна для платформ, полагающихся на пользовательские рейтинги (Яндекс.Маркет, Карты, Кинопоиск и т.д.). Способность Яндекса использовать кросс-сайтовые данные о поведении пользователей (вероятно, через Яндекс.Метрику или Браузер) делает реализацию этого патента высоковероятной и эффективной.

    Важность для SEO

    Влияние на SEO значительно (7.5/10). Пользовательские оценки и отзывы являются важными поведенческими и трастовыми факторами ранжирования, особенно для локального поиска и e-commerce. Этот патент демонстрирует механизм, с помощью которого Яндекс защищает эти сигналы от манипуляций. Для SEO это означает, что попытки искусственно влиять на рейтинги через внешние кампании (покупка обзоров с призывом к действию, вирусный маркетинг) будут активно обнаруживаться и нейтрализовываться. Акцент смещается на получение органических, неподдельных сигналов пользовательского удовлетворения.

    Детальный разбор

    Термины и определения

    Аномальная краудсорсинговая метка (Anomalous Crowdsourcing Label)
    Оценка (рейтинг, голос), выставленная пользователем под влиянием внешнего события, а не на основе личного опыта. Является результатом «флешмоба».
    Внешнее инициирующее событие (External Initiating Event)
    Событие (например, публикация вирусного обзора, пост в социальной сети, новость), которое побуждает пользователей массово выставлять предвзятые оценки цифровому элементу.
    Дельта-набор (Delta-Set)
    Набор веб-ресурсов (URL), которые пользователи, выставившие аномальные метки, посещали значительно чаще, чем пользователи, выставившие нормальные метки. Содержит потенциальные источники влияния.
    Журнал просмотра веб-страниц (Web Page Viewing Log)
    Хранилище данных об истории посещений веб-ресурсов пользователями. В экосистеме Яндекса это, вероятно, данные, собранные через Яндекс.Метрику, Яндекс.Браузер или другие сервисы веб-аналитики.
    Краудсорсинговая метка (Crowdsourcing Label)
    Любой пользовательский сигнал обратной связи: рейтинг, отзыв, голос, комментарий.
    Пиковые тенденции (Peak Trends)
    Аномальные всплески концентрации определенных оценок в распределении, указывающие на возможное внешнее влияние.
    Типичное распределение меток (Typical Distribution)
    Ожидаемое (нормальное) распределение оценок для цифрового элемента в отсутствие внешнего влияния.
    Флешмоб (Flashmob)
    Термин, используемый в патенте для описания массового выставления предвзятых оценок под влиянием внешнего источника (аналог «review bombing»).
    Цифровой элемент (Digital Element)
    Объект, которому выставляется оценка (фильм, товар, организация, приложение и т.д.).
    DIV (Difference In Values)
    Разность значений концентраций меток для двух соседних меток. Используется для выявления пиков.
    Z-статистика (Z-statistics)
    Статистический метод, используемый для определения значимости различий в частоте посещения веб-ресурсов между двумя группами пользователей.

    Ключевые утверждения (Анализ Claims)

    Ядром изобретения является не просто обнаружение аномалий в рейтингах, а точное определение внешнего источника этой аномалии через анализ истории браузера.

    Claim 1 (Независимый пункт): Описывает основной способ обнаружения источника внешнего инициирующего события.

    1. Анализ краудсорсинговых меток, собранных за период времени.
    2. Определение аномального подмножества меток (потенциально вызванных внешним событием).
    3. Получение истории просмотра из журнала для пользователей, оставивших эти метки.
    4. Разделение истории просмотра на две группы: Первая группа (связана с аномальными метками) и Вторая группа (связана с остальными метками).
    5. Формирование дельта-набора веб-ресурсов путем анализа различий в посещенных ресурсах между Первой и Второй группой. Дельта-набор содержит ресурсы с аномальным характером посещений.
    6. Сопоставление ресурса из дельта-набора с источником внешнего инициирующего события.

    Claims 3, 4, 5 (Корректирующие действия): Описывают, что система делает после обнаружения источника.

    • Система может удалять или назначать уменьшающий весовой коэффициент меткам, оставленным пользователями, которые посещали идентифицированный источник (Claim 3, 4).
    • Система может применять эти действия проактивно к будущим меткам от пользователей, которые ранее посещали этот источник (Claim 5).

    Claims 6, 7 (Обнаружение аномалий): Детализируют, как определяется аномальное подмножество.

    • Анализ пиковых тенденций (всплесков) в фактическом распределении меток, которые не соответствуют типичному распределению.
    • Пики могут быть одиночными (одна метка резко выделяется) или групповыми (две соседние метки выделяются).

    Claims 11, 12, 13 (Статистическое подтверждение источника): Определяют, как подтверждается аномальный характер посещений.

    • Рассчитывается доля пользователей из Первой группы, посетивших ресурс, и доля пользователей из Второй группы, посетивших тот же ресурс.
    • Ресурс признается связанным с аномалией, если первая доля статистически значимо больше второй.
    • Для сравнения используется Z-статистика (Claim 12). Если различие статистически значимо, ресурс определяется как источник (Claim 13).

    Где и как применяется

    Изобретение применяется в слое контроля качества данных и влияет на формирование поведенческих факторов ранжирования.

    CRAWLING & DATA ACQUISITION – Сбор данных
    Система критически зависит от инфраструктуры сбора поведенческих данных. Это не веб-краулинг, а сбор журналов просмотра веб-страниц пользователей. Это реализуется через Сервер отслеживания (Tracking Server), который агрегирует данные, вероятно, из Яндекс.Метрики, Яндекс.Браузера и других точек сбора данных экосистемы.

    Слой Качества и Метрик (QUALITY & GOVERNANCE LAYER)
    Это основная область применения патента. Система функционирует как механизм очистки и валидации входных данных (пользовательских сигналов). Она взаимодействует с базами данных краудсорсинговых меток и глобальным хранилищем истории просмотра.

    RANKING – Ранжирование (L3/L4)
    Прямого влияния на алгоритм ранжирования патент не оказывает, но он критически влияет на качество входных данных для него. Очищенные или взвешенные пользовательские сигналы (рейтинги) затем используются как признаки в основных моделях ранжирования (CatBoost/YATI) и при расчете метрик качества (например, Proxima). Система гарантирует, что поведенческие факторы отражают реальный опыт, а не манипуляции.

    На что влияет

    • Конкретные типы контента/Платформы: Наибольшее влияние оказывается на сервисы, где пользовательские рейтинги играют ключевую роль: Яндекс.Маркет (товары), Яндекс.Карты/Бизнес (локальные организации), Кинопоиск (фильмы – пример из патента), Яндекс.Услуги.
    • Конкретные ниши или тематики: Любые ниши, подверженные хайпу, спорам или конкурентным войнам: медиа, развлечения, рестораны, отели, электроника, потенциально YMYL-тематики, где достоверность отзывов критична.

    Когда применяется

    • Триггеры активации: Алгоритм активируется при обнаружении пиковых тенденций в распределении оценок для конкретного цифрового элемента в течение определенного периода времени. Триггером служит статистически значимое отклонение фактического распределения от типичного распределения.
    • Временные рамки: Анализ проводится в скользящем временном окне. Длительность окна (период Т) может адаптироваться в зависимости от частоты поступления меток (если меток мало, окно шире; если много – уже).

    Пошаговый алгоритм

    1. Сбор данных и Мониторинг: Система непрерывно собирает краудсорсинговые метки для цифрового элемента и имеет доступ к журналу просмотра веб-страниц пользователей.
    2. Обнаружение Аномалий (Анализ Пиков):
      1. Для заданного периода времени (Т) анализируется фактическое распределение меток.
      2. Рассчитывается разность значений концентраций (DIV) для соседних меток.
      3. Разности DIV нормализуются.
      4. Система ищет аномально большие нормализованные DIV (одиночные или групповые пики), особенно на краях распределения (очень низкие или очень высокие оценки).
      5. Если пик обнаружен, определяется аномальное подмножество меток, формирующих этот пик.
    3. Получение и Сегментация Истории Просмотра:
      1. Извлекается история просмотра для всех пользователей, оставивших метки в период Т.
      2. История делится на две группы: Группа 1 (пользователи, оставившие аномальные метки) и Группа 2 (остальные пользователи).
    4. Анализ Различий и Формирование Дельта-набора:
      1. Система сравнивает наборы URL, посещенных Группой 1 и Группой 2.
      2. Для каждого URL рассчитывается доля посетивших его пользователей в Группе 1 (P1) и в Группе 2 (P2).
      3. Выявляются URL, где P1 значительно превышает P2. Эти URL формируют дельта-набор.
    5. Идентификация Источника:
      1. К различиям в долях применяется Z-статистика для подтверждения статистической значимости.
      2. URL из дельта-набора, показавшие статистически значимое различие, идентифицируются как источники внешнего инициирующего события.
      3. Источники могут ранжироваться по количеству посетивших их пользователей (Claim 14).
    6. Корректирующие действия:
      1. Меткам, оставленным пользователями, которые посещали идентифицированный источник, назначается уменьшающий весовой коэффициент или они удаляются.
      2. Система может проактивно применять эти меры к будущим меткам от этих пользователей.

    Какие данные и как использует

    Данные на входе

    • Поведенческие факторы (Краудсорсинг): Метки (рейтинги, голоса), оставленные пользователями для цифрового элемента. Временные метки выставления оценок.
    • Пользовательские факторы (Отслеживание): Идентификаторы пользователей (могут быть анонимизированы).
    • Данные истории просмотра (Ключевые данные): Журнал просмотра веб-страниц. Содержит записи вида {UserID, URL, Timestamp} о посещении пользователями различных веб-ресурсов (как внутри экосистемы Яндекса, так и внешних). Это данные кросс-доменного отслеживания.

    Какие метрики используются и как они считаются

    • Распределение меток: Частотный анализ количества меток для каждого значения рейтинга (например, сколько оценок «1», «2» и т.д.).
    • DIV (Difference In Values): Метрика для обнаружения пиков. Рассчитывается как разница между долями соседних меток. DIVi=∣Доля i−Доля i−1∣DIV_i = |\text{Доля}_i — \text{Доля}_{i-1}|DIVi=∣Доляi​−Доляi−1​∣
    • Нормализованная DIV: DIV, приведенная к шкале 100% для сравнения относительной величины пиков.
    • Доли посещений (Proportions P1, P2): Доля пользователей в Группе 1 и Группе 2, посетивших конкретный URL.
    • Z-статистика: Стандартный статистический тест для сравнения двух пропорций. Используется для определения, является ли разница в посещениях между Группой 1 и Группой 2 случайной или статистически значимой.

    Выводы

    1. Яндекс активно борется с внешними манипуляциями рейтингами: Патент описывает конкретный механизм для противодействия «флешмобам» (review bombing) и кампаниям влияния, направленным на искусственное изменение пользовательских оценок.
    2. Использование истории браузера для валидации поведения: Ключевым элементом системы является доступ к кросс-сайтовой истории просмотра пользователей. Это позволяет Яндексу устанавливать причинно-следственные связи между внешним контентом и действиями пользователя на своих платформах.
    3. Статистический подход к обнаружению влияния: Идентификация источника влияния основана не на предположениях, а на статистическом анализе (Z-статистика) различий в поведении между пользователями, оставившими аномальные и нормальные оценки.
    4. Нейтрализация манипулятивных сигналов: Система не просто обнаруживает проблему, но и активно ее решает путем удаления или понижения веса (downweighting) скомпрометированных оценок, причем как ретроактивно, так и проактивно.
    5. Целостность поведенческих факторов превыше всего: Для Яндекса критически важно, чтобы поведенческие сигналы, используемые в ранжировании, были подлинными. Этот патент защищает качество этих сигналов.

    Практика

    Best practices (это мы делаем)

    • Фокус на органическом получении отзывов: Сосредоточьтесь на качестве продукта/услуги и удобстве пользователя. Лучшая стратегия — это когда довольные клиенты оставляют положительные отзывы по собственной инициативе, а не в результате внешней стимуляции.
    • Стимулирование отзывов внутри платформы или через прямые каналы: Используйте легальные методы стимулирования обратной связи (например, напоминания после покупки или оказания услуги) непосредственно на платформе или через прямые каналы коммуникации (email, push), которые сложнее отследить как единый внешний веб-источник.
    • Мониторинг репутации и быстрое реагирование на негатив: Отслеживайте упоминания бренда в сети. В случае возникновения негативного инфоповода (который может спровоцировать review bombing), будьте готовы к работе с негативом, понимая, что система Яндекса может автоматически отфильтровать скоординированные искусственные отзывы.

    Worst practices (это делать не надо)

    • Организация «флешмобов» и кампаний влияния: Заказ публикаций у блогеров или в СМИ с прямым призывом поставить высокую оценку вашему продукту (или низкую оценку конкуренту) на платформах Яндекса. Этот патент описывает точный механизм, как такие кампании будут обнаружены через анализ истории браузера участников, и нейтрализованы.
    • Использование бирж отзывов и микрозадач: Если пользователи массово посещают сайт биржи (источник задания) перед тем, как оставить отзыв на сервисе Яндекса, URL этой биржи будет идентифицирован как источник внешнего инициирующего события, а все отзывы будут помечены как аномальные.
    • Агрессивный вирусный маркетинг с целью накрутки рейтингов: Создание вирусного контента, целью которого является искусственное завышение рейтингов. Если контент станет источником аномального всплеска оценок, эти оценки будут пессимизированы.

    Стратегическое значение

    Патент подтверждает стратегический приоритет Яндекса на качество и подлинность поведенческих сигналов. Он демонстрирует высокий уровень интеграции данных между различными сервисами Яндекса (Поиск, Маркет, Карты, Метрика/Браузер) для контроля качества. Для SEO и ORM это означает, что манипуляции поведенческими факторами через внешние источники становятся все более сложными и рискованными. Долгосрочная стратегия должна строиться исключительно на развитии качественного продукта и формировании органической лояльности аудитории.

    Практические примеры

    Сценарий 1: Нейтрализация позитивного «флешмоба» (Накрутка рейтинга через блогера)

    1. Событие: Компания заказывает обзор нового смартфона у популярного техноблогера. Блогер публикует восторженный обзор и призывает подписчиков поставить смартфону 10/10 на Яндекс.Маркете.
    2. Действие пользователей: Тысячи пользователей переходят на Маркет и ставят 10/10.
    3. Реакция системы: Яндекс обнаруживает аномальный пик оценок 10/10 (Пиковая тенденция).
    4. Анализ: Система сравнивает историю браузера пользователей, поставивших 10/10 (Группа 1), с остальными (Группа 2).
    5. Результат: Выявляется, что Группа 1 статистически значимо чаще посещала URL обзора блогера. Этот URL признается источником внешнего инициирующего события. Оценкам от Группы 1 назначается уменьшающий весовой коэффициент. Рейтинг смартфона корректируется.

    Сценарий 2: Защита от негативного «флешмоба» (Review Bombing ресторана через Telegram)

    1. Событие: В популярном Telegram-канале публикуется вирусный пост с жалобой на ресторан и призывом ставить ему 1 звезду на Яндекс.Картах.
    2. Действие пользователей: Сотни пользователей, многие из которых никогда не были в ресторане, переходят по ссылке и ставят 1 звезду.
    3. Реакция системы: Яндекс обнаруживает аномальный пик оценок 1/5 на Картах.
    4. Анализ: Система анализирует историю браузера пользователей, поставивших 1 звезду (Группа 1).
    5. Результат: Выявляется, что большинство пользователей из Группы 1 недавно посещали URL Telegram-канала (t.me/…). Этот URL признается источником. Оценки, оставленные под влиянием этого поста, удаляются или пессимизируются, защищая рейтинг ресторана от нерелевантного негатива.

    Вопросы и ответы

    Что такое «флешмоб» или «review bombing» в контексте этого патента?

    Это ситуация, когда большое количество пользователей массово выставляет предвзятые оценки (очень высокие или очень низкие) какому-либо объекту (товару, фильму, организации) не на основе личного опыта, а под влиянием внешнего события. Примером может служить призыв блогера или вирусный пост в социальной сети, побуждающий людей искусственно завысить или занизить рейтинг.

    Как именно Яндекс понимает, что оценка является аномальной?

    Система анализирует распределение оценок за определенный период времени и сравнивает его с «типичным распределением». Если наблюдается резкий всплеск (пик) определенных оценок (например, внезапно появилось много оценок «1» или «10»), который статистически не характерен для данного объекта, система маркирует эти оценки как аномальные и запускает дальнейший анализ.

    Откуда Яндекс берет данные об истории просмотра пользователей?

    В патенте упоминается «журнал просмотра веб-страниц», хранящийся на «сервере отслеживания». В экосистеме Яндекса основными источниками таких кросс-сайтовых данных являются счетчики Яндекс.Метрики, установленные на миллионах сайтов, а также данные Яндекс.Браузера и других сервисов компании, где пользователь авторизован.

    Как система находит источник, спровоцировавший «флешмоб»?

    После выявления аномальных оценок система делит пользователей на две группы: тех, кто поставил аномальные оценки (Группа 1), и остальных (Группа 2). Затем она сравнивает историю их браузеров. Если пользователи из Группы 1 статистически значимо чаще посещали определенный URL по сравнению с Группой 2 (используется Z-статистика для подтверждения), этот URL признается источником влияния.

    Что Яндекс делает с оценками, которые были признаны результатом «флешмоба»?

    Патент предусматривает два основных варианта корректирующих действий. Такие оценки могут быть полностью удалены (игнорироваться при расчете рейтинга) или им может быть назначен «уменьшающий весовой коэффициент» (понижение веса). Это позволяет нейтрализовать влияние манипуляции на итоговый рейтинг.

    Означает ли это, что заказывать обзоры у блогеров теперь бесполезно?

    Заказывать обзоры для повышения узнаваемости и привлечения трафика по-прежнему эффективно. Однако, если целью обзора является искусственная накрутка рейтинга через прямой призыв к действию («Все идем ставить 5 звезд!»), то этот механизм Яндекса обнаружит и нейтрализует такие оценки. Польза будет только от тех оценок, которые оставят пользователи, реально воспользовавшиеся продуктом после обзора.

    Может ли этот механизм защитить мой бизнес от атак конкурентов (негативного review bombing)?

    Да, это одна из целей системы. Если конкуренты организуют кампанию по снижению вашего рейтинга через внешний ресурс (например, форум или социальную сеть), система должна обнаружить этот источник влияния и отфильтровать оценки, оставленные под его воздействием, защищая ваш реальный рейтинг.

    На каких сервисах Яндекса этот механизм наиболее актуален?

    Он критически важен для всех сервисов, где рейтинг играет важную роль в принятии решений пользователем и ранжировании. В первую очередь это Яндекс.Маркет, Яндекс.Карты (Яндекс.Бизнес), Кинопоиск (упомянут в примерах патента), Яндекс.Услуги и, возможно, отзывы о сайтах в самом Поиске.

    Делает ли этот патент покупку отзывов на биржах бессмысленной?

    Он делает массовые закупки крайне рискованными. Если исполнители заходят на сайт биржи для получения задания перед тем, как оставить отзыв, система Яндекса с высокой вероятностью идентифицирует URL биржи как источник скоординированной активности. В результате все эти отзывы будут аннулированы или пессимизированы.

    Что, если координация «флешмоба» происходит офлайн или в приватных чатах?

    Этот конкретный патент фокусируется на обнаружении источника в виде веб-ресурса (URL). Если координация происходит офлайн или в приложениях, история которых недоступна системе (например, приватные чаты мессенджеров), то источник не будет найден этим методом. Однако, сам факт статистической аномалии (резкий пик оценок) все равно будет зафиксирован, и Яндекс может применять другие методы фильтрации подозрительной активности.

    Навигация
    • Описание
    • Детальный разбор
    • Выводы
    • Практика
    • Вопросы и ответы
    • Наверх
    Telegram
    © 2025 SEO HARDCORE

    Type above and press Enter to search. Press Esc to cancel.