Как Google добавляет случайный шум к оценкам спама в бизнес-листингах (Local SEO), чтобы помешать обратному инжинирингу фильтров

REVERSE ENGINEERING CIRCUMVENTION OF SPAM DETECTION ALGORITHMS (Предотвращение обратного инжиниринга алгоритмов обнаружения спама)

US8612436B1
Google LLC
2011-09-27
2013-12-17

Google использует механизм для защиты своих алгоритмов обнаружения спама в бизнес-листингах (Local SEO). Чтобы спамеры не могли определить точные пороги фильтров путем тестирования, система добавляет контролируемый случайный шум к рассчитанной оценке спамности (Spam Score). Это делает применение санкций (удаление или понижение) недетерминированным и затрудняет обратный инжиниринг.

Какую проблему решает

Патент решает проблему обратного инжиниринга (reverse engineering) алгоритмов обнаружения спама. Спамеры, особенно в сфере локального поиска (fake business spam), систематически отправляют множество слегка отличающихся листингов и анализируют, какие из них пенализируются. Это позволяет им определить веса факторов и точные пороги срабатывания фильтров, чтобы адаптировать свои методы и обходить защиту. Изобретение направлено на то, чтобы сделать такой анализ невозможным.

Что запатентовано

Запатентована система, которая намеренно вносит элемент случайности (шум) в процесс оценки спама бизнес-листингов. После расчета базовой оценки спамности (Spam Score) система добавляет к ней случайное значение перед тем, как применить штрафные санкции (удаление или понижение). Это делает результаты работы спам-фильтров недетерминированными с точки зрения внешнего наблюдателя, что значительно усложняет обратный инжиниринг.

Как это работает

Система работает в несколько этапов:

Расчет базовой оценки: Для бизнес-листинга (z) вычисляется исходный Spam Score S(z) (например, от 0.0 до 1.0).
Определение границ шума: Используется ограничивающая функция (Bound Function B(x)), чтобы определить максимально допустимый уровень шума для данной оценки.
Генерация и применение шума: Генерируется случайное значение (Noise Function N(z)) в этих границах и добавляется к базовой оценке, формируя итоговую «зашумленную» оценку (Noisy Spam Score S'(z)).
Применение порогов: Итоговая оценка сравнивается с порогами. Если превышен высокий порог (First Threshold), листинг удаляется. Если превышен средний порог (Second Threshold), листинг понижается или помечается для проверки.
Шейпинг шума (Noise Shaping): Система может специально изменять (увеличивать или уменьшать) уровень шума вблизи пороговых значений для тонкой настройки баланса между обфускацией и точностью.

Актуальность для SEO

Высокая. Проблема fake business spam в Local SEO (Google Business Profile / Google Maps) остается крайне актуальной. Методы добавления шума для предотвращения обратного инжиниринга и повышения устойчивости к состязательным атакам (adversarial robustness) являются стандартной практикой в современных системах машинного обучения. Этот патент описывает фундаментальный механизм защиты алгоритмов Google от манипуляций.

Важность для SEO

Патент имеет значительное влияние (7/10) на стратегии в Local SEO. Он не раскрывает факторы ранжирования, но объясняет, почему попытки точно протестировать границы дозволенного в спам-фильтрах ненадежны. Он подчеркивает высокий риск для листингов, работающих в «серой зоне»: из-за внесенного шума применение санкций может казаться случайным и непоследовательным, что делает «серые» тактики нестабильными.

Термины и определения

Bound Function (B(x)) (Ограничивающая функция): Функция, которая определяет максимальное количество шума, добавляемого к заданному Spam Score (x). Гарантирует, что итоговая оценка останется в допустимом диапазоне (например, 0.0–1.0) и позволяет контролировать величину шума.
Boundary Points (Граничные точки): Значения Spam Score, которые соответствуют порогам применения различных санкций (например, точки, разделяющие зоны «принять», «понизить» и «удалить»).
Business Listing (z) (Бизнес-листинг): Запись о компании (например, Google Business Profile), предназначенная для включения в поисковый индекс.
Fake Business Spam (Фальшивый бизнес-спам): Мошенническая тактика, при которой создается большое количество листингов для несуществующих местоположений компании с целью доминирования в локальной выдаче.
Noise Function (N(z)) (Функция шума): Функция, которая вычисляет конкретное значение шума для листинга (z). Рассчитывается как произведение Bound Function B(S(z)) и случайного числа R(z).
Noisy Spam Score (S'(z)) (Зашумленная оценка спама): Итоговая оценка спама, используемая для принятия решений о санкциях. $S'(z) = S(z) + N(z)$ .
R(z) (Генератор случайных чисел): Компонент, генерирующий случайное значение (например, от -1.0 до 1.0). Может использовать данные листинга или параметры индексации (например, дату или имя индекса) как начальное значение (seed).
Shaped Bound Function (B'(x)) (Сформированная ограничивающая функция): Модифицированная Bound Function, настроенная на увеличение или уменьшение шума вблизи Boundary Points (Noise Shaping).
Spam Score (S(z)) (Оценка спама): Исходная базовая оценка, присвоенная листингу (z), указывающая на вероятность того, что он является мошенническим (0.0 – легитимный, 1.0 – спам).
Thresholds (Пороги): Заранее определенные значения. First Threshold (например, 0.8) для удаления листинга. Second Threshold (например, 0.6) для понижения или пометки флагом.

Ключевые утверждения (Анализ Claims)

Claim 1 (Независимый пункт): Описывает базовый метод обработки листинга с вариацией оценки спама.

Система получает листинг и присваивает первую оценку спама (first spam score).
Первая оценка изменяется до второй (second spam score).
Ключевой механизм: Изменение происходит с использованием разных функций (Первая или Вторая) в зависимости от того, в какое подмножество диапазона попадает первая оценка.
Если вторая оценка превышает First Threshold, листинг удаляется или не включается в поиск.

Защищается метод неравномерного применения шума. Использование разных функций позволяет системе по-разному обрабатывать шум в разных частях диапазона. Это основа для механизма Noise Shaping, где шум вблизи границ (Вторая функция) отличается от шума в остальном диапазоне (Первая функция).

Claim 2, 3, 4, 5 (Зависимые): Вводят второй уровень санкций.

Если вторая оценка превышает Second Threshold (который ниже First Threshold), листинг идентифицируется как потенциальный спам. К нему применяется понижение в ранжировании (demoted) или он помечается для проверки (flagged).

Claim 6, 7, 8, 9 (Зависимые): Детализируют механизм формирования шума (Noise Shaping).

Изменение оценки включает добавление функции шума (Claim 6).
Вторая функция изменяет оценку на большую величину, чем первая, когда оценка находится вблизи одного из порогов (Claim 7).
Система может специально увеличивать шум вблизи Второго порога (Claim 8) или уменьшать шум вблизи Первого порога (Claim 9).

Это позволяет точно настроить уровень неопределенности именно там, где спамеры пытаются найти границу.

Claim 11 (Независимый пункт): Альтернативное описание с уточнением природы функций.

Получение листинга, присвоение первой оценки и изменение до второй.
Изменение использует Первую функцию (включающую компонент шума) в одном диапазоне и Вторую функцию (включающую компонент без шума – non-noise component) в другом диапазоне.
Если вторая оценка превышает порог, листинг идентифицируется как потенциальный спам.

«Компонент без шума» во Второй функции можно интерпретировать как детерминированные параметры (например, значения порогов и коэффициенты крутизны в формуле B'(x)), которые используются для модификации (шейпинга) базового шума вблизи граничных точек.

Где и как применяется

Изобретение применяется на этапе обработки данных индекса, до того как листинги становятся доступны для поиска, и фокусируется на индексе локального поиска.

INDEXING – Индексирование и извлечение признаков

Основной этап применения. Патент указывает, что спам-фильтрация и добавление шума могут происходить:

Ближе к концу процесса индексирования: После того как листинги собраны и проанализированы, рассчитывается Spam Score и добавляется шум, прежде чем индекс копируется на рабочие машины (production machines).
В потоке обновлений (update stream): Отдельный процесс, который обрабатывает обновления в реальном времени.

Патент подчеркивает, что шум должен быть добавлен до принятия решения об удалении или понижении листинга, и рекомендует выполнять это как можно позже в процессе обработки.

RANKING / RERANKING – Ранжирование
Если система решает понизить (demote) листинг на основе Noisy Spam Score, это напрямую влияет на его позицию на этапе ранжирования.

Входные данные:

Бизнес-листинг (z).
Исходный Spam Score S(z).
Параметры ограничивающей функции B(x) или B'(x) и пороговые значения (Thresholds).

Выходные данные:

Зашумленный Spam Score S'(z).
Решение о статусе листинга (легитимный, пониженный/флаг, удаленный).

На что влияет

Конкретные типы контента: Патент строго сфокусирован на Business Listings и борьбе с Fake Business Spam. Это напрямую относится к системам локального поиска (Local SEO, Google Maps, Google Business Profile).
Конкретные ниши или тематики: Наибольшее влияние в конкурентных локальных нишах, подверженных спаму (например, услуги на дому, ремонт, юридические услуги), где активно используются тактики создания фейковых локаций и тестирования алгоритмов.

Когда применяется

Условия работы алгоритма: Применяется ко всем бизнес-листингам, проходящим процесс оценки спама.
Временные рамки и частота: Во время перестроения основного индекса (упоминается период в несколько недель) или при обработке листинга через поток обновлений (в реальном времени).
Триггеры активации (Шейпинг шума): Специальная логика изменения шума (использование модифицированных функций) активируется, когда Spam Score находится вблизи пороговых значений (Boundary Points).

Пошаговый алгоритм

Процесс обработки бизнес-листинга (z) и добавления шума:

Получение данных и расчет исходной оценки: Система получает листинг и присваивает исходный Spam Score S(z) (от 0.0 до 1.0).
Определение параметров шума (Noise Shaping): Система выбирает соответствующую ограничивающую функцию. Если S(z) находится вблизи порогов, может использоваться модифицированная функция B'(x) для увеличения или уменьшения шума. Рассчитывается максимальная величина шума: B(S(z)).
Генерация случайного значения: Генерируется случайное число R(z) (от -1.0 до 1.0). В качестве затравки (seed) может использоваться контент листинга или параметры индексации.
Расчет шума: Вычисляется функция шума N(z) по формуле: $N(z) = B(S(z)) * R(z)$ .
Расчет итоговой оценки: Вычисляется зашумленная оценка спама S'(z) по формуле: $S'(z) = S(z) + N(z)$ .
Сравнение с Первым порогом (T1): Проверяется, превышает ли S'(z) значение First Threshold (например, 0.8).
- Если ДА: Листинг идентифицируется как мошеннический и удаляется из индекса. Процесс завершен.
Сравнение со Вторым порогом (T2): Проверяется, превышает ли S'(z) значение Second Threshold (например, 0.6).
- Если ДА: Листинг понижается в ранжировании (demoted) или помечается для проверки (flagged for inspection).
- Если НЕТ: Листинг считается легитимным.

Какие данные и как использует

Данные на входе

Патент фокусируется на механизме обфускации, предполагая, что Spam Score уже рассчитан. Однако он упоминает факторы, используемые для расчета исходной оценки:

Контентные факторы:
- Название бизнес-листинга (business listing title).
- Идентифицирующая информация в листингах.
Географические факторы:
- Местоположение бизнеса.
Системные данные (для генерации шума): Информация из листинга, дата или имя создаваемого индекса могут использоваться как начальное значение (seed) для генератора случайных чисел R(z).

Какие метрики используются и как они считаются

Метрики для расчета исходного Spam Score (S(z)):

Географическая плотность (geographic density) предприятий в той же категории.
Повторяющаяся идентифицирующая информация (repeated identifying information) в разных листингах.
Соотношение общих терминов в названии бизнес-листинга к общему количеству слов в названии.

Метрики для расчета шума:

Limit Value (L): Глобальное максимальное количество шума (в примере L=0.1).
Bound Function (B(x)): Определяет максимальный шум. Должна удовлетворять условиям $B(x) \le x$ и $B(x) \le 1-x$ (чтобы оценка оставалась в пределах 0-1). Пример простой функции: $B(x) = K*(x-x^2)^2$ .
Shaped Bound Function (B'(x)): Используется для шейпинга шума (Noise Shaping) – увеличения или уменьшения шума вблизи пороговых значений с помощью дополнительных множителей (как в Eq. 12 патента).

Намеренная обфускация через недетерминизм: Основная цель патента — сделать невозможным для спамеров точное определение порогов срабатывания спам-фильтров и весов отдельных факторов. Добавление шума приводит к тому, что похожие или идентичные листинги получают разные итоговые оценки и санкции.
Ненадежность SEO-тестирования границ: Этот механизм напрямую подрывает эффективность A/B тестирования спам-фильтров в Local SEO. Выводы, сделанные на основе наблюдения за поведением алгоритма, могут быть ложными из-за внесенного шума.
Шейпинг шума (Noise Shaping): Шум не применяется равномерно. Google точно контролирует уровень шума вблизи критических границ (Boundary Points). Они могут увеличивать шум для максимизации путаницы или уменьшать его для минимизации ложных срабатываний.
Фокус на Local SEO: Патент специфичен для Business Listings и борьбы с Fake Business Spam. Все выводы применимы к оптимизации и управлению Google Business Profile.
Риски «серой зоны»: Листинги, чьи базовые оценки спама находятся вблизи пороговых значений, подвержены высокому риску случайного применения санкций. Из-за шума листинг может непредсказуемо пересекать границу (например, быть удаленным вместо понижения или наоборот).
Важность чистых сигналов легитимности: Единственная надежная стратегия — поддерживать базовый Spam Score как можно ближе к нулю, вне «шумных» зон риска.

Best practices (это мы делаем)

Обеспечение максимальной легитимности (Local E-E-A-T): Ключевая стратегия — поддерживать сигналы качества и достоверности на высоком уровне, чтобы базовый Spam Score был как можно ниже. В этой зоне влияние шума минимально, что обеспечивает стабильность и защиту от случайных санкций.
Консервативный подход к оптимизации GBP: Избегайте тактик, которые могут повысить Spam Score. Строго следуйте правилам Google Business Profile. Учитывайте факторы, упомянутые в патенте как примеры спама: избегайте переоптимизации названий (анализ соотношения терминов), не создавайте дубликаты (повторяющаяся информация) и будьте осторожны в перенасыщенных нишах (географическая плотность).
Принятие неопределенности при тестировании и диагностике: При проведении экспериментов или диагностике блокировок GBP учитывайте, что непоследовательные результаты могут быть следствием работы этого механизма, а не изменения алгоритма или конкретной проблемы с листингом.

Worst practices (это делать не надо)

Оптимизация «на грани фола» и работа в «серой зоне»: Попытки балансировать на грани допустимого (например, использование виртуальных офисов, агрессивное насыщение ключевыми словами в названии). Поскольку границы намеренно размыты шумом, такие стратегии крайне рискованны и нестабильны.
Обратный инжиниринг порогов спама: Трата ресурсов на определение точных порогов срабатывания фильтров путем отправки тестовых листингов. Патент описывает механизм, который делает такие тесты вводящими в заблуждение.
Игнорирование непоследовательности санкций: Если один спамный листинг прошел фильтр, это не значит, что тактика безопасна. Это может быть результатом случайного шума, который будет другим при следующей обработке.

Стратегическое значение

Патент подтверждает, что Google активно и намеренно противодействует попыткам обратного инжиниринга своих алгоритмов, используя состязательный (adversarial) подход к борьбе со спамом. Для SEO-специалистов это означает переход от поиска лазеек к стратегиям, сфокусированным на долгосрочном качестве и легитимности. Система спроектирована так, чтобы сделать манипулятивные тактики непредсказуемыми и рискованными.

Практические примеры

Сценарий: Непоследовательная блокировка GBP профилей с переоптимизированными названиями

SEO-специалист управляет двумя профилями в одной нише и использует агрессивную оптимизацию названий.

Исходные данные:
- Листинг A: Название включает 5 ключевых слов. Базовый S(A) = 0.78.
- Листинг B: Название включает 6 ключевых слов. Базовый S(B) = 0.82.
Пороги и шум: Порог удаления (T1) = 0.80. Максимальный шум в этой зоне (L) = 0.05.
Обработка (Цикл 1): Система добавляет случайный шум.
- Листинг A: Шум = +0.03. Итоговый S'(A) = 0.81.
- Листинг B: Шум = -0.03. Итоговый S'(B) = 0.79.
Результат Цикла 1: Листинг A (с меньшим количеством ключей) удален (S'(A) > 0.80). Листинг B (с большим количеством ключей) остается активным.
Обработка (Цикл 2, после обновления индекса): Система добавляет новый случайный шум (так как seed может зависеть от даты индекса).
- Листинг A (если восстановлен): Шум = -0.01. Итоговый S'(A) = 0.77.
- Листинг B: Шум = +0.01. Итоговый S'(B) = 0.83.
Результат Цикла 2: Листинг A активен. Листинг B удален.
Вывод специалиста: Результаты кажутся случайными и противоречивыми. Невозможно определить точный лимит ключевых слов, что и является целью патента.

Применяется ли этот механизм к обычному веб-поиску или только к Local SEO?

Текст патента строго сфокусирован на Business Listings и борьбе с Fake Business Spam (фальшивыми местоположениями компаний). Все примеры относятся к тому, что сейчас является Google Business Profile и Google Maps. Хотя технически этот метод может быть применен шире, в контексте данного патента речь идет только о локальном поиске.

Объясняет ли этот патент, почему мой GBP профиль был заблокирован, а профиль конкурента с теми же нарушениями – нет?

Да, это одно из прямых следствий работы описанного механизма. Если оба профиля имеют базовый Spam Score, близкий к порогу блокировки, добавление случайного шума может привести к тому, что один профиль случайно превысит порог, а другой – нет. Это сделано намеренно, чтобы скрыть точное значение порога.

Значит ли это, что ранжирование или применение санкций в Google Maps случайно?

Не совсем. Базовый расчет Spam Score детерминирован. Случайность (шум) вносится только на этапе применения санкций и только в ограниченных пределах, заданных Bound Function. Для явно легитимных (около 0.0) или явно спамных (около 1.0) листингов результат будет стабильным. Неопределенность возникает только в «серой зоне» вблизи пороговых значений.

Что такое «Шейпинг шума» (Noise Shaping), упомянутый в патенте?

Это модификация ограничивающей функции (Bound Function) вблизи критических порогов (Boundary Points). Google может захотеть увеличить шум около порога понижения (например, 0.6), чтобы максимально запутать спамеров. Одновременно они могут уменьшить шум около порога удаления (например, 0.8), чтобы минимизировать ложные срабатывания для легитимных бизнесов или гарантировать удаление явного спама.

Как этот патент влияет на A/B тестирование в Local SEO?

Он делает A/B тестирование для выявления спам-факторов и порогов крайне ненадежным. Поскольку система вносит случайный шум, вы не можете быть уверены, что разница в результатах вызвана вашими изменениями, а не шумом. Это вынуждает специалистов полагаться на лучшие практики, а не на эмпирическое тестирование границ.

Насколько сильно может измениться Spam Score из-за шума?

Патент предлагает использовать максимальный предел шума (L). В примерах упоминается значение L=0.1 (по шкале от 0 до 1). Обычно максимальный шум применяется к средним оценкам (около 0.5), а минимальный – к крайним (около 0 или 1), но это может быть изменено с помощью шейпинга шума.

Может ли легитимный бизнес пострадать из-за этого шума?

Теоретически да, если его базовая оценка Spam Score по какой-то причине близка к порогу (например, из-за ошибок в данных или атак конкурентов). Однако Bound Function ограничивает шум, и если бизнес посылает сильные сигналы легитимности, его базовая оценка будет низкой, минимизируя риск.

Когда именно добавляется этот шум?

Шум добавляется во время обработки индекса (Indexing), непосредственно перед принятием решения о применении штрафов и до того, как индекс публикуется на производственных серверах. Это может происходить при периодическом перестроении индекса или в реальном времени через поток обновлений (update stream).

Является ли этот шум постоянным для конкретного листинга?

Не обязательно. Патент упоминает, что генератор случайных чисел R(z) может использовать дату или имя индекса в качестве начального значения (seed). Это означает, что при каждой переиндексации шум может быть разным, даже если листинг не менялся, что еще больше затрудняет обратный инжиниринг.

Если мой листинг был понижен (demoted), может ли он восстановиться без изменений из-за шума?

Да, это возможно. Если исходный Spam Score был близок к порогу, и в предыдущем цикле положительный шум привел к его превышению, то в следующем цикле шум может оказаться отрицательным. В этом случае итоговая оценка окажется ниже порога, и листинг восстановит свои позиции без каких-либо действий со стороны владельца.

Как Google борется со спамом в бизнес-профилях (Local SEO), используя контекстуальный анализ и калибровку оценок спама

Google использует систему для обнаружения спамных бизнес-листингов (Local SEO), сравнивая данные из доверенных и ненадежных источников в рамках конкретных бизнес-контекстов (например, «сантехники» против «юристов»). Система выявляет характеристики, статистически связанные со спамом в данной нише, генерирует оценку спама и калибрует её в вероятность с помощью логистической регрессии для точной фильтрации.

US8738557B1
2014-05-27

Антиспам
Local SEO
EEAT и качество

Как Google использует отзывы пользователей для обнаружения спама и фейковых компаний в локальном поиске (Google Maps)

Google анализирует текст отзывов о компаниях для выявления спама в бизнес-листингах. Система ищет стоп-слова (например, "фейк", "не существует"), выявляет нерелевантные термины для категории бизнеса и сравнивает отзывы с базой известного спама. При превышении порога подозрительных сигналов листинг помечается как спам.

US8621623B1
2013-12-31

Антиспам
Local SEO
EEAT и качество

Как Google использует «Оценку Неожиданности» (Surprisingness Value) для выявления и фильтрации переспама в названиях компаний в локальном поиске

Google использует статистический анализ для борьбы со спамом в названиях компаний (например, в Google Maps). Система анализирует корпус легитимных названий, чтобы понять естественные комбинации слов. Затем для проверяемого названия вычисляется «Оценка Неожиданности» (Surprisingness Value). Если сочетание слов слишком маловероятно (например, «Ресторан Слесарь»), листинг помечается как спам и исключается из выдачи.

US8473491B1
2013-06-25

Антиспам
Local SEO

Как Google использует закон Ципфа для выявления спама и манипуляций с названиями в локальных листингах

Google анализирует все известные названия (Titles), связанные с локальным бизнесом. Система сравнивает распределение частотности слов в этих названиях с двумя моделями: равномерным распределением (характерно для легитимных данных из разных источников) и распределением по закону Ципфа (характерно для маркетинговых текстов и спама). Если распределение ближе к закону Ципфа, листинг помечается как потенциальный спам и понижается в локальной выдаче.

US9483566B2
2016-11-01

Антиспам
Local SEO

Как Google выявляет спам в Локальном Поиске, анализируя частоту изменений в листингах и коммерческую ценность ключевых слов

Google использует систему для выявления спама в локальной выдаче (например, на Картах). Система анализирует, насколько часто определенные термины появляются в обновлениях бизнес-листингов (Flux) и какова их потенциальная коммерческая ценность (Monetary Value). Если высокодоходные термины часто изменяются или добавляются, система помечает эти термины и использующие их листинги как потенциальный спам и понижает их в ранжировании.

US20150154612A1
2015-06-04

Антиспам
Local SEO

Как Google использует цитирования на веб-страницах для ранжирования книг в основной выдаче

Google использует механизм для определения релевантных книг по общим информационным запросам, даже если пользователь не искал книгу специально. Система анализирует, какие книги цитируются на топовых веб-страницах в выдаче. Книги получают оценку, основанную на авторитетности цитирующих страниц и контексте цитирования, и затем подмешиваются в результаты поиска.

US8392429B1
2013-03-05

Ссылки
SERP
EEAT и качество

Как Google улучшает результаты поиска, подбирая похожие "идеальные" запросы из логов и структурированных данных

Google идентифицирует запросы, которые стабильно показывают высокое вовлечение пользователей (CTR, долгие клики), и генерирует синтетические запросы из структурированных данных (например, частотного анкорного текста). Когда пользователь вводит похожий, но потенциально плохо сформулированный запрос, Google использует эти "аугментирующие запросы" для предоставления более качественных и релевантных результатов.

US9128945B1
2015-09-08

SERP
Поведенческие сигналы
EEAT и качество

Как Google использует клики и пропуски пользователей для оценки и корректировки правил близости терминов (Proximity Rules)

Google анализирует поведение пользователей для оценки эффективности правил близости (Proximity Rules), которые влияют на ранжирование в зависимости от расстояния между ключевыми словами на странице. Система отслеживает, кликают ли пользователи на результаты, где термины расположены далеко друг от друга, или пропускают их. На основе этих данных (Click Count, Skip Count) вычисляется оценка качества правила, что позволяет Google динамически адаптировать важность фактора близости.

US9146966B1
2015-09-29

Поведенческие сигналы
SERP

Как Google использует социальные связи для выявления предвзятых ссылок и борьбы со ссылочными схемами и кликфродом

Google анализирует взаимоотношения между администраторами веб-сайтов (используя данные социальных сетей), чтобы определить независимость ссылок или кликов по рекламе. Если обнаружена тесная связь, это интерпретируется как предвзятость (Bias). В результате вес ссылки для ранжирования может быть снижен (борьба с Search Spamming), или клик по рекламе может быть дисконтирован (борьба с Ad Spamming).

US10402457B1
2019-09-03

Ссылки
Антиспам
Краулинг

Как Google динамически перестраивает выдачу, если пользователь игнорирует результаты, связанные с определенной сущностью

Google использует механизм уточнения интента пользователя в реальном времени при обработке неоднозначных запросов. Система группирует результаты поиска по связанным сущностям. Если пользователь демонстрирует отсутствие интереса к одной из групп (например, прокручивает или смахивает результаты), система динамически модифицирует выдачу, понижая или удаляя все результаты, связанные с этой отклоненной сущностью.

US9348945B2
2016-05-24

Семантика и интент
SERP
Поведенческие сигналы

Как Google обучается на поведении пользователя для персонализации весов источников в поисковой выдаче

Google использует сигналы интереса пользователя (клики, время просмотра) для динамической корректировки весов различных источников данных (например, ключевых слов, тем, типов контента). Система определяет, какие источники наиболее полезны для конкретного пользователя, и повышает их значимость при ранжировании последующих результатов поиска, тем самым персонализируя выдачу.

US8631001B2
2014-01-14

Персонализация
Поведенческие сигналы
SERP

Как Google генерирует «синтетический анкорный текст», анализируя структуру и контекст ссылающихся страниц

Google анализирует структурно похожие страницы, ссылающиеся на различные ресурсы. Определяя, где известные поисковые запросы (Seed Queries) появляются в структуре этих ссылающихся страниц (например, в заголовках или Title), Google создает шаблоны. Эти шаблоны затем используются для извлечения текста из аналогичных мест на других страницах, создавая «синтетический описательный текст» (аналог анкорного текста) для целевых ресурсов. Это улучшает ранжирование, даже если фактический анкорный текст низкого качества.

US9208232B1
2015-12-08

Ссылки
Структура сайта
Семантика и интент

Как Google использует данные о кликах и пропусках для валидации и удаления неэффективных синонимов в поиске

Google постоянно тестирует правила подстановки (синонимы) для расширения запросов. Этот патент описывает механизм оценки эффективности этих правил с помощью анализа поведения пользователей (клики и пропуски результатов). Если пользователи часто пропускают результаты, содержащие подставленный термин, система автоматически удаляет это правило, очищая понимание запросов от нерелевантных синонимов.

US8965875B1
2015-02-24

Поведенческие сигналы
Семантика и интент
EEAT и качество

Как Google определяет популярность и ранжирует физические события (концерты, выставки) в локальной выдаче

Google использует специализированную систему для ранжирования физических событий в определенном месте и времени. Система вычисляет оценку популярности события на основе множества сигналов: количества упоминаний в интернете, кликов на официальную страницу, популярности связанных сущностей (артистов, команд), значимости места проведения и присутствия в общих поисковых запросах о событиях. Затем результаты переранжируются для обеспечения разнообразия, понижая схожие события или события одной категории.

US9424360B2
2016-08-23

Local SEO
Поведенческие сигналы

Как Google рассчитывает и показывает рейтинг легитимности сайтов и рекламодателей на основе их истории и активности

Google патентует систему для оценки и отображения «Рейтинга Легитимности» источников контента, включая сайты в органической выдаче и рекламодателей. Этот рейтинг основан на объективных данных: как долго источник взаимодействует с Google (история) и насколько активно пользователи с ним взаимодействуют (объем транзакций, клики). Цель — предоставить пользователям надежную информацию для оценки качества и надежности источника.

US7657520B2
2010-02-02

SERP
EEAT и качество
Поведенческие сигналы