Антиспам

Google использует масштабируемую распределенную систему для анализа огромных графов, таких как Веб-граф (триллионы связей). Система вычисляет кратчайшие пути от каждого узла (сайта) до набора предопределенных авторитетных источников («Seeds»). Эти расстояния …
Google использует систему для идентификации оригинального контента путем фиксации времени первого появления фрагментов текста (Content Pieces) в индексе. Система отслеживает, как быстро и широко этот контент копируется другими авторами (Copy …
Google разработал систему, позволяющую пользователям удалять нежелательные сайты из своей выдачи. Патент описывает, как эти данные агрегируются от «легитимных пользователей» и используются для расчета «Remove List Score» — глобального сигнала …
Google использует систему для обнаружения аномальной сетевой активности (кликового спама) путем создания статистических моделей ожидаемого поведения сетевых объектов (IP-адресов, cookies, запросов). Система анализирует множество параметров и выявляет объекты, чье поведение …
Google использует модель машинного обучения (Reinforcement Learning) для прогнозирования, как показ конкретного результата повлияет на будущую активность пользователя. Если контент (даже кликабельный) снижает долгосрочную вовлеченность, система может его не показать, …
Google прогнозирует оценку качества сайта, анализируя, какие фразы (N-граммы) используются и как часто они распределены по страницам сайта. Система создает «Фразовую модель», изучая известные высококачественные и низкокачественные сайты, а затем …
Патент Google, описывающий метод улучшения ранжирования с помощью анализа "социальных сигналов" (Social Reference Data). Система отслеживает, как часто пользователи делятся контентом (через email, соцсети, блоги, закладки) и сколько раз его …
Google использует механизм для оценки качества ссылок, выходящий за рамки анкорного текста. Система анализирует редкие слова (rare words) в тексте, непосредственно окружающем ссылку, чтобы определить ее уникальный контекст. Ранжирование улучшается …
Google использует модель машинного обучения для прогнозирования вероятности того, что пользователь перейдет по конкретной ссылке. Эта модель анализирует характеристики ссылки (положение, размер шрифта, анкорный текст) и данные о поведении пользователей. …
Google использует архитектуру глубокого обучения (Deep Network) для классификации веб-ресурсов. Система преобразует разнородные признаки страницы (текст, URL, возраст) в числовые векторы (эмбеддинги), обрабатывает их через нейронную сеть для глубокого анализа …
Google использует механизм для гарантированного включения результатов с авторитетных сайтов в поисковую выдачу. Если исходный запрос содержит ключевое слово, связанное с авторитетным источником, или если качество стандартной выдачи низкое, система …
Механизм защиты пользователей, который перехватывает запрос на загрузку веб-страницы. Если страница идентифицирована как низкокачественная (паркинг домена, ферма контента или ссылочная ферма), система показывает предупреждение и предлагает перейти на альтернативный релевантный …
Анализ патента Google (связанного с Google Knol), который детализирует расчет метрик авторитетности автора: Reputation Score (репутация) и Credibility Factor (достоверность). Патент описывает использование этих метрик для ранжирования и монетизации, а …
Google применяет систему для обнаружения фейковых отзывов и рейтингов не только в магазинах приложений, но и на веб-сайтах (включая локальный поиск и e-commerce). Система агрегирует сигналы, основанные на скорости получения …
Google использует механизм для очистки системы автозаполнения (Autocomplete). Система выявляет популярные подсказки, которые развлекают или интересуют пользователей, но не соответствуют их изначальному намерению. Путем экспериментов с временным скрытием этих подсказок …
Google использует механизм для борьбы с кликбейтными или нерелевантными изображениями в поиске. Система анализирует, как часто пользователи кликают на изображение по множеству несвязанных запросов. Если изображение часто выбирают независимо от …
Google использует гибридную систему для борьбы с манипуляциями в поиске. Если алгоритм фиксирует аномально быстрый рост позиций результата («Свежесть Ранжирования»), это инициирует проверку Арбитрами (асессорами). Решение о пессимизации (разрыве ассоциации) …
Google применяет систему для валидации брендовых ассетов (изображений и названий организаций) перед их отображением в результатах поиска. Система использует ML-модели для двух проверок: является ли изображение приемлемым (не нарушает правила, …
Google использует автоматизированный анализ геолоцированных изображений (например, Street View) для валидации локальных бизнес-листингов. Система классифицирует окружающую среду и сравнивает ее с заявленной категорией бизнеса. Если категория несовместима с визуальным контекстом …
Патент Google описывает систему автоматической классификации видео, которая не требует ручной разметки и устойчива к неточным метаданным. Система сначала обучает классификаторы на основе аудиовизуального контента. Затем эти результаты используются для …