Антиспам

Google использует метод обнаружения спама, основанный на анализе переходов между различными наборами символов (например, с латиницы на кириллицу и обратно). Этот метод выявляет попытки спамеров заменить буквы визуально похожими символами …
Патент Google, описывающий метод сбора поведенческих данных (кликов по результатам поиска) без замедления загрузки целевой страницы. Вместо использования серверных редиректов, система применяет клиентский JavaScript (событие onmousedown) для асинхронной отправки данных …
Google использует репутацию и научный вес членов программных или редакционных комитетов (например, их цитируемость) для оценки качества академического события (конференции, журнала). Эта оценка качества события затем используется для ранжирования документов …
Google использует механизм для обнаружения медиаконтента (например, видео на YouTube), который обходит стандартные системы контент-анализа (Content ID). Система анализирует историю поисковых запросов, которые приводили пользователей к уже удаленному (пиратскому) контенту. …
Google использует адаптивный механизм для сортировки пользовательского контента (UGC), такого как комментарии или посты в социальных сетях, связанных с веб-страницей. Если страница популярна или трендовая («buzzy»), система отдает приоритет самым …
Патент Google, описывающий механизм рекламного аукциона (Paid Search). Рекламодатели могут заплатить дополнительный сбор (Highest-Bidder Fee), чтобы их объявление ранжировалось так, как если бы у него была самая высокая цена за …
Google использует систему для борьбы с лично нежелательным контентом (например, «revenge porn»). Система применяет два классификатора: один определяет, является ли контент нежелательным (например, порнографическим), а второй — является ли он …
Google использует механизм безопасности для защиты пользователей от вредоносных или нежелательных сайтов. Система оценивает репутацию ссылки в момент взаимодействия с ней. Если ссылка ведет на опасный ресурс (включая редиректы и …
Google анализирует результаты поиска, связанные с потенциальной поисковой подсказкой, и оценивает их безопасность на основе рейтингов контента. Если запрос часто ведет на нежелательный или небезопасный контент (например, для детей), он …
Google использует инфраструктурный метод обновления инвертированного индекса "на месте" (in-place updates). Система заранее резервирует пустые позиции в отсортированных списках документов (posting lists). Это позволяет почти мгновенно добавлять или удалять документы, …
Патент раскрывает инфраструктуру Google для кэширования результатов поиска и сниппетов. Описан механизм, использующий «метки времени» (datestamps) для проверки актуальности кэшированной информации на основе даты последнего индексирования документа. Если кэшированный сниппет …
Google использует инфраструктурный механизм для эффективного хранения похожих документов. Система группирует документы (часто с одного хоста, используя реверсированные URL) в кластеры и сжимает их, удаляя повторяющиеся последовательности токенов внутри кластера. …
Google анализирует поисковые сессии пользователей для обучения классификатора, выявляющего запросы о неприемлемом контенте (например, насилии, CSAM, терроризме). Система отслеживает, какие еще запросы вводил пользователь незадолго до или после ввода уже …
Google использует систему адаптивного планирования для ускорения ответа на поисковый запрос. Система разбивает запрос на множество внутренних задач (например, поиск, парсинг, фильтрация) и прогнозирует время их выполнения на основе исторических …
Анализ патента Google, описывающего два ключевых механизма. Первый — адаптивная система верификации (CAPTCHA/SmartQuiz), которая динамически изменяет частоту проверок для борьбы с ботами. Второй — модель ранжирования (Pay-to-Surf), где порядок результатов …
Патент Google описывает систему для анализа схожести программного кода на субфайловом уровне. Система изолирует только исполняемые части файла, игнорируя метаданные и ресурсы, разбивает код на логические блоки и хеширует их. …
Google использует внутреннюю систему для проверки своих антиспам-алгоритмов. Система хранит базу "запросов высокого риска" (тех, что ранее приводили к спаму) и периодически отправляет их в поиск. Если спам проходит через …
Google использует механизм для точной оценки релевантности спонсируемого контента (рекламы) при анализе ключевых слов из нескольких источников на странице (текст, URL, категории). Чтобы предотвратить завышение оценки из-за дублирования слов в …
Патент описывает механизм для рекламных систем (например, Google Ads) по борьбе с дублированием отчетов о конверсиях (Conversion Spam) в моделях с оплатой за действие (CPA). Для каждой конверсии генерируется уникальный …