Google использует метод обнаружения спама, основанный на анализе переходов между различными наборами символов (например, с латиницы на кириллицу и обратно). Этот метод выявляет попытки спамеров заменить буквы визуально похожими символами …
Антиспам
Патент Google, описывающий метод сбора поведенческих данных (кликов по результатам поиска) без замедления загрузки целевой страницы. Вместо использования серверных редиректов, система применяет клиентский JavaScript (событие onmousedown) для асинхронной отправки данных …
Google использует репутацию и научный вес членов программных или редакционных комитетов (например, их цитируемость) для оценки качества академического события (конференции, журнала). Эта оценка качества события затем используется для ранжирования документов …
Google использует механизм для обнаружения медиаконтента (например, видео на YouTube), который обходит стандартные системы контент-анализа (Content ID). Система анализирует историю поисковых запросов, которые приводили пользователей к уже удаленному (пиратскому) контенту. …
Google использует адаптивный механизм для сортировки пользовательского контента (UGC), такого как комментарии или посты в социальных сетях, связанных с веб-страницей. Если страница популярна или трендовая («buzzy»), система отдает приоритет самым …
Патент Google, описывающий механизм рекламного аукциона (Paid Search). Рекламодатели могут заплатить дополнительный сбор (Highest-Bidder Fee), чтобы их объявление ранжировалось так, как если бы у него была самая высокая цена за …
Google использует систему для борьбы с лично нежелательным контентом (например, «revenge porn»). Система применяет два классификатора: один определяет, является ли контент нежелательным (например, порнографическим), а второй — является ли он …
Google использует механизм безопасности для защиты пользователей от вредоносных или нежелательных сайтов. Система оценивает репутацию ссылки в момент взаимодействия с ней. Если ссылка ведет на опасный ресурс (включая редиректы и …
Google анализирует результаты поиска, связанные с потенциальной поисковой подсказкой, и оценивает их безопасность на основе рейтингов контента. Если запрос часто ведет на нежелательный или небезопасный контент (например, для детей), он …
Google использует инфраструктурный метод обновления инвертированного индекса "на месте" (in-place updates). Система заранее резервирует пустые позиции в отсортированных списках документов (posting lists). Это позволяет почти мгновенно добавлять или удалять документы, …
Патент раскрывает инфраструктуру Google для кэширования результатов поиска и сниппетов. Описан механизм, использующий «метки времени» (datestamps) для проверки актуальности кэшированной информации на основе даты последнего индексирования документа. Если кэшированный сниппет …
Google использует инфраструктурный механизм для эффективного хранения похожих документов. Система группирует документы (часто с одного хоста, используя реверсированные URL) в кластеры и сжимает их, удаляя повторяющиеся последовательности токенов внутри кластера. …
Google анализирует поисковые сессии пользователей для обучения классификатора, выявляющего запросы о неприемлемом контенте (например, насилии, CSAM, терроризме). Система отслеживает, какие еще запросы вводил пользователь незадолго до или после ввода уже …
Google использует систему адаптивного планирования для ускорения ответа на поисковый запрос. Система разбивает запрос на множество внутренних задач (например, поиск, парсинг, фильтрация) и прогнозирует время их выполнения на основе исторических …
Анализ патента Google, описывающего два ключевых механизма. Первый — адаптивная система верификации (CAPTCHA/SmartQuiz), которая динамически изменяет частоту проверок для борьбы с ботами. Второй — модель ранжирования (Pay-to-Surf), где порядок результатов …
Патент Google описывает систему для анализа схожести программного кода на субфайловом уровне. Система изолирует только исполняемые части файла, игнорируя метаданные и ресурсы, разбивает код на логические блоки и хеширует их. …
Google использует внутреннюю систему для проверки своих антиспам-алгоритмов. Система хранит базу "запросов высокого риска" (тех, что ранее приводили к спаму) и периодически отправляет их в поиск. Если спам проходит через …
Google использует механизм для точной оценки релевантности спонсируемого контента (рекламы) при анализе ключевых слов из нескольких источников на странице (текст, URL, категории). Чтобы предотвратить завышение оценки из-за дублирования слов в …
Патент описывает механизм для рекламных систем (например, Google Ads) по борьбе с дублированием отчетов о конверсиях (Conversion Spam) в моделях с оплатой за действие (CPA). Для каждой конверсии генерируется уникальный …