Автор: Виктор Репин

Google использует технологию «комбинированных цифровых отпечатков» для идентификации видеоконтента, загруженного в разных соотношениях сторон. Система создает две версии видео с разной коррекцией формата, генерирует отпечаток для каждой, а затем объединяет половину одного отпечатка с половиной другого. Это позволяет точно находить дубликаты (например, для Content ID), независимо от того, является ли видео широкоформатным, обрезанным или искаженным.

Патент Google описывает инфраструктурный метод для эффективного расчета корреляции (степени пересечения) между различными поисковыми терминами в больших базах данных. Используя алгоритм HyperLogLog (HLL), система может быстро оценить, как часто два термина встречаются вместе, потребляя минимум памяти. Эта технология ориентирована на анализ структурированных данных и Business Intelligence (BI).

Google анализирует сущности (entities), доминирующие в топовых органических результатах поиска, чтобы точнее определить контекст. Исходный запрос пользователя модифицируется (дополняется или фильтруется) на основе этих сущностей, создавая «расширенный запрос» (Enhanced Query). Этот расширенный запрос используется исключительно для выбора более релевантных рекламных объявлений (Sponsored Content).

Google определяет, когда пользователь ищет социальную сеть по названию. В ответ система находит главный результат этой соцсети и группирует рядом с ним релевантный контент (профили, недавние посты), созданный контактами пользователя на этой же платформе. Это механизм форматирования выдачи, объединяющий общий и персонализированный социальный поиск.

Патент описывает систему, которая позволяет пользователю начать планирование поездки, кликнув на изображение или текст на любом веб-сайте. Система анализирует выбранный элемент, определяет связанную с ним географическую локацию (например, распознавая достопримечательность на фото) и автоматически открывает интерфейс поиска путешествий с уже заполненным пунктом назначения.

Этот патент описывает систему управления рекламой (AdTech), а не органическим поиском (SEO). Он объясняет, как Google может автоматически перемещать («продвигать») рекламу из менее заметных мест (например, боковой колонки) в более заметные (например, над результатами поиска), если эта реклама показывает высокую эффективность (CTR) и экономическую ценность.

Патент Google, описывающий интерфейс и механизм, позволяющий пользователям выборочно отключать категории поисковых сигналов, используемых для персонализации результатов. Пользователь может исключить такие факторы, как свое местоположение, историю поиска или социальные связи, чтобы получить менее персонализированную (более общую) поисковую выдачу и контролировать свой «пузырь фильтров».

Анализ патента Google, описывающего систему таргетинга рекламы на основе будущих событий пользователя (например, из календаря). Система определяет релевантность ключевых слов в зависимости от того, сколько времени осталось до события (например, реклама телевизоров за месяц до Суперкубка и доставка пиццы за час до него), и корректирует эти оценки на основе исторических данных о конверсиях.

Патент Google описывает интерфейс для носимых устройств (например, AR-очков). Пользователь инициирует визуальный поиск, обведя интересующий объект в поле зрения (например, пальцем). Система распознает жест, идентифицирует объект с помощью методов компьютерного зрения и запускает прогрессивный поиск, который обновляется в реальном времени по мере того, как пользователь уточняет контур.

Патент описывает механизм для рекламных систем (например, Google Ads) по борьбе с дублированием отчетов о конверсиях (Conversion Spam) в моделях с оплатой за действие (CPA). Для каждой конверсии генерируется уникальный идентификатор (UID). Система подтверждает конверсию, только если этот UID используется впервые. Это инфраструктурный патент AdTech, не влияющий на органический поиск (SEO).

Google использует систему для определения «фактической свежести» (de facto fresh) кэшированного документа, анализируя историю его обновлений, а не полагаясь только на заголовки истечения срока действия. Если статистический анализ показывает, что контент, вероятно, не изменился, система отдает кэшированную версию, а затем проверяет обновление в фоновом режиме. Это оптимизирует ресурсы сканирования и ускоряет доставку.

Патент Google, описывающий систему ранжирования рекламы, которая учитывает конфигурацию устройства пользователя (наличие функции звонка, размер экрана, скорость соединения). Система рассчитывает отдельные оценки для стандартных ссылок и функций (например, «звонок по клику») и может отдать предпочтение формату, который лучше работает на данном устройстве, даже если он менее релевантен текстуально.

Google использует этот механизм для монетизации пустых страниц (припаркованные домены, 404 ошибки). Система показывает начальный набор рекламы на основе ключевых слов страницы (например, из URL), отслеживает клики пользователей (CTR, доход), определяет ключевые слова наиболее эффективных объявлений и использует их для динамической генерации блока «Связанные поисковые запросы» на этой же странице.

Патент Google, описывающий технологию для локального (Desktop) или персонализированного поиска. Система отслеживает взаимодействие пользователя с контентом (события) и использует «схемы событий» для автоматической категоризации файлов, электронных писем и истории просмотров. Эти категории затем используются для предоставления релевантных результатов в ответ на неявные запросы, генерируемые системой на основе текущего контекста пользователя.

Система Google для анализа изменений в объеме поисковых запросов (Search Query Volume). Она вычисляет оценку тренда (Trend Score), приоритизируя краткосрочные изменения, чтобы выявить растущую популярность запросов. Эти трендовые запросы затем предлагаются в качестве новых ключевых слов рекламодателям, чьи кампании похожи друг на друга.

Яндекс патентует специфический математический метод для обучения моделей на основе Деревьев Принятия Решений (например, CatBoost/MatrixNet). Изобретение описывает функцию потерь (метрику точности), которая использует нелинейное логарифмическое взвешивание (log(N+1)) размера листа дерева. Это направлено на повышение качества и надежности основных моделей ранжирования путем оптимизации их обучения.

Google использует механизм сравнения стоимости маршрутов для разных видов транспорта. Когда пользователь запрашивает маршрут (например, на автомобиле), система рассчитывает его стоимость и сравнивает ее со стоимостью альтернатив (например, перелета). Если альтернативный вариант дешевле, система отображает уведомление в интерфейсе карт, предлагая пользователю сэкономить.

Google использует метод квантования векторов для ускорения поиска и снижения потребления памяти. Этот метод разбивает большие векторы (например, эмбеддинги страниц и запросов) на части (субпространства) и аппроксимирует их значения с помощью «кодовых книг». Это позволяет выполнять быстрый поиск максимального внутреннего произведения (MIPS), что критично для работы систем векторного поиска, таких как Neural Matching, в масштабах веба.

Патент Google, описывающий механизм персонализации поиска. Документы или сайты, добавленные пользователем в закладки, могут получать повышение в его персональной выдаче. Система позволяет пользователю детально настроить, как именно закладки влияют на ранжирование: для всех запросов, только для конкретных запросов или для продвижения всего сайта.

Патент описывает инфраструктуру Google для создания пользовательских поисковых индексов (Custom Search Indexes), отдельных от основного веб-индекса. Он фокусируется на методах защиты конфиденциального контента, включая шифрование результатов и индексирование только метаданных, в то время как сам контент хранится на защищенных внешних серверах.