Автор: Виктор Репин

Google использует масштабируемую систему для идентификации полных дубликатов аудиоконтента. Система создает двухчастный дайджест (фингерпринт): компактный «Index Hash» для быстрого поиска потенциальных совпадений и подробный «Verification Hash» для точного подтверждения. Это позволяет эффективно управлять миллиардами аудио- и видеофайлов, что критично для платформ типа YouTube и Google Podcasts.

Google использует вероятностную модель для определения, какой именно показ рекламы привел к телефонному звонку. Модель учитывает время, местоположение и позицию объявления на странице. Эти данные используются для расчета вероятности звонка (pCall), которая затем включается в формулу ранжирования рекламы (Rank Score) наряду с вероятностью клика (pCTR) и ставками рекламодателя.

Google использует систему для генерации визуальных превью (Page Previews) страниц в результатах поиска. Система анализирует страницу, находит наиболее релевантный запросу контент (текст и изображения) и оценивает его контекст и расположение. Превью может показывать разные части страницы, соединенные «разрывом» (Page Tear), и автоматически увеличивать ключевой контент (Zoom Feature) для лучшей читаемости прямо в выдаче.

Патент описывает систему для магазинов приложений (например, Google Play), которая анализирует, какие визуальные характеристики (цвет, композиция, разрешение) изображений и видео коррелируют с успехом приложения (загрузки, доход, удержание). На основе этих данных система рекомендует разработчикам, какие скриншоты использовать для повышения вероятности успеха их приложения.

Анализ патента IBM, описывающего метод агрегации ранжирования (Rank Aggregation). Система сортирует один и тот же набор документов по разным критериям (например, по релевантности и по дате), а затем объединяет эти списки с помощью арифметических операций (Сумма, Пересечение, Разность) для создания финального, более релевантного результата поиска.

Патент описывает фундаментальный механизм рекламного аукциона Google. Система ранжирует объявления, используя комбинацию максимальной ставки и показателя эффективности (например, CTR). Фактическая цена, которую платит победитель, определяется не его ставкой, а минимальной суммой, необходимой для сохранения позиции — на основе ставки и эффективности следующего по рангу конкурента.

Google использует этот механизм для улучшения качества межъязыковых поисковых подсказок (автокомплита), особенно для смешанных запросов. Если автоматическое определение языка затруднено, система генерирует два перевода в разных направлениях (Язык A -> Язык B и Язык B -> Язык A). Затем она сравнивает их с оригиналом с помощью N-грамм. Перевод, который максимально отличается от оригинала, выбирается как наилучшая межъязыковая подсказка.

Яндекс патентует метод эффективного использования памяти в древовидных моделях ранжирования (например, CatBoost). Вместо выделения огромных массивов памяти для категориальных признаков с большим числом значений (URL, запросы, ключевые слова), система хеширует эти признаки и комбинирует их с другими данными, создавая компактный ключ (Hashed Complex Vector). Это позволяет моделям ранжирования учитывать сложные комбинации признаков без избыточного потребления ресурсов.

Патент Google описывает систему, которая объединяет голосовой локальный поиск с личными контактами пользователя. Когда пользователь находит бизнес через голосовой поиск и совершает звонок, система автоматически сохраняет контактные данные этого бизнеса и создает голосовую метку (voice label) для быстрого набора в будущем, минуя повторный поиск.

Система Google для автоматической агрегации пользовательского контента. Она идентифицирует видео одного события, синхронизирует их, ранжирует сегменты на основе качества, содержания и социальных связей авторов, и автоматически монтирует новый композитный видеоролик, выбирая лучшие фрагменты.

Google анализирует активность пользователя и его контент в различных сервисах (таких как email, календарь, фотохостинг). На основе этих данных система генерирует персонализированные поисковые подсказки (Autocomplete), когда пользователь начинает вводить запрос. Это позволяет предлагать запросы типа «мои рейсы» или «мои фото», основываясь на реальных бронированиях или загруженных изображениях пользователя.

Google использует механизм для повышения релевантности предлагаемых исправлений текста (например, в поисковой строке или редакторе). Система анализирует не только слово целиком, но и точное место, рядом с которым пользователь установил курсор или коснулся экрана. Предложения по исправлению фильтруются в зависимости от того, соответствуют ли они этой указанной пользователем позиции редактирования.

Google использует инфраструктуру для распределенного сканирования контента, требующего Cookies. Система поддерживает централизованную базу данных, где хранятся Cookies, полученные любым краулером. Это позволяет всем краулерам совместно использовать эти Cookies для доступа к закрытым или персонализированным разделам сайтов, обеспечивая более полное индексирование.

Патент Google, описывающий инфраструктурный механизм для динамического изменения поведения ссылок (например, открытие в новой вкладке или в том же окне) на стороне сервера. Система определяет контекст пользователя (тип устройства, приложение, поддержка вкладок) и генерирует соответствующий HTML-код (например, атрибуты target или onClick) на лету перед отправкой страницы.

Патент Google описывает архитектуру для создания и ранжирования пользовательских индексов (Custom Search Index) отдельно от основного веб-поиска. Владельцы контента могут напрямую влиять на ранжирование в своем индексе, используя аннотации (указание относительной важности), а также активируя учет обратной связи пользователей и паттернов использования.

Патент Google описывает адаптивный интерфейс для агрегации трендового контента (поисковые запросы, видео, изображения, новости). Система позволяет пользователям настраивать ленту и использует сигналы взаимодействия (позитивные и негативные) для персонализации отбора контента, учитывая популярность, личные интересы и социальные факторы.

Яндекс патентует механизм для повышения точности распознавания интента в голосовых ассистентах (например, Алиса). Система использует несколько специализированных моделей (Сценариев), обученных на разных данных (например, такси, музыка, умный дом). При получении команды все модели генерируют гипотезы. Затем главный алгоритм машинного обучения (Арбитр) оценивает эти гипотезы и выбирает наиболее вероятный сценарий или комбинацию сценариев для выполнения.

Google описывает механизм создания специальных ссылок (rank-specific search links), которые кодируют запрос и позицию результата в выдаче. При активации такой ссылки поиск выполняется заново, и пользователь видит документ, который занимает эту позицию в данный момент, а не тот, который был там изначально.

Патент описывает механизм интерфейса Google для динамического отображения свежего контента (новости, социальные сети). Система использует клиентский код (например, JavaScript) для периодического опроса сервера на наличие обновлений и вставляет их в SERP автоматически. Пользователь может приостановить этот процесс с помощью специального элемента управления.

Google фиксирует точное персонализированное и динамическое содержимое (например, ленты социальных сетей или корзины покупок), которое видит пользователь, и сохраняет его в приватном Персональном Кэше. Это позволяет пользователям искать и просматривать историю своих посещений именно в том виде, в котором они ее видели, включая контент, недоступный в публичном индексе.