Автор: Виктор Репин

Патент описывает систему интеграции поиска и социальных сетей. Google анализирует публичную и приватную онлайн-активность (включая историю браузера) контактов пользователя, чтобы определить, кто из них обладает экспертизой по теме текущего запроса. Пользователю предлагается задать вопрос рекомендованным контактам прямо из интерфейса поиска, при этом система защищает конфиденциальность контактов, чья экспертиза выявлена по приватным данным.

Патент Google, описывающий систему для анализа оцифрованных газет и журналов. Система определяет, какие блоки текста на разных страницах принадлежат одной статье. Для этого комбинируются статистический анализ языка (схожесть контента) и анализ макета (визуальные подсказки о продолжении статьи, например, «продолжение на стр. X»).

Патент описывает технологию, позволяющую сторонним поисковым системам, не имеющим собственной функциональности блоков с ответами (Answer Boxes), запрашивать и отображать эти блоки от другого провайдера (например, Google). Это достигается путем встраивания специального кода (API/AJAX), который отправляет отфильтрованный запрос провайдеру и интегрирует полученный ответ в стороннюю выдачу.

Патент описывает инфраструктурную систему для эффективного сканирования социальных сетей. Контент разделяется на «Посты» (основной контент) и «Вовлеченность» (комментарии, ответы). Система адаптивно планирует сканирование: проверяет комментарии реже, если API социальной сети уведомляет об обновлениях, и чаще (по расписанию), если уведомлений нет. Это позволяет оптимизировать ресурсы и соблюдать лимиты API.

Патент описывает инфраструктурный механизм Google для улучшения низкокачественных изображений (например, в Картах или Street View) путем поиска высококачественных заменяющих фрагментов (патчей) в огромной базе данных. Система использует двухуровневый подход: сначала находит похожие изображения по глобальным дескрипторам, а затем ищет конкретные визуальные патчи внутри этих изображений, используя эффективные структуры данных для масштабируемости.

Патент описывает интерфейс для носимых устройств (например, AR-очков), позволяющий инициировать визуальный поиск с помощью жеста. Система распознает, когда пользователь сначала очерчивает объект пальцами, а затем перекрывает (окклюдирует) его. Это действие интерпретируется как команда для идентификации объекта и запуска поиска информации о нем.

Google использует механизм итеративного уточнения запросов для кастомизированных поисковых систем (например, Google Custom Search). Если результаты поиска не соответствуют спецификациям, заданным разработчиком, система автоматически модифицирует запрос (добавляя ключевые слова или ограничивая поиск по сайтам) и отправляет его повторно, прежде чем показать результаты пользователю.

Яндекс патентует математический метод обучения алгоритмов ранжирования (например, CatBoost). Метод решает проблему оптимизации сложных метрик качества (NDCG, ERR), которые обычно не поддаются стандартным методам. Это достигается путем добавления искусственного шума к оценкам релевантности во время обучения, что сглаживает функцию метрики и позволяет рассчитать градиент для более эффективного обучения модели.

Патент Google, описывающий алгоритм ранжирования результатов при поиске людей внутри социальной сети. Система вычисляет оценку персонального сходства между ищущим пользователем и найденными профилями, учитывая общие места работы, учебы и интересы. Профили, с которыми пользователь пересекался в одно и то же время, получают значительное повышение в рейтинге.

Яндекс патентует метод для эффективной и надежной оценки новых признаков (факторов ранжирования) или обучающих данных. Вместо полного переобучения модели с нуля, система начинает тестирование нового фактора с промежуточного этапа обучения (до наступления переобучения/«сверхподгонки»). Это экономит вычислительные ресурсы и позволяет статистически достоверно определить ценность нового фактора.

Патент Google описывает систему для сбора данных о социальных связях пользователя из различных сервисов (контакты, микроблоги, мессенджеры). Система анализирует интенсивность взаимодействия и социальную дистанцию, чтобы автоматически формировать группы (кластеры) контактов. Это инфраструктурный патент, направленный на управление социальным графом, а не на ранжирование в веб-поиске.

Патент Google, описывающий систему интеграции одобрений (endorsements) от экспертов и социальных рекомендаций в рекламную выдачу. Система показывает пользователю, что рекламируемый товар или услуга одобрены экспертом, которого рекомендовал кто-то из социальной сети пользователя. Патент также описывает модель монетизации, при которой эксперты получают компенсацию за клики или конверсии по одобренной ими рекламе.

Google разработал систему для создания и расширения списков аудитории без использования third-party cookies. Система анализирует, какие анонимные группы по интересам (User Interest Groups) посещают веб-ресурс. Затем она использует собственные данные о залогиненных пользователях из этих групп для обучения ML-модели. Эта модель находит похожих пользователей (Lookalike Audience) для таргетинга контента и рекламы, сохраняя конфиденциальность.

Инфраструктурный патент Google, описывающий механизм миграции данных из объектно-ориентированных сред в реляционные базы данных (RDBMS). Система создает специальную справочную таблицу (TreeID lookup table) для отслеживания сложных иерархических связей между сущностями, что упрощает последующее выполнение запросов к этим данным. Патент не связан с алгоритмами ранжирования веб-поиска.

Патент описывает инфраструктуру для создания кастомизированных поисковых систем (CSE). Пользователь может создать персональную поисковую систему, указав источники своего контента (соцсети, блоги) и предоставив учетные данные для доступа. Система индексирует этот контент, включая приватные данные, и генерирует код для встраивания поисковой строки, строго соблюдая при этом исходные настройки приватности (ACL).

Google использует механизм для улучшения пользовательского опыта при работе с несколькими устройствами. Пользователь может отправить поисковый запрос (например, голосом) с одного устройства (смартфона), а система автоматически отобразит результаты на другом связанном устройстве (например, телевизоре или планшете), которое лучше подходит для просмотра этого контента.

Патент Google, описывающий систему ранжирования для телевизионных программных гидов (например, Google TV). Вместо традиционной сетки «канал/время», система рассчитывает оценку релевантности для каждой передачи, учитывая персонализацию, популярность в реальном времени, язык, местоположение пользователя и оставшееся время эфира, чтобы показать наиболее подходящий контент.

Яндекс патентует метод для навигационных сервисов, который определяет популярные места парковки (включая неофициальные) на основе анализа того, где пользователи фактически завершали свои маршруты. Система использует алгоритм иерархической кластеризации (модифицированный алгоритм Крускала), учитывающий детальный граф дорог (типы дорог, препятствия, иерархию), чтобы группировать эти точки в релевантные и доступные парковочные зоны для последующих рекомендаций.

Яндекс патентует метод генерации синтетических пользовательских откликов для новых цифровых элементов (например, музыкальных треков), у которых еще нет реальной статистики взаимодействий. Система оценивает схожесть нового автора с уже известными или использует внешние сигналы популярности, чтобы предсказать реакцию пользователей. Это позволяет сразу включать новинки в обучение рекомендательного алгоритма, минуя проблему «холодного старта».

Патент описывает инфраструктурное решение Яндекса для рекомендательных систем (таких как Дзен). Система решает проблему согласованности версий пользовательских и контентных эмбеддингов во время обновления моделей. Для этого используется гибридное хранилище: эмбеддинги пользователей хранятся в нераспределенном хранилище (с поддержкой нескольких версий одновременно), а эмбеддинги контента — в распределенном (с заменой старой версии на новую). Это гарантирует, что для расчета релевантности всегда используется пара эмбеддингов из одной и той же версии модели.