Автор: Виктор Репин

Патент описывает систему для автоматического улучшения поисковых запросов в контексте юридического обнаружения (E-Discovery). Система использует обучающую выборку документов, размеченных юристами как релевантные/нерелевантные, для итеративного уточнения запроса (комбинации ключевых слов и булевых операторов), максимизируя количество найденных релевантных документов и минимизируя нерелевантные. Патент не относится к публичному веб-поиску.

Механизм персонализации поисковой выдачи, позволяющий пользователям исключать контент и рекомендации от определенных людей из их социального графа. Если пользователь «заглушил» контакт, система удаляет связанные с ним социальные аннотации и результаты из персональной выдачи.

Google использует инфраструктурный механизм для автоматической синхронизации метаданных электронного контента (музыка, видео, книги) между устройствами пользователя. Если пользователь ставит рейтинг или пропускает трек на одном устройстве, система автоматически обновляет эту информацию на сервере и на всех остальных его устройствах, включая сценарии отложенной синхронизации.

Яндекс патентует метод оптимизации производительности поиска за счет использования многопоточности внутри одного сервера (шарда). Система оценивает сложность входящего запроса («вес») и, если она высока, делит инвертированный индекс на чередующиеся сегменты. Разные потоки процессора одновременно обрабатывают разные сегменты, после чего результаты агрегируются. Это позволяет быстрее выполнять ресурсоемкие запросы без необходимости дальнейшего дробления индекса на более мелкие шарды.

Яндекс патентует метод для консолидации определений и переводов слов, полученных из разных источников (например, разных словарей). Система анализирует полученные данные, находит дубликаты или схожие варианты и объединяет их в кластеры. Это позволяет представить пользователю чистый, недублированный ответ (например, в Яндекс.Словарях или Колдунщике), указывая при этом количество источников, подтверждающих данный вариант определения.

Патент описывает дизайн пользовательского интерфейса для поиска медиаконтента (ТВ, видео). Google объединяет стандартный список результатов поиска с интерактивной сеткой программы передач (EPG). Выбор результата в списке автоматически перемещает сетку к соответствующему времени и каналу, позволяя пользователю изучать контент в контексте расписания.

Патент Google, описывающий пользовательский интерфейс для отображения результатов поиска путешествий (например, авиабилетов). Система использует интерактивную диаграмму рассеяния (time-time scatter plot), где оси времени отправления и прибытия трансформируются (shear transformation) и поворачиваются для наглядного отображения длительности поездки, а цена кодируется через визуальные атрибуты иконок (цвет, размер).

Патент описывает систему Google Ads для автоматического добавления меток брендинга (логотипов, фавиконов) к рекламным объявлениям. Система проверяет права рекламодателя на использование метки, оптимизирует ее расположение относительно текста с учетом размера экрана и может повышать Quality Score объявления при наличии верифицированного брендинга.

Патент описывает механизм точного измерения времени, в течение которого реклама фактически отображалась в видимой области браузера пользователя. Система использует клиентский таймер (например, JavaScript) для отслеживания блокировок (скроллинг, перекрытие окон) и рассчитывает стоимость на основе модели Cost-Per-Display-Time (CPDT), обеспечивая оплату только за реальные просмотры.

Google использует специализированную структуру индекса для быстрого поиска по частям слов (подстрокам) и запросам с подстановочными знаками (*, ?). Индекс хранит не только слова, но и их подстроки, связанные с включающими их строками (Inclusive Strings). Это позволяет системе быстро находить все релевантные совпадения без полного сканирования базы данных, оптимизируя вычислительные ресурсы.

Патент Google, описывающий архитектуру локальной поисковой системы (Desktop Search). Система отслеживает действия пользователя с медиафайлами на устройстве в реальном времени. Эти события ставятся в очередь и индексируются в фоновом режиме с учетом производительности компьютера, обеспечивая локальный поиск без замедления работы устройства.

Google использует механизм для улучшения поисковых подсказок (Autocomplete) в таких сервисах, как Gmail. Система анализирует корпус документов пользователя, распознает сущности (например, email-адреса, имена) и предлагает их в качестве подсказок. Это помогает пользователю быстрее находить нужный контент, предлагая контекстуализированные подсказки (например, полный контакт) вместо отдельных слов.

Патент описывает технологию (например, расширение для браузера), которая анализирует просматриваемую веб-страницу для обнаружения связанного медиаконтента (ТВ-программы, потоковое видео). Система позволяет пользователю выбрать этот контент на компьютере и автоматически воспроизвести его на другом устройстве, например, подключенном телевизоре (Google TV).

Google использует метод для сравнения изображений текстовых страниц (например, сканов книг или PDF), который не зависит от языка и качества текста. Система определяет положение слов и создает «сигнатуры» на основе углов и расстояний до соседних слов. Это позволяет эффективно находить дубликаты страниц или идентифицировать документ по фотографии, анализируя только его визуальную структуру.

Google использует сигналы с персональных устройств (смартфонов), такие как близость и общие WiFi сети, чтобы определить, когда несколько человек смотрят контент на одном общем экране (например, телевизоре). Система объединяет их индивидуальные профили в «Групповой профиль», взвешивая интересы на основе социального влияния каждого участника. Этот профиль затем используется для подбора релевантного контента и рекламы для группы в целом.

Патент, поданный от имени ООО «Яндекс Музыка», описывает метод снижения задержек в рекомендательных системах. Система заранее рассчитывает альтернативные («вспомогательные») рекомендации на случай, если пользователь поставит Лайк или Дизлайк текущему элементу. Это позволяет мгновенно обновить поток контента без ожидания ответа сервера.

Патент Google, описывающий внутренний механизм оптимизации производительности баз данных (например, в облачной инфраструктуре). Система анализирует историю выполненных SQL-запросов (рабочую нагрузку) и итеративно определяет оптимальный набор индексов базы данных для хранения в памяти, чтобы ускорить выполнение будущих запросов при ограниченных ресурсах.

Патент описывает инфраструктурный механизм Google для эффективного удаления устаревших или измененных документов из распределенного индекса. Вместо опроса всех серверов система поддерживает главный список (Non-Key Master List), указывающий, где хранится каждый документ. Это позволяет направлять запросы на удаление только на релевантные серверы, ускоряя обновление индекса.

Патент описывает инфраструктурный процесс Google для оцифровки печатных изданий (например, Google Books). Система сканирует документ, ищет идентификаторы (ISBN, ISSN) на странице авторских прав или в штрихкоде, сверяет их с базами данных метаданных и автоматически связывает текст документа с его библиографическим описанием для последующего поиска.

Патент описывает инфраструктурную оптимизацию поисковых систем Google. Он детализирует математический метод (Быстрая ортогональная проекция с использованием произведения Кронекера) для преобразования высокоразмерных данных (векторов признаков). Это позволяет поисковой системе выполнять сравнения (например, находить похожие изображения или документы) намного быстрее и с использованием значительно меньшего объема памяти, сохраняя при этом точность.