Google стабилизирует обнаружение дубликатов, игнорируя новый или часто меняющийся контент (например, рекламу, комментарии). Система сравнивает текущую версию документа с предыдущей, определяет возраст различных частей и вычисляет контрольную сумму (checksum) только …
Разборы патентов
Патент Google раскрывает продвинутую систему поиска похожих изображений. Используя гибкую архитектуру (Fetchers, Scorers, Poolers), система оценивает подобие по множеству признаков, а не только по визуальному совпадению. Она интегрирует мультимодальные данные …
Google разработал систему для улучшения навигации по VOD-контенту (Video-on-Demand). Вместо просмотра видео с начала, пользователи могут искать конкретные типы сцен («хуки»). Система идентифицирует эти моменты, используя анализ видео (Video Image …
Google патентует архитектуру нейронного поиска (Contextualized Token Retriever или XTR), которая обеспечивает высокую точность за счет анализа взаимодействий на уровне отдельных токенов (как в моделях типа ColBERT), но радикально снижает …
Google использует систему предиктивного поиска для повышения скорости и эффективности. Система прогнозирует, какие запросы пользователи введут в будущем, и заранее вычисляет для них результаты поиска, сохраняя их в специальном «предиктивном …
Google анализирует «меру завершенности запроса» (Measure of Query Completeness) по мере ввода текста пользователем. Если намерение неясно и существует много вариантов продолжения (низкая завершенность, высокая энтропия), система предлагает общие категории …
Яндекс патентует метод для оптимизации порогов срабатывания в системах бинарной классификации (например, спам/не спам, релевантный/нерелевантный), которые используют несколько «вложенных» метрик одновременно. Метод позволяет итеративно подобрать оптимальную комбинацию порогов для всех …
Яндекс патентует метод идентификации объектов на веб-странице (таких как реклама, логотипы, карты) путем анализа их характеристик после рендеринга (размер, положение, стиль) и особенностей исходного кода. Система использует машинное обучение для …
Google использует систему для аппроксимации текущего местоположения пользователя, когда точные данные (например, GPS) недоступны. Система анализирует исторические данные о локациях (из поиска, карт, IP) и текущий IP-адрес. Найденные локации оцениваются …
Анализ патента Xerox (1999 г.), описывающего метод персонализации поиска. Система создает профили пользователей и групп (сообществ) на основе анализа документов, которые они ранее оценили. Эти профили (векторы весов терминов) используются …
Google применяет многоуровневую систему аннотирования изображений. Она объединяет метаданные (EXIF), первичное распознавание объектов и контекста (Primary Annotation), а также семантическое расширение меток (Label Expansion). Это позволяет системе понимать сложные запросы …
Google разрабатывает систему для индексации невзаимозаменяемых токенов (NFT) путем прямого анализа данных из блокчейнов и с веб-страниц (маркетплейсов). Система использует ML-модели для анализа содержания самих цифровых активов, создавая специализированный индекс …
Патент описывает, как Google может анализировать медиаконтент (фильмы, ТВ-шоу, видео) для автоматической идентификации показанных в нем товаров или услуг, используя распознавание изображений, речи и текста (субтитров). Система создает динамический каталог, …
Google анализирует, как слова пишутся в разных языках (с акцентами, диграфами или транслитерацией), и создает "карту синонимов". При получении запроса система определяет его вероятный язык и статистически выбирает только те …
Google анализирует существующие плейлисты, созданные пользователями, которые релевантны широкому поисковому запросу (например, жанру или теме). Система оценивает качество этих плейлистов на основе их популярности и свежести, а затем агрегирует эти …
Google может определять интересы пользователя не только по его прямым действиям, но и анализируя интересы его социальных связей (друзей, коллег). Если окружение пользователя активно интересуется определенной темой, система повышает оценку …
Google использует механизм для определения языка, на котором пользователь хочет видеть результаты поиска, особенно когда язык запроса отличается от языка региона. Система сравнивает текст запроса с его переводом на местный …
Google использует механизм для получения метаданных о файлах, не являющихся веб-страницами (например, PDF, документы Office). Во время сканирования эти метаданные передаются поисковой системе через специальные HTTP-заголовки. Затем Google преобразует их …
Google использует машинное обучение для оценки надежности пользователей, предлагающих правки для Графа Знаний. Система анализирует профиль пользователя, историю его предыдущих правок, его интересы, уровень экспертизы и активность в других сервисах …
Патент Google, описывающий систему для рекламных платформ (например, Google Ads). Система анализирует логи органического поиска, чтобы определить, какие запросы привели к кликам на конкретные сайты. На основе этой "народной популярности" …

