Google использует гибридную архитектуру индекса, комбинируя документное шардирование (Document-Sharding) и терминологическое шардирование (Term-Sharding). Эта система позволяет балансировать нагрузку на сеть и операции ввода-вывода, а также обеспечивает механизмы обновления индекса без …
Разборы патентов
Этот патент описывает инфраструктуру, которую Google использует для крупномасштабных систем сопоставления медиа (таких как Content ID). В нем подробно рассказывается, как Google распределяет масштабную задачу сравнения пользовательских видео с защищенными …
Google использует историю взаимодействий пользователя и его социальные связи (Social Affinity), чтобы предсказать, какой контент (профили, ленты) он запросит следующим. Этот контент предварительно загружается (pre-fetching) и сохраняется локально, что ускоряет …
Яндекс патентует статистический метод (линеаризацию) для улучшения оценки результатов A/B тестирования. Метод преобразует сложные метрики-отношения (например, CTR или клики на сессию) в линейную форму. Это повышает чувствительность оценки, позволяя быстрее …
Яндекс патентует метод оптимизации обучения систем рекомендаций (например, Дзен). Вместо случайной инициализации при матричном разложении (ALS), система использует заранее рассчитанные векторы (эмбеддинги) контента. Это обеспечивает «теплый старт», ускоряет сходимость алгоритма …
Патент Google описывает инфраструктурный механизм для эффективного поиска дубликатов или похожих аудио- и видеофайлов в огромных базах данных. Система использует технику Locality Sensitive Hashing (LSH) и распределенную сортировку (например, MapReduce) …
Яндекс патентует метод оптимизации рекламных кампаний в рекомендательных системах (например, Дзен). Система рассчитывает вероятность взаимодействия каждого пользователя с контентом, прогнозирует размер доступной аудитории и определяет минимальный порог вероятности. Реклама показывается …
Яндекс патентует метод для рекомендательных систем (например, Дзен), гарантирующий достижение заданных показателей продвижения (SLA). Система рассчитывает вероятность взаимодействия для каждого пользователя, прогнозирует общий трафик и определяет минимальный порог вероятности. Контент …
Патент Google, описывающий специализированную систему («Социальный граф вещей»), где пользователи вручную каталогизируют предметы, которыми владеют или интересуются. Система позволяет искать эти предметы, фильтруя результаты на основе социальных связей пользователя (контактов) …
Google использует интерфейс "Relevance Bar" для визуализации результатов поиска по контенту, привязанному ко времени (например, ТВ-программы, подкасты, вебинары). Эта временная шкала показывает, когда происходят события, и использует визуальные атрибуты (цвет, …
Google использует систему для эффективного тестирования и оценки различных критериев отбора ресурсов для включения в индекс. Вместо затратного перестроения индекса для каждого эксперимента, система симулирует, как разные процессы отбора повлияют …
Google использует технологию для обработки визуальных запросов (например, фотографий страниц книги). Система выполняет OCR и применяет сложный алгоритм оценки качества распознавания, учитывающий контекст и языковые модели. Это позволяет выделить наиболее …
Яндекс патентует новый интерфейс для поисковых подсказок (саджеста). Вместо статического списка, подсказки представлены в виде прокручиваемой "карусели" или "колеса", которое пользователь перемещает относительно поля ввода. Это упрощает выбор и формирование …
Патент описывает инфраструктурный процесс Google для каталогизации оцифрованных документов (Google Books). Система статистически сравнивает текст книги, полученный через OCR (особенно страницу авторских прав), с базой библиотечных метаданных. Используя вероятностный анализ, …
Google использует систему визуализации результатов поиска по историческим новостям. Она строит график, показывающий развитие новостных сюжетов (кластеров) во времени, включая их разделение и слияние. Система также использует различные маркеры для …
Google использует скрытые водяные знаки в своих структурированных результатах (таких как SERP или машинный перевод), чтобы позже идентифицировать их как контент, созданный машиной. Это позволяет исключать такой контент из обучающих …
Патент описывает инфраструктурный механизм Google для эффективного обновления кеша данных в вертикальных поисках (Google Hotels, Flights). Система рассчитывает ценность (Utility Value) для каждого потенциального запроса к API партнера на основе …
Google использует метод для организации больших объемов неструктурированных данных (например, отзывов клиентов или сообщений на форумах) в иерархическую таксономию. Система итеративно применяет стандартные алгоритмы кластеризации: сначала группирует документы, затем группирует …
Патент описывает техническую инфраструктуру, позволяющую Google Картам работать офлайн. Google организует картографические данные и информацию о локальных объектах (бизнесы, POI) в виде тайлов. Эти тайлы загружаются на мобильное устройство, кэшируются …
Google использует систему для сканирования контента нативных мобильных приложений (App Indexing). Патент описывает, как система определяет момент полной загрузки приложения, отслеживая технические сигналы: стабилизацию использования памяти, сетевые запросы и события …

