Автор: Виктор Репин

Яндекс патентует метод генерации текстовых подсказок (autocomplete) с учетом приложения, в котором пользователь вводит текст. Система создает векторные представления для введенного текста и для названия приложения (например, Карты или Мессенджер). Эти векторы объединяются и передаются в NLP-модель (например, LSTM или RWKV). Это позволяет генерировать разные, более релевантные подсказки для одного и того же ввода в разных контекстах.

Google использует механизм для экономии места на экранах мобильных и носимых устройств при отображении поисковых подсказок. Вместо показа полной предлагаемой фразы система отображает только следующий вероятный сегмент (слово), ранжированный на основе веб-активности пользователя. Это позволяет итеративно формировать запрос, не перегружая интерфейс.

Яндекс патентует метод повышения эффективности обучения алгоритмов рекомендаций контента (Collaborative Filtering). Вместо случайной инициализации система использует предварительно рассчитанные векторы контента (эмбеддинги). Это обеспечивает «теплый старт» для алгоритма факторизации (ALS), ускоряя его сходимость и снижая вычислительные затраты при обучении модели.

Яндекс патентует метод обучения ML-моделей для рекомендательных систем (например, Дзен), решающий проблемы переобучения и вычислительной нагрузки. Система разделяет признаки на общие (User-nonspecific), которые рассчитываются офлайн и хранятся в «Снапшотах», и пользовательские (User-specific), рассчитываемые в реальном времени. При обучении используются только данные, доступные строго до момента события, что предотвращает «заглядывание в будущее» и повышает точность.

Яндекс патентует метод повышения качества и согласованности данных, получаемых от краудсорсинговых работников (асессоров). Система автоматически подбирает минимальный набор эталонных примеров из прошлых задач (например, оценки SERP). Эти примеры служат «анкорями» на шкале оценивания, помогая асессорам точнее калибровать свои метки и снижая предвзятость.

Патент описывает систему, которая автоматически выполняет дополнительные поиски на основе контента, который пользователь просматривает в данный момент. Эти поиски персонализированы: пользователь заранее настраивает предпочтения (например, контент от социальных связей или результаты с определенных доменов), и система отображает эти результаты рядом с основной страницей.

Анализ патента Google, описывающего интерфейс «Search Refinement Wheel» (Wonder Wheel). Система визуализировала поисковый запрос и его уточнения в виде интерактивного графа (hub-and-spoke). Она позволяла пользователям исследовать смежные темы, отслеживать историю поискового пути и быстро возвращаться к предыдущим шагам за счет клиентского кэширования и анимированных переходов.

Патент Google, описывающий инфраструктуру поискового индекса, основанного на фразах, а не только на отдельных словах. Система распределяет индекс по разным уровням (Tiers) в зависимости от стоимости обработки фраз и разбивает данные на разделы (Shards). Это позволяет оптимизировать хранение данных и значительно ускорить обработку запросов за счет минимизации связи между серверами во время поиска.

Яндекс патентует метод предобработки текста перед подачей в алгоритмы машинного обучения (например, YATI). Вместо стандартного разделения слов на фиксированные части (токены), система вносит элемент случайности, исключая некоторые возможные слияния токенов. Это создает вариативность в токенизации одного и того же слова, действуя как механизм регуляризации, делая ML-модели более устойчивыми к шуму (опечаткам, редким словам) и улучшая общее понимание языка.

Патент описывает систему автоматического создания «исторических туров» для виртуальных карт (например, Google Earth). Система находит веб-страницы с геоданными (например, статьи Википедии о достопримечательностях), извлекает исторические изображения для этих мест и оценивает их важность, используя PageRank исходной страницы. Лучшие локации объединяются в KML-файл для интерактивного тура.

Патент Google, описывающий дизайн пользовательского интерфейса для поиска по оцифрованным печатным изданиям (книги, журналы). Он детализирует, как представляются результаты поиска, включая обложки, релевантные выдержки (excerpts), библиографическую информацию и навигацию по страницам, содержащим поисковый запрос.

Патент описывает систему для локального поиска и Карт, позволяющую владельцам бизнеса выбирать и оплачивать «улучшения» (Enhancements) для своих листингов. Эти улучшения (например, купоны, фото, меню) отображаются в виде специальных тегов рядом с названием компании в списке результатов и на самой карте, выделяя листинг среди органических результатов.

Google использует механизм для точного определения момента, когда нативное мобильное приложение полностью загрузило и отобразило контент. Система последовательно отслеживает завершение всех внешних сетевых запросов и состояние бездействия (idle) внутренних потоков приложения. Это гарантирует, что сканирование контента (App Indexing) начинается только тогда, когда экран приложения полностью сформирован.

Яндекс патентует метод для автоматического контроля качества ML-моделей ранжирования. Система ищет рассогласования, сравнивая входные данные модели (Векторы Свойств) и выходные данные (Оценки Релевантности) для пар документов. Если наблюдается аномалия (например, признаки похожи, а оценки сильно различаются), эти данные используются для отладки и дообучения алгоритма.

Патент описывает механизм, позволяющий владельцам сайтов загружать приватные структурированные данные, недоступные при обычном сканировании. Доступ к этим данным защищен ключом (API key). Авторизованные системы (например, Google Custom Search Engine или вертикальные поиски) могут использовать эти данные для фильтрации, сортировки и изменения ранжирования результатов поиска, не раскрывая их публично.

Google использует двухэтапную каскадную систему машинного обучения для автоматического определения того, является ли загруженное видео сферическим (360°). Анализируя визуальные и геометрические признаки (соотношение сторон, дисперсию на полюсах, кривизну линий), система гарантирует корректное воспроизведение видео в соответствующем плеере, независимо от метаданных.

Этот патент описывает UI-механизм для Q&A платформ или форумов. Он позволяет пользователям, отвечающим на вопросы, искать подтверждающую информацию и встраивать в ответ как результат поиска (в виде ссылки), так и точный поисковый запрос, который они использовали. Читатели могут просмотреть цитату и повторно запустить исходный запрос одним кликом.

Патент Google о системе оптимизации платной рекламы в Картах. Система рассчитывает «Скорректированную стоимость» (Adjusted Value), учитывая базовую ставку, влияние соседних объявлений (конкуренция/синергия) и предотвращая перекрытие важных объектов (POI). Это механизм Paid Search (PPC), а не органического SEO.

Google использует итеративный алгоритм для форматирования сниппетов, содержащих текст и изображение. Система рассчитывает высоту текста, подгоняет под нее размер изображения (сохраняя пропорции), а затем пересчитывает высоту текста с учетом нового размера изображения. Это позволяет избежать неэстетичного пустого пространства или обрезки контента в результатах поиска.

Анализ патента Google, описывающего дизайн и функциональность интерфейса для поиска отелей. Патент фокусируется на способах представления, фильтрации и сравнения результатов. Ключевые элементы включают «шорт-листы» для сравнения отелей, отображение относительных цен (сравнение с историческими данными), «карточки отелей» для быстрого просмотра, а также функции карты, такие как выделение туристических зон и фильтрация по полигону.