Автор: Виктор Репин

Патент Google, описывающий инфраструктурный механизм обновления индекса (репозитория документов). Система позволяет добавлять новые версии документов и удалять старые, не блокируя доступ к данным для параллельно выполняющихся поисковых запросов. Это достигается за счет управления «доступным диапазоном» данных и отложенного удаления старых версий.

2020 Алиса Голосовой поиск Интент пользователя Патенты Яндекс

Как Яндекс использует акустические характеристики голоса (интонацию, темп, паузы) для определения намерения пользователя в голосовых помощниках

Яндекс патентует метод для умных помощников (типа Алисы), позволяющий точнее определять намерение пользователя (вопрос, утверждение) не только по тексту, но и по акустическим характеристикам речи (интонация, громкость, темп). Система комбинирует текстовые и акустические векторы и использует нейронную сеть (RNN) для классификации интента.

2024 Патенты Яндекс Рекомендательные системы Холодный старт Яндекс Музыка

Как Яндекс решает проблему «холодного старта» для новых элементов в рекомендательных системах (например, Музыка, Маркет)

Яндекс патентует методы генерации синтетической обратной связи (например, лайков/дизлайков) для новых элементов (треков, товаров), у которых еще нет реальной истории взаимодействий. Это позволяет рекомендательным системам (таким как Яндекс Музыка или Маркет) сразу включать новинки в рекомендации, решая проблему «холодного старта». Синтетическая обратная связь генерируется на основе схожести поставщиков контента или внешних сигналов популярности.

2003 Краулинг Патенты Google

Как Google автоматически создает рекламные объявления, анализируя сайты рекламодателей (Основа Dynamic Search Ads)

Анализ патента Google, описывающего систему автоматизации платной рекламы (PPC), лежащую в основе Dynamic Search Ads (DSA). Система анализирует контент веб-сайтов рекламодателей для динамической генерации текста объявления (креатива), выбора целевой страницы и определения таргетинга. Патент не относится к органическому поиску (SEO).

2007 Патенты Google Персонализация

Как Google записывает историю поиска пользователя и отображает ее через виджеты с помощью контент-фидов

Патент описывает инфраструктуру для создания специализированных приложений (виджетов). Он детализирует, как поисковая система Google отслеживает и записывает запросы пользователя и клики по результатам на стороне сервера. Затем эта история поиска преобразуется в контент-фид (например, RSS) и передается в клиентское приложение (виджет) для отображения пользователю.

2017 Обучение моделей Патенты Яндекс Рекомендательные системы Яндекс Дзен

Как Яндекс использует «Снимки данных» (Snapshot Archives) для обучения систем рекомендаций и предотвращения переобучения

Яндекс патентует метод обучения моделей для систем рекомендаций (например, Дзен), решающий проблемы переобучения и вычислительной эффективности. Признаки разделяются: специфичные для пользователя рассчитываются в реальном времени, а общие (глобальные) рассчитываются периодически офлайн и сохраняются в «Снимках данных» (Snapshot Archives). Это гарантирует, что при обучении используются только данные, доступные в момент исторического события, предотвращая «взгляд в будущее».

2023 Асессоры Краудсорсинг Обучение моделей Патенты Яндекс

Как Яндекс использует машинное обучение для оптимизации выдачи заданий асессорам и повышения качества обучающих данных

Яндекс патентует метод ранжирования задач для исполнителей (асессоров) на своей краудсорсинговой платформе (например, Яндекс.Задания). Система использует ML для балансировки между предпочтениями асессора (вероятность выбора задачи) и его навыками (вероятность точного выполнения). Цель — максимизировать качество собираемых данных для обучения поиска при сохранении вовлеченности асессоров.

2023 SERP Обучение моделей Патенты Яндекс Яндекс Директ

Как Яндекс использует клики по рекламе как прокси для предсказания ее фактической видимости (Visibility Score)

Яндекс патентует метод обучения ML-модели для предсказания вероятности того, что пользователь увидит рекламное объявление (Visibility Score). Поскольку факт просмотра сложно зафиксировать, система использует данные о взаимодействиях (кликах или наведении курсора) как прокси-метрику видимости. Модель обучается путем показа одного и того же объявления одному пользователю в разных слотах, чтобы понять, как позиция влияет на взаимодействие.

2019 Алиса Голосовой поиск Обучение моделей Патенты Яндекс

Как Яндекс использует нейросети для выбора ответов в чат-ботах (например, Алисе), учитывая логику и стиль беседы

Яндекс патентует метод для умных помощников и чат-ботов по выбору следующего ответа в диалоге. Система использует нейронную сеть для создания векторов контекста беседы и потенциальных ответов. Ответ выбирается на основе оценки ранжирования, которая суммирует два показателя: лингвистическое сходство (соответствие стилю) и логическое сходство (релевантность ответа). Это позволяет системе не только давать логичные ответы, но и подражать стилю речи пользователя.

2019 Патенты Яндекс Рекомендательные системы Холодный старт Яндекс Дзен

Как Яндекс использует анализ верстки доверенных сайтов для решения проблемы «холодного старта» в рекомендательных системах (например, Дзен)

Яндекс патентует метод для рекомендательных сервисов (например, Дзен), решающий проблему «холодного старта». Если у пользователя нет истории взаимодействий, система не может создать персонализированную ленту. Вместо этого она анализирует визуальные характеристики (размер, позиция, изображения) контента на главных страницах заранее определенных «надежных» ресурсов. Используя обученную модель, система предсказывает популярность контента на основе его визуальной заметности и формирует из него неперсонализированную ленту рекомендаций.

2019 Алиса Голосовой поиск Обучение моделей Патенты Яндекс

Как Яндекс обучает голосовых помощников (чат-ботов) поддерживать логичный диалог и соответствовать стилю общения пользователя

Яндекс патентует метод для улучшения работы интеллектуальных персональных ассистентов (IPA) или чат-ботов. Система использует нейронную сеть для оценки потенциальных ответов, учитывая два ключевых фактора: логическую связь с текущим диалогом и лингвистическое сходство (стиль речи) с предыдущим контекстом. Это позволяет чат-боту давать не только правильные по смыслу ответы, но и поддерживать естественный стиль общения (например, формальный или неформальный), соответствующий контексту разговора.

2017 Индексация Патенты Яндекс Свежесть контента Яндекс Маркет

Как Яндекс ускоряет и оптимизирует индексацию партнерских фидов с помощью частичного обновления индекса

Яндекс использует инфраструктурный механизм для эффективной индексации партнерских данных (например, товаров или рекламы из XML-фидов). Вместо полной переиндексации базы система группирует объявления в логические «Разделы». При обновлении данных переиндексируется только та часть поискового индекса, которая соответствует измененному Разделу, что значительно ускоряет появление актуальной информации в сервисах Яндекса.

2020 Асессоры Метрики качества поиска Обучение моделей Патенты Яндекс

Как Яндекс автоматически находит и исправляет ошибки в работе своих алгоритмов ранжирования

Яндекс патентует систему внутреннего контроля качества для автоматического выявления ошибок ранжирования. Система сравнивает входные данные (векторы признаков) и выходные результаты (оценки релевантности) для пар документов. Если документы похожи по признакам, но сильно различаются по рангу (или наоборот), система маркирует их как потенциальную ошибку. Это позволяет Яндексу фокусировать внимание асессоров на реальных проблемах и быстрее улучшать модели машинного обучения.

2017 Обучение моделей Патенты Яндекс Рекомендательные системы Яндекс Дзен

Как Яндекс обучает модели рекомендательных систем, используя исторические «снимки» данных для повышения точности

Яндекс патентует метод обучения ML-моделей для систем рекомендаций (например, Дзен, Музыка). Для повышения точности и эффективности признаки разделяются: связанные с пользователем вычисляются в реальном времени, а глобальные признаки контента — периодически офлайн и хранятся в «Архивах Снимков». При обучении используются только данные, доступные строго ДО момента исторического события, что предотвращает «заглядывание в будущее» и устраняет искажения модели.

2004 Безопасный поиск Патенты Google

Как Google мгновенно обновляет права доступа к документам в индексе без полного переиндексирования (для корпоративного поиска)

Патент описывает инфраструктурный механизм для корпоративных поисковых систем (Search Appliances). Он позволяет мгновенно отражать изменения прав доступа к документам в поисковой выдаче, не дожидаясь полного переиндексирования. Система использует «отпечатки безопасности» для маркировки общедоступных документов и фильтрации результатов в реальном времени.

2020 Алиса Голосовой поиск Обучение моделей Патенты Яндекс

Как Яндекс обучает голосовых помощников и NLP-системы понимать команды на естественном языке с помощью майнинга паттернов

Патент Яндекса описывает метод эффективного обучения систем обработки естественного языка (NLP), таких как голосовые помощники или приложения для диктовки. Вместо анализа огромных текстовых корпусов система изучает конкретные примеры команд, извлекает лингвистические признаки и использует алгоритмы майнинга (например, Charm Bitset) для выявления устойчивых шаблонов. Это позволяет точно преобразовывать фразы пользователя в машинные инструкции.

2019 SERP Навигационные запросы Патенты Яндекс Яндекс Браузер

Как Яндекс использует адресную строку браузера для отображения истории навигации и исходных поисковых запросов

Яндекс патентует технологию для браузера, позволяющую использовать адресную строку для отображения информации, не исходящей от владельца текущего сайта. Основной механизм — отображение истории навигации в виде «умных» хлебных крошек, включающих текст исходного поискового запроса как интерактивный элемент для быстрого возврата на страницу поиска (SERP).

2012 Мультимедиа Патенты Google

Как Google использует механизм «Push-to-Talk» и жесты для оптимизации голосового ввода на мобильных устройствах

Патент Google, описывающий интерфейс «Push-to-Talk» для голосового ввода. Пользователь удерживает кнопку во время произнесения запроса и отпускает для завершения ввода. Также описан механизм жестов для направления распознанного текста в конкретное приложение. Патент фокусируется на UI/UX и не содержит информации об алгоритмах ранжирования.

2019 Метрики качества поиска Обучение моделей Патенты Яндекс Ранжирование

Как Яндекс борется с переобучением и смещением в ранжирующих моделях (CatBoost) с помощью метода «Не заглядывать вперед»

Патент Яндекса описывает технический метод обучения моделей машинного обучения (в частности, градиентного бустинга над деревьями решений, лежащего в основе CatBoost), направленный на уменьшение переобучения и смещения модели. Метод «Не заглядывать вперед» гарантирует, что при обучении модель использует только данные из «прошлого» (предыдущие объекты в упорядоченном списке), предотвращая утечку информации из «будущего».

2016 Интент пользователя Патенты Яндекс Холодный старт Яндекс Директ

Как Яндекс определяет «Параметр Намерения» рекламных объявлений для улучшения таргетинга и прогнозирования CTR в Яндекс.Директ

Яндекс патентует метод многоэтапного лингвистического анализа рекламных объявлений для извлечения их основного смысла («Параметра Намерения»), отфильтровывая «бессмысленные фразы». Этот параметр используется для точного сопоставления рекламы с интентом пользователя и для прогнозирования CTR новых объявлений на основе исторических данных объявлений с аналогичным намерением.