Патент Google, описывающий механизм интеллектуального исправления ошибок голосового поиска. Система позволяет пользователю исправить неверно распознанный запрос, предоставив контекстную подсказку (например, «Я имел в виду футболиста»). Google использует анализ сущностей, чтобы выбрать правильную интерпретацию из первоначальных гипотез распознавания.
Автор: Виктор Репин
Яндекс патентует метод персонализации поисковых подсказок для сериализованного контента. Система не просто фиксирует клик, а использует статистический алгоритм «Heart Beat», чтобы определить, действительно ли пользователь завершил просмотр эпизода (досмотрел до конца или превысил порог времени). Только если просмотр завершен, Яндекс предложит в подсказках следующий по порядку эпизод.
Патент описывает внутренний механизм машинного обучения Яндекса (вероятно, часть CatBoost) для борьбы с переобучением (Overfitting). При обучении система намеренно добавляет случайный шум (Random Parameters of Interest) в данные для оценки качества дерева решений. Это заставляет алгоритм выбирать более надежные и обобщающие факторы ранжирования, устойчивые к шуму и ложным корреляциям.
Google использует частотность текстовых запросов из своих логов для разрешения неоднозначности при вводе текста с цифровой клавиатуры (например, на старых мобильных телефонах). Система определяет наиболее вероятное слово, соответствующее введенной числовой последовательности, основываясь на популярности этого слова среди всех пользователей.
Google использует систему для автоматического управления объявлениями с функцией звонка (Click-to-Call). Система анализирует сайт рекламодателя, чтобы определить начальную частоту показа кнопки вызова. Затем она отслеживает параметры звонков (время ожидания, процент ответов, конверсии) и динамически корректирует частоту показа этой функции, чтобы максимизировать эффективность рекламы и не перегружать ресурсы рекламодателя.
Google использует систему «Гибкой географической иерархии» для управления данными о местоположениях. Эта система адаптируется к различным административным структурам по всему миру, позволяя классифицировать локации с разным количеством уровней (например, 3 уровня в США и 5 на Филиппинах). Эта инфраструктура обеспечивает точный географический таргетинг для доставки контента, преимущественно в рекламных системах.
Яндекс патентует метод повышения надежности и качества машинного обучения (в частности, CatBoost). Для борьбы с переобучением (overfitting) система намеренно вводит случайный шум в данные во время тренировки модели при оценке качества дерева решений. Это заставляет алгоритм выявлять более общие и стабильные закономерности, делая финальную ранжирующую модель более устойчивой к шуму и манипуляциям.
Google использует механизм для динамического определения длины сниппета в результатах поиска (в патенте — специфично для email). Если документ старый, не просмотрен пользователем или слабо соответствует запросу (низкий Query Score, высокий Scatter Score), система показывает более длинный сниппет, чтобы дать пользователю достаточно контекста для оценки релевантности.
Анализ патента Google, описывающего метод оптимизации базовых математических операций в поиске. Вместо медленных вычислений с большими плотными матрицами Google использует структурированные матрицы на основе произведения Кронекера. Это значительно ускоряет обработку высокоразмерных данных (эмбеддингов) и поиск ближайших соседей (ANN), позволяя масштабировать сложные нейросетевые модели.
Анализ патента Google, описывающего механизм персонализации поиска, который позволял пользователю явно указать подмножество своего социального графа (например, «Круг» друзей) при выполнении запроса. Система идентифицировала отзывы или рейтинги (ассоциации) от контактов именно из этой группы. Результаты, рекомендованные выбранной группой, повышались в выдаче и аннотировались деталями этих рекомендаций.
Google использует механизм для рекомендации музыки к видео, анализируя его визуальное содержание и генерируя семантический вектор (Signature Vector) с помощью тысяч классификаторов. Система находит похожие по содержанию видео, определяет, насколько типично в них используется музыка, и предлагает саундтреки из наиболее релевантных и типичных примеров. Патент раскрывает методы глубокого понимания видеоконтента.
Яндекс патентует систему адаптивного отображения рекомендаций (например, Дзен) в браузере. Используя машинное обучение (MLA), система прогнозирует уровень интереса пользователя (Confidence Level). Чем выше этот уровень, тем более заметным будет формат показа блока рекомендаций (от скрытого состояния до крупного окна). Логика отображения определяется динамически через Поисковые Таблицы.
Google оптимизирует производительность Autocomplete, кэшируя подсказки локально в браузере, чтобы избежать запросов к серверу при каждом вводе символа. Хотя патент фокусируется на скорости, он также подтверждает, что Google ранжирует подсказки на основе популярности запросов (частоты использования) и значимости сущностей (например, численности населения для географических объектов).
Патент описывает технологию контекстного поиска (например, Desktop Search), которая отслеживает активность пользователя в различных окнах интерфейса. Система извлекает ключевые слова из активных и неактивных приложений и автоматически генерирует неявные поисковые запросы. Вес ключевых слов динамически снижается в зависимости от того, как давно окно было активным.
Этот патент описывает продвинутую технику машинного обучения, используемую Google для комбинирования различных типов сигналов (запрос, история пользователя, контекст) при ранжировании. Он использует метод иерархического взвешивания (тензорные произведения и слои), который гарантирует точность системы, даже если часть информации (например, история пользователя) отсутствует, отдавая приоритет фундаментальной релевантности над сложными взаимодействиями.
Google патентует систему для записи и индексации реального опыта пользователя с помощью мобильных и носимых устройств (например, очков). Система автоматически захватывает аудио и видео, распознает объекты, лица и звуки, и создает персональную, доступную для поиска базу данных («историю опыта»). Это позволяет пользователю искать информацию о том, что он видел или слышал.
Механизм автоматического расширения критериев выбора контента (например, рекламного таргетинга в Google Ads). Система анализирует, какие сущности (entities) совместно используются другими поставщиками контента в аналогичных кампаниях. Если эти дополнительные сущности показывают высокую эффективность (CTR, конверсии) и используются достаточно часто, они предлагаются или добавляются к исходным критериям для увеличения охвата.
Google может динамически изменять текст и оформление рекламного объявления в результатах поиска, если пользователь кликнул на него, перешел на сайт, а затем вернулся обратно на страницу выдачи в рамках той же сессии. Это позволяет показывать вернувшимся пользователям специальные предложения или дополнительную информацию для повторного вовлечения.
Google индексирует не только текст, но и визуальные/аудио характеристики страниц (цвет фона, размер текста, стиль дизайна, музыку, объекты на изображениях). Это позволяет пользователям находить контент по его внешнему виду или звучанию, используя специальные операторы (например, «background:gray»), что полезно для повторного нахождения контента.
Патент описывает механизм, позволяющий Google (CSE Provider) генерировать спецификацию для Пользовательской Поисковой Системы (CSE) динамически в момент запроса. Вместо статического хранения настроек, система использует ссылку (URL) на внешний источник (HTML, RSS, XML) и извлекает правила поиска (например, список сайтов) на лету.