Автор: Виктор Репин

Google разработал метод поиска, позволяющий пользователям объединять отображаемые объекты (например, изображения людей или продуктов) с помощью жеста, такого как перетаскивание. Система идентифицирует сущности, стоящие за этими объектами, находит их общие атрибуты и автоматически выполняет поиск по этим связям (например, фильмы, в которых снимались оба актера).

Патент Google описывает технический механизм доставки обновляемых (потоковых) результатов поиска в реальном времени. Система кодирует идентификаторы уже отправленных результатов в специальную строку состояния (State String) и передает ее клиенту через Polling URL. При запросе обновлений клиент возвращает эту строку, позволяя серверу отфильтровать дубликаты (как по URL, так и по контенту) перед отправкой новых данных.

Google анализирует частично введенный запрос в реальном времени, чтобы определить, пытается ли пользователь выполнить структурированный поиск (например, по дате или атрибуту). Если система распознает формат (например, дату или email) или ключевые индикаторы (например, название месяца), она предлагает соответствующие поисковые операторы (например, «before:», «from:») в подсказках автозаполнения, помогая пользователю правильно сформулировать сложный запрос.

Яндекс использует многоуровневый подход для рекомендательных систем (Дзен). Он включает офлайн-квалификацию источников на основе их трафика и частоты обновлений (Source Suitability). В онлайн-режиме система работает в два этапа: сначала выбирает источники, смешивая известные пользователю сайты с новыми, найденными через коллаборативную фильтрацию (SVD/PMI); затем ранжирует конкретные материалы из этих источников.

Яндекс патентует метод интеграции блоков с похожими запросами (Suggests) непосредственно в основную выдачу. Чтобы ранжировать эти блоки наравне с обычными результатами, система рассчитывает метрику «Related Long Click». Она оценивает вероятность того, что пользователь перейдет по подсказке и совершит «длинный клик» на веб-ресурсе в следующей выдаче.

Патент Google, описывающий систему отображения на странице результатов поиска (SERP) информации о других пользователях, которые одновременно ищут схожие запросы. Система может показывать количество таких пользователей, их местоположение, являются ли они контактами пользователя, а также предлагать начать или присоединиться к онлайн-обсуждению (чат, форум) прямо из выдачи.

Яндекс патентует метод оценки изменений в поиске через A/B тесты. Система объединяет метрики, показывающие направление изменений (хорошо/плохо, например, DAU), с метриками, чувствительными к малым изменениям (например, CTR). Это позволяет Яндексу точнее определять, улучшает ли новый алгоритм взаимодействие пользователей, опираясь на ключевые показатели вовлеченности, такие как успешность запроса (клик и пребывание >30 сек).

Яндекс использует метод повышения точности распознавания речи (ASR), интегрируя глубокую персонализацию. Система анализирует не только акустику голоса, но и учитывает профиль интересов пользователя, историю поиска и браузера, возраст и пол. Это позволяет точнее интерпретировать неоднозначные голосовые команды, адаптируя транскрипцию под контекст конкретного пользователя еще до этапа поиска.

Патент описывает систему, функционирующую подобно рекламной сети (типа AdSense), но для Q&A. Google анализирует содержание веб-сайтов (издателей) и пользовательские вопросы для определения тематической релевантности. Затем система размещает релевантные вопросы на этих сайтах, чтобы эксперты, посещающие их, могли дать ответ. Это демонстрирует базовые механизмы Google для определения тематики контента.

Яндекс патентует метод обучения чат-ботов, использующий подход Retrieval-Augmented Generation (RAG). Система находит релевантный факт во внешней базе знаний с помощью модели семантической близости. Затем этот факт объединяется (конкатенируется) с запросом пользователя и подается на вход генеративной модели (LLM). Это позволяет модели генерировать более естественные, контекстуально осведомленные и фактологически точные ответы.

Яндекс патентует метод улучшения распознавания речи (ASR), критически важный для голосового поиска и ассистентов (например, Алисы). Система использует многоступенчатое ранжирование гипотез, учитывая не только лингвистический контекст, но и акустические характеристики речи, а также персональный профиль пользователя (историю поиска, браузинга, демографию). Это позволяет точнее интерпретировать неоднозначные голосовые запросы.

Google использует технологии кластеризации для идентификации документов, посвященных одной теме или концепции. Комментарии (UGC), оставленные на одном документе, автоматически распространяются на другие документы в том же кластере. Перед показом эти комментарии ранжируются на основе качества, авторитетности автора и релевантности контексту.

Google отслеживает взаимодействие пользователя с поисковой выдачей. Если система фиксирует паттерн «прокрутка вниз, затем быстрый возврат вверх», это интерпретируется как неудовлетворенность результатами. В этот момент Google динамически вставляет дополнительный контент (связанные запросы, фильтры, рекламу) под строкой поиска, чтобы помочь пользователю уточнить запрос без ручного ввода текста, что особенно актуально для мобильных устройств.

Яндекс использует метод для точной идентификации специфических объектов на веб-странице (реклама, логотипы, карты, формы) после ее полной отрисовки браузером. Система анализирует как визуальные характеристики (размер, положение, стиль), так и характеристики исходного кода (HTML-атрибуты, JS-скрипты), применяя машинное обучение для определения типа объекта. Это позволяет поисковой системе лучше понимать структуру, компоновку и качество страницы.

Патент описывает систему, работающую на стороне клиента (в браузере), которая анализирует контент текущей веб-страницы. Система идентифицирует ключевые термины («триггеры запросов»), ранжирует их по значимости (учитывая форматирование, частоту и популярность) и предлагает пользователю готовые поисковые запросы для дальнейшего изучения темы.

Яндекс патентует технологию, позволяющую пользователям взаимодействовать с внешними сервисами (например, бронировать отели или билеты) непосредственно на странице результатов поиска (SERP), не переходя на сайт партнера. Система обеспечивает это путем встраивания интерактивных интерфейсов, данные для которых загружаются с ресурса партнера (часто через API) в момент генерации выдачи или извлекаются из кеша.

Google использует механизм для динамического обновления поисковых подсказок (Autocomplete) в реальном времени. Если пользователь вводит запрос медленно, система предполагает, что он увидел и отклонил предложенные варианты. Эти варианты понижаются в следующем списке подсказок на основе времени их показа (Exposure Time), уступая место новым, более разнообразным предложениям.

Система обрабатывает неоднозначные входные данные, например, цифровую последовательность с телефонной клавиатуры, преобразуя их во все возможные буквенные комбинации. Эти комбинации проверяются по лексикону (включая словарь и журнал прошлых запросов) и отправляются в поисковую систему как единый запрос с оператором «ИЛИ». Это позволяет поисковой системе вернуть релевантные результаты, отфильтровав неправдоподобные интерпретации.

Яндекс патентует механизм, который анализирует запрос и, если система с высокой степенью уверенности определяет, что пользователь ищет контент из конкретной вертикали (например, Картинки, Видео, Погода, Карты), она пропускает стандартную страницу результатов (SERP) и немедленно показывает исключительно результаты этой вертикали. Это решение базируется на анализе ключевых слов в запросе, позиции вертикального результата в ранжировании и историческом поведении пользователей.

Патент описывает механизм Google для стимулирования пользователей оставлять социальные аннотации (например, Google +1) к результатам поиска. Когда пользователь выражал интерес к теме или сайту, система немедленно предлагала связанный социальный контент: посты от идентифицированных экспертов и популярные обсуждения. Патент раскрывает критерии, которые Google использовал для алгоритмического определения экспертности автора и популярности контента.