Автор: Виктор Репин

2013 Knowledge Graph Мультимедиа Патенты Google Семантика и интент

Как Google использует жесты (Drag-and-Drop) для поиска общих связей между сущностями или изображениями

Google разработал метод поиска, позволяющий пользователям объединять отображаемые объекты (например, изображения людей или продуктов) с помощью жеста, такого как перетаскивание. Система идентифицирует сущности, стоящие за этими объектами, находит их общие атрибуты и автоматически выполняет поиск по этим связям (например, фильмы, в которых снимались оба актера).

2012 Kumar Mayur Thakur Патенты Google Ссылки

Как Google предотвращает дублирование контента в потоковых результатах поиска (Streaming Search)

Патент Google описывает технический механизм доставки обновляемых (потоковых) результатов поиска в реальном времени. Система кодирует идентификаторы уже отправленных результатов в специальную строку состояния (State String) и передает ее клиенту через Polling URL. При запросе обновлений клиент возвращает эту строку, позволяя серверу отфильтровать дубликаты (как по URL, так и по контенту) перед отправкой новых данных.

2014 Патенты Google Поведенческие сигналы Свежесть контента Семантика и интент

Как Google распознает намерения структурированного поиска и предлагает операторы в автозаполнении

Google анализирует частично введенный запрос в реальном времени, чтобы определить, пытается ли пользователь выполнить структурированный поиск (например, по дате или атрибуту). Если система распознает формат (например, дату или email) или ключевые индикаторы (например, название месяца), она предлагает соответствующие поисковые операторы (например, «before:», «from:») в подсказках автозаполнения, помогая пользователю правильно сформулировать сложный запрос.

2019 Патенты Яндекс Рекомендательные системы Холодный старт Яндекс Дзен

Как Яндекс использует двухэтапное машинное обучение и предварительную квалификацию источников для формирования ленты рекомендаций (Дзен)

Яндекс использует многоуровневый подход для рекомендательных систем (Дзен). Он включает офлайн-квалификацию источников на основе их трафика и частоты обновлений (Source Suitability). В онлайн-режиме система работает в два этапа: сначала выбирает источники, смешивая известные пользователю сайты с новыми, найденными через коллаборативную фильтрацию (SVD/PMI); затем ранжирует конкретные материалы из этих источников.

2017 SERP Метрики качества поиска Патенты Яндекс Поисковые подсказки Ранжирование

Как Яндекс ранжирует блоки похожих запросов (подсказок) в основной поисковой выдаче с помощью метрики «Related Long Click»

Яндекс патентует метод интеграции блоков с похожими запросами (Suggests) непосредственно в основную выдачу. Чтобы ранжировать эти блоки наравне с обычными результатами, система рассчитывает метрику «Related Long Click». Она оценивает вероятность того, что пользователь перейдет по подсказке и совершит «длинный клик» на веб-ресурсе в следующей выдаче.

2013 Патенты Google Персонализация Поведенческие сигналы

Как Google предлагает взаимодействие с другими пользователями, ищущими то же самое в реальном времени

Патент Google, описывающий систему отображения на странице результатов поиска (SERP) информации о других пользователях, которые одновременно ищут схожие запросы. Система может показывать количество таких пользователей, их местоположение, являются ли они контактами пользователя, а также предлагать начать или присоединиться к онлайн-обсуждению (чат, форум) прямо из выдачи.

2020 Метрики качества поиска Обучение моделей Патенты Яндекс Поведенческие факторы

Как Яндекс комбинирует метрики в A/B тестах для точной оценки качества поиска и какие KPI использует

Яндекс патентует метод оценки изменений в поиске через A/B тесты. Система объединяет метрики, показывающие направление изменений (хорошо/плохо, например, DAU), с метриками, чувствительными к малым изменениям (например, CTR). Это позволяет Яндексу точнее определять, улучшает ли новый алгоритм взаимодействие пользователей, опираясь на ключевые показатели вовлеченности, такие как успешность запроса (клик и пребывание >30 сек).

2021 Алиса Голосовой поиск Патенты Яндекс Персонализация

Как Яндекс использует историю поиска, интересы и личные данные пользователя для персонализации распознавания голосовых запросов

Яндекс использует метод повышения точности распознавания речи (ASR), интегрируя глубокую персонализацию. Система анализирует не только акустику голоса, но и учитывает профиль интересов пользователя, историю поиска и браузера, возраст и пол. Это позволяет точнее интерпретировать неоднозначные голосовые команды, адаптируя транскрипцию под контекст конкретного пользователя еще до этапа поиска.

2007 Краулинг Патенты Google Семантика и интент

Как Google использует анализ контента для распределения пользовательских вопросов на тематически релевантные сайты

Патент описывает систему, функционирующую подобно рекламной сети (типа AdSense), но для Q&A. Google анализирует содержание веб-сайтов (издателей) и пользовательские вопросы для определения тематической релевантности. Затем система размещает релевантные вопросы на этих сайтах, чтобы эксперты, посещающие их, могли дать ответ. Это демонстрирует базовые механизмы Google для определения тематики контента.

2024 Алиса Обучение моделей Патенты Яндекс Семантический поиск

Как Яндекс обучает чат-ботов (Алиса/YandexGPT) с помощью Retrieval-Augmented Generation (RAG) для использования внешних фактов

Яндекс патентует метод обучения чат-ботов, использующий подход Retrieval-Augmented Generation (RAG). Система находит релевантный факт во внешней базе знаний с помощью модели семантической близости. Затем этот факт объединяется (конкатенируется) с запросом пользователя и подается на вход генеративной модели (LLM). Это позволяет модели генерировать более естественные, контекстуально осведомленные и фактологически точные ответы.

2020 Алиса Голосовой поиск Патенты Яндекс Персонализация

Как Яндекс использует глубокую персонализацию (историю поиска, интересы) и акустику для повышения точности распознавания речи (ASR)

Яндекс патентует метод улучшения распознавания речи (ASR), критически важный для голосового поиска и ассистентов (например, Алисы). Система использует многоступенчатое ранжирование гипотез, учитывая не только лингвистический контекст, но и акустические характеристики речи, а также персональный профиль пользователя (историю поиска, браузинга, демографию). Это позволяет точнее интерпретировать неоднозначные голосовые запросы.

2009 Патенты Google Семантика и интент

Как Google использует кластеризацию контента для агрегации и показа комментариев на тематически схожих страницах

Google использует технологии кластеризации для идентификации документов, посвященных одной теме или концепции. Комментарии (UGC), оставленные на одном документе, автоматически распространяются на другие документы в том же кластере. Перед показом эти комментарии ранжируются на основе качества, авторитетности автора и релевантности контексту.

2012 SERP Патенты Google Поведенческие сигналы

Как Google использует паттерны скроллинга на SERP для динамического показа связанных запросов и фильтров

Google отслеживает взаимодействие пользователя с поисковой выдачей. Если система фиксирует паттерн «прокрутка вниз, затем быстрый возврат вверх», это интерпретируется как неудовлетворенность результатами. В этот момент Google динамически вставляет дополнительный контент (связанные запросы, фильтры, рекламу) под строкой поиска, чтобы помочь пользователю уточнить запрос без ручного ввода текста, что особенно актуально для мобильных устройств.

2017 Антикачество Индексация Качество контента Патенты Яндекс

Как Яндекс идентифицирует ключевые элементы страницы (рекламу, логотипы, карты) после рендеринга

Яндекс использует метод для точной идентификации специфических объектов на веб-странице (реклама, логотипы, карты, формы) после ее полной отрисовки браузером. Система анализирует как визуальные характеристики (размер, положение, стиль), так и характеристики исходного кода (HTML-атрибуты, JS-скрипты), применяя машинное обучение для определения типа объекта. Это позволяет поисковой системе лучше понимать структуру, компоновку и качество страницы.

2009 Knowledge Graph Патенты Google Персонализация Семантика и интент

Как Google генерирует подсказки для следующего поиска прямо в браузере на основе контента просматриваемой страницы

Патент описывает систему, работающую на стороне клиента (в браузере), которая анализирует контент текущей веб-страницы. Система идентифицирует ключевые термины («триггеры запросов»), ранжирует их по значимости (учитывая форматирование, частоту и популярность) и предлагает пользователю готовые поисковые запросы для дальнейшего изучения темы.

2017 SERP Вертикальный поиск Колдунщики Патенты Яндекс

Как Яндекс встраивает интерактивные интерфейсы бронирования (Колдунщики) прямо в поисковую выдачу

Яндекс патентует технологию, позволяющую пользователям взаимодействовать с внешними сервисами (например, бронировать отели или билеты) непосредственно на странице результатов поиска (SERP), не переходя на сайт партнера. Система обеспечивает это путем встраивания интерактивных интерфейсов, данные для которых загружаются с ресурса партнера (часто через API) в момент генерации выдачи или извлекаются из кеша.

2012 Lev Finkelstein Патенты Google Персонализация Поведенческие сигналы

Как Google динамически меняет подсказки в Autocomplete, понижая те, которые пользователь уже видел и проигнорировал

Google использует механизм для динамического обновления поисковых подсказок (Autocomplete) в реальном времени. Если пользователь вводит запрос медленно, система предполагает, что он увидел и отклонил предложенные варианты. Эти варианты понижаются в следующем списке подсказок на основе времени их показа (Exposure Time), уступая место новым, более разнообразным предложениям.

Патенты Google Поведенческие сигналы Семантика и интент

Как Google обрабатывает неоднозначные запросы с устройств с ограниченным вводом, используя логическое «ИЛИ» и логи прошлых поисковых запросов

Система обрабатывает неоднозначные входные данные, например, цифровую последовательность с телефонной клавиатуры, преобразуя их во все возможные буквенные комбинации. Эти комбинации проверяются по лексикону (включая словарь и журнал прошлых запросов) и отправляются в поисковую систему как единый запрос с оператором «ИЛИ». Это позволяет поисковой системе вернуть релевантные результаты, отфильтровав неправдоподобные интерпретации.

2016 SERP Вертикальный поиск Интент пользователя Колдунщики Патенты Яндекс

Как Яндекс пропускает стандартную веб-выдачу и показывает только результаты вертикального поиска (Колдунщики) при высокой уверенности в интенте

Яндекс патентует механизм, который анализирует запрос и, если система с высокой степенью уверенности определяет, что пользователь ищет контент из конкретной вертикали (например, Картинки, Видео, Погода, Карты), она пропускает стандартную страницу результатов (SERP) и немедленно показывает исключительно результаты этой вертикали. Это решение базируется на анализе ключевых слов в запросе, позиции вертикального результата в ранжировании и историческом поведении пользователей.

2013 EEAT и качество Патенты Google

Как Google использовал социальные аннотации в SERP для идентификации экспертов и стимулирования вовлеченности

Патент описывает механизм Google для стимулирования пользователей оставлять социальные аннотации (например, Google +1) к результатам поиска. Когда пользователь выражал интерес к теме или сайту, система немедленно предлагала связанный социальный контент: посты от идентифицированных экспертов и популярные обсуждения. Патент раскрывает критерии, которые Google использовал для алгоритмического определения экспертности автора и популярности контента.