Автор: Виктор Репин

2016 SERP Интент пользователя Колдунщики Патенты Яндекс

Как Яндекс динамически формирует и обогащает Карточку Объекта (Object Card) на основе интента пользователя и лучших органических результатов

Яндекс патентует комплекс методов для улучшения представления сущностей (Object Card) на SERP. Система адаптирует состав и порядок блоков в карточке под интент пользователя, позволяет интерактивно фильтровать информацию по аспектам (например, «Биография», «Фильмография»), показывает связанные сущности из разных доменов и добавляет в карточку ссылки на наиболее релевантные органические результаты (Best-Matching Results) для каждого аспекта.

2014 SERP Вертикальный поиск Индексация Патенты Яндекс Поиск по картинкам

Как Яндекс группирует и ранжирует серии похожих изображений из одного источника в Поиске по Картинкам

Яндекс патентует механизм для улучшения выдачи в Поиске по Картинкам путем группировки визуально похожих изображений, найденных на одной веб-странице, в «Серии». Эти серии отображаются в выдаче как единый, визуально отличимый блок и ранжируются по релевантности лучшего изображения в группе. Это позволяет пользователям быстрее находить коллекции связанных изображений, такие как пошаговые инструкции или фотогалереи.

2004 Мультиязычность Патенты Google Семантика и интент

Как Google предсказывает запросы на идеографических языках (например, японском) во время фонетического ввода

Патент Google, описывающий систему автозаполнения для языков, использующих идеограммы (например, иероглифы Кандзи) и фонетический ввод (например, Кана). Система анализирует исторические запросы и учитывает все возможные фонетические варианты написания идеограмм. Это позволяет предсказывать полный идеографический запрос, даже когда пользователь находится в процессе ввода фонетических символов до их преобразования.

2024 SERP Обучение моделей Патенты Яндекс Ранжирование

Как Яндекс обучает ранжирование, учитывая визуальный размер и позицию элементов (виджетов) на SERP

Яндекс патентует метод оптимизации поисковой выдачи (SERP), учитывающий физический размер (высоту) и позицию элементов. Система рассчитывает «оценку полезности» для обучения ML-моделей. Если пользователь пропускает большой элемент (например, виджет или расширенный сниппет) и кликает ниже, пропущенный элемент получает штраф, пропорциональный его размеру. Это позволяет Яндексу точнее интерпретировать поведение пользователей и оптимизировать компоновку выдачи.

2025 Интент пользователя Обучение моделей Патенты Яндекс Поведенческие факторы

Как Яндекс использует переформулировки запросов в сессии для генерации негативных примеров обучения ранжирования

Яндекс патентует метод автоматической генерации высококачественных негативных обучающих примеров для моделей ранжирования. Система анализирует сессии, где пользователь уточняет запрос (например, с А на Б). Результаты из выдачи А используются как негативные примеры для запроса Б, особенно если время взаимодействия с ними было коротким (менее 30 сек). Это позволяет модели лучше различать релевантность при близких, но разных интентах.

2004 Индексация Патенты Google Персонализация Поведенческие сигналы

Как Google индексирует действия пользователя на локальном устройстве для контекстного поиска (Архитектура Google Desktop)

Патент описывает архитектуру клиентского поискового движка (например, Google Desktop), который в реальном времени фиксирует взаимодействия пользователя с контентом (веб-страницы, документы, email). Система индексирует этот контент локально и может генерировать автоматические (имплицитные) запросы на основе текущего контекста пользователя, объединяя локальные и веб-результаты.

2012 EEAT и качество Индексация Краулинг Патенты Google

Как Google тестирует и выбирает, какие документы включать в индекс, используя инкрементно обновляемую тестовую среду

Патент описывает инфраструктуру Google для оценки различных стратегий отбора документов в индекс. Система поддерживает актуальный набор данных (Query-to-Resource Mapping), периодически добавляя свежий контент и новые запросы. Это позволяет Google сравнивать разные алгоритмы индексации через A/B тесты и оценку асессорами, чтобы определить, какая стратегия обеспечивает более качественную выдачу.

2012 Патенты Google Персонализация Семантика и интент

Как Google показывает мгновенные результаты на карте на основе поисковых подсказок (Autocomplete) во время ввода запроса

Google динамически отображает индикаторы (пины) на карте для сущностей, соответствующих наиболее вероятной поисковой подсказке (Autocomplete), пока пользователь еще вводит запрос. Система автоматически предсказывает интент, выполняет фоновый поиск и обновляет карту в реальном времени, учитывая текущую видимую географическую область.

2016 Патенты Яндекс Поведенческие факторы Рекомендательные системы Холодный старт

Как Яндекс использует мультимодальные векторные пространства для связи поведения пользователей с текстом и изображениями

Яндекс разрабатывает систему для глубокого понимания контента (текста и изображений) путем анализа того, как пользователи взаимодействуют с ним. Система создает единое векторное пространство (User Item Space), где поведенческие паттерны (в частности, совместный просмотр в рамках одной сессии), текстовые описания и визуальные характеристики товаров или баннеров напрямую сопоставимы. Это позволяет Яндексу рекомендовать релевантные элементы, основываясь на визуальной схожести или поведенческой близости.

2012 EEAT и качество Google Shopping SERP Патенты Google

Как Google ранжирует и продает платный контент в поиске, используя цену, отзывы, уникальность и историю споров

Анализ патента Google, описывающего инфраструктуру для интеграции платного контента (For-Pay Content) в поисковую выдачу. Система предлагает использовать отдельные алгоритмы ранжирования для платного контента, учитывающие цену, уникальность, отзывы пользователей и историю споров/возвратов. Также описан автоматизированный механизм управления репутацией и разрешения споров.

2017 Интент пользователя Патенты Яндекс Поведенческие факторы Поисковые подсказки

Как Яндекс использует совокупный вес ресурса для показа обогащенных ответов (Rich Suggest) в поисковых подсказках

Яндекс патентует механизм выбора обогащенного ответа (Rich Suggest) в поисковых подсказках. Система агрегирует вероятность перехода на конкретный ресурс по всем релевантным подсказкам, связанным с вводимым префиксом. Если совокупный вес (Cumulative Resource Weight) одного ресурса доминирует, Яндекс показывает его контент (карточку объекта) прямо в выпадающем списке еще до отправки запроса.

2007 EEAT и качество Индексация Патенты Google Семантика и интент

Как Google использует контекст органической выдачи для диверсификации и ранжирования рекламы

Google использует механизм для повышения релевантности и разнообразия рекламных объявлений при неоднозначных запросах. Система анализирует контексты (темы) в результатах органического поиска и использует их как эталон. Затем она корректирует ранжирование рекламы так, чтобы оно лучше соответствовало распределению тем в органической выдаче, обеспечивая диверсификацию.

2024 Асессоры Краудсорсинг Обучение моделей Патенты Яндекс

Как Яндекс использует «Метрику Согласованности» для повышения качества данных от асессоров и обучения алгоритмов поиска

Яндекс патентует метод повышения точности обучающих данных, получаемых через краудсорсинг (например, Толока). Система рассчитывает «Метрику Согласованности» — вероятность того, что большинство асессоров дали правильный ответ, учитывая их персональные показатели качества. Для будущих задач система формирует группы асессоров так, чтобы максимизировать эту метрику, итеративно исключая тех, кто не согласен с большинством. Это обеспечивает высокое качество Ground Truth для обучения ключевых алгоритмов поиска.

2021 SERP Патенты Яндекс Ранжирование Семантический поиск

Как Яндекс использует схожесть между результатами поиска (D2D Similarity) как фактор ранжирования и для выявления аутлаеров

Яндекс патентует метод, который вводит контекст самой поисковой выдачи как фактор ранжирования. Система рассчитывает векторную близость (D2D proximity) между документами, попавшими в топ. Измеряется, насколько документ похож на «средний» документ выдачи (Reference Vector) или на самый релевантный результат. Эти значения используются как признаки ранжирования, позволяя идентифицировать аутлаеров (outliers) и дополнять недостающие данные о документах.

2008 Knowledge Graph Патенты Google Персонализация Семантика и интент

Как Google позволяет пользователям изменять, персонализировать и совместно улучшать категории результатов поиска

Google патентует систему организации результатов поиска в иерархию категорий (фасетную навигацию). Пользователи могут модифицировать эту иерархию: добавлять/удалять категории, голосовать за их полезность и связывать страницы с темами. Система сохраняет эти изменения для персонализации будущих результатов пользователя и агрегирует обратную связь для глобального улучшения категоризации.

2022 Обучение моделей Патенты Яндекс Рекомендательные системы Холодный старт Яндекс Дзен

Как Яндекс решает проблему «холодного старта» в рекомендательных системах, предсказывая поведенческие сигналы по тексту контента

Яндекс использует Transfer Learning для решения проблемы «холодного старта» в рекомендательных системах (например, Дзен). Когда у нового контента мало взаимодействий, система не может применить коллаборативную фильтрацию. Патент описывает, как Яндекс обучает модель предсказывать коллаборативные эмбеддинги (поведенческие векторные представления), используя только текст статьи. Это позволяет рекомендовать новый контент так, как если бы у него уже была богатая история взаимодействий.

2021 Патенты Яндекс Ранжирование Семантический поиск Холодный старт

Как Яндекс использует семантическую близость между результатами поиска для улучшения ранжирования и переноса факторов

Яндекс патентует метод улучшения ранжирования, который анализирует, насколько семантически похожи друг на друга документы, уже отобранные в качестве кандидатов. Система вычисляет «базисный вектор» (смысловой центр выдачи) и использует близость каждого документа к этому центру как дополнительный фактор ранжирования. Также метод позволяет переносить признаки (факторы ранжирования) с одного документа на другой, если они семантически очень близки.

2022 Local SEO Антикачество Антиспам Патенты Яндекс Яндекс Карты

Как Яндекс использует графовый анализ для выявления скоординированных накруток рейтингов организаций

Яндекс патентует систему для борьбы с накруткой отзывов. Система строит граф связей между организациями на основе общих рецензентов. Если группа организаций тесно связана (образует «клику») и распределение их оценок аномально (например, только максимальные баллы), система идентифицирует это как скоординированную атаку, удаляет фейковые отзывы и помечает аккаунты нарушителей.

2011 Патенты Google Семантика и интент

Как Google использует категории бизнеса и историю рекламы для расширения таргетинга в локальном поиске

Анализ патента Google, описывающего систему таргетинга рекламы для локальных запросов. Когда пользователь ищет конкретный локальный бизнес, система определяет его категории на основе исторических данных, включая предыдущие рекламные кампании. Эти категории используются как дополнительные ключевые слова для показа релевантной локальной рекламы, которая также ранжируется по расстоянию.

2020 Антикачество Патенты Яндекс Рекомендательные системы Яндекс Дзен

Как Яндекс сравнивает популярность контента внутри рекомендательной системы и в Вебе для борьбы с кликбейтом

Яндекс патентует механизм для повышения качества рекомендаций (например, в Дзен) путем выявления и пессимизации кликбейта. Система сравнивает популярность источника контента внутри рекомендательной платформы с его популярностью в интернете в целом. Если контент аномально популярен внутри системы, но малоизвестен в Вебе, он признается потенциальным кликбейтом, и его рейтинг агрессивно понижается.