Автор: Виктор Репин

Google использует механизм персонализации ранжирования, основанный на стадии развития пользователя в социальной сети («Maturity Score»). Система определяет, насколько пользователь «зрелый» (например, по количеству связей и времени в сети), и использует предопределенные правила («Utility Scores») для повышения контента, полезного на данном этапе (например, «добавить друзей» для новичков, «просмотр контента» для опытных пользователей).

Яндекс патентует механизм обогащения SERP интерактивными компонентами. Система проверяет результаты поиска по специальному Реестру, который связывает веб-ресурсы с доступными действиями (например, купить, забронировать). Если найдено соответствие, в сниппет встраивается кнопка или виджет, позволяющий совершить это действие прямо на странице поиска через специальную Платформу операций.

Патент Google описывает механизм интерфейса, позволяющий пользователям строить запросы пошагово (слово за словом). Вместо немедленного поиска, выбор подсказки добавляет ее к запросу и генерирует новый набор подсказок для уточнения интента. Это облегчает создание длинных, специфичных запросов, особенно на мобильных устройствах.

Яндекс использует трехуровневую систему машинного обучения для оптимизации позиций вертикальных результатов (колдунщиков) в SERP. Отдельные модели независимо предсказывают вероятность клика по колдунщику («Win») и по следующему за ним результату («Loss»). Третья модель использует эти предсказания для расчета «Параметра Полезности» (Usefulness Parameter) и находит позицию в выдаче, где этот параметр максимален.

Яндекс патентует антифрод-механизм, нацеленный на потенциально мошеннические коммерческие ресурсы. Система намеренно повышает, а затем понижает позиции сайта в выдаче в разные промежутки времени, используя случайные значения. Цель — создать резкие колебания трафика, чтобы демотивировать операторов мошеннических схем, делая их деятельность нестабильной.

Яндекс патентует метод борьбы с мошенничеством путем манипулирования ранжированием подозрительных коммерческих сайтов. Система периодически повышает и понижает эти сайты в выдаче, используя случайные значения. Цель — создать сильные колебания трафика (Gap in user traffic), чтобы демотивировать владельцев продолжать мошеннические схемы, делая их невыгодными.

Яндекс использует систему для временного повышения и понижения позиций определенных сайтов (часто коммерческих, не являющихся высококачественными или высокотрафиковыми). Цель — создать максимальную разницу в трафике между этими периодами. Это позволяет системе собрать чистые данные о поведении пользователей и качестве ресурса для обучения алгоритмов Anti-Quality и выявления мошенничества.

Google формирует поисковые подсказки (Autocomplete), комбинируя два источника данных: запросы, которые пользователь вводил ранее (персональная история), и запросы, популярные среди сообщества пользователей. Система ранжирует эти подсказки, учитывая частоту и новизну персональных запросов, и визуально выделяет персональные подсказки от общих.

Яндекс использует машинное обучение для оптимизации очереди сканирования. Система прогнозирует будущую долгосрочную популярность новой страницы и скорость угасания этой популярности, анализируя исторические данные похожих URL-структур (паттернов). На основе этого рассчитывается «Выгода от сканирования». Страницы с высокой ожидаемой популярностью и быстрым угасанием интереса (например, новости) сканируются в первую очередь, пока они актуальны.

Google использует механизм для долгосрочного отслеживания поведения пользователей. Система присваивает пользователю уникальный идентификатор, позволяя распознавать его на разных устройствах и в разных браузерах, даже после истечения срока действия cookie. История действий и предпочтений хранится централизованно и используется для таргетинга контента на основе долгосрочного профиля интересов.

Яндекс патентует систему динамического формирования карточки объекта (Object Card) на SERP. Система определяет интент пользователя и, в зависимости от него, меняет порядок информационных блоков (например, фильмография выше биографии) или выбирает, какие блоки включать. Также описаны механизмы интерактивных фильтров интента и добавления ссылок на лучшие веб-результаты (Best-Matching Result) внутрь карточки.

Этот патент описывает ключевые механизмы алгоритма CatBoost, ядра машинного обучения Яндекса. Он раскрывает, как система эффективно преобразует категориальные (нечисловые) факторы ранжирования, такие как регион, тип сайта или URL, в числовые значения. Для этого используются упорядоченные статистические данные и методы динамического комбинирования признаков, что позволяет алгоритму ранжирования учитывать эти факторы точно и без переобучения.

Яндекс использует гибридный подход для ускорения систем рекомендаций. Система заранее (офлайн) рассчитывает набор общепопулярного или высококачественного контента. В момент запроса пользователя (онлайн) она быстро находит персонализированные рекомендации на основе его истории и объединяет их с заранее подготовленным набором. Это позволяет быстро предоставлять релевантные рекомендации.

Яндекс патентует механизм динамического расширения сниппетов на странице результатов поиска (SERP). По клику пользователя стандартный сниппет (First informational snippet) дополняется интерактивным блоком (Second informational snippet), например, видеоплеером или картой. Это позволяет пользователю взаимодействовать с контентом, не покидая SERP, используя данные из вертикалей Яндекса или API сайта.

Google использует гибридную языковую модель для повышения точности распознавания речи (ASR). Система запоминает наиболее частые полные запросы и их точную вероятность на основе истории поиска (Компонент 1). Для редких или новых запросов используется традиционная N-граммная модель (Компонент 2). Это позволяет точнее интерпретировать голосовой ввод, отдавая предпочтение статистически вероятным фразам.

Яндекс патентует систему для обработки запросов об объектах (сущностях), имеющих несколько аспектов (например, актер, режиссер). Система определяет интент пользователя и динамически формирует карточку объекта: выбирает, какие блоки информации показать и в каком порядке. Выдача включает интерактивные фильтры (вкладки), позволяющие пользователю уточнить интент и мгновенно перестроить SERP без перезагрузки. Также описан механизм встраивания ссылки на лучший результат из органического поиска прямо в блок карточки объекта.

Google разделяет результаты поиска товаров на группы в зависимости от источника данных. Информация, полученная напрямую от продавцов через фиды (Vendor Feeds), считается более достоверной. Информация, автоматически извлеченная (Extracted) с веб-страниц, считается менее надежной. Эти группы визуально разделяются на странице выдачи (например, в Google Shopping), чтобы указать пользователю на разницу в надежности данных.

Яндекс патентует метод автоматического создания тезауруса путем анализа контекста, в котором встречаются слова и фразы в больших массивах текста. Система определяет семантические связи (синонимы, антонимы, гиперонимы) на основе схожести их окружения и частоты совместного употребления в предложениях. Созданный тезаурус используется для модификации и расширения поисковых запросов.

Яндекс патентует механизм для борьбы с кликбейтом и нежелательным контентом в рекомендательных системах. Система использует два алгоритма: первый (MLA 1) определяет персональную релевантность на основе интересов пользователя. Второй (MLA 2), независимый от пользователя, оценивает качество и соответствие контента политикам сервиса, формируя «понижающий балл» (Demoting Score). Финальный ранг определяется комбинацией этих оценок, что позволяет понижать контент, нарушающий правила, даже если он популярен у пользователей.

Google анализирует корреляцию между всплесками поисковой активности и трансляцией медиаконтента (ТВ, радио). Если во время первой трансляции наблюдается резкий рост запросов по теме передачи, система запоминает эту связь. Во время повторной трансляции пользователи, вводящие те же запросы, идентифицируются как зрители и могут получать таргетированный контент или рекламу, связанную с передачей.