Яндекс патентует механизм динамического уточнения поисковой выдачи в реальном времени. Система отслеживает гранулярные взаимодействия пользователя (выделение текста, скорость прокрутки, остановки) с конкретными элементами (словами, фразами) внутри сниппетов. На основе агрегированного интереса к этим элементам по всей странице, система автоматически переформулирует исходный запрос и обновляет SERP, чтобы лучше соответствовать уточненному интенту пользователя.
Автор: Виктор Репин
Google использует специализированные AI-модели для разбивки сложных запросов (задач) на подзадачи. Система отслеживает, с какими подзадачами взаимодействует пользователь, и динамически обновляет выдачу, подгружая больше релевантного контента для этой подзадачи прямо во время скроллинга страницы. Это позволяет уточнять интент пользователя в реальном времени.
Яндекс патентует механизм радикального изменения вида поисковой выдачи. Если система определяет высокую уверенность в том, что запрос пользователя лучше всего отвечает результатам из конкретного вертикального поиска (например, Картинки, Видео, Карты, Погода), она может полностью скрыть стандартные органические результаты и показать исключительно результаты этой вертикали.
Google патентует механизм, позволяющий пользователям взаимодействовать с конкретным результатом поиска через интерфейс чата (prompt input interface) прямо на странице выдачи. Искусственный интеллект анализирует запрос пользователя и его последующий промпт, определяет намерение (поиск информации, действие или навигация) и предоставляет глубинные ссылки (deep links) на конкретные внутренние страницы этого же домена в виде conversational response.
Google использует поведенческие данные сообщества пользователей для определения тематической связи между сайтами. Если пользователи часто посещают Сайт А и Сайт Б в течение короткого промежутка времени (Co-Visitation), система создает «Вектор повышения» (Boost Vector). Этот вектор используется для повышения в выдаче тематически связанных сайтов, основываясь на истории посещений пользователя или контексте текущего сайта, улучшая персонализацию и релевантность.
Google использует систему для автоматической идентификации связанных версий контента (например, переводов). Система анализирует ссылки между страницами и ищет «индикаторы связи» (названия языков в анкорах или флаги). Обнаруженная связь затем верифицируется с помощью машинного перевода и сравнения контента, а также анализа частоты обновлений. Это позволяет Google показывать пользователю наиболее подходящую языковую или региональную версию в поиске.
Google использует итеративный алгоритм для обеспечения разнообразия в результатах поиска и рекомендациях. Система выбирает первый результат с наивысшей релевантностью, а затем штрафует оставшиеся результаты, если они слишком похожи на уже выбранные. Схожесть может определяться через контент или поведенческие данные (Covisitation). Цель — максимизировать вероятность того, что хотя бы один результат в выдаче заинтересует пользователя.
Яндекс использует алгоритмы машинного обучения (включая DSSM) для глубокой персонализации Яндекс Карт. Система анализирует действия пользователя во всей экосистеме Яндекса (Поиск, Такси, Еда, Музыка и т.д.) и создает вектор его интересов. Организации (POI) также векторизуются по их признакам. На карте приоритетно показываются те организации, чьи векторы наиболее близки к вектору интересов пользователя, при этом количество объектов ограничивается в зависимости от масштаба карты.
Google определяет, когда показывать блок с ответом (Answer Box) или вертикальную интеграцию (погода, акции и т.д.), анализируя не только текст запроса, но и состав органической выдачи. Если в результатах присутствуют специфические авторитетные URL или ключевые слова (называемые «индикаторами блока ответов»), система с большей вероятностью покажет соответствующий блок. Эти индикаторы определяются заранее путем анализа того, какие сайты часто появляются по ключевым «исходным запросам» для данной темы.
Яндекс использует сложный статистический метод для A/B тестирования изменений на SERP (например, новых алгоритмов ранжирования или дизайна). Вместо сравнения средних значений поведенческих метрик (таких как Dwell Time), система анализирует сдвиги в их распределениях. Это позволяет с высокой чувствительностью обнаруживать даже незначительные изменения в том, как пользователи взаимодействуют с выдачей, и определять, являются ли эти изменения положительными или отрицательными.
Патент Google, описывающий трехэтапный алгоритм для идентификации «выдающихся личностей» (экспертов) в темах, интересующих пользователя. Система анализирует контент, социальные взаимодействия между экспертами (кто на кого ссылается) и расширяет охват на связанные темы, чтобы сформировать рейтинг авторитетности.
Google использует механизм для уточнения ранжирования, анализируя ссылочные связи исключительно между документами, уже попавшими в топ выдачи по конкретному запросу. Система рассчитывает оценку локальной авторитетности (LocalScore), повышая документы, на которые ссылаются другие релевантные результаты. При этом применяются строгие фильтры для учета разнообразия хостов и нейтрализации манипуляций.
Яндекс патентует метод для рекомендательных систем (например, Дзен), который решает проблему смешивания разных поведенческих сигналов. Вместо использования одной модели для анализа всех взаимодействий (клики, время чтения, лайки), система применяет отдельные, независимые модели для каждого типа сигнала. Это позволяет точнее оценить как привлекательность контента (по кликам), так и его ценность (по времени взаимодействия), а затем объединить эти оценки для финального ранжирования.
Яндекс патентует метод учета визуального представления элементов на SERP (размер сниппета, позиция, расстояние от топа) при обучении ранжирования. Система корректирует оценку полезности элемента, учитывая, как его размер мог повлиять на клик. Если большой элемент пропускают в пользу маленького, он получает сильный штраф. Это позволяет бороться с Presentation Bias и точнее определять истинную релевантность.
Google использует механизм для расчета оценок качества документов (Ranking Scores), который учитывает аффилированность между ссылающимися источниками. Если несколько ссылок исходят от сайтов, контролируемых одной организацией (например, PBN), система учитывает только максимальный вклад от этой группы, а не сумму всех вкладов. Это предотвращает искусственное завышение рейтинга через ссылочные схемы.
Google анализирует исторические данные о том, как пользователи ищут конкретный факт. Если они часто используют естественный язык (например, «какая высота у Эйфелевой башни»), система считает, что пользователи действительно ищут этот факт. На основе этого рассчитывается «Оценка поиска фактов» (Fact-Seeking Score). Эта оценка используется как сигнал ранжирования, чтобы решить, нужно ли показывать прямой ответ (Factual Answer) и насколько высоко его разместить в результатах поиска.
Яндекс патентует метод для оценки и продвижения специализированного (нишевого) контента в рекомендательных системах (например, Дзен). Система идентифицирует «ядро аудитории» (подписчиков канала) и принудительно показывает им новый контент. Реакция этой лояльной группы используется для прогнозирования релевантности контента для широкой аудитории, позволяя преодолеть нехватку данных для ранжирования.
Google индексирует структурированные данные (Action Data), описывающие функциональность ресурса (например, бронирование, покупка, воспроизведение медиа). Если запрос пользователя подразумевает намерение совершить действие, Google рассчитывает Action Score, отдавая предпочтение ресурсам, которые позволяют выполнить это действие с наименьшим количеством шагов, и повышает их в выдаче.
Google использует модель машинного обучения для определения того, какой тип контента (Новости, Картинки, Товары, Веб-страницы) пользователь хочет видеть в ответ на запрос. Модель анализирует запрос, контекст пользователя и исторические данные о кликах, чтобы рассчитать «оценку желания» для каждого репозитория. На основе этих оценок система решает, какие вертикали искать, какие результаты показывать и насколько заметно их размещать на странице выдачи.
Google использует систему анализа затрат и выгод, чтобы решить, стоит ли генерировать данные временных рядов (графики, исторические данные) в выдаче. Система оценивает вычислительные затраты (нагрузка на сервер, задержка) и сравнивает их с ожидаемой выгодой (точность данных, вовлеченность пользователя на основе анализа кликов). Блок генерируется, только если выгода превышает затраты.