Семантика и интент

Google решает проблему «холодного старта» для новых страниц, у которых нет собственных поведенческих данных. Система агрегирует историю кликов на уровне Сущностей (Entities). Если сущности, упомянутые на новой странице, исторически имеют …
Google анализирует цепочки запросов пользователей в рамках поисковых сессий. Если пользователь начинает с общего или неточного запроса и уточняет его до тех пор, пока не найдет конкретный авторитетный ресурс, система …
Google использует механизм для автоматического создания страниц о сущностях (например, о фильмах или персонажах). Система определяет, какие категории (свойства) сущности наиболее интересны пользователям, сравнивая данные из Knowledge Graph с данными …
Google использует систему для динамической интеграции результатов поиска по картинкам в основную веб-выдачу. Система анализирует намерение пользователя (Image Intent Score) и качество доступных изображений (Quality Scores). На основе этих данных …
Google использует механизм для определения семантического расстояния между запросами (Generalized Edit Distance). Вместо подсчета изменений символов система анализирует исторические логи, чтобы понять, как пользователи переформулируют запросы. На основе этих данных …
Google идентифицирует запросы, которые исторически показывают высокую эффективность (на основе CTR и Long Clicks), и генерирует синтетические запросы из структурированных данных (заголовков, анкоров). Когда пользователь вводит запрос, система находит похожий …
Google патентует систему Retrieval-Augmented Generation (RAG) для повышения точности ответов LLM на локальные запросы. Специализированная «Research Model» извлекает актуальные фактические (адреса, часы работы) и субъективные (отзывы, рейтинги) данные из структурированных …
Патент описывает механизм генерации рекомендаций контента на основе того, что пользователь просматривает в данный момент, без ввода поискового запроса. Система анализирует текущий контент, находит связанные ресурсы и ранжирует их, основываясь …
Google улучшает ранжирование, особенно для редких или новых запросов, используя поведенческие данные (клики) из семантически или сессионно связанных запросов. Если данных по исходному запросу недостаточно, система «заимствует» сигналы о кликах …
Google анализирует, как пользователи уточняют свои запросы, и строит «Граф Запросов». Этот граф используется двумя способами: 1) Для повышения ранжирования документов (особенно по заголовкам), которые точно соответствуют популярным кластерам запросов, …
Google анализирует историю посещений и действий пользователя в интернете, чтобы выявить незавершенные задачи (например, покупку товара или планирование поездки). Система использует графы вероятностных переходов для моделирования пути пользователя, прогнозирует его …
Google использует систему для автоматического извлечения структурированных данных (заголовков и связанных элементов) с целевой страницы. Эти данные организуются в "Навигационные фильтры" — концептуально параллельные списки (например, "Бренды: Canon, Nikon, Sony"). …
Google использует механизм для корректировки показателей популярности документов (например, кликов). Система определяет «широту» (Query Breadth) запроса. Клики, полученные по широким, общим запросам, считаются менее значимыми индикаторами популярности, чем клики по …
Google оценивает качество сайта не по общему CTR, а по тому, в ответ на какие запросы он получает клики. Система сегментирует пользовательский фидбек (клики, CTR) по различным параметрам запроса (например, …
Google анализирует сессии пользователей для выявления ресурсов, которые часто посещаются последовательно (co-selected). Система строит граф этих связей и распространяет известные тематики (Contextual Profile) авторитетных ресурсов на связанные с ними страницы. …
Google использует статистический анализ для обнаружения спама и переоптимизации. Система определяет ожидаемое количество связанных концепций (фраз) в типичном документе. Если документ содержит неестественно большое количество связанных фраз по сравнению с …
Google анализирует логи запросов, чтобы понять, как пользователи переформулируют свои запросы в рамках одной сессии. Система выявляет слова, которые пользователи заменяют друг на друга в одинаковых контекстах, и валидирует их, …
Патент описывает систему Google для верификации того, что нативное мобильное приложение и соответствующая веб-страница отображают идентичный контент (Consistent Content). Система сравнивает контент, используя N-gram анализ, сопоставление сущностей и сравнение признаков. …
Google использует механизм иерархического скоринга для ранжирования сущностей (например, брендов или исполнителей) в вертикальных поисках (non-WWW corpus). Популярность родительской сущности рассчитывается на основе агрегированной популярности дочерних (например, товаров или треков). …
Google использует механизм для классификации веб-страниц, основанный на анализе исторических поисковых логов. Система "распространяет" тематическую классификацию с известных сайтов на неизвестные через анализ запросов, по которым они совместно ранжируются, и …