Семантика и интент

Патент Google (с приоритетом от 1999 г.), описывающий методы фильтрации результатов поиска на основе их связанности с заданным контекстом (набором URL или категорий). Документ раскрывает фундаментальные методы определения связанности (Relatedness): …
Патент описывает механизм интеграции экспертов (Authoritative Users) в поисковую выдачу. Когда запрос совпадает с триггерным запросом, система извлекает пул экспертов и их оценки авторитетности. Этот пул фильтруется с использованием оценок, …
Анализ патента Google, описывающего систему классификации видео (например, на YouTube). Для решения проблемы нехватки размеченных данных система анализирует поведение пользователей: какие видео смотрят последовательно (Co-Watch). На основе этих данных строятся …
Google анализирует тысячи существующих пар Вопрос-Ответ в интернете, чтобы понять, какие термины чаще всего используются при ответе на конкретный вопрос. На основе этого анализа создается "Вектор Терминов Ответа" (Answer Term …
Google использует механизм для определения того, подразумевает ли запрос (например, «ресторан») поиск локальной информации, даже если местоположение не указано. Система анализирует агрегированное поведение пользователей для расчета «степени неявной локальной релевантности» …
Google генерирует "Связанные запросы" (Related Searches), анализируя, какие еще запросы приводят пользователей к тем же документам, что и исходный запрос. Если Документ X релевантен Запросам A и B, то Запрос …
Google использует механизм для помощи в исследовании тем, связанных с сущностями (люди, места, продукты). Система распознает сущность в запросе, определяет ее ключевые атрибуты (анализируя результаты поиска или Knowledge Graph) и …
Google использует машинное обучение для анализа логов поведения пользователей, чтобы понять, что они ищут после посещения определенного контента. Система создает совместное векторное пространство (joint embedding) для документов и запросов, где …
Google использует механизм обобщения запросов для улучшения ранжирования, особенно когда исторических данных по исходному запросу недостаточно. Система создает варианты запроса (удаляя стоп-слова, используя синонимы, стемминг или частичное совпадение) и агрегирует …
Google использует систему для определения значимости слов в поисковом запросе на основе контекста. Анализируя логи запросов, система выявляет термины, добавление которых статистически не меняет поисковую выдачу. Такие термины считаются малозначимыми …
Google рассчитывает метрику "Word-Score" для оценки значимости слова в запросе. Метрика основана на сравнении historical CTR контента, найденного по ключевым словам, включающим это слово (Keep-Count), и CTR контента, найденного по …
Google использует систему для устранения неоднозначности имен людей. Анализируя исторические данные о том, какие запросы (как включающие имя, так и нет) приводили пользователей на одни и те же ресурсы, система …
Google использует механизм для очистки системы автозаполнения (Autocomplete). Система выявляет популярные подсказки, которые развлекают или интересуют пользователей, но не соответствуют их изначальному намерению. Путем экспериментов с временным скрытием этих подсказок …
Google улучшает поиск по визуальному контенту (картинки, видео), анализируя, как пользователи переформулируют запросы на других языках в рамках одной сессии. Если пользователь ввел запрос на одном языке, а затем его …
Google анализирует результаты поиска на предмет наличия «авторитетных ресурсов» (например, официальных сайтов или страниц Википедии), чтобы определить главную сущность, которой посвящен запрос. Если сущность точно идентифицирована, система извлекает связанные сущности …
Google анализирует массивы поисковых запросов, используя лингвистические шаблоны (например, «население [Города]»), чтобы автоматически определить, какие атрибуты наиболее важны для разных категорий сущностей. Этот механизм позволяет масштабно наполнять Knowledge Graph фактами, …
Google использует модель машинного обучения для прогнозирования текущих интересов пользователя на основе истории поиска. Эта модель объединяет несколько методов прогнозирования: анализ того, как недавно были отправлены запросы (на основе времени), …
Google использует систему для агрегации «контекстных данных» от множества вертикальных сайтов или экспертов по одной теме. Эта система позволяет Google понять истинное намерение пользователя (например, покупка, сравнение или решение проблемы) …
Патент Google, описывающий механизм встраивания структурированных отзывов и рейтингов непосредственно в HTML/XML код документов с помощью специальных тегов (Identifier Tag и Rating Tag). Поисковые роботы извлекают эту информацию, агрегируют ее …
Google использует систему для понимания диалогового поиска. Если пользователь задает последующий неполный запрос (например, «напомни мне за час до этого»), система определяет контекст из предыдущего запроса (например, время рейса). Затем …