Семантика и интент

Google анализирует визуальное содержимое изображений, которые пользователи чаще всего выбирают в ответ на определенный запрос. На основе этого анализа (наличие лиц, текста, графиков, доминирующих цветов) система определяет категорию запроса (например, …
Google анализирует контент веб-страницы или приложения, активного на устройстве пользователя, для понимания неоднозначных или диалоговых запросов (например, «когда он родился?»). Система идентифицирует сущности (людей, места, объекты) в активном контенте и …
Google использует технологию анализа контента на экране устройства (включая видимую и прокручиваемую области, а также историю взаимодействий) для прогнозирования следующего шага пользователя. Система идентифицирует и ранжирует сущности на странице по …
Google анализирует соседние слова в поисковом запросе для выявления иерархических отношений (например, «Город, Страна» или «Род, Вид»), используя данные таксономии. Система генерирует различные интерпретации запроса, оценивает их на основе шаблонов …
Google использует метод машинного обучения для автоматического понимания и маркировки контента, такого как изображения, видео или текст. Система анализирует обучающий набор данных, выделяет схожие признаки (кластеры) и определяет, какие комбинации …
Патент описывает систему локального поиска, которая ранжирует результаты не только по расстоянию (Spatial Relevance), но и по социальной значимости (Social Relevance) и релевантности виду деятельности (Activity Relevance). Система анализирует отзывы …
Google использует механизм для разрешения географической неоднозначности. Если фраза может означать как местоположение, так и нечто иное (например, «Orange»), система анализирует сопутствующие слова в запросе (Location Factor), местоположение пользователя (Origin …
Анализ патента Google, описывающего фундаментальные технологии распознавания контента внутри изображений. Система обнаруживает и идентифицирует людей (используя комбинацию лиц, одежды, времени и местоположения), текст (OCR) и другие объекты. Эта информация индексируется, …
Google использует этот механизм для помощи пользователям в изучении тем, связанных с их исходным запросом. Когда пользователь ищет коллекцию сущностей (например, «Романтические фильмы»), система анализирует связи этих сущностей в Knowledge …
Патент Google описывает систему коррекции запросов для сложных случаев: редких запросов (long-tail), сложных опечаток и путаницы между сущностями. Если система подозревает неточность термина, она генерирует производные запросы, удаляя или заменяя …
Google использует этот механизм для оптимизации своей базы данных путем объединения дублирующихся тематических кластеров документов. Система анализирует метки (labels), присвоенные разным кластерам. Если метки семантически схожи, кластеры объединяются. При этом …
Google использует аддитивную модель для разрешения неоднозначности сущностей (например, «Ягуар» — машина или животное). Вместо перемножения вероятностей контекстных признаков, система усредняет их «голоса» (support scores). Это предотвращает ошибки из-за коррелирующих …
Google использует этот механизм для классификации запросов и выбора формата прямого ответа. Система анализирует, присутствуют ли сущности, извлеченные из результатов поиска, в тексте самого запроса. Если найдена новая сущность (которой …
Google патентует систему для автоматической категоризации видеоканалов и плейлистов. Система определяет тематику канала, анализируя не только метаданные, но и то, какие видео пользователи смотрят чаще всего и сколько времени проводят …
Анализ фундаментального патента Xerox PARC, описывающего методы Information Retrieval. Патент раскрывает, как различные типы данных (текст, изображения, ссылки, поведение пользователей) преобразуются в векторы для мультимодальной кластеризации. Описаны концепции анализа пользователей …
Google использует механизм для генерации расширенных поисковых подсказок (Expanded Query Suggestions), особенно в географическом поиске. Система идентифицирует сущности, соответствующие введенному префиксу, а затем обходит граф связанных сущностей (Entity Graph), чтобы …
Google использует систему для динамического выбора thumbnail для видео в результатах поиска. Система анализирует запрос пользователя и содержание каждого кадра видео, преобразуя их в числовые векторы в общем семантическом пространстве. …
Google использует иерархическую систему правил для выбора единственной «геолокации запроса» из множества доступных сигналов. Система анализирует физическое местоположение пользователя, локации в тексте запроса, историю поиска и настройки профиля. Затем она …
Google использует систему для извлечения фактов (дат, имен, концепций) и связанных с ними фрагментов предложений из веб-документов. Эти пары индексируются отдельно. В ответ на запрос система находит релевантные факты, ранжирует …
Анализ фундаментального патента (изначально Xerox), описывающего, как системы Information Retrieval преобразуют различные характеристики документов (текст, URL, ссылки, изображения) и поведение пользователей в векторные представления. Это позволяет численно определять сходство, комбинируя …