Семантика и интент

Анализ патента Google, описывающего метод определения наиболее релевантного географического местоположения для веб-страницы. Система анализирует текст на странице (названия городов, штатов, почтовые индексы) и вычисляет оценку местоположения (Location Score). При расчете …
Google создает персонализированную «Модель пользователя» на основе его личного контента (письма, события, контакты). Эта модель хранит ключевые термины и их контекст. Система использует ее, чтобы понять «неявное намерение» запроса — …
Google использует механизм для улучшения релевантности результатов путем анализа недавней истории поиска пользователя. Если текущий запрос похож на предыдущие, система определяет ключевые контекстные термины, которые часто повторялись в истории (устойчивый …
Google использует систему для анализа конкуренции между видео на основе общих поисковых запросов и времени просмотра. Система выявляет поисковые запросы, которые приводят трафик на конкурирующие (например, производные) видео, и сравнивает …
Google использует этот механизм для улучшения результатов по навигационным (брендовым) запросам. Система определяет официальный сайт и связанный с ним верифицированный профиль в социальной сети. Свежий или популярный контент (посты, изображения) …
Google анализирует контент «интерактивных сессий» (например, видеоинструкций), используя распознавание объектов и речи, чтобы определить, какие инструменты и детали необходимы для конкретных задач. Система также вычисляет «профили надежности» продуктов, определяя, какие …
Google описывает механизм для точной идентификации авторов контента. Система (например, плагин браузера) отслеживает отправку контента через веб-формы (CMS, комментарии), фиксирует личность пользователя и отправленный текст. Затем Google проверяет, появился ли …
Google использует систему для персонализации рекомендаций контента, анализируя характеристики документов (например, через TF-IDF) и создавая динамические профили интересов пользователей. Система обучается на основе поведения: разные типы взаимодействий (просмотр, печать, сохранение) …
Патент Google описывает механизм валидации качества внутренних правил синонимов. Система анализирует логи запросов, чтобы изолировать влияние конкретного синонима на поведение пользователя. Если пользователь кликает на результат, содержащий ТОЛЬКО синоним (а …
Google использует этот метод для анализа больших наборов тегов (таких как ключевые слова или сущности) с целью выявления пересекающихся тематических кластеров («сообществ»). Система строит взвешенный граф на основе частоты совместного …
Патент описывает систему (Agent Rank), позволяющую Google идентифицировать авторов контента с помощью цифровых подписей. Система рассчитывает репутационный балл для каждого автора на основе качества подписанного им контента и ссылок на …
Google анализирует, как часто и когда пользователи вводят разные запросы. Если временные графики (распределения) двух запросов совпадают (одинаковые пики и спады популярности), система считает эти запросы семантически близкими или переводом …
Google анализирует вероятность того, что запрос является запросом информации об акциях, даже если он введен в поле общего поиска. Система сравнивает, как часто термин (тикер) используется в общем контексте (в …
Google анализирует поведение пользователей для оценки правил, которые меняют порядок слов в запросе (Reordering Rules). Если пользователи кликают на результаты с измененным порядком слов, правило считается полезным (Click Count). Если …
Google создает "гибридный документ" для индексации блогов, объединяя информацию из разных источников: контент поста, данные из RSS/Atom фида, контекст всего блога (например, блогролл) и внешние связанные страницы (например, профиль автора). …
Google использует систему для ранжирования сущностей, извлеченных из Knowledge Graph. Система рассчитывает четыре ключевые метрики: связанность, значимость типа, вклад и награды. Затем она применяет весовые коэффициенты, которые адаптируются в зависимости …
Патент Google, описывающий специализированный язык запросов для поиска в «Хранилище фактов» (Fact Repository), основе Knowledge Graph. Система позволяет выполнять точные запросы к полуструктурированным данным (пары Атрибут-Значение), используя специальные операторы для …
Google использует многоэтапный процесс для определения связей между компаниями (сущностями). Система анализирует совместные упоминания (co-occurrence) в новостях и на веб-страницах, оценивая авторитетность источников (включая Pagerank) и контекст. Затем эти связи …
Google использует систему для ответов на вопросы, заданные на естественном языке. Система извлекает предложения-кандидаты из топовых результатов поиска и ранжирует их на основе трех ключевых метрик: авторитетности источника (Web Ranking …
Google использует механизм для улучшения качества результатов при использовании фильтров или поиске в специализированных коллекциях (например, по дате или типу документа). Система анализирует, какие характеристики объединяют лучшие результаты в общей …