Семантика и интент

Google использует систему канонизации запросов для преобразования неструктурированных или неграмотных поисковых фраз в "хорошо сформированные" (well-formed) вопросы. Система использует модель классификации для определения необходимости перезаписи и модель Sequence-to-Sequence для генерации …
Google использует систему для автоматического определения экспертности авторов (Identities) в конкретных темах (Topics). Система анализирует корпус документов, оценивая, насколько сильно автор связан с документом (Identity Score) и насколько документ релевантен …
Патент Google описывает инфраструктуру для улучшения поисковых подсказок (Autocomplete). Когда пользователь вводит текст, система одновременно опрашивает несколько специализированных поисковых сервисов (например, веб-поиск, вертикальный поиск или сервис прямых URL). Полученные результаты …
Патент Google описывает механизм определения наиболее значимых тем («Top Phrases») для веб-сайта, основанный на анализе семантически связанных фраз в контенте. Он также детализирует, как система может позволить администраторам сайтов вручную …
Google использует статистический анализ контекстов (соседних слов) для определения вероятности того, что слово в запросе является опечаткой или неправильно использованным омофоном. Система сравнивает частоту использования исходного слова и потенциального исправления …
Патент Google описывает систему извлечения фактов (Subject, Attribute, Object) из неструктурированного текста для пополнения Базы Знаний. Система генерирует паттерны на основе синтаксического разбора (dependency parses) и оценивает их надежность с …
Google использует систему, позволяющую владельцам тематических (вертикальных) сайтов программно управлять поведением поисковой системы с помощью «Файлов Контекста». Эти файлы содержат инструкции по модификации запроса, выбору коллекций документов для поиска, фильтрации …
Анализ патента Google, описывающего метод идентификации «именованных сущностей» (людей, тем, фраз) путем мониторинга действий пользователя, таких как электронная почта, просмотр веб-страниц и набор текста. Система использует эти сущности для проактивного …
Google использует механизм адаптации интерфейса в вертикальном поиске (например, Google Books или Shopping). Если система уверена, что результат №1 значительно релевантнее №2, он отображается заметно крупнее. Патент детализирует факторы оценки …
Google использует обученные NLP-модели (Sequence Tagging Models, например, BERT) для автоматического анализа статей с проверкой фактов. Система идентифицирует ключевые элементы — проверяемое утверждение (Claim), автора утверждения (Claimant) и вердикт (Veracity) …
Google анализирует последовательность запросов пользователя в рамках одной поисковой сессии. Если пользователь повторяет начало предыдущего запроса и добавляет новые слова (уточнения), система снижает вес этих новых слов. Это позволяет сохранить …
Google анализирует, как пользователи печатают на виртуальных клавиатурах (место касания, продолжительность, давление), и объединяет эти данные с глобальной популярностью потенциальных поисковых запросов. Система может отменить первоначальные предложения автозамены, если немного …
Патент Google описывает фреймворк, позволяющий третьим сторонам загружать «поисковые приложения» (данные, код и триггеры запросов) непосредственно в инфраструктуру Google. Если запрос пользователя совпадает с триггером, приложение выполняется в изолированной среде …
Google оптимизирует процесс распознавания фраз (N-грамм) в запросе, анализируя предыдущий запрос пользователя в той же сессии. Если пользователь уточняет запрос, добавляя новые слова, система исключает эти новые слова из анализа …
Google использует алгоритм для определения схожести документов, который превосходит традиционный TF-IDF. Система вычисляет Оценку Значимости (Prominence Score) и Оценку Описательности (Descriptiveness Score) для отдельных слов и фраз. Учитывается, где именно …
Google использует систему для анализа контента, который пользователь просматривает в данный момент (веб-страница, приложение). Система генерирует потенциальные поисковые запросы на основе этого контента, оценивает их качество (популярность, качество результатов, визуальное …
Google использует комплексный подход к визуальному поиску. Система строит персональный Граф Визуальных Интересов пользователя для персонализации выдачи и проактивных рекомендаций. Она анализирует композицию кадра и контекст (например, окружающий текст), чтобы …
Google анализирует историю поиска, чтобы классифицировать пользователей по категориям интересов (например, «автолюбитель» или «меломан»). Система хранит данные о популярности запросов внутри каждой категории. При вводе первых букв подсказки (Autocomplete) ранжируются …
Google использует масштабируемую систему для организации результатов поиска (таких как приложения или товары) в логические группы (кластеры). Система генерирует множество вариантов кластеризации для запроса, а затем использует краудсорсинговых работников для …
Google анализирует логи поисковых сессий, чтобы понять, как пользователи уточняют свои запросы. Система вычисляет, какие термины чаще всего встречаются в этих уточнениях (Term Occurrence Score) и насколько популярен сам путь …