Google использует систему для улучшения вертикального поиска (например, вакансий, недвижимости) путем оценки взаимной привлекательности двух разных типов сущностей (например, соискателя и вакансии). Система агрегирует данные из внешних источников для выявления …
2018
Google использует методы коллаборативной фильтрации для персонализации выдачи в вертикальных поисках (Hotels, Flights, Shopping). Система анализирует историю взаимодействий всех пользователей, чтобы создать векторные представления (эмбеддинги) для элементов (отелей, товаров). Затем …
Google использует систему для классификации сайтов по уровню качества и авторитетности в рамках конкретных тематик (Knowledge Domains). Система создает векторные представления (эмбеддинги) сайтов и сравнивает их с эталонными векторами высококачественных …
Google идентифицирует частых посетителей или находящихся поблизости пользователей ("Амбассадоров") локального бизнеса на основе их истории местоположений. Создается канал связи, позволяющий пользователям задавать этим Амбассадорам вопросы о бизнесе (например, наличие товара, …
Google использует систему для анализа составных запросов пользователя (например, «Какая погода в Лондоне и который час в Нью-Йорке?»). Система генерирует варианты разделения запроса на подзапросы и оценивает их качество. Если …
Google анализирует, какие изображения пользователи выбирают (кликают) в ответ на конкретные поисковые запросы в Image Search. Система использует эти поведенческие данные для понимания того, что изображено на картинке, и ассоциирует …
Google использует механизм оценки «Information Gain» для борьбы с избыточностью информации в поиске. Система анализирует контент, который пользователь уже просмотрел в рамках сессии, и рассчитывает, сколько новой информации содержат оставшиеся …
Google использует генеративные нейросетевые модели (Sequence-to-Sequence) для динамического создания вариантов поисковых запросов. Система учитывает контекст и предполагаемую задачу пользователя для генерации уточнений или эквивалентных формулировок. Механизм Actor-Critic (обучение с подкреплением) …
Google использует историю посещений пользователя для персонализации результатов географического поиска. Система идентифицирует знакомые пользователю места (на основе частоты и давности посещений) и повышает их рейтинг в поисковой выдаче. Знакомые места …
Патент Google описывает систему контекстного поиска, которая предлагает результаты на основе текущих действий пользователя (например, просмотра веб-страницы или звонка). Пользователь может выбрать один из исходных критериев поиска (например, сущность на …
Google анализирует историю местоположений пользователя для идентификации «знакомых мест» на основе частоты и давности посещений. Эти данные используются для глубокой персонализации в Google Maps: знакомые места получают повышение (boosting) в …
Google использует анализ личных медиафайлов (фото, видео) для построения профиля интересов пользователя. Объекты, распознанные в этих файлах (часто локально на устройстве), используются для определения релевантных тем с учетом их четкости …
Google анализирует агрегированные данные о том, что пользователи делают после клика по результату поиска или подсказке (например, покупка, сохранение, бронирование). Если определенное действие статистически значимо для конкретного результата, Google добавляет …
Google использует механизм для автоматического и безопасного наполнения ограниченных индексов (например, YouTube Kids). Система анализирует, что ищут пользователи в ограниченном индексе, находит соответствующие темы в основном индексе, а затем рассчитывает …
Анализ технологии Information Retrieval (на примере патента Citrix), которая конвертирует слова и предложения в числовые векторы (эмбеддинги) с помощью глубокого обучения (например, Word2Vec). Система оценивает семантическую близость между вектором запроса …
Google использует двухэтапную систему для генерации временных шкал. Сначала система определяет значимые события, анализируя всплеск публикаций от широкой категории источников (например, всех СМИ) в определенные интервалы времени. Затем для этих …
Google анализирует результаты поиска по новостям и группирует статьи, освещающие одно и то же событие, в кластеры. Затем система извлекает общие ключевые слова из этих кластеров для формирования блока "Связанные …
Патент описывает технику Multiscale Quantization (MSQ), используемую Google для повышения скорости и точности поиска по сходству (векторного поиска). MSQ решает проблему снижения точности стандартных методов сжатия векторов (эмбеддингов), когда векторы …
Патент Google описывает систему поиска похожих изображений, основанную на эмбеддингах. Система проецирует изображения в многомерное пространство признаков, учитывая как визуальное сходство (внешний вид), так и семантическое сходство (контекстный смысл и …
Google сканирует веб-сайты в поисках метаданных, связывающих «цифровые дополнения» (AR-опыт, 3D-модели, действия) с реальными объектами. При визуальном поиске система ранжирует эти дополнения, учитывая не только релевантность и авторитетность источника (Prestige …