Google использует фундаментальную архитектуру для персонализации поиска. Система собирает историю действий пользователя (запросы, клики по результатам и рекламе, просмотренные страницы) с разных устройств и браузеров. Эти фрагментированные данные объединяются в …
Разборы патентов
Google использует механизм диффузии для улучшения ранжирования в поиске по картинкам. Система строит граф визуально похожих изображений и распространяет оценки релевантности, основанные на поведении пользователей (клики, dwell time), по этому …
Google использует систему для определения того, какие сущности (люди, места, объекты) подразумеваются в поисковом запросе. Система анализирует, насколько релевантны топовые документы запросу и насколько центральное место в этих документах занимает …
Фундаментальный патент Google, лежащий в основе AdSense. Он описывает, как Google анализирует контент документа (веб-страницы или видео) для определения его тем. Система использует классические методы Information Retrieval: частоту терминов (концепция …
Google использует систему для автоматического определения, какие URL-параметры влияют на контент страницы (content-relevant), а какие нет (content-irrelevant). URL группируются в кластеры по хосту и пути. Система анализирует статистику прошлых сканирований …
Патент описывает систему для определения семантического контекста текста (веб-страниц, запросов и истории пользователя). Она разделяет информацию на тематические Домены и вычисляет контекстный вектор (Macro-Context) на основе использования уникальной терминологии. Это …
Патент описывает механизм, который Google использует для консолидации фактов, извлеченных из интернета. Система анализирует разрозненные данные (объекты), сравнивает их на предмет сходств (например, общие редкие факты) и конфликтов (например, разные …
Google использует графовую модель Маркова (Markov Model) для кластеризации поисковых подсказок. Система анализирует, какие запросы пользователи вводят в рамках одной сессии (session co-occurrence) и на какие документы они кликают (click-through …
Google использует гибридный подход для генерации рекомендаций контента. Система динамически переключается между внешними данными (например, ТВ-рейтингами) и поведенческими данными (поисковые запросы, клики). Для нового контента приоритет отдается внешним данным и …
Google использует алгоритмы для анализа информации о контенте (например, книгах, фильмах, сериалах) из множества источников. Система создает записи, кластеризует их для выявления серий, определяет канонические названия серий и отдельных произведений, …
Google анализирует логи запросов, чтобы понять, какую информацию пользователи чаще всего ищут о конкретных сущностях (например, «высота» для здания или «альбомы» для музыканта). Система комбинирует данные по конкретной сущности с …
Google использует систему интерактивных подсказок (Autocomplete), которая предлагает как завершение запроса, так и прямые URL-адреса по мере ввода пользователем префикса. Система заранее создает индекс, анализируя популярные сайты и связывая префиксы …
Google анализирует, насколько хорошо веб-страница представляет выбранное изображение («image-centricity»). Если изображение на странице качественное, заметное и удовлетворяет интент пользователя (на основе статических и поведенческих данных), Google направляет трафик из Поиска …
Патент описывает фундаментальный процесс управления данными для идентификации дублирующихся записей об одной и той же сущности. Система использует хеширование для поиска совпадений в полях данных, а затем применяет сложную логику …
Google использует данные о наведении курсора (hovers) на изображения как сигнал вовлеченности. Патент описывает, как эти данные улучшают ранжирование: вес hovers увеличивается для редких запросов с малым количеством кликов. Также …
Google анализирует агрегированные данные о поведении пользователей, чтобы определить, какие документы часто просматриваются в течение короткого времени после показа других документов в результатах поиска. Эта модель используется для расчета «Оценок …
Google использует данные о взаимодействии пользователей с бизнес-листингами в картографических сервисах (запросы адресов, построение маршрутов, клики для звонка) для определения популярности локальных компаний. Эти сигналы агрегируются и взвешиваются по значимости …
Google использует метод для идентификации областей сайта, содержащих временный контент (например, рекламу, погоду, динамические виджеты). Система сравнивает разные версии страниц и анализирует, как часто меняется контент в определенных структурных расположениях …
Google использует иерархический профиль интересов пользователя (Profile Tree), построенный на основе истории поиска и поведения, чтобы определить, какие слова в запросе наиболее важны для конкретного человека. Специфичные интересы (глубокие узлы …
Google улучшает локальное ранжирование, агрегируя поведенческие данные (клики) не только из страны пользователя, но и из «совместимых» стран (соседних, культурно близких) или схожих языков. Система определяет совместимость на основе общих …

