2005

Google может собирать и анализировать данные о том, как пользователи взаимодействуют с электронными документами (например, PDF, DOC, HTML). Система отслеживает, какие разделы или страницы просматриваются дольше всего или добавляются в …
Анализ патента Google, описывающего систему сбора явных оценок пользователей (рейтинги, метки, комментарии) для веб-страниц. Эти аннотации используются для глубокой персонализации поиска: они отображаются в выдаче, позволяют фильтровать результаты и напрямую …
Google использует систему для ответов на фактические запросы, извлекая информацию из различных источников и сохраняя ее в структурированном хранилище (Fact Repository). Система выбирает лучший ответ, основываясь на corroboration (подтверждении из …
Патент Google описывает инфраструктуру для сбора и обмена контекстной информацией о пользователе между разными поисковыми системами. Система определяет «постоянные» характеристики пользователя (например, интересы, уровень знаний) во время его взаимодействия с …
Патент Google, описывающий механизм работы динамических поисковых подсказок (Autocomplete/Google Suggest). Система в реальном времени предлагает варианты завершения запроса, комбинируя три источника: локальную историю поиска пользователя, популярные запросы других пользователей (серверные …
Google анализирует, как пользователи взаимодействуют с результатами поиска за пределами клика. Действия, такие как сохранение результата, его совместное использование (sharing), отправка по почте или быстрое удаление из сохраненного, используются как …
Google записывает и анализирует историю действий пользователя: запросы, клики по результатам и рекламе, посещенные страницы. Система группирует связанные действия в сессии, определяет "Предпочитаемые локации" на основе частоты и времени визитов …
Анализ патента Google, описывающего фундаментальную архитектуру поиска, основанную на фразах. Система идентифицирует значимые фразы и их взаимосвязи через Information Gain. Для масштабирования используется разделенный индекс: Primary Index хранит богатые данные …
Google использует систему машинного обучения для оценки качества предлагаемых альтернативных запросов. Система анализирует исторические данные о поведении пользователей, используя «длинные клики» (Long Clicks) как индикатор удовлетворенности. На основе этого анализа …
Google записывает историю поиска, кликов по результатам и рекламе, а также посещенные сайты в централизованную базу данных пользователя. Эта информация используется для модификации поисковой выдачи: повышения позиций ранее посещенных сайтов, …
Google записывает историю поиска и просмотров пользователя для персонализации результатов. Система определяет "предпочтительные сайты" на основе частоты посещений, кликов и времени на сайте, повышая их в выдаче для этого пользователя. …
Google использует многофакторную систему для идентификации хостов (Hostnames) или разделов сайтов (Subtrees), которые являются зеркалами друг друга. Система анализирует взвешенные сигналы, включая IP-адреса, редиректы, структуру ссылок, данные WHOIS и степень …
Google анализирует, на какие темы пользователи массово подписываются в сервисах оповещений (например, Google Alerts) за определенный период времени. Эти трендовые темы (Topical Subjects) затем используются как сигнал для ранжирования: новостные …
Google использует механизм для генерации сниппетов в поисковой выдаче, основанный не только на терминах запроса, но и на профиле интересов пользователя. Система анализирует документ, находит термины, соответствующие интересам пользователя, и …
Google использует систему для агрегации и выбора репрезентативной выборки отзывов о продуктах или компаниях. Система рассчитывает общий рейтинг и адаптирует выборку к нему (показывая смесь мнений при среднем рейтинге). Также …
Патент Google, описывающий механизм поддержания актуальности и релевантности новостной ленты (например, Google News). Система использует явные (удаление, понижение) и неявные (клики) сигналы пользователя для фильтрации контента. Просмотренные или скрытые новости …
Google использует технику Minhashing для эффективной кластеризации пользователей на основе схожести их действий (кликов, просмотров, покупок). Этот масштабируемый метод лежит в основе коллаборативной фильтрации и систем рекомендаций (например, Google Discover), …
Google использует механизм для повышения эффективности сканирования интернета. Для каждого документа создается уникальный отпечаток (fingerprint), например, с помощью Simhash. Если новый документ почти идентичен уже просканированному (их отпечатки отличаются минимально), …
Анализ патента Google, описывающего фундаментальные технологии распознавания контента внутри изображений. Система обнаруживает и идентифицирует людей (используя комбинацию лиц, одежды, времени и местоположения), текст (OCR) и другие объекты. Эта информация индексируется, …
Google сканирует веб на наличие «Scumware» (вредоносное и нежелательное ПО). Патент описывает, как система различает сайты, которые содержат вредоносный код, и сайты, которые на него ссылаются. Обнаружение угрозы может привести …