2004

Google использует детальный профиль пользователя, основанный на его истории поиска, поведении, предпочтениях и контексте. Этот профиль применяется для автоматической модификации исходного запроса (добавления или замены терминов) и последующего переранжирования результатов, …
Анализ патента, описывающего фундаментальную архитектуру поисковых систем. Система использует модульный подход, где различные факторы (контент, ссылки, структура URL, данные пользователя) оцениваются независимыми модулями. Затем механизм агрегации рангов (Rank Aggregation) объединяет …
Google использует методы для отделения основного содержания страницы от повторяющихся элементов (навигация, футеры, копирайты). Анализируя частоту повторений на сайте, пространственное расположение блоков, окружающий код и цели ссылок, система классифицирует контент …
Google использует итеративный процесс для определения оптимального интервала сканирования (Web Crawl Interval) для каждого документа. Система анализирует историю изменений контента, важность документа (PageRank) и частоту его просмотра пользователями (User View …
Анализ патента Google, описывающего метод идентификации «именованных сущностей» (людей, тем, фраз) путем мониторинга действий пользователя, таких как электронная почта, просмотр веб-страниц и набор текста. Система использует эти сущности для проактивного …
Google использует систему для определения "меры ассоциации" между различными документами (статьями, веб-страницами, письмами). Ассоциация рассчитывается на основе того, насколько близко по времени пользователь взаимодействовал с этими документами, насколько похож их …
Патент Google, описывающий инфраструктуру для перехвата, фильтрации, консолидации и хранения истории поисковых запросов и их результатов. Система детально фиксирует контекстную информацию, включая то, какие результаты просмотрел пользователь, когда и как …
Google повышает эффективность поиска, заранее вычисляя и кэшируя улучшенные (переписанные) версии для часто встречающихся запросов. Это позволяет системе мгновенно использовать лучшую формулировку запроса, не тратя время на ее генерацию в …
Патент Google, описывающий итеративный процесс поиска и инфраструктуру для хранения сжатых документов (Tokenspace Repository). Система анализирует контекст вокруг ключевых слов в предварительных результатах, автоматически расширяет запрос на основе этого контекста …
Google разработал систему, позволяющую использовать изображения с мобильных устройств в качестве поисковых запросов. Система распознает объекты на изображении (продукты, здания, текст, лица), преобразует их в символьное описание (текстовый запрос) и …
Анализ фундаментального патента Google, описывающего систему перехода от поиска по ключевым словам к поиску по концепциям. Система автоматически определяет семантически значимые фразы и вычисляет, насколько одна фраза предсказывает появление другой …
Google использует метод для эффективного обнаружения почти дубликатов документов. Система генерирует компактный цифровой отпечаток (fingerprint) для каждого документа путем выборки перекрывающихся блоков текста (shingling), вычисления контрольных сумм и их сжатия. …
Google использует статистический механизм для определения географической релевантности документов или запросов, содержащих неоднозначные названия мест. Система создает «Профили гео-релевантности» (Geo-relevance Profiles) для терминов на основе их близости к известным адресам …
Google может строить модель интересов пользователя, анализируя семантически значимые фразы и тематические кластеры в контенте, который пользователь потребляет (просматривает, сохраняет, печатает). При последующих запросах система повышает в ранжировании те документы, …
Google использует систему для определения, должен ли запрос активировать локальный поиск или обычный веб-поиск. Система заранее вычисляет, какие названия городов являются «однозначными», анализируя, как часто они упоминаются в вебе вместе …
Google анализирует исторические данные о кликах, чтобы определить, когда название сущности (например, бренда или магазина) в запросе подразумевает поиск только внутри этой сущности. Если намерение пользователя однозначно (высокая концентрация кликов …
Google создает детальные профили интересов пользователей на основе истории поиска, поведения и взаимодействия с контентом. Эти профили используются для персонализации выдачи, в частности, для изменения порядка показа рекламы (Placed Content). …
Google анализирует запросы на наличие названий брендов, новостных источников или других сущностей. Если название уникально (например, «MSNBC»), система может автоматически переписать запрос, чтобы ограничить поиск этой сущностью. Если название является …
Google использует сигналы интереса пользователя (клики, время просмотра) для динамической корректировки весов различных источников данных (например, ключевых слов, тем, типов контента). Система определяет, какие источники наиболее полезны для конкретного пользователя, …
Google использует метод сегментации документов, основанный на визуальном макете после рендеринга, а не только на структуре DOM. Система анализирует визуальные разрывы (white space) на странице для определения иерархической структуры контента. …