Google использует детальный профиль пользователя, основанный на его истории поиска, поведении, предпочтениях и контексте. Этот профиль применяется для автоматической модификации исходного запроса (добавления или замены терминов) и последующего переранжирования результатов, …
2004
Анализ патента, описывающего фундаментальную архитектуру поисковых систем. Система использует модульный подход, где различные факторы (контент, ссылки, структура URL, данные пользователя) оцениваются независимыми модулями. Затем механизм агрегации рангов (Rank Aggregation) объединяет …
Google использует методы для отделения основного содержания страницы от повторяющихся элементов (навигация, футеры, копирайты). Анализируя частоту повторений на сайте, пространственное расположение блоков, окружающий код и цели ссылок, система классифицирует контент …
Google использует итеративный процесс для определения оптимального интервала сканирования (Web Crawl Interval) для каждого документа. Система анализирует историю изменений контента, важность документа (PageRank) и частоту его просмотра пользователями (User View …
Анализ патента Google, описывающего метод идентификации «именованных сущностей» (людей, тем, фраз) путем мониторинга действий пользователя, таких как электронная почта, просмотр веб-страниц и набор текста. Система использует эти сущности для проактивного …
Google использует систему для определения "меры ассоциации" между различными документами (статьями, веб-страницами, письмами). Ассоциация рассчитывается на основе того, насколько близко по времени пользователь взаимодействовал с этими документами, насколько похож их …
Патент Google, описывающий инфраструктуру для перехвата, фильтрации, консолидации и хранения истории поисковых запросов и их результатов. Система детально фиксирует контекстную информацию, включая то, какие результаты просмотрел пользователь, когда и как …
Google повышает эффективность поиска, заранее вычисляя и кэшируя улучшенные (переписанные) версии для часто встречающихся запросов. Это позволяет системе мгновенно использовать лучшую формулировку запроса, не тратя время на ее генерацию в …
Патент Google, описывающий итеративный процесс поиска и инфраструктуру для хранения сжатых документов (Tokenspace Repository). Система анализирует контекст вокруг ключевых слов в предварительных результатах, автоматически расширяет запрос на основе этого контекста …
Google разработал систему, позволяющую использовать изображения с мобильных устройств в качестве поисковых запросов. Система распознает объекты на изображении (продукты, здания, текст, лица), преобразует их в символьное описание (текстовый запрос) и …
Анализ фундаментального патента Google, описывающего систему перехода от поиска по ключевым словам к поиску по концепциям. Система автоматически определяет семантически значимые фразы и вычисляет, насколько одна фраза предсказывает появление другой …
Google использует метод для эффективного обнаружения почти дубликатов документов. Система генерирует компактный цифровой отпечаток (fingerprint) для каждого документа путем выборки перекрывающихся блоков текста (shingling), вычисления контрольных сумм и их сжатия. …
Google использует статистический механизм для определения географической релевантности документов или запросов, содержащих неоднозначные названия мест. Система создает «Профили гео-релевантности» (Geo-relevance Profiles) для терминов на основе их близости к известным адресам …
Google может строить модель интересов пользователя, анализируя семантически значимые фразы и тематические кластеры в контенте, который пользователь потребляет (просматривает, сохраняет, печатает). При последующих запросах система повышает в ранжировании те документы, …
Google использует систему для определения, должен ли запрос активировать локальный поиск или обычный веб-поиск. Система заранее вычисляет, какие названия городов являются «однозначными», анализируя, как часто они упоминаются в вебе вместе …
Google анализирует исторические данные о кликах, чтобы определить, когда название сущности (например, бренда или магазина) в запросе подразумевает поиск только внутри этой сущности. Если намерение пользователя однозначно (высокая концентрация кликов …
Google создает детальные профили интересов пользователей на основе истории поиска, поведения и взаимодействия с контентом. Эти профили используются для персонализации выдачи, в частности, для изменения порядка показа рекламы (Placed Content). …
Google анализирует запросы на наличие названий брендов, новостных источников или других сущностей. Если название уникально (например, «MSNBC»), система может автоматически переписать запрос, чтобы ограничить поиск этой сущностью. Если название является …
Google использует сигналы интереса пользователя (клики, время просмотра) для динамической корректировки весов различных источников данных (например, ключевых слов, тем, типов контента). Система определяет, какие источники наиболее полезны для конкретного пользователя, …
Google использует метод сегментации документов, основанный на визуальном макете после рендеринга, а не только на структуре DOM. Система анализирует визуальные разрывы (white space) на странице для определения иерархической структуры контента. …