Анализ основополагающего патента Google, описывающего создание детальных профилей пользователей (Term-based, Category-based, Link-based) на основе их интересов, истории поиска, поведения на сайте и демографии. Эти профили используются для переранжирования органических результатов …
2004
Google использует механизм для борьбы с кликбейтными или нерелевантными изображениями в поиске. Система анализирует, как часто пользователи кликают на изображение по множеству несвязанных запросов. Если изображение часто выбирают независимо от …
Google анализирует исторические данные о поисковых запросах и введенных URL. Когда пользователь начинает вводить текст, система быстро находит наиболее вероятные варианты завершения, используя эффективные структуры данных (хеш-таблицы и фингерпринты). Подсказки …
Патент Google описывает систему оценки контента, основанную на делегировании авторитета. Доверенный источник (Primary Authority) передает количественно измеримый авторитет другим экспертам (Contributing Authorities), которые могут делегировать его дальше. Итоговый рейтинг контента …
Анализ патента Google (на основе Search Report A3), описывающего использование исторических данных и данных о трафике для оценки документов. Система анализирует характеристики рекламы на странице: частоту ее обновления, качество рекламодателей …
Google использует масштабную инфраструктуру машинного обучения для понимания семантики. Система анализирует огромные объемы текста (например, поисковые сессии), чтобы автоматически выявить скрытые «концепции» (кластеры связанных слов) и вероятности их взаимодействия. Эта …
Google использует данные о посещаемости и навигации пользователей для расчета популярности документов. Система классифицирует документы и запросы по темам, а затем вычисляет популярность документа внутри каждой конкретной темы (Per-Topic Popularity). …
Патент Google, описывающий три механизма, основанных на анализе поведения пользователей (selection data). Система использует путь навигации пользователя для генерации новых ключевых слов для рекламы, улучшает гео-таргетинг объявлений на основе предпочтений …
Фундаментальный патент Google, описывающий переход от индексирования слов к индексированию концепций (фраз). Система определяет «хорошие фразы» на основе частотности и их способности прогнозировать появление других фраз (Information Gain). Документы индексируются …
Google оптимизирует ресурсы сканирования, используя метрику Важности Страницы (Page Importance Score, например, PageRank). Высоковажные страницы всегда скачиваются заново для обеспечения свежести. Менее важные и стабильные страницы могут быть «переиспользованы» из …
Патент описывает технологию Google Autocomplete (Suggest). Система предсказывает финальный запрос на основе частично введенного текста, используя словари, составленные из популярных запросов сообщества. Предсказания ранжируются по популярности и персонализируются с учетом …
Патент Google, описывающий технологию автодополнения (Autocomplete). Система анализирует вводимые пользователем символы и предлагает варианты завершения запроса, основанные на популярности среди всех пользователей. Одновременно с вариантами запросов система может показывать и …
Анализ патента (IBM), описывающего модификации алгоритмов типа PageRank для более точной оценки качества страниц. Система предлагает методы для ранжирования «висячих узлов» (страниц без исходящих ссылок или несканируемых страниц) и механизмы …
Google может персонализировать поисковую выдачу, изменяя вес анкорного текста ссылок. Вес ссылки зависит не от глобального PageRank ссылающейся страницы, а от ее "персонализированного PageRank", рассчитанного на основе предпочтений пользователя (например, …
Анализ фундаментального патента Google, описывающего переход от индексации слов к индексации концепций (фраз). Система определяет значимые фразы и их семантические связи через статистику совместной встречаемости (Information Gain). Документы ранжируются на …
Google анализирует, как часто и когда пользователи вводят разные запросы. Если временные графики (распределения) двух запросов совпадают (одинаковые пики и спады популярности), система считает эти запросы семантически близкими или переводом …
Патент Google, описывающий методы автоматического создания и проверки контактных данных (телефон, адрес, email) для сущностей (людей, организаций). Система анализирует различные источники, агрегирует разрозненные данные и использует частоту совместного упоминания (co-occurrence) …
Google может анализировать, как документы организованы пользователями (например, в папках, через ярлыки или закладки), и использовать эти организационные структуры для расчета рейтинга документа. Документы, концептуально сгруппированные вместе, передают друг другу …
Патент описывает комплексную систему перехода от индексации слов к индексации фраз. Google определяет статистическую связь между фразами с помощью меры Information Gain. Эти данные используются для автоматической организации поисковой выдачи …
Анализ архитектуры индексирования, которая позволяет поисковым системам повышать свежесть выдачи за счет распараллеливания процессов. Вместо ожидания медленного глобального анализа (расчет PageRank, дубликаты), система строит новый индекс, используя результаты предыдущего цикла. …