Google анализирует набор документов, связанных с целевой страницей (например, другие страницы того же сайта или статьи того же автора). Система вычисляет агрегированную оценку для этого набора, отражающую общую тематическую релевантность …
2003
Google индексирует не только анкорный текст ссылки, но и окружающий ее текст («annotation text») в исходном документе. Эта информация ассоциируется с целевой страницей и используется для ее ранжирования, даже если …
Анализ патента, лежащего в основе Google News. Google оценивает качество новостных источников по оригинальности и скорости реакции на события. Статьи группируются в кластеры (сюжеты), которые ранжируются по свежести и авторитетности. …
Google выявляет поисковый спам, анализируя группы (кластеры) документов, а не только отдельные страницы. Система ищет подозрительные структуры, такие как сети ссылок (плотные двудольные графы), и агрегирует сигналы манипуляции (скрытый текст, …
Система перехватывает результаты поиска и проверяет их по реестру, содержащему пользовательские аннотации, метаданные и социальные связи. Затем результаты переупорядочиваются на основе релевантности, которая частично определяется этими аннотациями и метаданными. Пользователям …
Google улучшает ранжирование, особенно для редких или новых запросов, используя поведенческие данные (клики) из семантически или сессионно связанных запросов. Если данных по исходному запросу недостаточно, система «заимствует» сигналы о кликах …
Google анализирует историю поиска пользователя, клики по ссылкам и взаимодействие с контентом (время просмотра, скроллинг) для создания многофакторного профиля интересов. Этот профиль (включающий термины, категории и предпочитаемые сайты) используется для …
Google использует систему машинного обучения для создания модели ранжирования, которая предсказывает вероятность клика пользователя по документу. Модель обучается на огромных массивах данных о прошлых поисках (запросы, документы, клики). Система учитывает …
Патент Google, описывающий механизм персонализации поиска путем модификации алгоритма PageRank. Система определяет "точку зрения" пользователя (Point-of-View Data) на основе его истории посещений, закладок или указанных категорий. Затем стандартный расчет PageRank …
Google использует механизм для корректировки поисковой выдачи на основе поведения групп пользователей (популяций), к которым принадлежит автор запроса. Система анализирует данные о кликах (clickthrough data) конкретной популяции (например, пользователи из …
Google анализирует, какие запросы в прошлом приводили к кликам на документы, которые сейчас ранжируются по текущему запросу. Эти исторические запросы кластеризуются по смыслу для выявления разных интентов. Лучший запрос из …
Google использует механизм для автоматического определения географической релевантности веб-ресурсов путем анализа местоположения их посетителей (через IP-адреса). Система применяет кластерный анализ к этим данным: если аудитория сконцентрирована в определенных регионах, сайт …
Google анализирует текст на страницах, ссылающихся на целевой документ, извлекая «Web Quotes». Это не только текст абзаца, окружающего ссылку, но и текст из ближайших заголовков. Эти цитаты ранжируются по качеству …
Google патентует систему "вспомогательного браузинга", которая активируется на странице результатов поиска (SERP) при проявлении интереса к ссылке. Система показывает текстовый сниппет и оценку интереса предыдущих пользователей, рассчитанную на основе имплицитных …
Google использует механизм для анализа HTML и не-HTML документов (PDF, Word и т.д.) с целью автоматического обнаружения упоминаний и цитат (статьи, компании, продукты). Система определяет контекстуально релевантный анкорный текст, ищет …
Google динамически определяет предпочитаемую страну пользователя, используя интерфейс поиска (например, google.de) и IP-адрес. Затем система смещает результаты поиска, повышая оценки (Weighting Factor) или позиции (Shifting Factor) контента, связанного с этой …
Google использует механизм для улучшения ранжирования путем анализа взаимодействия пользователя с документами, email и веб-страницами на его устройстве. Система отслеживает детальные действия, такие как скроллинг, движение мыши, копирование, печать и …
Google использует механизм автоматического создания вероятностных словарей для перевода между разными языками и наборами символов. Система анализирует «выровненный текст», в первую очередь анкорные тексты ссылок (Parallel Anchor Text), указывающих на …
Google динамически регулирует минимальный порог эффективности (например, CTR или сигналы вовлеченности). Если релевантность результата определена с низкой степенью уверенности (например, через семантическое расширение запроса), ему необходимо показать более высокую эффективность, …
Google использует систему для автоматического определения канонической формы URL. Система активно тестирует различные комбинации параметров в URL, чтобы определить, какие из них влияют на контент, а какие нет (например, tracking-коды …