2012

Google использует двухэтапную систему для персонализации ранжирования. Сначала выявляются скрытые категории предпочтений на основе данных всего сообщества. Затем для конкретного пользователя определяется его принадлежность к этим категориям (персонализированные веса смешивания). …
Google анализирует, как физическое окружение (погода, время, местоположение) влияет на то, что ищут пользователи. Система выявляет корреляции между средой и поведением пользователей в прошлом (включая длительность кликов), чтобы лучше понять …
Google использует систему для преодоления ограничений поиска по ключевым словам, особенно для видео, где мало текста. Система определяет вероятность принадлежности запроса к определенной теме (P(T|Q)), а затем находит релевантные результаты …
Патент Google описывает систему генерации Панелей Знаний (Knowledge Panels). Система идентифицирует сущность в запросе, определяет ее тип и использует соответствующий шаблон. Этот шаблон наполняется контентом, агрегированным из множества разных источников. …
Google патентует систему построения "графа интересов" пользователя на основе его личных данных: истории поиска, посещенных сайтов, email, социальных связей и истории местоположений. Этот граф используется для автоматического предсказания интересов и …
Google использует механизм для обучения диалоговых систем (голосовых ассистентов). Система анализирует последующие реплики и действия пользователя (например, повторение вопроса или уточняющий запрос) как обратную связь на предоставленный ответ. Эта связь …
Google использует систему для определения степени связанности между сущностями путем анализа поведения пользователей (co-interaction data) в разных типах медиа (видео, веб-страницы, покупки). Этот механизм агрегирует поведенческие данные для расчета «оценки …
Google оценивает качество страниц и доменов, анализируя, как они конкурируют в поисковой выдаче. Система отслеживает «Победы» (Wins) и «Поражения» (Losses) на основе поведения пользователей: сравнивая время пребывания (Dwell Time) при …
Google анализирует исторические данные о том, как пользователи переформулируют запросы (цепочки запросов), пока не найдут нужный контент. Если многие пользователи начинают с запроса А, переходят к запросу Б и кликают …
Google использует систему для идентификации людей (членов социальной сети), тесно связанных с темой запроса, на основе их активности (посты, взаимодействия, репосты) и квалификации. Система отображает этих людей в специальных блоках …
Механизм защиты пользователей, который перехватывает запрос на загрузку веб-страницы. Если страница идентифицирована как низкокачественная (паркинг домена, ферма контента или ссылочная ферма), система показывает предупреждение и предлагает перейти на альтернативный релевантный …
Патент описывает механизм интеграции экспертов (Authoritative Users) в поисковую выдачу. Когда запрос совпадает с триггерным запросом, система извлекает пул экспертов и их оценки авторитетности. Этот пул фильтруется с использованием оценок, …
Google использует метрику качества сайта («Site Quality Score»), которая рассчитывается как соотношение количества уникальных запросов, явно направленных на сайт (брендовые, навигационные, с оператором site:), к общему количеству уникальных запросов, по …
Патент Google описывает, как система определяет лучший способ отображения результатов поиска (карта, таймлайн, галерея) на основе свойств сущностей в Knowledge Graph. Также раскрывается механизм ранжирования результатов по «модифицирующим концепциям» — …
Google использует метод Latent Collaborative Retrieval (LCR) для персонализации поиска. Система создает векторные представления (эмбеддинги) для текущего запроса пользователя и его долгосрочного профиля (история, предпочтения). Эти векторы приводятся к единой …
Google использует статистическую модель, обученную на исторических данных (например, CTR/CVR), для переоценки релевантности параметров контента (ключевых слов, тем). Система не оценивает параметры изолированно, а анализирует их взаимодействие и совместную встречаемость …
Google использует анализ уточнений запросов (refinements) для определения тематической категории и интента. Система анализирует дополнительные слова (мета-термины), которые пользователи добавляют к исходному запросу. Если разные запросы уточняются схожим образом, система …
Google классифицирует синонимы по степени надежности. Если синоним считается ненадежным или зависящим от контекста (Restricted-Locality Synonym), он вносит вклад в ранжирование, только если находится в документе в непосредственной близости к …
Google улучшает ранжирование в специализированных поисковых вертикалях (например, Музыка, Книги, Товары), где данных для оценки контента недостаточно (Sparse Corpora). Система использует сигналы из основного Веб-поиска (популярность запросов, CTR веб-страниц), чтобы …
Google анализирует, что пользователи искали в прошлом, находясь рядом с определенными типами мест (например, в магазинах электроники или кафе). Когда новый пользователь начинает вводить запрос рядом с похожим местом, система …