Google анализирует, какие запросы в прошлом приводили к кликам на документы, которые сейчас ранжируются по текущему запросу. Эти исторические запросы кластеризуются по смыслу для выявления разных интентов. Лучший запрос из …
Поведенческие сигналы
Google использует агрегированные данные о продолжительности визитов пользователей на сайт для расчета метрики качества этого сайта (Site Quality Score). Система измеряет время взаимодействия (включая Dwell Time — время от клика …
Google использует двухэтапную систему для персонализации ранжирования. Сначала выявляются скрытые категории предпочтений на основе данных всего сообщества. Затем для конкретного пользователя определяется его принадлежность к этим категориям (персонализированные веса смешивания). …
Google анализирует логи поисковых запросов для выявления общих шаблонов (Query Patterns), удаляя при этом приватную информацию. Для каждого шаблона система вычисляет агрегированную статистику поведения пользователей (клики, отказы). Если будущий запрос …
Google разработал систему, позволяющую пользователям удалять нежелательные сайты из своей выдачи. Патент описывает, как эти данные агрегируются от «легитимных пользователей» и используются для расчета «Remove List Score» — глобального сигнала …
Google использует графовую модель для анализа поисковых сессий пользователей. Система определяет, какие уточняющие запросы чаще всего приводят к завершению поиска (становятся «финальным пунктом назначения»). Эти запросы считаются обладающими наибольшей «полезностью» …
Google использует систему для генерации поисковых подсказок (альтернативных запросов), анализируя текущую сессию пользователя. Система создает кандидатов путем замены терминов (Similarity Matrix) или расширения/сокращения исходного запроса (Expansion/Contraction Table). Подсказки ранжируются по …
Google идентифицирует универсальные слова-модификаторы (например, «фото», «отзывы», «pdf»), которые пользователи часто добавляют к разным запросам. Если такое слово появляется в сессии, система определяет скрытый интент пользователя. Затем Google переранжирует выдачу, …
Google использует систему для обнаружения аномальной сетевой активности (кликового спама) путем создания статистических моделей ожидаемого поведения сетевых объектов (IP-адресов, cookies, запросов). Система анализирует множество параметров и выявляет объекты, чье поведение …
Google использует статистический анализ текстовых корпусов (преимущественно логов запросов), чтобы определить значение многозначного слова в контексте. Система проверяет, какие альтернативные термины пользователи взаимозаменяют в одинаковых фразах. Если два термина часто …
Патент Google, описывающий интеграцию поисковой системы с социальной сетью (Member Network). Система позволяет пользователям одобрять (Endorse) контент. При поиске система идентифицирует одобрения от связанных пользователей (друзей) и, что критически важно, …
Этот патент раскрывает, как Google анализирует анонимизированные данные о местоположении (пешеходный трафик) для понимания физических локаций. Сравнивая фактические посещения с вместимостью заведения и сегментируя визиты по времени и демографии пользователей, …
Google анализирует историю местоположений пользователей для точной идентификации посещаемых бизнесов, даже при неточных данных GPS. Система ранжирует ближайшие локации, учитывая расстояние, известность бизнеса (Prominence Score), его категорию и время суток. …
Google может отслеживать поведение пользователей (например, время пребывания на странице и клики) и связывать его с конкретными сущностями (продуктами, людьми, темами), идентифицированными через структурированные данные, а не только с URL-адресом. …
Патент Google, описывающий метод улучшения ранжирования с помощью анализа "социальных сигналов" (Social Reference Data). Система отслеживает, как часто пользователи делятся контентом (через email, соцсети, блоги, закладки) и сколько раз его …
Патент описывает, как Google анализирует пользовательские аннотации и поведение при просмотре (Traffic Traces) для выявления важных сегментов внутри видео. Система автоматически группирует схожие сигналы, определяет границы популярных сегментов (Annotated Clips) …
Google анализирует, как физическое окружение (погода, время, местоположение) влияет на то, что ищут пользователи. Система выявляет корреляции между средой и поведением пользователей в прошлом (включая длительность кликов), чтобы лучше понять …
Google использует исторические данные о поведении пользователя для определения его интересов. Когда запрос вызывает Панель знаний для сущности, система переоценивает потенциальные факты и сниппеты для включения в панель. Приоритет отдается …
Google патентует систему для рекомендации целых категорий контента (например, "Рецепты барбекю"), а не только отдельных страниц. Система создает "Эмбеддинги Категорий", агрегируя эмбеддинги топовых результатов поиска по названию этой категории. Затем …
Google использует механизм краудсорсинга для повышения точности данных. Система отслеживает, как пользователи исправляют или подтверждают факты (значения атрибутов сущностей), представленные в поиске. Эти исправления, особенно подтвержденные внешними источниками, используются для …