Google может повышать в ранжировании места (рестораны, магазины), которые посещал сам пользователь или его контакты из социального графа. Система учитывает данные о физическом присутствии, давность посещения и силу социальной связи, чтобы персонализировать результаты локального поиска.
Автор: Виктор Репин
Google использует систему для определения «меры ассоциации» между различными документами (статьями, веб-страницами, письмами). Ассоциация рассчитывается на основе того, насколько близко по времени пользователь взаимодействовал с этими документами, насколько похож их контент и совпадают ли метаданные (например, автор). Эти связи используются для понимания пути пользователя и персонализации последующих результатов поиска.
Google анализирует последовательность запросов пользователя в рамках одной поисковой сессии. Если пользователь повторяет начало предыдущего запроса и добавляет новые слова (уточнения), система снижает вес этих новых слов. Это позволяет сохранить фокус на изначальном интенте и рассматривать добавленные термины как второстепенные уточнения, а не как изменение основного направления поиска.
Патент Google, описывающий инфраструктуру для перехвата, фильтрации, консолидации и хранения истории поисковых запросов и их результатов. Система детально фиксирует контекстную информацию, включая то, какие результаты просмотрел пользователь, когда и как часто. Эти данные формируют основу для анализа поведения пользователей и обучения систем ранжирования.
Google использует социальный граф пользователя для идентификации контента, который был одобрен (Endorsed) его контактами (например, через ссылки в блогах, репосты, отзывы). Система аннотирует эти результаты в выдаче, указывая, кто и где одобрил контент. Приоритет показа и влияние на ранжирование определяются метрикой близости (Affinity) между пользователем и его контактом.
Google использует модульную систему для динамической генерации Панелей Знаний. Система определяет сущность в запросе, находит релевантные единицы контента из разных источников и ранжирует их по популярности (Rank Score), основанной на истории поисковых запросов. Затем система выбирает UI-модули (Knowledge Modules) для отображения этого контента и определяет их порядок, учитывая предпочтительные форматы и строгие ограничения на компоновку панели.
Google улучшает геолокацию пользователей, анализируя «повторяющиеся запросы» (Recurrent Queries) — запросы, популярность которых резко возрастает в конкретных регионах в определенное время (например, локальные праздники или события). Когда пользователь вводит такой запрос в соответствующий период, система с высокой уверенностью определяет его местоположение, даже если другие сигналы (IP, GPS) неоднозначны.
Google анализирует, как пользователи печатают на виртуальных клавиатурах (место касания, продолжительность, давление), и объединяет эти данные с глобальной популярностью потенциальных поисковых запросов. Система может отменить первоначальные предложения автозамены, если немного менее вероятное написание соответствует гораздо более популярному поисковому запросу, активно направляя пользователя к каноническим запросам.
Яндекс патентует систему для приоритизации проверки сайтов на вредоносный контент. Система рассчитывает «Оценку надежности» на основе ранга в поиске и поведенческих факторов. Ключевой механизм: сайт наследует надежность по принципу «слабого звена», получая наименьшую оценку среди всех ссылающихся на него ресурсов. Сайты с наименьшей итоговой надежностью проверяются в первую очередь.
Google повышает точность определения местоположения, агрегируя исторические «высококачественные посещения» от множества устройств для создания «облака точек» (Point Cloud) для каждого бизнеса. Это позволяет системе точнее определять, какое именно место посещает пользователь, даже при неточном GPS-сигнале или в плотной городской застройке.
Google использует методы анализа визуального представления страницы для выявления скрытого контента. Система строит структурное представление документа (DOM) и анализирует свойства элементов (цвет, размер, позиция, Z-index), чтобы определить, виден ли контент пользователю. Это позволяет обнаруживать и игнорировать манипуляции (спам), такие как текст цветом фона или позиционирование за пределами экрана.
Google использует статистическую модель, обученную на поведении пользователей (Session Features) после клика по результату. Анализируя такие сигналы, как время пребывания, последующие клики и запросы, система прогнозирует удовлетворенность пользователя. Хотя патент описывает систему рекламы, методология оценки качества через пост-клик сигналы критически важна для понимания органического ранжирования.
Google патентует новый тип интерфейса для «нелинейного браузинга». Вместо списка ссылок пользователь перемещается по массиву карточек (tiles) в разных направлениях (вверх/вниз, влево/вправо). Каждое направление представляет собой отдельное тематическое путешествие (например, «похожие темы», «больше от этого автора», «противоположное мнение»). Система автоматически генерирует скрытые поисковые запросы на основе текущего документа, чтобы определить, какой контент показать следующим в каждом направлении.
Google использует поведенческие сигналы для определения похожих видео на платформах типа YouTube. Система анализирует, какие видео пользователи смотрят одно за другим в течение короткого времени (ко-просмотры). Если пользователи положительно взаимодействуют (например, долго смотрят) с Видео А и сразу после этого с Видео Б, система считает их связанными. Финальный список рекомендаций ранжируется с учетом временной близости просмотров и общего времени просмотра (Total Watch Time).
Google использует систему для сбора сигналов одобрения продуктов (лайки, +1, репосты) из социальных сетей, сайтов производителей и ритейлеров. Эти данные агрегируются в единый «Рейтинг Одобрения» (Endorsement Rating или Likeness Factor) для каждого товара. Этот рейтинг используется для фильтрации и ранжирования результатов в товарном поиске, анализа трендов и показа релевантной рекламы.
Система прогнозирует «сетевой эффект» контента — его способность генерировать каскад последующих взаимодействий (репосты, комментарии) в онлайн-сервисах (например, Google Discover, YouTube). При расчете используется граф причинно-следственных связей и дисконтирующий фактор для снижения веса удаленных реакций. Цель — максимизировать общее вовлечение на платформе, отдавая приоритет виральному контенту.
Google идентифицирует результаты поиска, в которых система максимально уверена («очень релевантные»). Для этого анализируется комбинация факторов: доминирующий показатель кликабельности (CTR) относительно конкурентов, высокая позиция в ранжировании и значительный отрыв по оценке релевантности. Такие результаты выделяются визуальными индикаторами (например, миниатюрами или логотипами), чтобы пользователь быстрее нашел нужный ответ.
Патент Google описывает фреймворк, позволяющий третьим сторонам загружать «поисковые приложения» (данные, код и триггеры запросов) непосредственно в инфраструктуру Google. Если запрос пользователя совпадает с триггером, приложение выполняется в изолированной среде (sandbox) на серверах Google и генерирует готовый форматированный ответ, который встраивается в SERP без задержек на обращение к стороннему серверу.
Google анализирует поведение пользователей внутри поисковых сессий. Если пользователь быстро переходит от запроса с низким CTR (низкоэффективный) к запросу с высоким CTR (высокоэффективный), система связывает их как относящиеся к одному интенту. В дальнейшем, при получении низкоэффективного запроса, Google использует связанный высокоэффективный запрос для поиска и подмешивания более релевантного контента.
Google повышает эффективность поиска, заранее вычисляя и кэшируя улучшенные (переписанные) версии для часто встречающихся запросов. Это позволяет системе мгновенно использовать лучшую формулировку запроса, не тратя время на ее генерацию в реальном времени. Система также умеет распознавать и переписывать отдельные компоненты (фрагменты) внутри более длинных запросов, используя валидацию на основе поведения пользователей.