Google анализирует, какие изображения пользователи выбирают последовательно в рамках одной поисковой сессии и одной выдачи. Если пользователи часто взаимодействуют с неизвестным изображением и изображением с известной тематикой (например, «Спорт» или «Adult») в ответ на один и тот же запрос, система присваивает неизвестному изображению эту же тематику. Этот механизм позволяет точнее классифицировать контент и улучшать фильтрацию выдачи (например, SafeSearch).
Автор: Виктор Репин
Google использует запатентованный метод для ранжирования 3D-моделей путем сравнения их визуальных характеристик с популярными веб-изображениями по тому же запросу. Система анализирует, какие изображения пользователи кликают чаще всего, чтобы понять «идеальный» вид объекта. Затем 3D-модели, которые визуально соответствуют этим популярным изображениям, ранжируются выше, а в качестве превью выбирается наиболее соответствующий ракурс.
Google анализирует физическое местоположение (используя GPS, IP и т.д.) пользователей, которые взаимодействуют с веб-страницей (например, совершают клик и долго ее изучают). Агрегируя эти данные, система определяет географическую релевантность страницы («Центр») и область ее популярности («Дисперсию»), даже если на самой странице нет адреса. Эта информация используется для повышения позиций страницы в поиске для пользователей, находящихся в этой области.
Патент Google, описывающий систему динамического отображения точек интереса (POI) на электронных картах. Система ранжирует POI на основе вероятности взаимодействия с ними (персонализация) и ограничивает их количество на экране (Point of Interest Density Threshold), чтобы избежать перегруженности интерфейса. Данные кэшируются на устройстве для быстрой отрисовки при масштабировании и панорамировании.
Google использует механизм клиентской проверки для обработки Deep Links (ссылок на контент внутри приложений) в результатах поиска. Если на устройстве пользователя не установлено нужное нативное приложение, система автоматически и незаметно подменяет ссылку приложения (App URI) на ссылку эквивалентной веб-страницы (Web URL). Это гарантирует бесшовный доступ к контенту.
Патент Google описывает инфраструктуру для улучшения поисковых подсказок (Autocomplete). Когда пользователь вводит текст, система одновременно опрашивает несколько специализированных поисковых сервисов (например, веб-поиск, вертикальный поиск или сервис прямых URL). Полученные результаты агрегируются и отображаются в отдельных секциях интерфейса, а выбор пользователя направляется строго в соответствующий сервис.
Google использует систему для автоматического определения, выполнил ли пользователь задачу (например, покупку товара или посещение места). Система отслеживает активность пользователя (локацию, email, транзакции) и сравнивает ее с индикаторами, связанными с задачей. Успешное выполнение задачи используется для формирования персонального рейтинга предпочтений сущностей (например, магазинов), что может влиять на будущие поисковые результаты и рекламу для этого пользователя.
Google использует механизм для улучшения ранжирования путем объединения данных о поведении пользователей (клики и время взаимодействия) из разных поисковых систем (например, Веб-поиск и Поиск по Видео). Если в основной системе данных недостаточно, система заимствует данные из другой, применяя весовой коэффициент и фактор сглаживания для контроля смещения и обеспечения релевантности.
Google анализирует историю местоположений пользователя для идентификации «знакомых мест» на основе частоты и давности посещений. Эти данные используются для глубокой персонализации в Google Maps: знакомые места получают повышение (boosting) в ранжировании локального поиска, аннотируются специальными метками и используются как ориентиры при навигации.
Патент Google описывает механизм определения наиболее значимых тем («Top Phrases») для веб-сайта, основанный на анализе семантически связанных фраз в контенте. Он также детализирует, как система может позволить администраторам сайтов вручную корректировать эти темы и интегрировать эту внешнюю информацию обратно в поисковый индекс, обновляя семантические связи.
Анализ патента, описывающего фундаментальную архитектуру поисковых систем. Система использует модульный подход, где различные факторы (контент, ссылки, структура URL, данные пользователя) оцениваются независимыми модулями. Затем механизм агрегации рангов (Rank Aggregation) объединяет эти отдельные оценки в единый финальный рейтинг. Это решает проблему сравнения разнородных сигналов и обеспечивает устойчивость к манипуляциям отдельными факторами.
Система прогнозирует, когда пользователь посетит локацию, используя его текущее местоположение, историю поиска и запросы. Затем она определяет ожидаемые условия (погоду, сезон, время суток) на этот будущий момент и выбирает изображения (например, в Street View или Google Maps), которые наиболее точно соответствуют этим условиям, обеспечивая максимальную визуальную релевантность.
Google использует методы для отделения основного содержания страницы от повторяющихся элементов (навигация, футеры, копирайты). Анализируя частоту повторений на сайте, пространственное расположение блоков, окружающий код и цели ссылок, система классифицирует контент как шаблонный (boilerplate) и исключает его из индексации или значительно понижает его вес.
Google использует систему персонализации, которая анализирует историю поиска пользователя для выявления «предпочитаемых результатов» (User-Preferred Search Results). Ключевыми критериями являются не только минимальное количество кликов, но и продолжительность интереса (time span). Если пользователь часто и долго взаимодействовал с сайтом, система рассчитывает высокую метрику популярности (Popularity Metric) и активно повышает этот сайт в его персональной выдаче.
Google использует итеративный процесс для определения оптимального интервала сканирования (Web Crawl Interval) для каждого документа. Система анализирует историю изменений контента, важность документа (PageRank) и частоту его просмотра пользователями (User View Rate). Цель — минимизировать вероятность показа устаревших данных (Stale Content), сканируя важный и часто обновляемый контент чаще, и экономя ресурсы на статичных страницах. Документы группируются в Тиры (Tiers) по схожим интервалам сканирования.
Google использует статистический анализ контекстов (соседних слов) для определения вероятности того, что слово в запросе является опечаткой или неправильно использованным омофоном. Система сравнивает частоту использования исходного слова и потенциального исправления в рамках одного и того же контекста, используя массивные текстовые корпусы, включая эталонные (хорошо написанные), чтобы решить, нужно ли переписать запрос.
Патент Google описывает систему извлечения фактов (Subject, Attribute, Object) из неструктурированного текста для пополнения Базы Знаний. Система генерирует паттерны на основе синтаксического разбора (dependency parses) и оценивает их надежность с помощью меры семантической когерентности (Coherence Score), используя векторные представления слов (embeddings). Это позволяет точно извлекать даже редко встречающиеся (long-tail) атрибуты.
Google динамически формирует категории для бизнесов, основываясь на том, как пользователи ищут их (используемые ключевые слова и клики) в веб-поиске и голосовом поиске. Эти данные формируют иерархическое понимание типов бизнеса. Эта структура затем используется для повышения точности распознавания названий компаний в голосовых запросах.
Google использует историю запросов маршрутов (Directions Queries) для определения реальной популярности местных бизнесов. Система учитывает, как часто люди ищут маршрут до конкретного места, как далеко они готовы ехать (Historical Travel Distance), а также время суток и день недели. Эти данные о реальном поведении используются как ключевой сигнал для ранжирования в локальном поиске наряду с близостью.
Google использует систему для оптимизации вовлеченности видеоконтента. Система анализирует, как пользователи смотрят видео (когда ставят лайки, делятся, пересматривают или уходят), определяет самые интересные сегменты и рекомендует кадры из этих сегментов в качестве миниатюр (thumbnails). Цель — повысить общее время просмотра (Consumption Rate) и снизить показатель отказов, вызванных кликбейтными изображениями.