Google использует масштабируемую распределенную систему для анализа огромных графов, таких как Веб-граф (триллионы связей). Система вычисляет кратчайшие пути от каждого узла (сайта) до набора предопределенных авторитетных источников («Seeds»). Эти расстояния …
Патенты Google
Разборы патентов поисковой системы Google
Google использует внешние «офлайн-сигналы» для ранжирования документов с плохой ссылочной структурой (книги, журналы). К ним относятся: попадание в списки бестселлеров (с учетом локации пользователя), данные о тиражах, общие продажи издателя …
Google использует систему для оценки и ранжирования онлайн-сообществ (например, форумов или групп в социальных сетях). Система анализирует, кто участвует в сообществе (их репутацию и экспертизу), как они взаимодействуют (качество и …
Google использует этот механизм для интеграции контента из нативных приложений в веб-поиск. Если приложение установлено у пользователя и система определяет высокую релевантность его контента запросу, в выдачу добавляется специальный элемент …
Google использует систему для понимания локальных запросов, которые явно не указывают категорию места (например, «где поесть рис с бобами?»). Система анализирует тексты веб-страниц и отзывы, чтобы связать фразы (N-граммы) с …
Google анализирует историю поиска пользователя, клики по ссылкам и взаимодействие с контентом (время просмотра, скроллинг) для создания многофакторного профиля интересов. Этот профиль (включающий термины, категории и предпочитаемые сайты) используется для …
Google патентует систему проактивного поиска для "второго экрана". Анализируя исторические данные, система определяет, что пользователи ищут во время просмотра контента (фильма, матча). Когда новый пользователь смотрит этот контент, система распознает …
Google использует систему, которая определяет визуальное значение текстового запроса, анализируя объекты на картинках, которые пользователи выбирали ранее по этому или похожим запросам. Система создает набор «меток контента» (визуальный профиль) для …
Google использует механизм для понимания контента без текста (изображения, видео), анализируя, какие другие (текстовые) страницы пользователи посещают в рамках той же сессии. Ключевые слова с этих текстовых страниц заимствуются и …
Google использует систему для идентификации оригинального контента путем фиксации времени первого появления фрагментов текста (Content Pieces) в индексе. Система отслеживает, как быстро и широко этот контент копируется другими авторами (Copy …
Google анализирует активность пользователя (поиск, email, карты, календарь) для построения персонального графа интересов (User Attribute Graph). Система классифицирует эти интересы как краткосрочные (например, планирование отпуска) или долгосрочные (например, хобби). При …
Google использует архитектуру, которая одновременно применяет множество стратегий (расширение, уточнение, синтаксис, анализ сессий) для генерации альтернативных запросов. Система оценивает качество этих вариантов с помощью показателей уверенности, основанных на поведении пользователей …
Фундаментальный патент Google (с приоритетом от 2001 года), описывающий интеграцию статистики использования в ранжирование. Система рассчитывает Usage Score на основе частоты посещений (Visit Frequency), количества уникальных пользователей (Unique Users) и …
Google использует этот механизм для динамической адаптации алгоритма ранжирования к специфике конкретного запроса. Система анализирует, какие факторы оказали наибольшее влияние на формирование первичной выдачи по сравнению с историческими данными. Если …
Google применяет медицинский подход "дифференциальной диагностики" к поисковым подсказкам. Когда пользователь вводит симптом, система предлагает уточняющие запросы (например, "кашель с мокротой"), чтобы исключить возможные заболевания. Если пользователь игнорирует подсказку, система …
Google анализирует поведение пользователей в поиске по картинкам, чтобы определить связь между изображениями. Если пользователи часто кликают на изображение А и изображение Б в рамках одной сессии поиска и в …
Google использует систему машинного обучения для создания модели ранжирования, которая предсказывает вероятность клика пользователя по документу. Модель обучается на огромных массивах данных о прошлых поисках (запросы, документы, клики). Система учитывает …
Google анализирует коммуникации пользователя (email, сообщения) для выявления планируемых событий (встречи, поездки). Система присваивает событию динамический уровень достоверности, который обновляется по мере поступления новых данных (ответы в переписке, поисковые запросы …
Google использует интерактивные уточнения (метки или фильтры) на странице результатов поиска для определения намерения пользователя. Когда пользователь взаимодействует с уточнением, Google объединяет исходный запрос с новым тематическим контекстом метки. Это …
Google использует «гибридные запросы» (например, «тема + бренд» или «тема + автор») для выявления авторитетных источников и экспертов. Анализируя логи запросов и клики пользователей, система создает ассоциации между темами и …