Патент Google описывает систему ранжирования, которая идентифицирует группы сайтов под общим контролем (аффилированные узлы или PBN). Система резко снижает вес ссылок внутри такой группы и ограничивает общее влияние группы на …
2011
Google анализирует поведение пользователей на выдаче, создавая "Профили Взаимодействия". Система учитывает продолжительность кликов (Short/Long Clicks), их последовательность (Single/Multiple Clicks, Pogo-sticking) и уточнение запросов. Эти данные используются для оценки удовлетворенности пользователей, …
Google анализирует статистику взаимодействий (кликов) для групп связанных бизнес-листингов (Common Business). Система вычисляет статистически нормальный уровень активности и устанавливает порог (Anomaly Detection Threshold). Резкий всплеск активности выше этого порога (например, …
Google использует систему для динамической интеграции результатов поиска по картинкам в основную веб-выдачу. Система анализирует намерение пользователя (Image Intent Score) и качество доступных изображений (Quality Scores). На основе этих данных …
Система ранжирования для поиска по блогам, которая комбинирует релевантность запросу (Relevance Score) с независимой оценкой качества (Quality Score). Эта оценка качества вычисляется на основе индикаторов, специфичных для блогов: паттерны частоты …
Google анализирует вовлеченность пользователей (полезность), сравнивая фактическую удовлетворенность (Good Utilization Events) с ожидаемой вовлеченностью для данной позиции ранжирования. На основе этого рассчитывается Correction Factor для повышения документов, превосходящих ожидания, и …
Google использует алгоритм для идентификации наиболее важных страниц сайта (Primary Resources), которые затем отображаются как Sitelinks в поисковой выдаче. Система строит иерархическую модель сайта на основе структуры URL (а не …
Google использует механизм для понимания контента без текста (изображения, видео), анализируя, какие другие (текстовые) страницы пользователи посещают в рамках той же сессии. Ключевые слова с этих текстовых страниц заимствуются и …
Анализ патента Google, описывающего систему автоматического дополнения метаданных для видео. Система строит граф сходства, используя как анализ аудиовизуального контента, так и поведенческие сигналы (co-play counts – совместные просмотры). Этот граф …
Google отказывается от фиксированных идентификаторов сущностей. Вместо этого сущность (например, бизнес) определяется как «Кластер неизменяемых Наблюдений». Система собирает данные из разных источников и использует «Контекст» (например, NAP) для сопоставления новых …
Анализ патента Google, описывающего систему классификации видео (например, на YouTube). Для решения проблемы нехватки размеченных данных система анализирует поведение пользователей: какие видео смотрят последовательно (Co-Watch). На основе этих данных строятся …
Google рассчитывает метрику "Word-Score" для оценки значимости слова в запросе. Метрика основана на сравнении historical CTR контента, найденного по ключевым словам, включающим это слово (Keep-Count), и CTR контента, найденного по …
Google использует модель машинного обучения для прогнозирования текущих интересов пользователя на основе истории поиска. Эта модель объединяет несколько методов прогнозирования: анализ того, как недавно были отправлены запросы (на основе времени), …
Google использует механизм для улучшения поисковых подсказок (Autocomplete). Система определяет запросы, которые имеют идентичную каноническую форму (тот же базовый интент после нормализации), но структурно отличаются от вводимого текста. Среди этих …
Google использует анализ «избыточных запросов» (тем, которые ищут в регионе значительно чаще, чем в среднем по стране) для определения поведенческой схожести географических локаций, независимо от расстояния. Это позволяет Google переносить …
Google использует систему для автоматического извлечения пар Вопрос-Ответ из веб-документов, форумов и логов чатов. Система создает два репозитория: один для точных совпадений вопросов, другой для ключевых слов. Это позволяет предоставлять …
Google анализирует, на какие категории результатов пользователи кликали чаще всего в прошлом (CTR) по неоднозначному запросу (например, "Pool"). Система определяет доминирующие интенты, выявляя резкие перепады в CTR между категориями или …
Google использует распределенную сеть агентов (браузеры, тулбары, скрипты на сайтах) для сбора детальной навигационной статистики и данных о поведении пользователей после перехода из поиска. Ключевым показателем является частота «завершения поисковой …
Google агрегирует отчеты об ошибках доступа (например, из браузеров), когда пользователи не могут подключиться к сайту. Анализируя частоту и географию этих сбоев, система определяет, работает ли сайт или нет. Эта …
Google использует автоматизированный анализ геолоцированных изображений (например, Street View) для валидации локальных бизнес-листингов. Система классифицирует окружающую среду и сравнивает ее с заявленной категорией бизнеса. Если категория несовместима с визуальным контекстом …