Google использует эту систему, чтобы понять, о какой конкретной сущности (например, месте или человеке) идет речь на веб-странице, особенно когда названия неоднозначны. Система анализирует доминирование упоминаний сущности на странице (соотношения), …
2009
Google собирает комментарии, отзывы и посты в блогах, относящиеся к определенной веб-странице. Система использует сложные алгоритмы для определения основной темы упоминаний (особенно если в них несколько ссылок) и ранжирует эти …
Google использует географические сигналы ссылающихся сайтов для определения локальной релевантности целевого домена. Система анализирует контент, технические данные и, что важно, географию аудитории ссылающихся ресурсов, чтобы вычислить «Link Based Locale Score». …
Google использует модель Марковских цепей (Transition Matrix) для количественной оценки силы взаимосвязей между поисковыми сущностями (запросы, документы, сессии, время) на основе истории поиска. Эта инфраструктура применяется для выявления и нейтрализации …
Патент описывает модификацию алгоритма PageRank. Вместо предположения, что все ссылки на странице имеют равную вероятность клика (модель случайного серфера), система измеряет реальное поведение пользователей. Вес ссылки определяется фактической частотой ее …
Google использует гибридный подход для классификации контента в детальные иерархические категории. Система анализирует, какие запросы (N-граммы) приводят пользователей к кликам на контент из определенных категорий. Эти запросы становятся «подтверждающими» (Supporters) …
Google анализирует цепочки запросов пользователей в рамках поисковых сессий. Если пользователь начинает с общего или неточного запроса и уточняет его до тех пор, пока не найдет конкретный авторитетный ресурс, система …
Google идентифицирует запросы, которые исторически показывают высокую эффективность (на основе CTR и Long Clicks), и генерирует синтетические запросы из структурированных данных (заголовков, анкоров). Когда пользователь вводит запрос, система находит похожий …
Google анализирует сессии пользователей для выявления ресурсов, которые часто посещаются последовательно (co-selected). Система строит граф этих связей и распространяет известные тематики (Contextual Profile) авторитетных ресурсов на связанные с ними страницы. …
Google использует механизм для классификации веб-страниц, основанный на анализе исторических поисковых логов. Система "распространяет" тематическую классификацию с известных сайтов на неизвестные через анализ запросов, по которым они совместно ранжируются, и …
Google генерирует "Связанные запросы", анализируя данные о предпочтениях пользователей (клики, dwell time). Система ищет запросы, которые одновременно связаны с исходным запросом через общие качественные результаты (Quality Score) и привносят новизну …
Google использует масштабируемую распределенную систему для анализа огромных графов, таких как Веб-граф (триллионы связей). Система вычисляет кратчайшие пути от каждого узла (сайта) до набора предопределенных авторитетных источников («Seeds»). Эти расстояния …
Google использует механизм для уточнения ранжирования изображений путем перекрестной проверки поведенческих сигналов (например, кликов) и данных о визуальном сходстве. Если изображение часто выбирается пользователями И визуально похоже на другие релевантные …
Google анализирует недавнюю активность пользователя (запросы и клики в рамках сессии), чтобы определить его краткосрочный тематический интерес. Система сравнивает, как другие пользователи с таким же интересом взаимодействовали с результатами по …
Google улучшает поиск по визуальному контенту (картинки, видео), анализируя, как пользователи переформулируют запросы на других языках в рамках одной сессии. Если пользователь ввел запрос на одном языке, а затем его …
Google использует поведенческие данные для определения семантической связи между запросами и изображениями. Если пользователи часто кликают на одни и те же изображения в ответ на два разных запроса (даже на …
Google анализирует, какие изображения пользователи выбирают совместно в ответ на один и тот же запрос (co-click data) и что они ищут сразу после просмотра изображения (subsequent queries). На основе этих …
Google использует двухкомпонентную систему для ранжирования пользовательского контента (UGC) и комментариев. Сначала вычисляется объективная оценка качества, независимая от пользователя (учитывая репутацию автора, грамматику, свежесть). Затем, если пользователь идентифицирован, вычисляется субъективная …
Google собирает и анализирует историю исправлений, которые пользователи вносят в фактические данные (например, характеристики продуктов или биографические данные). Система классифицирует эти исправления по типу (например, было ли исправление подтверждено ссылкой …
Патент описывает гибридную систему Google для генерации синонимов, комбинирующую статистический анализ логов запросов и лингвистический анализ. Ключевая особенность — механизм повышенного доверия к лексическим вариантам (например, словам с общим корнем, …