2008

Google решает проблему «холодного старта» для новых документов или специализированных поисковых вертикалей (например, Google Покупки, Книги). Если у системы недостаточно поведенческих данных (клики, время просмотра) для оценки контента в вертикальном …
Google использует запатентованную систему для генерации информативных сниппетов для сущностей, о которых оставляют отзывы (например, рестораны, товары). Система извлекает фразы, выражающие мнение (sentiment phrases), из множества отзывов, оценивает их тональность …
Google использует механизм определения связанности контента (например, рекомендованных видео на YouTube или статей в Discover) на основе анализа сессий пользователей. Система отслеживает последовательные позитивные взаимодействия с разными единицами контента в …
Google анализирует исторические данные о том, какие запросы приводили к кликам по конкретному изображению. Эти запросы используются как автоматические метки (labels) для индексации и как предлагаемые альтернативные запросы при взаимодействии …
Патент Google описывает систему ранжирования поставщиков услуг и продавцов (рекламодателей). Система оценивает поставщиков не только по релевантности запросу, но и по метрикам производительности: скорости ответа на заявку, уровню удовлетворенности клиентов …
Google использует этот механизм для анализа логов поисковых запросов и автоматического поиска часто задаваемых вопросов. Система группирует разные варианты одного и того же вопроса в «каноническую форму» путем нормализации текста. …
Google может использовать явное действие пользователя по копированию дизайна (темы) веб-страницы как сильный сигнал интереса к контенту сайта. Ключевые слова из этого контента добавляются в "персональный индекс" пользователя, который затем …
Google анализирует последовательность запросов пользователя в рамках одной поисковой сессии. Если пользователь повторяет начало предыдущего запроса и добавляет новые слова (уточнения), система снижает вес этих новых слов. Это позволяет сохранить …
Google использует поведенческие сигналы для определения похожих видео на платформах типа YouTube. Система анализирует, какие видео пользователи смотрят одно за другим в течение короткого времени (ко-просмотры). Если пользователи положительно взаимодействуют …
Google оптимизирует процесс распознавания фраз (N-грамм) в запросе, анализируя предыдущий запрос пользователя в той же сессии. Если пользователь уточняет запрос, добавляя новые слова, система исключает эти новые слова из анализа …
Google использует алгоритм для определения схожести документов, который превосходит традиционный TF-IDF. Система вычисляет Оценку Значимости (Prominence Score) и Оценку Описательности (Descriptiveness Score) для отдельных слов и фраз. Учитывается, где именно …
Google анализирует историю поиска, чтобы классифицировать пользователей по категориям интересов (например, «автолюбитель» или «меломан»). Система хранит данные о популярности запросов внутри каждой категории. При вводе первых букв подсказки (Autocomplete) ранжируются …
Google использует технологию для автоматического определения оглавления (TOC) в цифровых документах (книгах, PDF). Система извлекает названия разделов из TOC и сопоставляет их с заголовками в основном тексте, используя машинное обучение, …
Google использует метрику «Proxy Pad Score» для оценки вероятности того, что сайт систематически копирует контент у разных источников. Система анализирует кластеры дубликатов: если документы сайта часто проигрывают по качеству оригиналам …
Система сбора данных о взаимодействии пользователей с отображаемыми документами (на бумаге или экране). Система рассчитывает метрику популярности (Readership Value) на основе этих взаимодействий и явно заявляет о возможности использования этих …
Google использует механизм для оценки качества и авторитетности изображений, даже если на них нет прямых ссылок. Система создает "виртуальные ссылки" между изображениями на основе их визуального сходства, данных о кликах …
Google анализирует поведение сайтов на предмет массовых редиректов на сторонние организации. Сайты, состоящие преимущественно из таких редиректов («Bounce Pads» или Дорвеи), пессимизируются в процессе каноникализации. Это гарантирует, что при наличии …
Google использует систему для автоматического извлечения структурированных данных (пар атрибут-значение) непосредственно из веб-страниц, ранжирующихся в топе выдачи. Система проверяет достоверность фактов с помощью механизмов консенсуса (Thresholding) и усиления (Reinforcement), а …
Анализ патента Google, описывающего систему кросс-языкового поиска (CLIR). Система определяет, стоит ли автоматически переводить запрос пользователя на другой язык для поиска более релевантных результатов. Ключевыми факторами являются наличие в запросе …
Google использует систему для оценки авторов онлайн-контента, рассчитывая показатели репутации (на основе отзывов и известности), подлинности (проверяя личность автора) и авторитетности (на основе подтвержденного опыта, такого как образование, работа и …