Google автоматически анализирует набор результатов поиска, чтобы предложить пользователю способы сузить выдачу (фасеты). Система ранжирует эти предложения, основываясь на том, насколько равномерно они разделяют результаты (селективность), а также на исторических …
Разборы патентов
Google использует гибкий фреймворк для сбора, нормализации и ранжирования вспомогательной информации (аннотаций) из разнообразных источников (отзывы, редакционные статьи, списки Топ-X). Система использует машинное обучение, чтобы определить, какая аннотация наиболее полезна …
Google использует анализ личных медиафайлов (фото, видео) для построения профиля интересов пользователя. Объекты, распознанные в этих файлах (часто локально на устройстве), используются для определения релевантных тем с учетом их четкости …
Патент Google, раскрывающий механизм ранжирования видеорекламы (Promoted Video Programs). Система рассчитывает Quality Factor (QF) видео, учитывая релевантность контента (CF), детальные метрики вовлеченности зрителей (PWF), а также физические характеристики ролика, такие …
Google использует систему для идентификации основного контента веб-страницы путем ее разделения на логические разделы на основе визуального макета. Система оценивает характеристики каждого раздела (соотношение ссылок к тексту, количество слов, изображения, …
Google использует систему анализа слоев пользовательского интерфейса для точного определения, какие элементы контента реально видны пользователю, а какие скрыты перекрывающими элементами (меню, уведомлениями). Это позволяет отфильтровывать ложные сигналы вовлеченности (клики, …
Google борется со спамом в локальной выдаче (например, в Google Maps), группируя ранее отклоненные фейковые бизнес-профили в кластеры на основе общих признаков (телефон, адрес, IP-адрес отправителя). Новые заявки или обновления …
Google анализирует контент (новости, блоги, социальные сети) для выявления упоминаний событий, привязанных к конкретному времени. Система извлекает ключевые фразы (N-граммы) и определяет точное время события. Если пользователь вводит запрос, связанный …
Google использует систему для извлечения сущностей (Instances), их характеристик (Attributes) и конкретных данных (Values) из разрозненных и неструктурированных веб-документов. Эта система агрегирует информацию, оценивает ее достоверность (Confidence) и представляет пользователю …
Google анализирует, на какие темы пользователи массово подписываются в сервисах оповещений (например, Google Alerts) за определенный период времени. Эти трендовые темы (Topical Subjects) затем используются как сигнал для ранжирования: новостные …
Google использует механизм для проактивного предложения пользователю его прошлых поисковых запросов и результатов, на которые он кликал, основываясь на его текущем физическом местоположении. Система анализирует историю поиска, определяет связанные с …
Система Google для автоматического понимания характеристик географических областей (например, «дорогой район», «центр индийской кухни»). Система анализирует распределение бизнес-листингов, демографические данные и информацию о недвижимости, чтобы присвоить регионам классификации. Эти данные …
Google использует метод машинного обучения для оптимизации моделей ранжирования (например, в Поиске по картинкам). Вместо равномерного обучения на всех данных, система фокусируется на самых сложных примерах, которые попадают в топ …
Google использует анализ логов запросов (уточнений и расширений) для выявления ключевых "аспектов" (подтем), связанных с сущностью. Эти аспекты ранжируются по популярности и разнообразию, а затем используются для организации поисковой выдачи …
Google использует механизм для персонализации лент контента (например, Новости, Discover). Система анализирует, как часто пользователь запрашивает контент. Для частых посетителей приоритет отдается новизне, чтобы избежать повторов. Для редких посетителей приоритет …
Google использует статистический анализ для борьбы со спамом в названиях компаний (например, в Google Maps). Система анализирует корпус легитимных названий, чтобы понять естественные комбинации слов. Затем для проверяемого названия вычисляется …
Google использует «Фактор чувствительности к местоположению» (Location Sensitivity Factor), чтобы динамически определять, насколько важна близость для конкретного запроса. Система объединяет оценку расстояния (Distance Score) и тематическую оценку (Topical Score) в …
Google использует многоступенчатый процесс для улучшения аннотаций изображений. Система сначала генерирует набор меток на основе визуальных характеристик (Content Feature Values). Затем она использует базу семантических связей (Semantic Database/Граф знаний), чтобы …
Google использует механизм для ускорения уточнения запросов. Когда пользователь взаимодействует со словом в середине существующего запроса (например, ставит курсор), система определяет это слово («анкорный сегмент») и предлагает семантически отличные альтернативы …
Патент описывает создание и использование репозитория фактов (предшественника Knowledge Graph). Система извлекает факты из интернета и связывает их с объектами (сущностями). При поиске Google не просто возвращает список объектов, а …

