2011

Google использует систему планирования сканирования для оптимизации ресурсов. Система динамически рассчитывает интервал сканирования для каждого ресурса, учитывая его популярность (например, количество подписчиков), частоту «значимых» изменений контента (особенно в визуально важных …
Google использует систему для поиска сайтов, похожих на заданный "примерный ресурс". Система анализирует логи поисковых запросов, чтобы определить, по каким запросам пользователи находили этот ресурс, а затем находит другие сайты, …
Google использует технологию Structure from Motion (SfM) для создания 3D-моделей местности и точного определения ракурса каждой фотографии. Это позволяет системе ранжировать изображения для точек интереса (POI). При выборе учитывается контекст …
Google измеряет, насколько полно сгенерированы "быстрые данные для предпросмотра" (сниппеты, превью) для страниц, которые реально показываются пользователям. Патент описывает статистический метод сэмплирования и взвешивания по показам, который позволяет эффективно оценить …
Google использует гибридную технику компьютерного зрения для оценки возраста людей на изображениях. Комбинируя результаты нескольких простых бинарных классификаторов возраста (например, «ребенок или взрослый») с помощью регрессора, Google генерирует конкретные оценки …
Google использует систему для идентификации событий (спорт, концерты) в запросах и генерации «Интегрированного представления события» (Integrated Event View). Эта система агрегирует фактические данные, результаты веб-поиска и контент из социальных сетей. …
Google использует систему для автоматического определения событий в видео (например, "езда на велосипеде"). Она анализирует заголовки и описания с помощью NLP (POS-анализ), чтобы найти комбинации "глагол+существительное", и фильтрует их через …
Патент описывает, как Google Maps агрегирует и отображает ленту свежих новостей и социального контента, релевантную просматриваемой области карты или искомой теме. Система ранжирует этот контент по свежести и может визуализировать …
Google использует фреймворк для быстрого создания парсеров, извлекающих точные отношения "Субъект-Предикат-Объект" (S-P-O) из HTML/XML. Ключевым механизмом является определение "области видимости" (Scope) в DOM-дереве, что гарантирует структурную близость и точность связей …
Патент описывает методы агрегации данных о посещениях веб-страниц для создания отчетов о потоках трафика (например, в Google Analytics). Система анализирует структуру URL-адресов, определяет общие префиксы и группирует схожие страницы в …
Патент Google описывает систему поиска и ранжирования локального пользовательского контента (UGC), такого как отзывы. Система определяет местоположение пользователя (GPS), находит релевантный контент поблизости и ранжирует его, учитывая близость, популярность, количество …
Патент Google, описывающий фундаментальный механизм индексирования динамического контента, генерируемого на стороне клиента (JavaScript/AJAX). Система идентифицирует «индексируемые фрагменты» в URL (часть после '#'), выполняет клиентский код для генерации финального состояния страницы …
Google использует механизм для определения значимости изменений контента на веб-странице. Система анализирует визуальную структуру (рендеринг) старой версии страницы и присваивает «оценки важности» разным блокам. Затем эти оценки переносятся на новую …
Google использует анализ временных меток документов для определения "запросов, ищущих свежесть" (QDF). Система строит временную шкалу публикаций по теме и ищет резкие всплески (события). Если обнаружен значительный недавний всплеск, система …
Google использует технологию для анализа видеоконтента, автоматического обнаружения и распознавания лиц. Система создает "закладки" (временные метки), указывающие, когда конкретный человек появляется и исчезает из кадра. Для идентификации используются данные социального …
Google использует адаптивную систему планирования повторного сканирования. Система оценивает, как часто меняется документ (Change Period) и насколько он важен (Importance Rank, например, PageRank). На основе этих данных рассчитывается оптимальная частота …
Google может оптимизировать размер и скорость своего индекса, анализируя, какие части документа использовались для ответа на запросы пользователей. Части, которые редко используются, удаляются из индекса, а сохраняются только наиболее востребованные …
Google использует систему для идентификации веб-страниц, основным контентом которых являются изображения (страницы-галереи). Система анализирует количество, размер, расположение изображений и их структуру в DOM-дереве, исключая рекламу и шаблонные элементы. Если страница …
Google использует автоматизированную систему для создания индекса логотипов. Система анализирует логи поисковых запросов, содержащих слово «логотип», собирает соответствующие изображения из выдачи, кластеризует их по визуальному сходству и выбирает лучшее «репрезентативное …
Google использует этот механизм для автоматической идентификации и группировки вариантов одного продукта (например, разных цветов или размеров), предлагаемых разными продавцами. Система анализирует заголовки товаров в фидах, выявляет закономерности и создает …