Патент описывает комплексную систему для анализа содержимого изображений. Google может распознавать лица, текст на объектах (OCR) и характеристики одежды/аксессуаров. Эта информация индексируется, позволяя пользователям искать изображения не только по тексту, …
Индексация
Google использует технологию Structure from Motion (SfM) для создания 3D-моделей местности и точного определения ракурса каждой фотографии. Это позволяет системе ранжировать изображения для точек интереса (POI). При выборе учитывается контекст …
Анализ патента, описывающего комплексный подход к пониманию изображений. Система обнаруживает и распознает лица, одежду, текст на объектах (OCR) и другие объекты. Для повышения точности используются комбинации признаков (лицо + одежда) …
Google использует систему для организации локальной выдачи, кластеризуя веб-документы вокруг конкретного физического адреса или номера телефона. Система определяет «область интереса», используя динамический радиус поиска, который меняется в зависимости от типа …
Патент Google описывает методы повышения точности обнаружения почти дубликатов контента. Система может использовать двухэтапный подход, комбинируя алгоритмы: один чувствителен к порядку слов (например, Shingling/Broder), а другой учитывает частоту слов, но …
Google применяет систему для выявления неявного локального интента в запросах без указания местоположения (например, "пицца"). Система проверяет запрос по двум разным "Белым спискам" (Whitelists). В зависимости от того, известно ли …
Google использует систему для определения веб-страниц, где выполнение скриптов (например, JavaScript) не меняет основной контент, ссылки или структуру. Такие страницы помечаются как «контентно-нейтральные». Это позволяет браузерам (и системам индексации Google) …
Google использует систему для автоматического определения событий в видео (например, "езда на велосипеде"). Она анализирует заголовки и описания с помощью NLP (POS-анализ), чтобы найти комбинации "глагол+существительное", и фильтрует их через …
Патент Google, описывающий систему организации результатов поиска по картинкам. Google группирует похожие изображения в кластеры на основе визуальных и семантических признаков. Система использует двухуровневый скоринг: Image Score определяет позицию изображения …
Google использует механизм для улучшения результатов поиска по картинкам. Система анализирует набор изображений, найденных по запросу, и сравнивает их визуальные характеристики (цвет, текстуру, формы). Изображения, которые визуально похожи на большинство …
Google использует систему для создания структурированной базы данных цитат. Система извлекает цитаты из веба, идентифицирует автора и сущность, о которой идет речь. Цитаты оцениваются на основе авторитетности источника, релевантности сущности, …
Анализ патента Google, описывающего систему поиска событий. Чтобы избежать доминирования популярных событий в выдаче, система разделяет запрашиваемый временной интервал на более мелкие части (например, неделю на дни). Затем она находит …
Google использует систему для определения «необязательных ресурсов» (например, скриптов аналитики, трекеров), которые не влияют на видимый контент или структуру страницы. Анализируя шаблоны URL и сравнивая результаты рендеринга с ресурсом и …
Google предоставляет инструмент, который использует актуальную логику обработки контента поисковой системы для генерации «предсказанного результата поиска» (сниппета) в изолированной среде. Это позволяет мгновенно увидеть, как страница будет выглядеть в выдаче …
Google использует фреймворк для быстрого создания парсеров, извлекающих точные отношения "Субъект-Предикат-Объект" (S-P-O) из HTML/XML. Ключевым механизмом является определение "области видимости" (Scope) в DOM-дереве, что гарантирует структурную близость и точность связей …
Google использует систему автоматического распознавания лиц для идентификации людей в видео. Система самостоятельно создает базу данных моделей лиц, анализируя изображения и тексты из интернета. Затем она отслеживает лица в видеопотоке, …
Google использует систему для автоматического обнаружения, отслеживания и распознавания лиц в видеоконтенте. Это позволяет индексировать видео не только по метаданным, но и по конкретным людям, присутствующим в кадре. Система может …
Google использует систему для автоматического обнаружения взаимосвязи между десктопными (non-mobile) и мобильными (mobile) версиями страниц, когда используются разные URL. Система анализирует структуру URL, находит общие токены и проверяет схожесть контента. …
Патент Google, описывающий фундаментальный механизм индексирования динамического контента, генерируемого на стороне клиента (JavaScript/AJAX). Система идентифицирует «индексируемые фрагменты» в URL (часть после '#'), выполняет клиентский код для генерации финального состояния страницы …
Google использует передовые технологии OCR для точного извлечения текста из изображений, включая низкокачественные фото с мобильных устройств. Система применяет масштабирование (Super-resolution), многоуровневый анализ (Multi-scale OCR) и контекстно-зависимые языковые модели (например, …