Индексация

Патент Google, описывающий систему массового присвоения геоданных изображениям. Система собирает информацию из EXIF, текста на странице, распознавания объектов и пользовательских альбомов/событий. Затем она кластеризует похожие или связанные изображения и «размазывает» …
Google использует механизм для разрешения неоднозначности слов и фраз («Элементов знаний»), особенно для целей точного перевода. Система анализирует связанный контекст и применяет вероятностную модель, чтобы определить, какое из возможных значений …
Google использует модель машинного обучения для ранжирования изображений, которая совместно обрабатывает признаки запроса, самого изображения и посадочной страницы, на которой оно размещено. Это позволяет системе динамически определять важность визуальных характеристик …
Патент Google описывает систему Визуального Позиционирования (VPS) для локального поиска. Система определяет точное местоположение и ориентацию устройства по изображениям с камеры, а затем ищет и ранжирует ближайшие точки интереса (POI). …
Патент Google описывает систему для организации видеоконтента на хостинговых платформах. Система идентифицирует исходный источник загруженных пользователями клипов (например, фильм или ТВ-шоу), находит все связанные фрагменты, выстраивает их в правильном хронологическом …
Google использует файлы Sitemap как ключевой источник данных для управления сканированием. Патент описывает, как система обрабатывает метаданные (lastmod, changefreq, priority) и интегрирует их с внутренними сигналами (PageRank) в планировщик краулера. …
Патент описывает, как Google активирует обогащенные результаты (например, расширенные данные о книгах или товарах). Система проверяет, является ли верхний результат поиска значительно более релевантным, чем другие (доминирование по оценке), и …
Google использует два метода для определения главного изображения страницы (Primary Image). Первый анализирует визуальное сходство между изображениями на странице и миниатюрами, которые используют внешние сайты при ссылке на нее. Второй …
Система Google для визуального поиска товаров. Пользователь загружает изображение, система идентифицирует продукт путем сравнения визуальных признаков и распознанного текста с базой данных известных изображений товаров. Затем она использует метаданные найденного …
Google записывает действия пользователя (запросы, клики по результатам и рекламе, посещенные сайты) для персонализации поиска. Система может изменять порядок стандартных результатов, повышая сайты на основе частоты и времени предыдущих посещений. …
Google использует механизм, позволяющий авторизованным владельцам сайтов напрямую отправлять структурированные данные (например, цены, наличие товара) в поисковый индекс. Этот процесс происходит по требованию ("unscheduled update sequence"), значительно быстрее стандартного сканирования, …
Google разрабатывает систему для обнаружения и индексации NFT непосредственно из данных блокчейна. Система анализирует байт-код, чтобы идентифицировать потенциальные NFT, проверяя события-триггеры смарт-контрактов, соответствие стандартам (например, EIP-721) и намерения создателей. Перед …
Google использует технологию анализа структуры документа (DOM-дерева) для отделения основного содержания страницы от шаблонных элементов (boilerplate) — таких как навигационные меню, футеры, списки ссылок и рекламные блоки. Система анализирует геометрические, …
Google использует механизм неконтролируемого (автоматического) извлечения фактов для пополнения Knowledge Graph. Система находит уже известный факт на странице и анализирует окружающую его HTML-структуру («контекстуальный шаблон»). Затем этот изученный шаблон используется …
Google улучшает распознавание объектов на изображениях, проверяя их контекстуальную согласованность. Система анализирует, как часто названия потенциальных объектов встречаются вместе в огромном корпусе текстов (например, в Интернете). Это позволяет выбирать наиболее …
Патент описывает инфраструктуру Google для анализа и индексации изображений, особенно товаров. Система автоматически сегментирует объекты, извлекает визуальные признаки (цвет, форма, текстура) и классифицирует их, используя как изображение, так и метаданные. …
Google использует механизм для определения силы социальных связей (Social Affinity) между пользователями на основе публично доступной информации в интернете (например, через XFN или FOAF разметку). Система строит граф связей, различая …
Патент Google, раскрывающий инфраструктуру поиска визуального контента. Он описывает, как обрабатываются гибридные запросы (текст + изображение), генерируются компактные дескрипторы для оценки сходства и используется структура «Spill Tree» для создания «Визуальных …
Google использует двухэтапную модель оценки релевантности (Bifurcated Scoring) и фразовое индексирование. На этапе индексирования система определяет значимость фраз внутри документа (Phrase Relevance Score). На этапе поиска запрос интерпретируется через наиболее …
Google использует систему для глубокого анализа видеоконтента, сегментируя видео на сцены и идентифицируя семантические концепции в каждом кадре. Это позволяет системе динамически выбирать наиболее релевантные кадры для создания превью (storyboard) …