Google использует технологию визуального поиска для идентификации исходного (канонического) документа по изображению (например, фотографии страницы). Система анализирует не только распознанный текст (OCR), но и структурную информацию (верстку, шрифты, расположение), чтобы …
Индексация
Патент описывает инфраструктуру визуального поиска Google. Система сканирует веб-ресурсы для обнаружения метаданных о "цифровых дополнениях" (интерактивный контент, AR, действия) и индексирует их, привязывая к объектам реального мира ("анкорям"). При визуальном …
Google разработал систему для индексации и поиска 3D-моделей. Система может автоматически аннотировать части объектов (например, определять «объектив» на камере), изучая их форму и расположение. Это позволяет искать 3D-объекты, используя изображения …
Google использует автоматический анализ изображений (например, Street View и фото пользователей) для создания Геосемантического индекса. Этот индекс каталогизирует физические особенности мест (скамейки, деревья, игровые площадки) и связывает их с активностями …
Google использует механизм машинного обучения для решения проблемы несогласованности данных в фидах мерчантов. Система анализирует пары товарных предложений с одинаковыми идентификаторами (GTIN, MPN), но разными названиями брендов. Путем расчета метрик …
Google использует систему для анализа и разделения составных слов (компаундов), часто встречающихся в таких языках, как немецкий. Система генерирует различные варианты разделения слова, применяет морфологические изменения и оценивает их, используя …
Google использует систему обработки структурированных фидов данных (например, от ритейлеров или стриминговых сервисов) для точного сопоставления их инвентаря с конкретными сущностями в Knowledge Graph. Это позволяет генерировать пары «сущность-действие» (например, …
Google использует систему для преобразования неструктурированного контента веб-страниц в структурированные данные. Система обучается на примерах, размеченных вручную, для создания обобщенных структурных шаблонов (Template Trees), учитывающих повторяющиеся или опциональные элементы. Затем …
Патент Google описывает систему, позволяющую авторам напрямую отправлять контент поисковой системе до или сразу после публикации. Система проверяет новизну контента и может проиндексировать его немедленно, без сканирования URL. Также она …
Google анализирует структуру сайтов для автоматического определения «Visual Leaf Pages» (например, карточек товаров или рецептов), где изображение является основным контентом. Система находит «Hub Pages» (например, категории), которые ссылаются на них, …
Google использует контекстные слова в запросе (например, профессию, местоположение) для исправления ошибок в написании имен сущностей (людей, брендов, мест). Система создает индекс ассоциаций между сущностями и их контекстом на основе …
Google использует систему для автоматического извлечения и проверки «Структурных параметров» (бренды, атрибуты, категории, линейки продуктов) из неструктурированного веб-контента и логов запросов. Система валидирует классификацию с помощью анализа контекстуального сходства, целевого …
Google патентует систему, позволяющую местным заведениям (барам, ресторанам) указывать в своих бизнес-профилях, какие именно события (например, спортивные матчи) они будут транслировать. Эта информация индексируется и используется в Поиске и Картах, …
Google индексирует веб-контент и проверяет, доступен ли этот же контент («синхронизированный контент») через нативные приложения, установленные на устройстве пользователя. Если приложение установлено и контент синхронизирован, Google формирует специальный результат поиска …
Google патентует систему «Временная карта» (Temporal Map), которая индексирует локальные события (концерты, распродажи, специальные меню) и отображает их на карте в привязке ко времени. Система агрегирует эти данные для вычисления …
Патент Google, описывающий механизм улучшения пользовательского опыта после клика на результат поиска. Система идентифицирует ключевые фрагменты текста (Resource Search Tidbits) на целевой странице. Когда пользователь переходит на страницу, браузер может …
Анализ патента Google, лежащего в основе системы «Поиск по картинке» (Search by Image). Описан метод генерации компактных цифровых подписей (хэшей) изображений с помощью вейвлет-преобразований для эффективного поиска почти дубликатов. Также …
Этот основополагающий патент описывает технологию XML Sitemap. Он определяет, как веб-серверы могут автоматически генерировать списки URL с метаданными (дата изменения, приоритет, частота обновления) путем анализа файловой системы или логов доступа, …
Google использует систему для автоматического понимания структуры сайтов с пользовательским контентом (UGC), таких как форумы. Система разделяет страницы на статичные элементы («boilerplate») и динамический контент («posts»), определяет различные типы постов …
Патент описывает систему Google для автоматического сбора данных о физических локациях сетевых магазинов. Система находит страницу «Поиск магазина» на сайте, имитирует ввод географических данных (например, почтовых индексов) и извлекает адреса, …