Close Menu
    Telegram
    SEO HARDCORE
    • Разборы патентов
      • Патенты Google
      • Патенты Яндекс
    • Скоро
      SEO инструменты
    • Скоро
      SEO аналитика
    SEO HARDCORE
    Разборы патентов • Патенты Google

    Как Google извлекает географические данные из изображений и текста для быстрого запуска поиска путешествий

    INITIATING TRAVEL SEARCHES (Инициирование поиска путешествий)
    • US8819053B1
    • Google LLC
    • 2014-08-26
    • 2012-05-07
    2012 Мультимедиа Патенты Google

    Патент описывает систему, которая позволяет пользователю начать планирование поездки, кликнув на изображение или текст на любом веб-сайте. Система анализирует выбранный элемент, определяет связанную с ним географическую локацию (например, распознавая достопримечательность на фото) и автоматически открывает интерфейс поиска путешествий с уже заполненным пунктом назначения.

    • Описание
    • Детальный разбор
    • Выводы
    • Практика
    • Вопросы и ответы
    • Наверх

    Описание

    Какую задачу решает

    Патент решает проблему трения между моментом вдохновения пользователя и началом планирования путешествия. Когда пользователь видит на веб-странице контент (изображение или текст), связанный с интересным местом, ему обычно приходится вручную переходить на сайт бронирования и вводить пункт назначения. Изобретение автоматизирует этот процесс, позволяя инициировать поиск путешествия непосредственно из контекста просматриваемого контента, даже если пользователь не знает точного местоположения объекта.

    Что запатентовано

    Запатентована система для автоматического инициирования поиска путешествий на основе контента, просматриваемого пользователем на сторонних веб-страницах. Система принимает на вход элемент (изображение или текст), извлекает из него географическую информацию (преобразуя неявные данные в явные) и предоставляет пользователю интерфейс поиска путешествий (travel search interface) с предварительно заполненным полем пункта назначения.

    Как это работает

    Ключевой механизм включает несколько этапов:

    • Ввод данных: Пользователь выбирает элемент (например, кликает на изображение достопримечательности или выделяет текст) на веб-странице, не связанной с сервисом путешествий.
    • Анализ информации: Система анализирует элемент и связанную с ним информацию (например, метаданные, geo tag).
    • Извлечение локации: Если явная информация о локации отсутствует, система использует неявную информацию (implicit information). Для изображений применяются технологии распознавания образов (image recognition software) или поиска по изображению (search-by-image software). Для текста используется алгоритм поиска строк (character string search algorithm) для идентификации названий мест или объектов.
    • Предоставление интерфейса: Система запускает travel search interface (например, в виде виджета или новой вкладки).
    • Предварительное заполнение: Поле пункта назначения автоматически заполняется извлеченной локацией (например, кодом аэропорта). Поле отправления также может быть заполнено на основе данных о местоположении пользователя (например, IP-адреса или данных профиля).

    Актуальность для SEO

    Средняя. Сама идея интеграции контента и вертикального поиска актуальна. Технологии, лежащие в основе патента — распознавание изображений и извлечение географических сущностей из текста — активно развиваются и используются Google (например, в Google Lens). Однако конкретные реализации пользовательского интерфейса, описанные в патенте (например, через дополнения браузера или виджеты, активируемые кликом по элементу), могли эволюционировать или быть заменены другими решениями.

    Важность для SEO

    Патент имеет минимальное значение для SEO (Инфраструктура/UX). Он описывает пользовательский интерфейс и методы извлечения данных для запуска вертикального поиска (Travel), а не алгоритмы ранжирования, индексирования или оценки качества контента в основном веб-поиске. Он не влияет на то, как сайты ранжируются в SERP, но дает представление о возможностях Google по интерпретации географического контекста визуального и текстового контента.

    Детальный разбор

    Термины и определения

    Character string search algorithm (Алгоритм поиска символьных строк)
    Метод, используемый для анализа текста с целью выявления строк, соответствующих названиям географических объектов, городов, стран или известных достопримечательностей.
    Explicit information (Явная информация)
    Прямые индикаторы географического местоположения, связанные с элементом. Примеры: широта, долгота, страна, город, аэропорт, адрес или geo tag.
    Geo tag (Геотег)
    Метаданные, содержащие географические координаты, прикрепленные к элементу (например, к изображению).
    Image recognition software (Программное обеспечение для распознавания изображений)
    Технология, используемая для идентификации известных объектов, мест или достопримечательностей на изображении путем сравнения его характеристик с базой данных.
    Implicit information (Неявная информация)
    Косвенные индикаторы географического местоположения. Примеры: распознаваемые характеристики (recognizable features) объекта на изображении или упоминания объектов в тексте, из которых можно определить местоположение.
    Item (Элемент)
    Объект на веб-странице, выбранный пользователем для инициирования поиска путешествия. В патенте это изображение (image) или текстовая строка (text string).
    Search-by-image software (Программное обеспечение для поиска по изображению)
    Технология для сопоставления изображения с семантической интерпретацией объекта и определения его местоположения, даже если сам объект не является широко известным.
    Travel search interface (Интерфейс поиска путешествий)
    Пользовательский интерфейс (например, веб-страница или виджет), предоставляемый системой для планирования поездки, включающий поля для ввода пункта отправления, назначения и дат.

    Ключевые утверждения (Анализ Claims)

    Патент фокусируется на методе и системе запуска поиска путешествий на основе контента.

    Claim 1 (Независимый пункт): Описывает систему, выполняющую следующие операции с изображениями:

    1. Получение ввода, который идентифицирует изображение на веб-странице, независимой от веб-сайта туристических услуг. Изображение содержит распознаваемые характеристики (recognizable features).
    2. В ответ на ввод, инициирование travel search interface, отображаемого отдельно от веб-страницы.
    3. Определение явной информации (explicit information) о географическом местоположении путем выполнения процесса распознавания изображения (image recognition process) или процесса поиска по изображению (search-by-image process).
    4. Получение информации, связанной с пользователем.
    5. Отображение полей поиска в интерфейсе (отправление, назначение, дата).
    6. Предварительное заполнение поля назначения кодом (например, аэропорта), соответствующим извлеченной географической локации.
    7. Предварительное заполнение поля отправления на основе информации, связанной с пользователем.

    Claim 8 и 10 (Зависимые): Уточняют, что ввод может идентифицировать не только изображение, но и текстовую строку (text string). В этом случае (Claim 10) определение явной информации происходит с использованием алгоритма поиска символьных строк (character string search algorithm).

    Где и как применяется

    Этот патент описывает внутренние процессы и пользовательский интерфейс Google, которые напрямую не связаны со стандартным процессом ранжирования веб-страниц. Он относится к функциональности вертикального поиска (Travel) и технологиям извлечения данных.

    QUNDERSTANDING – Понимание Запросов (и Контента)
    Хотя это не традиционное понимание запроса пользователя, описанные механизмы тесно связаны с извлечением сущностей (в данном случае, географических локаций) из контента. Система должна интерпретировать изображение или текст, чтобы понять, о каком месте идет речь. Это требует сложных NLP и технологий компьютерного зрения.

    METASEARCH – Метапоиск и Смешивание (Вертикальная интеграция)
    Основная цель патента — интеграция контента веб-страницы с вертикалью поиска путешествий. Система действует как триггер для запуска этой вертикали и передает ей контекст.

    Взаимодействие компонентов:

    • Клиентская часть (Браузер/Дополнение): Перехватывает действия пользователя на веб-странице (например, через browser add-on или widget) и отправляет выбранный элемент (изображение/текст) на сервер.
    • Серверная система (Travel Portal System): Принимает элемент, запускает модули анализа (Image Recognition/Search-by-Image/Text Analysis), определяет локацию (используя Map API и базы данных), определяет локацию пользователя и генерирует Travel Search Interface.

    Входные данные:

    • Выбранный пользователем элемент (изображение или текст).
    • Метаданные элемента (если доступны, например, Geo tag).
    • Данные пользователя (IP-адрес, данные аккаунта социальной сети) для определения пункта отправления.

    Выходные данные:

    • Travel Search Interface с предварительно заполненными полями пункта назначения и отправления.

    На что влияет

    • Конкретные типы контента: Наибольшее влияние на контент, богатый изображениями локализуемых объектов (блоги о путешествиях, фотохостинги, новостные сайты, сайты музеев, социальные сети) и статьи, упоминающие конкретные географические названия.
    • Форматы контента: Изображения и текст.
    • Конкретные ниши или тематики: В первую очередь, Travel, а также любые ниши, где обсуждаются физические локации (недвижимость, события, история).

    Когда применяется

    • Триггеры активации: Алгоритм активируется только по явному действию пользователя — когда пользователь выбирает элемент на странице и инициирует поиск путешествия (например, через контекстное меню, клик по иконке рядом с элементом или клик по самому элементу).
    • Временные рамки: Применяется в реальном времени в ответ на запрос пользователя.

    Пошаговый алгоритм

    Процесс инициирования поиска путешествия:

    1. Получение ввода: Система получает элемент (изображение или текст), выбранный пользователем на веб-странице.
    2. Получение связанной информации: Система получает информацию, ассоциированную с элементом (например, метаданные), и информацию о пользователе.
    3. Проверка явной информации: Система определяет, содержит ли полученная информация явные географические данные (explicit information), такие как координаты или geo tag.
    4. Извлечение неявной информации (если необходимо): Если явная информация отсутствует, система анализирует implicit information:
      • Для изображений: Выполняется анализ с помощью image recognition software или search-by-image software для идентификации распознаваемых характеристик объекта и определения его местоположения.
      • Для текста: Выполняется анализ с помощью character string search algorithm для поиска названий мест или достопримечательностей.
    5. Определение локации пользователя: Система определяет вероятный пункт отправления пользователя (например, по IP-адресу или данным профиля).
    6. Предоставление интерфейса: Система генерирует и предоставляет пользователю travel search interface отдельно от исходной страницы.
    7. Предварительное заполнение полей: Система заполняет поле пункта назначения данными, полученными на шаге 3 или 4 (например, кодом аэропорта), и поле пункта отправления данными, полученными на шаге 5.

    Какие данные и как использует

    Данные на входе

    Система использует следующие типы данных:

    • Контентные факторы:
      • Изображения: Пиксельные данные изображения и распознаваемые характеристики (recognizable features) для распознавания объектов.
      • Текст: Текстовые строки для поиска географических названий.
    • Технические/Мультимедиа факторы:
      • Метаданные изображений, в частности Geo tags (если доступны).
    • Географические факторы:
      • IP-адрес пользователя для определения его текущего местоположения (пункта отправления).
    • Пользовательские факторы:
      • Информация из профиля пользователя (например, аккаунта социальной сети — social networking account) для определения домашнего местоположения.

    Какие метрики используются и как они считаются

    Патент не описывает конкретные метрики ранжирования, но упоминает ключевые технологии анализа данных:

    • Image Recognition (Распознавание изображений): Используется для идентификации известных объектов (например, Эйфелевой башни) на основе сравнения с базой данных изображений.
    • Search-by-Image (Поиск по изображению): Используется для сопоставления изображения с семантической интерпретацией и локацией, даже если объект менее известен.
    • Text Analysis (Анализ текста): Используется character string search algorithm для извлечения географических сущностей из текста.
    • Map API: Упоминается использование Map API для сопоставления идентифицированных объектов или текста с конкретными географическими координатами или локациями (например, ближайшими аэропортами).

    Выводы

    1. Инфраструктурный и UX фокус: Патент описывает механизм улучшения пользовательского опыта и захвата интента в вертикали Travel, а не алгоритм ранжирования в веб-поиске. Прямых рекомендаций для влияния на ранжирование в нем нет.
    2. Продвинутое понимание контента: Патент демонстрирует способность Google извлекать точные географические данные как из текста, так и из изображений, даже при отсутствии явных метаданных. Это подчеркивает важность технологий компьютерного зрения (Image Recognition, Search-by-Image) и NLP (Character string search) в стеке Google.
    3. Преобразование неявных данных в явные: Ключевая техническая задача, описанная в патенте, — это конвертация implicit information (например, вида озера на фото) в explicit information (например, код ближайшего аэропорта).
    4. Персонализация и контекст: Система учитывает контекст пользователя (его местоположение, определяемое по IP или данным профиля) для предварительного заполнения поля отправления.
    5. Значение для SEO: Хотя влияние на ранжирование минимально, патент подтверждает важность обеспечения машиночитаемости географического контекста контента (текстового и визуального) для корректной интерпретации системами Google.

    Практика

    Best practices (это мы делаем)

    Хотя патент не дает прямых рекомендаций по ранжированию, он подчеркивает важность корректной интерпретации географии контента. Для SEO-специалистов это означает:

    • Оптимизация изображений для распознавания (Image SEO): Используйте четкие, высококачественные изображения достопримечательностей и локаций. Это облегчает работу систем Image Recognition и Search-by-Image.
    • Явное указание географического контекста: Обеспечьте, чтобы географическая привязка контента была очевидна для поисковых систем. Используйте:
      • Информативные Alt-тексты и подписи к изображениям, указывающие местоположение.
      • Упоминание названий городов, регионов и достопримечательностей в основном тексте (для Character String Search Algorithm).
      • Микроразметку (Schema.org) для локаций (Place, TouristAttraction) и изображений (ImageObject с contentLocation).
    • Использование гетегов (по возможности): Если это уместно (например, для сайтов с фотографиями), сохранение Geo tags в метаданных EXIF может служить источником explicit information, упрощая системе задачу.

    Worst practices (это делать не надо)

    • Использование стоковых или общих изображений для конкретных локаций: Использование нерелевантных или слишком общих изображений может привести к неправильной интерпретации географического контекста страницы системами Google.
    • Обфускация или неоднозначность местоположения: Намеренное скрытие географической информации или использование неоднозначных названий без контекста (например, Париж, Франция vs Париж, Техас) затрудняет извлечение сущностей.
    • Удаление метаданных EXIF без необходимости: Хотя удаление метаданных часто делается для оптимизации размера файла, полное удаление может устранить полезные сигналы, такие как геотеги.

    Стратегическое значение

    Патент подтверждает стратегический приоритет Google в понимании сущностей и их атрибутов, в данном случае — географического местоположения объектов на изображениях и в тексте. Это часть более широкой тенденции к семантическому пониманию контента не только для ранжирования, но и для создания интерактивных функций и интеграции между различными сервисами Google (Web Search, Image Search, Maps, Travel, Lens). Для SEO это означает, что стратегия должна фокусироваться на четком представлении сущностей и их связей.

    Практические примеры

    Сценарий: Оптимизация статьи в блоге о путешествиях

    Цель: Обеспечить точное извлечение географических данных из контента.

    1. Действие: Вставить в статью фотографию конкретного пляжа (например, Пляж Навайо на Закинфе).
    2. Оптимизация:
      • Использовать четкое изображение, где видны уникальные особенности пляжа (recognizable features).
      • Прописать Alt-текст: «Вид сверху на Пляж Навайо (Navagio Beach) с останками корабля, остров Закинф, Греция».
      • В подписи к фото повторить название и локацию.
      • В основном тексте упомянуть название пляжа, острова и страны.
      • (Опционально) Добавить микроразметку ImageObject с указанием contentLocation.
    3. Ожидаемый результат: Системы Google (включая те, что описаны в патенте, или современные аналоги вроде Google Lens) с высокой вероятностью корректно идентифицируют локацию как Закинф, Греция. Это гарантирует правильную интерпретацию контекста страницы.

    Вопросы и ответы

    Влияет ли этот патент на ранжирование моего сайта в поиске?

    Нет, этот патент не описывает алгоритмы ранжирования. Он посвящен пользовательскому интерфейсу и способу быстрого запуска поиска путешествий (Google Travel) путем анализа контента на странице, которую просматривает пользователь. Он не влияет на позиции вашего сайта в стандартной поисковой выдаче (SERP).

    Что этот патент говорит о важности Image SEO?

    Патент подчеркивает технические возможности Google по распознаванию объектов и мест на изображениях (Image Recognition, Search-by-Image). Это подтверждает, что Google активно анализирует визуальный контент. Для SEO это означает, что использование уникальных, четких изображений и предоставление явного контекста (Alt-текст, подписи) критически важны для правильной интерпретации контента.

    Нужно ли мне добавлять специальные теги на сайт, чтобы эта функция работала?

    Патент не предполагает каких-либо действий со стороны владельца сайта для активации этой функции. Система работает автономно (через браузер или дополнения) и анализирует существующий контент. Однако предоставление явной географической информации (например, через микроразметку или Geo tags в EXIF) может повысить точность определения локации.

    Как система определяет местоположение, если на фото нет известных достопримечательностей?

    Патент упоминает использование search-by-image software. Эта технология позволяет найти похожие изображения в интернете и ассоциировать семантическую информацию и локацию с исходным изображением, даже если на нем изображен менее известный объект (например, пейзаж или интерьер).

    Как система обрабатывает текст для определения локации?

    Система использует character string search algorithm. Это означает, что она сканирует текст на наличие строк, которые соответствуют названиям городов, стран, регионов или известных достопримечательностей (сущностей) в базе данных Google. Точность зависит от однозначности названия и контекста.

    Как система узнает, откуда я собираюсь лететь?

    Система автоматически заполняет поле пункта отправления, используя информацию, связанную с пользователем. В патенте упоминается использование IP-адреса пользователя или информации из его профиля (например, аккаунта социальной сети — social networking account) для определения его текущего местоположения или домашнего аэропорта.

    Может ли система ошибиться с определением локации?

    Да, как и любая автоматизированная система. Ошибки могут возникать при использовании неоднозначных изображений, изображений низкого качества или текста с многозначными географическими названиями без достаточного контекста. Именно поэтому в интерфейсе поиска путешествий пользователю предоставляется возможность изменить предложенный пункт назначения.

    Использует ли Google эту технологию сейчас?

    Хотя мы не можем точно знать, используется ли конкретная реализация UI из этого патента (например, через browser add-on), лежащие в ее основе технологии активно применяются. Например, Google Lens использует распознавание изображений для идентификации мест и предоставления связанной информации, что очень похоже на концепцию, описанную в патенте.

    Что такое implicit information и explicit information в контексте этого патента?

    Explicit information — это прямые данные о локации, например, координаты GPS в метаданных фото (Geo tag). Implicit information — это косвенные данные, например, внешний вид Эйфелевой башни на фото. Система распознает башню и на основе этого определяет, что это Париж.

    Какова основная польза этого патента для SEO-специалиста?

    Основная польза заключается в понимании того, насколько глубоко Google анализирует визуальный и текстовый контент для извлечения конкретных сущностей (в данном случае, локаций). Это служит напоминанием о необходимости семантической оптимизации и предоставления четкого, машиночитаемого контекста для всего контента на сайте.

    Навигация
    • Описание
    • Детальный разбор
    • Выводы
    • Практика
    • Вопросы и ответы
    • Наверх
    Telegram
    © 2025 SEO HARDCORE

    Type above and press Enter to search. Press Esc to cancel.