Close Menu
    Telegram
    SEO HARDCORE
    • Разборы патентов
      • Патенты Google
      • Патенты Яндекс
    • Скоро
      SEO инструменты
    • Скоро
      SEO аналитика
    SEO HARDCORE
    Разборы патентов • Патенты Google

    Как Google ранжирует и выбирает фотографии для локальных объектов, анализируя 3D-контекст, качество и популярность

    SYSTEM AND METHOD FOR SELECTING USER GENERATED CONTENT RELATED TO A POINT OF INTEREST (Система и метод выбора пользовательского контента, относящегося к точке интереса)
    • US9460160B1
    • Google LLC
    • 2016-10-04
    • 2011-11-29
    2011 Local SEO Индексация Мультимедиа Патенты Google

    Google использует технологию Structure from Motion (SfM) для создания 3D-моделей местности и точного определения ракурса каждой фотографии. Это позволяет системе ранжировать изображения для точек интереса (POI). При выборе учитывается контекст просмотра карты пользователем (масштаб, направление взгляда), внутреннее качество фото (привлекательность, популярность) и тип фото (снято «из» точки или «в» точке).

    • Описание
    • Детальный разбор
    • Выводы
    • Практика
    • Вопросы и ответы
    • Наверх

    Описание

    Какую задачу решает

    Патент решает проблему неэффективного выбора пользовательских изображений (User Generated Content, UGC), связанных с точками интереса (Point of Interest, POI) на картах. Предыдущие методы полагались на неточные GPS-координаты и не учитывали ориентацию камеры, фокусное расстояние (масштаб) или контекст просмотра карты пользователем. Это приводило к показу нерелевантных или низкокачественных изображений, которые не давали пользователю полезной информации о локации.

    Что запатентовано

    Запатентована система для выбора и ранжирования фотографий, связанных с POI. Система использует технологию Structure from Motion (SfM) для создания 3D-реконструкции местности и определения точного положения, ориентации и фокусного расстояния камеры для каждого фото. Фотографии индексируются в Spatial Index. При запросе система ранжирует фотографии с помощью функции стоимости (Cost Equation), которая учитывает Map Context (текущий вид карты у пользователя), Photo Quality (качество, популярность, привлекательность) и Photo Type.

    Как это работает

    Система работает в двух фазах: индексирование и ранжирование.

    1. Индексирование (Офлайн): Пользовательские фотографии обрабатываются с помощью SfM для определения точных параметров камеры и создания разреженного 3D-облака точек местности. Создается Spatial Index, где карта делится на ячейки (Cells). Фотографии ассоциируются с ячейками, которые они «видят» (View Of), и с ячейками, из которых они были сняты (View From).
    2. Ранжирование (Реальное время): Когда пользователь запрашивает фотографии для POI, система извлекает кандидатов из Spatial Index. Для каждого кандидата рассчитывается функция стоимости C(p). Эта функция штрафует фотографии, которые не соответствуют текущему Map Context (масштаб, направление взгляда), имеют низкое качество/популярность или не соответствуют доминантному типу фотографий для данной локации. Фотографии с наименьшей стоимостью выбираются для показа.

    Актуальность для SEO

    Высокая. Выбор репрезентативных изображений для локальных объектов (бизнесов, достопримечательностей) критически важен для пользовательского опыта в Google Maps, Local Pack и панелях знаний. Описанные методы, использующие 3D-реконструкцию и многофакторное ранжирование качества и контекста, лежат в основе современных систем визуализации локальных данных.

    Важность для SEO

    Патент имеет высокое значение (8.5/10) для Local SEO и Image SEO. Он детально раскрывает критерии, по которым Google выбирает, какие изображения будут представлять физический объект или локацию. Понимание этих механизмов (качество, популярность, контекстуальное соответствие, выравнивание) позволяет оптимизировать визуальный контент (например, в Google Business Profile), чтобы повысить вероятность его показа на приоритетных позициях, что напрямую влияет на привлекательность и конверсию локального листинга.

    Детальный разбор

    Термины и определения

    Structure from Motion (SfM) (Структура из движения)
    Процесс компьютерного зрения для реконструкции 3D-структуры сцены и определения точного положения, ориентации и фокусного расстояния камеры для каждого фото на основе набора 2D-изображений.
    Point of Interest (POI) (Точка интереса)
    Точка или регион на карте (например, бизнес, объект), для которого запрашиваются фотографии.
    Spatial Index (Пространственный индекс)
    Структура данных, которая хранит список фотографий, связанных с каждой ячейкой (Cell) карты. Индекс может быть разным для разных уровней масштабирования.
    Cell (Ячейка)
    Единица разделения пространства карты (2D или 3D).
    View Of (Фото этого места)
    Фотография, которая «видит» (отображает) сцену или объект, находящийся внутри данной ячейки.
    View From (Фото отсюда)
    Фотография, снятая из данной ячейки (центр камеры находится внутри ячейки).
    Map Context (Контекст карты)
    Текущее состояние карты у пользователя: окно просмотра (Viewport), направление (Heading), уровень масштабирования (Zoom Level) и наклон (Tilt).
    Cost Equation / C(p) (Функция стоимости)
    Основная формула ранжирования. Агрегирует различные штрафы (Penalties) для определения итогового рейтинга фото (p). Низкая стоимость означает высокий ранг.
    C_context (Штраф за контекст)
    Оценивает, насколько фотография соответствует текущему Map Context и текстовому запросу пользователя. Включает C_scale, C_view-direction и C_text.
    C_photo (Штраф за качество фото)
    Оценивает внутреннее качество, популярность, привлекательность и выравнивание фотографии. Включает C_quality и C_alignment.
    C_type (Штраф за тип фото)
    Предпочитает тот тип фото (View Of или View From), который доминирует для данной локации.
    C_alignment (Штраф за выравнивание)
    Оценивает, насколько фронтально снят объект. Предпочитает перпендикулярный вид для плоских сцен (например, фасадов).
    Eye-candy / Human Appeal (Привлекательность)
    Оценка эстетической привлекательности фотографии, основанная на таких признаках, как контраст и насыщенность.

    Ключевые утверждения (Анализ Claims)

    Claim 1 (Независимый пункт): Описывает основной метод предоставления фотографий в реальном времени.

    1. Система получает запрос на просмотр фотографий, связанных с POI на карте в определенный момент времени (t1).
    2. Система получает доступ к набору фотографий. Каждое фото имеет точку обзора (viewpoint), определяемую полем зрения или направлением взгляда.
    3. Система оценивает (scoring) отдельные фотографии на основе сходства между viewpoint фотографии и map viewpoint (текущим видом карты у пользователя) в момент времени t1.
    4. Система предоставляет для отображения одну или несколько фотографий на основе этой оценки.

    Ядро изобретения — это ранжирование фотографий для POI на основе того, насколько хорошо ракурс и масштаб фотографии соответствуют тому, как пользователь смотрит на карту в данный момент.

    Claim 6 (Зависимый): Указывает на технологию, лежащую в основе системы.

    Spatial Index генерируется путем обработки фотографий с помощью системы Structure from Motion (SfM). Это подтверждает использование 3D-реконструкции для понимания контекста фото.

    Claim 9 (Зависимый): Уточняет определение map viewpoint (контекста).

    Map viewpoint определяется параметрами: окно просмотра карты (map viewport), наклон карты (map tilt), направление карты (map heading) и уровень масштабирования карты (map zoom level).

    Claim 10 (Зависимый): Добавляет критерии качества к ранжированию.

    Оценка (scoring) дополнительно основывается на качестве фото (photo quality). Качество определяется позицией/ориентацией, популярностью (photo popularity), выравниванием (photo alignment), контрастом, насыщенностью или тем, является ли фото панорамой.

    Где и как применяется

    Изобретение затрагивает несколько этапов поисковой архитектуры, преимущественно в контексте локального и визуального поиска (Google Maps, Local Pack).

    INDEXING – Индексирование и извлечение признаков
    Это ключевой этап для офлайн-обработки данных:

    1. Clustering: Группировка UGC фотографий по POI на основе GPS, тегов и визуальных признаков.
    2. Structure from Motion (SfM): Выполнение SfM для каждого кластера. Это позволяет понять 3D-геометрию сцены и точно определить параметры камеры для каждого фото.
    3. Feature Extraction: Извлечение признаков качества (Eye-candy), популярности и статуса панорамы.
    4. Spatial Index Generation: Создание Spatial Index, где фотографии (View Of и View From) привязываются к конкретным ячейкам карты.

    RANKING – Ранжирование / RERANKING – Переранжирование
    Алгоритм применяется в реальном времени при взаимодействии пользователя с картой или локальным объектом.

    1. Retrieval: При запросе POI система извлекает ассоциированные фотографии из Spatial Index.
    2. Scoring: Система вычисляет функцию стоимости C(p) для каждой фотографии. Это многофакторное ранжирование, учитывающее C_context, C_photo и C_type.
    3. Selection: Выбираются фотографии с наименьшей стоимостью для отображения.

    Входные данные:

    • Коллекция UGC фотографий с метаданными.
    • Данные о популярности фотографий.
    • Запрос пользователя (POI, текстовый запрос).
    • Текущий Map Context пользователя (Viewport, Zoom, Heading, Tilt).

    Выходные данные:

    • Отранжированный список фотографий для POI, оптимизированный под контекст запроса.

    На что влияет

    • Конкретные типы контента: Влияет на ранжирование пользовательских изображений (UGC) и панорам, связанных с локальными объектами и бизнесами (Google Business Profile).
    • Специфические запросы: Наибольшее влияние на локальные запросы и навигацию в картографических сервисах.
    • Конкретные ниши или тематики: Критически важно для туризма, недвижимости, ритейла, ресторанов и любых бизнесов, где визуальное представление локации влияет на принятие решения пользователем.

    Когда применяется

    • Триггеры активации: Активируется, когда пользователь запрашивает фотографии для Point of Interest (клик по объекту на карте, поиск локации или просмотр деталей локального листинга).
    • Условия работы: Алгоритм ранжирования (Cost Equation) применяется к набору фотографий, извлеченных из Spatial Index. Ранжирование динамически меняется при изменении Map Context (например, когда пользователь перемещает или масштабирует карту).

    Пошаговый алгоритм

    Процесс А: Офлайн-подготовка данных (Индексирование)

    1. Сбор данных и кластеризация: Сбор UGC фотографий. Группировка фотографий по POI на основе локации (GPS), текстовых тегов и визуальных признаков.
    2. Выполнение Structure from Motion (SfM): Обработка кластеров для создания 3D-модели (Point Cloud) и определения точных параметров камеры (позиция, ориентация, фокусное расстояние) для каждого фото.
    3. Генерация Spatial Index: Разделение карты на ячейки (Cells).
      1. Ассоциация «View Of»: Определение, какие фото видят 3D-точки в ячейке.
      2. Ассоциация «View From»: Определение, у каких фото центр камеры находится в ячейке.
    4. Извлечение признаков: Расчет и сохранение метрик качества (Eye-candy, панорама) и популярности.

    Процесс Б: Обработка запроса и ранжирование (Онлайн)

    1. Идентификация POI и Контекста: Получение запроса от пользователя и определение текущего Map Context.
    2. Извлечение фото: Идентификация соответствующих ячеек и получение списка фотографий из Spatial Index.
    3. Ранжирование (Расчет функции стоимости C(p)): Для каждого фото (p) рассчитывается стоимость.
      1. Расчет C_context (Штраф за контекст):
        • C_scale: Сравнение поля зрения фото с текущим зумом карты.
        • C_view-direction: Сравнение направления взгляда фото с текущим направлением карты.
        • C_text: Сравнение тегов фото с текстовым запросом.
      2. Расчет C_photo (Штраф за качество):
        • C_quality: Оценка внутреннего качества, популярности, привлекательности (Eye-candy) и статуса панорамы.
        • C_alignment: Оценка фронтальности вида.
      3. Расчет C_type (Штраф за тип): Предпочтение доминирующего типа (Of/From) для локации.
      4. Агрегация: Суммирование всех штрафов с учетом весовых коэффициентов (lambda).
    4. Сортировка и выбор: Сортировка фотографий по возрастанию стоимости C(p) и возврат Топ-N фотографий.

    Какие данные и как использует

    Данные на входе

    • Контентные факторы (Визуальные): Содержимое изображений используется в процессе Structure from Motion для 3D-реконструкции и определения параметров камеры.
    • Технические факторы (Изображения): Метрики качества изображения: контраст и насыщенность (используются в Eye-candy(p)). Статус панорамы. Разрешение, резкость.
    • Структурные факторы (Текстовые теги): Текстовые теги (text tags), ассоциированные с фотографиями. Используются в C_text и для кластеризации.
    • Поведенческие факторы (Популярность): Метрики вовлеченности, такие как количество просмотров фото, «лайков» или отметок как «избранное». Используются в Popularity(p).
    • Географические факторы: GPS данные фотографий используются для первичной кластеризации и привязки 3D-модели к реальным координатам.
    • Пользовательские факторы (Контекст запроса): Текущее состояние интерфейса пользователя (Map Context): Viewport, Zoom Level, Heading, Tilt. Текстовый запрос пользователя.

    Какие метрики используются и как они считаются

    Система использует сложную взвешенную Cost Equation для ранжирования. Патент детально описывает компоненты (представленные как штрафы/penalties). (Лямбда (λ) обозначает весовые коэффициенты, которые могут быть изучены с помощью Машинного обучения).

    Общая функция стоимости (Eq. 1):
    C(p) = C_context(p) + λ_photo * C_photo(p) + λ_type * C_type(p)

    C_context (Штраф за контекст) (Eq. 2):
    C_context(p) = C_scale(p) + λ_view * C_view_direction(p) + λ_text * C_text

    • C_scale (Eq. 3): Штраф за несоответствие масштаба. Минимизируется, когда поле зрения фото пропорционально размеру текущего viewport карты.
    • C_view_direction (Eq. 4): Штраф за несоответствие направления. Рассчитывается на основе угла между направлением взгляда фото и направлением взгляда карты.
    • C_text (Eq. 5): Штраф за несоответствие текстовому запросу. Оценивает пересечение слов в тегах фото и в запросе пользователя.

    C_photo (Штраф за качество фото) (Eq. 6):
    C_photo(p) = C_quality(p) + λ_alignment * C_alignment(p)

    • C_quality (Eq. 7): Штраф за внутреннее качество. Учитывает:
      • Точность реконструкции и видимость (reprojection-error, количество видимых 3D-точек). Штрафует фото, где объект загорожен.
      • Popularity(p) (обратная зависимость: выше популярность — ниже штраф).
      • Eye-candy(p) (обратная зависимость: выше привлекательность — ниже штраф).
      • C_panorama(p) (штрафует не-панорамы; 0 для панорам, 1 иначе).
    • C_alignment (Eq. 8): Штраф за выравнивание. Рассчитывается как дисперсия расстояний от камеры до видимых 3D-точек вдоль направления взгляда. Минимизируется (0) для фронтальных видов плоских сцен (фасадов).

    C_type (Штраф за тип фото) (Eq. 9):
    Рассчитывается на основе соотношения количества Photos Of и Photos From для данной локации. Отдает предпочтение доминирующему типу.

    Выводы

    1. Google детально понимает 3D-геометрию изображений: Использование Structure from Motion (SfM) означает, что Google точно знает, откуда было снято фото, куда смотрела камера и каков был масштаб. Это позволяет системе выбирать изображения, которые геометрически соответствуют запросу пользователя.
    2. Контекст карты определяет выбор фото (Динамическое ранжирование): Значительная часть алгоритма (C_context) посвящена тому, чтобы фото соответствовало текущему виду карты пользователя (зум, направление, наклон). Отображаемые фото меняются динамически при взаимодействии с картой.
    3. Многофакторная оценка качества: Качество включает не только технические параметры, но и поведенческие сигналы (Popularity), эстетическую привлекательность (Eye-candy) и тип контента (предпочтение панорамам).
    4. Выравнивание (Alignment) как фактор ранжирования: Для плоских объектов (фасады зданий) система предпочитает фронтальные виды (C_alignment). Это важный инсайт для выбора ракурса съемки.
    5. Анализ интента локации («View Of» vs «View From»): Система различает фото, снятые в локации, и фото, показывающие локацию, и адаптирует выбор в зависимости от того, что более характерно для данного места (C_type).

    Практика

    Best practices (это мы делаем)

    Рекомендации напрямую применимы для оптимизации Google Business Profile (GBP) и улучшения видимости в Local SEO.

    • Приоритет визуальной привлекательности (Eye-Candy): Загружайте высококачественные, хорошо освещенные, контрастные и насыщенные фотографии. Алгоритм явно учитывает Eye-candy(p).
    • Загрузка разнообразных ракурсов и масштабов: Поскольку система стремится соответствовать Map Context (C_scale, C_view-direction), важно иметь набор фотографий, показывающих объект с разных сторон и с разным уровнем детализации (общие планы, крупные планы). Это увеличивает шансы на показ фото при разных взаимодействиях с картой.
    • Оптимизация под фронтальные виды (C_alignment): Для фасадов зданий или вывесок загружайте четкие фронтальные фотографии. Алгоритм предпочитает виды, перпендикулярные плоскости объекта.
    • Использование панорам и 3D-туров: Патент явно указывает, что панорамам отдается предпочтение (меньший штраф в C_quality). Создание качественных панорам улучшит ранжирование визуального контента.
    • Стимулирование популярности изображений и UGC: Поскольку Popularity(p) является фактором ранжирования, необходимо работать над увеличением просмотров и взаимодействий с фотографиями в GBP. Поощряйте клиентов загружать свои качественные фото.
    • Обеспечение чистоты кадра: Избегайте фотографий, где основной объект загорожен случайными объектами или людьми. Метрика видимости (в составе C_quality) штрафует такие изображения.

    Worst practices (это делать не надо)

    • Использование стоковых или нерелевантных фото: Система использует SfM для проверки соответствия фото 3D-модели локации. Стоковые фото или фото других объектов будут иметь плохие показатели реконструкции и низкую релевантность.
    • Загрузка только одного типа фото: Загрузка только фотографий интерьера или только экстерьера ограничивает возможности системы по выбору релевантного изображения в разных контекстах.
    • Игнорирование качества и привлекательности: Загрузка низкокачественных или непривлекательных изображений приведет к высокому штрафу C_quality.
    • Манипуляции с метаданными GPS: Попытки обмануть систему путем вставки неверных GPS-данных неэффективны, так как SfM определяет истинное положение и ориентацию камеры на основе визуального контента и сравнения с другими фотографиями.

    Стратегическое значение

    Патент подтверждает переход Google к глубокому пониманию визуального контента, выходящему за рамки простой классификации объектов. Способность анализировать 3D-геометрию и контекст съемки делает визуальный поиск более точным. Для Local SEO это означает, что оптимизация изображений становится технически сложной задачей, требующей не только качественного контента, но и понимания того, как этот контент будет использоваться в различных интерфейсах (Maps, Local Pack). Стратегия должна фокусироваться на создании аутентичного, качественного и разнообразного визуального портфолио.

    Практические примеры

    Сценарий: Оптимизация фотографий для ресторана в GBP

    1. Задача: Улучшить ранжирование и выбор фотографий ресторана в Google Maps.
    2. Действия на основе патента:
      1. Качество и привлекательность: Нанять профессионального фотографа для создания ярких, «аппетитных» фотографий блюд и стильных фото интерьера (максимизация Eye-candy(p)).
      2. Разнообразие ракурсов: Сделать фото фасада с улицы (общий план), фото входа крупным планом, фото интерьера из разных точек (обеспечение покрытия для C_scale и C_view-direction).
      3. Фронтальный вид: Сделать четкое фронтальное фото вывески и входа (оптимизация под C_alignment).
      4. Панорамы: Создать 360-градусный виртуальный тур по интерьеру (использование предпочтения панорам).
      5. Стимулирование UGC: Поощрять посетителей загружать свои качественные фото в GBP (увеличение объема и Popularity(p)).
    3. Ожидаемый результат: Фотографии получают приоритет в выдаче благодаря высокому качеству и разнообразию. Система чаще выбирает эти фото для отображения в карусели Local Pack и при навигации в Google Maps, что повышает привлекательность ресторана.

    Вопросы и ответы

    Что такое Structure from Motion (SfM) и почему это важно для SEO?

    Structure from Motion (SfM) — это технология компьютерного зрения, которая позволяет Google автоматически создавать 3D-модель сцены на основе набора 2D-фотографий. Для SEO это критически важно, так как позволяет Google понять, что именно изображено на фото, с какого ракурса оно снято (положение, ориентация, масштаб), и насколько качественно оно представляет объект (POI), вместо того чтобы полагаться только на неточные GPS-данные или теги.

    Является ли популярность фотографии фактором ранжирования?

    Да, патент явно указывает, что популярность (Popularity(p)) используется при расчете штрафа за качество (C_quality). Популярность определяется количеством просмотров, «лайков» или добавлений в избранное. Чем популярнее фотография, тем ниже штраф и выше ее итоговый ранг. Это подтверждает, что поведенческие сигналы влияют на ранжирование изображений в локальном поиске.

    Что такое «визуальная привлекательность» (Eye-candy) в контексте патента?

    Eye-candy(p) — это метрика, которая предсказывает визуальную привлекательность фотографии для человека. Патент указывает, что она основана на таких характеристиках, как контраст и насыщенность. Фотографии с более высокими показателями Eye-candy получают меньший штраф в функции ранжирования. Это означает, что следует загружать яркие, четкие и эстетически приятные изображения.

    Влияет ли уровень масштабирования карты у пользователя на то, какие фото будут показаны?

    Да, очень сильно. Система рассчитывает штраф за масштаб (C_scale), который оценивает, насколько поле зрения фотографии соответствует текущему окну просмотра карты (Viewport). Если пользователь смотрит на карту издалека (zoomed out), система предпочтет общие планы. Если пользователь приблизил карту (zoomed in), система выберет более детализированные фотографии этого конкретного места.

    Отдает ли система предпочтение панорамам?

    Да. В расчете качества C_quality есть компонент C_panorama(p). Патент указывает, что панорамы, как правило, имеют более высокое качество и позволяют пользователям свободнее осматриваться. Поэтому система предпочитает такие фотографии, назначая им меньший штраф (0 для панорам, 1 для обычных фото).

    Что означает «View Of» и «View From»?

    Система индексирует фотографии двумя способами. View Of (фото этого места) — это снимок, который отображает объект или сцену (например, фото Эйфелевой башни). View From (фото отсюда) — это снимок, который был сделан из этой локации (например, вид Парижа с башни). Система учитывает баланс этих типов для POI и может предпочесть доминирующий тип при ранжировании (C_type).

    Что такое штраф за выравнивание (C_alignment) и как его оптимизировать?

    C_alignment оценивает, насколько фронтально снят объект. Это особенно важно для планарных (плоских) сцен, таких как фасады зданий или вывески. Система предпочитает фотографии, где направление взгляда перпендикулярно плоскости объекта. Для оптимизации следует загружать четкие фронтальные снимки ключевых элементов экстерьера и интерьера.

    Применяется ли этот патент к Google Business Profile (GBP)?

    Хотя патент напрямую не упоминает GBP, он описывает базовую технологию выбора контента для точек интереса на карте. Механизмы ранжирования, учитывающие качество, популярность, разнообразие ракурсов и панорамы, лежат в основе того, как Google выбирает изображения для отображения в GBP, Google Maps и Local Pack.

    Стоит ли загружать много фотографий для одной локации?

    Да. Наличие большого количества разнообразных и качественных фотографий увеличивает вероятность того, что система найдет подходящий снимок для любого контекста карты (Map Context) пользователя. Важно обеспечить разнообразие масштабов (от общих планов до деталей) и ракурсов (с разных сторон, интерьер и экстерьер).

    Может ли этот алгоритм предпочесть пользовательское фото фотографии, загруженной владельцем бизнеса?

    Да. Система оценивает все доступные изображения (UGC и загруженные владельцем) по единым критериям стоимости (Cost Equation). Если пользовательская фотография имеет более высокую популярность, лучшее качество (Eye-candy) и лучше соответствует текущему контексту просмотра карты, она будет ранжироваться выше, чем фотография владельца.

    Навигация
    • Описание
    • Детальный разбор
    • Выводы
    • Практика
    • Вопросы и ответы
    • Наверх
    Telegram
    © 2025 SEO HARDCORE

    Type above and press Enter to search. Press Esc to cancel.