Яндекс патентует метод для ускорения и повышения точности поиска по картинке (CBIR). Вместо индексации отдельных элементов изображения («визуальных слов»), система использует «Композитный параметр визуальных характеристик» (КПВХ или «визуальная фраза»). КПВХ объединяет как минимум два элемента и их взаимосвязь (пространственную или визуальную). Это позволяет быстрее находить дубликаты и похожие изображения, устойчивые к изменениям (кадрирование, сжатие).
Описание
Какую задачу решает
Патент решает задачу повышения эффективности и скорости поиска изображений в крупномасштабных хранилищах (Content-Based Image Retrieval, CBIR). Традиционные методы, основанные на модели «набора слов» (Bag-of-Words), индексируют отдельные визуальные характеристики. Это приводит к необходимости дорогостоящей вычислительной пост-обработки (например, пространственной проверки RANSAC) для верификации большого числа кандидатов. Изобретение направлено на ускорение поиска за счет использования более дискриминирующих признаков на этапе индексации и первичного отбора.
Что запатентовано
Запатентован способ индексации и поиска изображений, основанный на использовании «Композитного параметра визуальных характеристик» (КПВХ), также называемого «визуальной фразой». Суть изобретения заключается в том, чтобы индексировать не отдельные «визуальные слова» (локальные дескрипторы), а их комбинации (минимум два) вместе с параметром, описывающим соотношение между соответствующими областями изображения (пространственное и/или визуальное).
Как это работает
Система анализирует изображение, идентифицирует локальные области и вычисляет для них дескрипторы (визуальные слова). Затем формируется КПВХ, который включает как минимум два визуальных слова и параметр соотношения областей (например, относительное положение, угол, соотношение масштабов или контраста). Изображение индексируется с использованием КПВХ в качестве ключа. Поскольку КПВХ обладает более высокой «дискриминирующей мощностью», списки кандидатов в индексе получаются короче, что ускоряет финальный этап детальной проверки (например, геометрической верификации).
Актуальность для SEO
Высокая (для технологий поиска изображений). Эффективное индексирование и быстрый поиск похожих изображений (CBIR) являются критически важными задачами. Описанный подход к созданию составных визуальных признаков, включающих пространственные отношения, актуален для повышения точности и скорости работы систем поиска дубликатов изображений в Яндексе, хотя современные системы также активно используют нейросетевые эмбеддинги.
Важность для SEO
Влияние на SEO низкое (3/10). Патент является инфраструктурным и описывает внутренние механизмы системы поиска по изображению (CBIR). Он не дает прямых рекомендаций для SEO и не раскрывает факторов ранжирования для стандартного поиска изображений по тексту. Однако он критически важен для понимания того, как Яндекс технически идентифицирует уникальность изображений и с высокой точностью обнаруживает дубликаты или незначительно модифицированные версии (кадрированные, сжатые, размытые).
Детальный разбор
Термины и определения
- Визуальное слово (Visual Word)
- Квантованный локальный дескриптор, представляющий собой визуальные характеристики определенной локальной области (патча) на изображении. Является аналогом слова в текстовом поиске.
- Дескриптор (Локальный дескриптор)
- Математическое (векторное) представление визуальных признаков в локальной области изображения. В патенте упоминается SIFT (Scale-Invariant Feature Transform) как пример.
- Композитный параметр визуальных характеристик (КПВХ)
- Ядро изобретения. Набор, включающий как минимум два визуальных слова (дескриптора) из разных областей изображения и параметр соотношения этих областей. Также упоминается как «визуальная фраза».
- Параметр соотношения областей (Relationship Parameter)
- Компонент КПВХ, характеризующий соотношение между двумя областями. Может быть пространственным (геометрическим) или визуальным.
- Пространственное соотношение (Spatial Relationship)
- Геометрическое размещение областей друг относительно друга (например, относительное положение, угол).
- Визуальное соотношение (Visual Relationship)
- Соотношение визуальных характеристик двух областей (например, соотношение контраста, цвета, масштаба).
- Дискриминирующая мощность (Discriminating Power)
- Способность признака (например, КПВХ) точно описывать конкретное изображение и отличать его от других. У КПВХ эта мощность выше, чем у отдельных визуальных слов.
- Список словопозиций (Posting List)
- Список идентификаторов изображений в индексе, которые содержат определенный ключ (в данном случае, КПВХ).
- RANSAC (Random Sample Consensus)
- Метод оценки параметров модели на основе случайных выборок. Упоминается как стандартный метод пространственной проверки (верификации) изображений на этапе пост-обработки.
Ключевые утверждения (Анализ Claims)
Патент защищает три основных аспекта: способ обработки изображения для создания КПВХ, способ создания индекса на основе КПВХ и способ поиска с использованием этого индекса.
Claim 1 (Независимый пункт): Описывает способ обработки изображения.
- Идентификация первой и второй локальных областей изображения.
- Определение первого и второго визуальных слов, связанных с этими областями.
- Определение Композитного параметра визуальных характеристик (КПВХ).
- Ключевой момент: КПВХ содержит оба визуальных слова (дескриптора) И параметр соотношения областей, характеризующий соотношение между двумя соответствующими областями.
- Индексирование изображения осуществляется с помощью этого КПВХ.
Claim 12 (Независимый пункт): Описывает способ создания индекса изображений.
- Определение ключа для индекса. Ключ содержит как минимум часть КПВХ (определенного методом из Claim 1).
- Сохранение индикации изображения в списке словопозиций (Posting List), связанном с этим ключом.
- Суть: создание инвертированного индекса, где ключами выступают составные визуальные признаки (КПВХ), а не отдельные визуальные слова. Зависимые пункты (13-19) уточняют, что ключ может быть полным КПВХ, или только словами, или словами с квантованным параметром соотношения.
Claim 20 (Независимый пункт): Описывает способ обнаружения соответствия (поиск).
- Получение искомого изображения (запроса) и определение его КПВХ.
- Проведение многостадийного поиска:
- Стадия 1 (Выбор кандидатов): Доступ к индексу (созданному по Claim 12) для поиска изображений, имеющих совпадающие КПВХ.
- Стадия 2 (Проверка): Проверка изображений-кандидатов по отношению к искомому изображению с использованием соответствующих локальных дескрипторов (детальная верификация, например, геометрическая).
Где и как применяется
Изобретение применяется в инфраструктуре поиска изображений Яндекса, в частности, в подсистеме, отвечающей за поиск похожих изображений и дубликатов (Content-Based Image Retrieval — CBIR).
INDEXING – Индексирование и извлечение признаков
Это основной этап применения патента. Во время индексации изображений система выполняет обработку:
- Извлечение локальных дескрипторов (визуальных слов).
- Вычисление Композитных параметров визуальных характеристик (КПВХ).
- Построение специализированного инвертированного индекса на основе КПВХ.
RANKING – Ранжирование (Специфично для Поиска по Изображению)
При выполнении запроса типа «Поиск по изображению» система использует этот механизм на этапах Retrieval и Reranking.
- L1 (Retrieval / Поиск кандидатов): Система использует КПВХ искомого изображения для быстрого доступа к индексу и отбора кандидатов. За счет высокой дискриминирующей мощности КПВХ этот этап выполняется эффективнее.
- L2/L3 (Reranking / Проверка): Отобранные кандидаты проходят детальную проверку (например, геометрическую верификацию), чтобы подтвердить сходство и определить точный ранг.
На что влияет
- Конкретные типы контента: Влияет исключительно на обработку графических файлов (изображений).
- Специфические запросы: Влияет на запросы типа «Поиск по изображению» (CBIR) или внутренние процессы дедупликации изображений в индексе. Не влияет на стандартный поиск изображений по текстовому запросу.
- Определенные форматы контента: Система разработана для обнаружения «почти идентичных» копий, включая изображения, которые были: кадрированы, размыты, имеют низкое разрешение, содержат шумы, включены как часть другого изображения или сняты с другого ракурса (другой 3D-ракурс).
Когда применяется
- При индексации: Каждый раз, когда новое изображение обрабатывается для добавления в базу данных поиска по картинкам.
- При поиске: Когда пользователь загружает изображение в качестве запроса для поиска похожих картинок.
- Офлайн-процессы: Механизм может использоваться для дедупликации хранилища изображений в автономном режиме (упоминается возможность выбора репрезентативного изображения из группы почти идентичных для сокращения индекса).
Пошаговый алгоритм
Процесс А: Обработка и Индексирование Изображения
- Получение изображения.
- Идентификация локальных областей: Выбор как минимум двух локальных областей. Выбор может быть случайным или основанным на алгоритме (например, выбор максимально отдаленных или максимально визуально отличающихся областей – Claims 10, 11).
- Вычисление дескрипторов: Определение визуальных слов для каждой выбранной области (например, с помощью SIFT и векторного квантования).
- Вычисление параметра соотношения: Определение пространственного (геометрического) и/или визуального соотношения между этими областями.
- Пространственное: например, угол (φ) между линией, соединяющей центры областей, и горизонталью; угол (θ) между доминантными векторами областей.
- Визуальное: соотношение масштабов, контраста, цвета.
- Генерация КПВХ: Создание Композитного параметра визуальных характеристик путем объединения визуальных слов и параметра соотношения.
- Квантование (для индекса): Компоненты КПВХ могут квантоваться для эффективного использования в качестве ключа индекса.
- Создание индекса: КПВХ (или его часть) используется как ключ в инвертированном индексе. Идентификатор изображения добавляется в список словопозиций этого ключа.
Процесс Б: Поиск по Изображению
- Получение искомого изображения (запроса).
- Анализ запроса: Вычисление КПВХ для искомого изображения (аналогично Процессу А).
- Стадия 1 (Выбор кандидатов): Доступ к индексу с использованием КПВХ запроса. Извлечение списков словопозиций для идентификации изображений-кандидатов, имеющих общие КПВХ.
- Первичное ранжирование (Опционально): Ранжирование кандидатов на основе числа совпадающих КПВХ.
- Стадия 2 (Проверка и Ранжирование): Детальная проверка отобранных кандидатов. Выполняется геометрическая проверка с использованием локальных дескрипторов и их положений (например, RANSAC или Кластеризация с преобразованием Хафа) для подтверждения консистентности признаков. Также может применяться проверка миниатюр (попиксельное сравнение).
- Выдача результатов: Формирование списка похожих изображений, ранжированных по степени релевантности.
Какие данные и как использует
Данные на входе
- Мультимедиа факторы: Основные данные — это пиксельные данные самих изображений. Система анализирует визуальные паттерны, текстуры, градиенты, контраст, цвета и формы в локальных областях изображения для генерации дескрипторов.
Патент не упоминает использование контентных (текстовых), ссылочных, поведенческих, временных или географических факторов в рамках описанного механизма.
Какие метрики используются и как они считаются
- Локальные дескрипторы (Visual Words): Численные представления локальных областей. Вычисляются с помощью алгоритмов типа SIFT и последующего квантования (например, методом к-средних) для сопоставления с визуальным словарем.
- КПВХ (Композитный параметр визуальных характеристик): Составная метрика, объединяющая дескрипторы и их соотношение.
- Метрики пространственного соотношения: Включают геометрические характеристики, такие как:
- Расположение одной ключевой точки относительно другой.
- Угол (φ) между гипотетической горизонтальной линией и линией, проходящей через центральные точки двух локальных областей.
- Угол (θ) между соответственными доминантными векторами двух локальных областей.
- Метрики визуального соотношения: Включают соотношение масштабов, соотношение цвета и соотношение контраста между двумя областями.
- Квантование: Используется для преобразования непрерывных значений в дискретные значения для эффективного использования в качестве ключей индекса.
Выводы
Патент описывает внутренние процессы Яндекс, связанные с инфраструктурой поиска изображений, без прямых рекомендаций для SEO.
- Специализированный индекс для поиска дубликатов: Яндекс разработал эффективный механизм индексации изображений, направленный на быстрое обнаружение идентичных или почти идентичных изображений.
- КПВХ как «Визуальная фраза»: Ключевая инновация — это переход от индексации отдельных «слов» (визуальных признаков) к индексации «фраз» (КПВХ). КПВХ кодирует не только наличие признаков, но и их взаимосвязь (пространственную и визуальную).
- Повышенная эффективность поиска: За счет более высокой дискриминирующей мощности КПВХ позволяют сократить списки кандидатов на ранних этапах поиска, ускоряя общую обработку запроса по изображению.
- Устойчивость к модификациям: Система спроектирована так, чтобы распознавать сходство даже при наличии изменений в изображении (масштабирование, кадрирование, шум, изменение ракурса), благодаря использованию инвариантных дескрипторов и относительных параметров соотношения.
- Ограниченное влияние на SEO: Патент не касается ранжирования в веб-поиске или поиске картинок по тексту. Его основное значение для SEO — это понимание того, насколько продвинуты алгоритмы Яндекса в определении технической уникальности изображений.
Практика
Этот патент скорее инфраструктурный и описывает алгоритмы компьютерного зрения для поиска по сходству. Он не дает практических выводов для стандартных SEO-задач, таких как оптимизация контента или ссылочного профиля.
Best practices (это мы делаем)
- Приоритет уникальности изображений: Патент демонстрирует, что у Яндекса есть высокоточные и эффективные механизмы для обнаружения дубликатов и незначительных модификаций. Для успешного продвижения в Яндекс Картинках критически важно использовать уникальные изображения.
- Создание визуально насыщенного контента: Поскольку система опирается на извлечение локальных дескрипторов и их комбинаций (КПВХ), изображения с четкими деталями, контрастными элементами и определенной структурой могут быть более надежно проиндексированы и распознаны системой.
- Мониторинг использования контента: Технология КПВХ является основой функции «Поиск по изображению». Этот инструмент можно эффективно использовать для поиска копий ваших изображений на других сайтах, так как система хорошо находит даже измененные версии.
Worst practices (это делать не надо)
- Попытки «уникализации» через простые модификации: Незначительное кадрирование, изменение размера, добавление шума, размытие или наложение простого фильтра не сделают изображение уникальным в глазах этой системы. Алгоритм устойчив к таким изменениям и распознает исходное изображение как «почти идентичное».
- Использование стоковых фото без изменений: Система, основанная на КПВХ, легко идентифицирует такие изображения как дубликаты, что может снижать их ценность для поиска.
- Использование изображений очень низкого качества: Хотя система устойчива к низкому разрешению и шумам, слишком низкое качество может помешать надежному извлечению локальных дескрипторов, необходимых для формирования КПВХ.
Стратегическое значение
Патент подтверждает высокий уровень развития технологий компьютерного зрения в Яндексе. Он показывает, что система способна анализировать не только объекты на картинке, но и сложную структуру взаимосвязей между элементами изображения. Для долгосрочной SEO-стратегии это означает, что техническая уникальность визуального контента строго контролируется. Ставка должна делаться на создание собственного качественного визуального контента, а не на манипуляции с чужими изображениями.
Практические примеры
Сценарий: Оптимизация карточек товара в E-commerce
- Задача: Повысить видимость товаров в Яндекс Картинках.
- Неправильное действие: Использовать стандартные фотографии от производителя, которые уже загружены сотнями конкурентов. Система на основе КПВХ мгновенно определит их как дубликаты.
- Правильное действие: Инвестировать в создание собственных уникальных фотографий товара с разных ракурсов, с демонстрацией деталей и сценариев использования.
- Ожидаемый результат: Система идентифицирует эти изображения как уникальный контент. Хотя этот патент сам по себе не гарантирует высокого ранжирования по текстовым запросам, уникальность является необходимым условием для получения трафика из поиска по картинкам.
Вопросы и ответы
Какова основная цель этого патента Яндекса?
Основная цель — повысить эффективность и скорость поиска похожих изображений в большой базе данных. Патент предлагает новый метод индексации с использованием «Композитного параметра визуальных характеристик» (КПВХ). Это позволяет быстрее отбирать кандидатов на сходство и снижает вычислительную нагрузку по сравнению с традиционными методами поиска по картинкам.
Влияет ли этот патент на ранжирование моего сайта в стандартном веб-поиске Яндекса?
Нет, прямого влияния на ранжирование в веб-поиске этот патент не оказывает. Он касается исключительно инфраструктуры и алгоритмов поиска по изображениям (Яндекс Картинки), в частности, механизма «Поиск по изображению» (CBIR) и дедупликации визуального контента. Он не затрагивает текстовые, ссылочные или поведенческие факторы ранжирования.
Что такое КПВХ или «визуальная фраза» простыми словами?
Если представить отдельный элемент картинки (например, угол здания) как «визуальное слово», то КПВХ — это «визуальная фраза». Она описывает как минимум два элемента (например, два угла здания) и их взаимосвязь (например, расстояние между ними и угол, под которым они расположены друг к другу). Индексация «фраз» гораздо точнее, чем индексация отдельных «слов».
Помогает ли эта технология Яндексу понять, что изображено на картинке (например, распознать кошку)?
В первую очередь, эта технология направлена на определение структурного сходства и идентификацию дубликатов, а не на семантическое распознавание объектов (Object Recognition). Она отвечает на вопрос «Видел ли я это изображение раньше или его модификацию?», а не на вопрос «Что это за объект?».
Как это влияет на SEO для изображений (Image SEO)?
Главное влияние заключается в механизме определения уникальности. Патент показывает, что Яндекс обладает сложными алгоритмами для выявления дубликатов и незначительных модификаций изображений. Это подчеркивает критическую важность использования действительно уникального визуального контента для продвижения в Яндекс Картинках.
Можно ли сделать изображение уникальным, если его немного обрезать, изменить размер или наложить фильтр?
Согласно патенту, такие методы уникализации малоэффективны. Система КПВХ разработана с учетом устойчивости к таким изменениям (кадрирование, масштабирование, шум, размытие). Она анализирует относительные взаимосвязи между ключевыми элементами изображения, которые сохраняются даже после таких модификаций, и распознает изображение как «почти идентичное».
Какие типы соотношений анализирует КПВХ?
КПВХ анализирует два основных типа соотношений между локальными областями изображения. Первый — пространственное (геометрическое) соотношение: как области расположены друг относительно друга (например, углы и расстояния). Второй — визуальное соотношение: разница в характеристиках самих областей (например, соотношение их масштабов, контрастности или цвета).
Эта технология использует SIFT или нейросети?
Патент основан на методах классического компьютерного зрения. Он явно упоминает использование локальных дескрипторов типа SIFT, кластеризацию методом к-средних для создания визуального словаря и алгоритмы геометрической верификации RANSAC. Современные глубокие нейросети (Deep Learning) в тексте патента не фигурируют.
Имеет ли значение качество изображения для этой системы?
Да, имеет. Хотя система спроектирована быть устойчивой к шумам и низкому разрешению, для надежной работы ей необходимо извлечь ключевые локальные дескрипторы. На изображениях экстремально низкого качества или с сильными артефактами сжатия система может не найти достаточное количество стабильных признаков для формирования КПВХ.
Какой главный вывод должен сделать SEO-специалист интернет-магазина из этого патента?
Главный вывод — нельзя полагаться на фотографии поставщика, если вы хотите получать трафик из Яндекс Картинок. Система легко определит, что эти фотографии не уникальны и уже присутствуют на сотнях других сайтов. Необходимо инвестировать в создание собственных качественных и уникальных фотографий товаров.