Close Menu
    Telegram
    SEO HARDCORE
    • Разборы патентов
      • Патенты Google
      • Патенты Яндекс
    • Скоро
      SEO инструменты
    • Скоро
      SEO аналитика
    SEO HARDCORE
    Разборы патентов • Патенты Яндекс

    Как Яндекс группирует похожие изображения с одной веб-страницы в «Серии» на выдаче Яндекс Картинок

    METHOD AND SYSTEM FOR PRESENTING IMAGE INFORMATION TO A USER OF A CLIENT DEVICE (Метод и система представления графической информации пользователю клиентского устройства)
    • WO2014184785A2
    • Yandex LLC
    • 2014-11-20
    • 2014-05-16
    2014 SERP Вертикальный поиск Индексация Патенты Яндекс Поиск по картинкам

    Яндекс патентует метод улучшения выдачи Яндекс Картинок путем отображения «Серий» (Групп) изображений. Система заранее (офлайн) находит визуально похожие изображения, расположенные на одной и той же веб-странице, и объединяет их в группу. На поисковой выдаче эти группы отображаются как визуально отличимые блоки (например, несколько миниатюр подряд), позволяя пользователю сразу увидеть коллекцию связанных изображений.

    • Описание
    • Детальный разбор
    • Выводы
    • Практика
    • Вопросы и ответы
    • Наверх

    Описание

    Какую задачу решает

    Патент решает проблему разрозненности связанных изображений на странице результатов поиска (SERP) по картинкам. Когда пользователь ищет коллекции (например, пошаговые инструкции, разные ракурсы товара или фоторепортаж), стандартная выдача, сортирующая изображения по индивидуальной релевантности, часто разбрасывает эти связанные картинки по всему SERP. Это ухудшает пользовательский опыт и усложняет поиск. Изобретение улучшает структуру выдачи, объединяя такие изображения в логические блоки.

    Что запатентовано

    Запатентована система и метод представления результатов поиска изображений, которая комбинирует на выдаче отдельные изображения и Группы изображений (Серии). Ключевая особенность изобретения — формирование этих групп заранее (офлайн, до запроса) на основе двух строгих критериев: визуальной схожести и происхождения с одной и той же веб-страницы.

    Как это работает

    Система функционирует в два этапа. Офлайн (Индексация): Система анализирует изображения, вычисляя их визуальные характеристики (Image Signature), такие как гистограммы цветов и градиентов. Если несколько изображений на одном URL признаются похожими, они объединяются в Серию (SeriesID). Онлайн (Поиск): В ответ на запрос система ранжирует как отдельные изображения, так и Серии. Позиция Серии определяется ее самым релевантным изображением (Lead Image). На SERP Серии отображаются с помощью специального Визуального представления (например, ряд миниатюр или стопка), которое отличается от отдельных результатов.

    Актуальность для SEO

    Высокая. Описанный механизм группировки изображений в «Серии» или «Коллекции» активно используется в Яндекс Картинках и других современных поисковых системах. Это важный элемент интерфейса, помогающий структурировать выдачу для таких тематик, как рецепты, товары, DIY и фотогалереи.

    Важность для SEO

    Влияние на Image SEO значительно (7/10). Хотя патент не описывает факторы ранжирования веб-поиска, он определяет структуру выдачи в Яндекс Картинках. Понимание этого механизма критически важно для сайтов, полагающихся на визуальный контент (E-commerce, контент-проекты). Оптимизация страниц под формирование «Серий» позволяет занять больше места на SERP, увеличить заметность и потенциально повысить CTR за счет представления контента в виде коллекции.

    Детальный разбор

    Термины и определения

    Group of Images / Series (Группа изображений / Серия)
    Набор изображений, предварительно объединенных системой. Критерии объединения: визуальная схожесть И нахождение на одной веб-странице.
    Image Signature (Сигнатура изображения)
    Набор вычисленных характеристик изображения, используемый для определения визуальной схожести. В патенте включает Color Histogram (гистограмму цветов), Histogram of Gradient (HOG) (гистограмму градиентов) и Prevailing Colors (преобладающие цвета).
    ImageID (Идентификатор изображения)
    Уникальный идентификатор изображения. Идентичные изображения (дубликаты) на разных страницах имеют одинаковый ImageID.
    SeriesID / GroupID (Идентификатор Серии / Группы)
    Идентификатор, присвоенный группе схожих изображений с одной конкретной страницы. Связывает несколько ImageID.
    Lead Image (Ведущее изображение)
    Изображение в Серии, имеющее наивысший ранг (релевантность) по отношению к запросу. Ранг этого изображения определяет позицию всей Серии на SERP.
    Visual Representation (Визуальное представление)
    Способ отображения Серии на SERP. Это UI-элемент (например, ряд миниатюр, плитка, стопка), который визуально отличается от отображения отдельных изображений.
    Expanded Version (Расширенная версия)
    Интерактивный просмотрщик изображений Серии, который открывается при клике пользователя, не покидая страницу SERP.

    Ключевые утверждения (Анализ Claims)

    Патент фокусируется на методе представления предварительно сгруппированных изображений в интерфейсе поиска.

    Claim 1 (Независимый пункт): Описывает основной метод работы системы.

    1. Сервер получает поисковый запрос.
    2. Сервер выполняет поиск.
    3. Сервер отправляет результаты, включающие (а) Группу изображений (Серию) и (б) как минимум одно другое изображение.
    4. Критически важно: Группа выбирается из множества групп, сохраненных на сервере ДО получения поискового запроса. Это подтверждает офлайн-природу группировки.
    5. Сервер отправляет инструкции для отображения SERP, где другое изображение и Визуальное представление группы отображаются в массиве (array).
    6. Ключевое условие: Визуальное представление группы визуально отличимо (visually distinguishable) от другого изображения.

    Зависимые пункты (Уточнения механизма):

    • Claim 2 и 16: Группы состоят из похожих (similar) или визуально похожих (visually similar) изображений.
    • Claim 22: Ключевое ограничение – изображения в группе происходят с одной веб-страницы (single web page).
    • Claim 17-21: Уточняют, что схожесть определяется на основе Color Histogram, HOG, преобладающих цветов, размера и пропорций.
    • Claim 34: Изображения в группе ранжированы, и в визуальном представлении используется изображение с наивысшим рангом (highest rank).
    • Claim 36: Описывает интерактивность. При выборе группы пользователем отображается расширенная версия (expanded version) без ухода с SERP (without leaving the SERP).

    Где и как применяется

    Изобретение применяется в вертикали поиска по изображениям (Яндекс Картинки) и затрагивает несколько этапов поисковой архитектуры.

    CRAWLING и INDEXING (Офлайн-процессы)

    Основная логика группировки происходит на этих этапах, до запроса пользователя.

    • Сбор и Анализ: Краулеры собирают изображения и их URL. Система вычисляет Image Signature (Color Histogram, HOG, Prevailing Colors) для каждого изображения.
    • Идентификация: Присвоение ImageID (дедупликация).
    • Группировка (Формирование Серий): Система сравнивает Image Signatures изображений, находящихся на одной и той же веб-странице. Если визуальная схожесть превышает порог, изображениям присваивается общий SeriesID.

    RANKING (Онлайн-процесс)

    • Определение релевантности: Вычисляется релевантность для отдельных изображений.
    • Ранжирование Серий: Внутри каждой Серии определяется Lead Image (изображение с наивысшим рангом). Вся Серия занимает позицию в выдаче, соответствующую рангу этого ведущего изображения.
    • Фильтрация: Серии слишком малого размера (в описании патента упоминаются пороги в 2 или 4 изображения) могут быть расформированы и показаны как отдельные картинки.

    BLENDER / Генерация SERP (Онлайн-процесс)

    Формирование финального вида страницы Яндекс Картинок.

    • Компоновка выдачи: Система собирает массив из отдельных изображений и Серий.
    • Отображение Серий: Для Серий генерируется специальное Visual Representation (например, ряд из нескольких миниатюр, баннер с информацией об источнике, счетчик количества), чтобы визуально отличить их от других результатов.

    На что влияет

    • Вертикаль поиска: Влияет исключительно на поиск по изображениям (Яндекс Картинки).
    • Типы контента и Ниши: Критически важно для тематик, где пользователи ищут коллекции: E-commerce (галереи товаров), Рецепты (пошаговые фото), Туториалы (DIY), Дизайн интерьеров, Портфолио, Фотоотчеты.

    Когда применяется

    Группировка применяется постоянно на этапе индексации. Отображение Серий на SERP происходит, если в результатах поиска есть релевантные группы, удовлетворяющие пороговым значениям (визуальная схожесть и минимальное количество изображений).

    Пошаговый алгоритм

    Процесс А: Офлайн-индексация и группировка

    1. Сбор данных: Краулер находит изображения на веб-странице и сохраняет их URL.
    2. Анализ изображения: Система вычисляет Image Signature (Color Histogram, HOG, Prevailing Colors).
    3. Присвоение ImageID: Дедупликация изображений.
    4. Анализ страницы источника: Система идентифицирует все изображения на данном URL.
    5. Определение схожести: Сравнение Image Signatures изображений на странице с использованием алгоритмов измерения расстояния (например, Euclidean distance или Manhattan distance, упомянутые в патенте).
    6. Формирование Серии: Изображения, признанные похожими и находящиеся на одной странице, объединяются в группу и получают SeriesID.

    Процесс Б: Обработка запроса и генерация SERP

    1. Получение запроса и Поиск: Извлечение релевантных изображений и Серий из индекса.
    2. Фильтрация Серий: Проверка размера Серий. Маленькие Серии (например, < 4 изображений) расформировываются.
    3. Ранжирование: Определение Lead Image для каждой Серии. Сортировка всех результатов (отдельных изображений и Серий) по релевантности.
    4. Генерация SERP: Формирование сетки выдачи. Для Серий создается специальное Visual Representation (например, выборка топ-миниатюр).
    5. Отправка клиенту: Передача результатов и инструкций по отображению и интерактивности (например, разворачивание Серии на SERP).

    Какие данные и как использует

    Данные на входе

    • Технические факторы (Источник): URL веб-страницы. Это критически важный фактор, так как он определяет границы, внутри которых может происходить группировка.
    • Мультимедиа факторы (Пиксельные данные): Сами изображения, используемые для анализа визуальных характеристик. Размер и пропорции изображения.
    • Контентные факторы (Метаданные): Ключевые слова, связанные с изображением (метаданные, текст на странице). Используются для определения релевантности на этапе поиска, но не для группировки.
    • Географические факторы: В патенте упоминается сохранение географического положения веб-страницы, которое может использоваться для фильтрации результатов.

    Какие метрики используются и как они считаются

    • Image Signature (Сигнатура изображения): Комплексная метрика, описывающая визуальное содержание. Рассчитывается путем анализа изображения (часто разделенного на ячейки). Включает:
      • Color Histogram: Распределение цветов.
      • Histogram of Gradient (HOG): Анализ текстур и форм.
      • Prevailing Colors: Основные цвета.
    • Визуальная Схожесть (Visual Similarity): Метрика, определяющая похожесть двух изображений. Рассчитывается путем сравнения Image Signatures с использованием алгоритмов измерения расстояния (в патенте упомянуты Manhattan distance и Euclidean distance).
    • Пороговые значения (Thresholds):
      • Порог схожести: Необходимый уровень совпадения сигнатур для признания изображений схожими.
      • Минимальный размер группы: Количество изображений, необходимое для отображения Серии как группы (упоминаются пороги в 2 или 4 изображения).

    Выводы

    1. Двойное условие для Серий: Ключевой вывод — для формирования Серии изображения должны быть одновременно (1) Визуально схожими (на основе анализа Image Signature) И (2) Расположенными на одной и той же веб-странице. Схожие изображения с разных URL сгруппированы этим механизмом не будут.
    2. Группировка происходит офлайн: Яндекс анализирует и группирует изображения на этапе индексации, а не в реальном времени при запросе пользователя, что обеспечивает скорость работы.
    3. Ранжирование по лучшему элементу (Lead Image): Позиция всей Серии в выдаче определяется рангом наиболее релевантного изображения в этой группе. Это подчеркивает важность оптимизации ключевых изображений.
    4. Визуальное преимущество в SERP: Серии занимают больше места и визуально выделяются (Visual Representation), что может повышать их CTR в поиске по картинкам по сравнению с отдельными изображениями.
    5. Требования к количеству: Существует минимальный порог количества изображений для формирования Серии (вероятно, 3 или 4). Маленькие группы могут быть расформированы.

    Практика

    Best practices (это мы делаем)

    Рекомендации направлены на максимизацию шансов попадания контента в «Серии» Яндекс Картинок.

    • Размещение коллекций на одном URL: Для контента, который подразумевает серию (товары, рецепты, туториалы, портфолио), размещайте все связанные изображения на одной веб-странице. Это необходимое условие для группировки.
    • Обеспечение визуальной консистентности: Используйте единый стиль съемки, фон, освещение и пропорции для изображений, которые вы хотите сгруппировать. Это поможет алгоритмам (HOG, Color Histogram) распознать их как визуально похожие.
    • Достаточное количество изображений: Стремитесь предоставить минимум 4 связанных изображения на странице, чтобы преодолеть порог фильтрации и обеспечить формирование Серии.
    • Оптимизация Lead Image: Определите главное изображение в серии (например, основной ракурс товара) и максимально оптимизируйте его (релевантные alt-тексты, заголовок). Высокий ранг этого изображения определит позицию всей Серии.

    Worst practices (это делать не надо)

    • Разделение галереи на несколько страниц (Пагинация): Если каждый шаг рецепта или каждая фотография товара находится на отдельном URL, система не сможет объединить их в Серию, так как нарушается условие единого источника (одна веб-страница).
    • Разнородный визуальный стиль: Использование на одной странице фотографий одного объекта, снятых в кардинально разных стилях, размерах и с разным освещением, помешает системе идентифицировать их как визуально похожие.
    • Использование только 1-2 изображений: Размещение недостаточного количества фотографий не позволит сформировать Серию.

    Стратегическое значение

    Патент подтверждает, что Яндекс в поиске по картинкам ценит структуру подачи визуального контента на сайте. Система вознаграждает страницы, предлагающие богатый визуальный контент в рамках одного URL. Для SEO-специалистов в конкурентных нишах (особенно E-commerce и контентные проекты) оптимизация под «Серии» является важной стратегией для увеличения заметности в Яндекс Картинках и привлечения целевого трафика за счет более крупных и информативных блоков в выдаче.

    Практические примеры

    Сценарий 1: Оптимизация карточки товара E-commerce

    1. Задача: Увеличить видимость товара «Красное кресло Модель X» в Яндекс Картинках.
    2. Действия SEO:
      • Разместить на странице товара 6 фотографий кресла (разные ракурсы, детали).
      • Все фотографии выполнить в едином стиле (например, на белом фоне, с одинаковым освещением), чтобы максимизировать визуальную схожесть.
      • Оптимизировать главную фотографию (Lead Image) под основной запрос.
    3. Ожидаемый результат: Яндекс индексирует страницу, определяет схожесть изображений и общий URL. Формируется SeriesID. При поиске «красное кресло» товар отображается в Яндекс Картинках не как одна миниатюра, а как блок «Серия» (например, 3 миниатюры подряд) с указанием количества фото, что увеличивает CTR.

    Сценарий 2: Оптимизация страницы DIY-инструкции

    1. Задача: Привлечь трафик на инструкцию «Как сделать оригами журавлика».
    2. Действия SEO:
      • Создать одну длинную страницу с пошаговой инструкцией, включающей 15 фотографий каждого этапа.
      • Обеспечить схожесть условий съемки (один и тот же фон, освещение).
    3. Ожидаемый результат: Яндекс объединяет эти фото в Серию. Пользователь видит на SERP блок, показывающий шаги процесса, и с большей вероятностью кликнет на него, так как понимает, что это полноценная инструкция.

    Вопросы и ответы

    Какие два главных условия для того, чтобы Яндекс объединил изображения в Серию (Group)?

    Согласно патенту, для формирования Серии необходимо одновременное выполнение двух условий: (1) Изображения должны быть визуально схожими (Visual Similarity), что определяется путем сравнения их Image Signatures (HOG, Color Histogram). (2) Изображения должны находиться на одной и той же веб-странице (Single Web Page). Если изображения похожи, но находятся на разных URL, они не будут объединены в Серию.

    Сколько минимум изображений должно быть в Серии, чтобы она отображалась как группа на SERP?

    В патенте упоминается механизм фильтрации малых групп. Указано, что если группа содержит только одно или два изображения, она может быть расформирована. В альтернативном варианте (Claim 27) упоминается порог в «не менее четырех изображений». Для надежного срабатывания механизма Серий рекомендуется использовать минимум 3-4 схожих изображения на странице.

    Как определяется позиция Серии изображений в результатах поиска?

    Позиция всей Серии определяется рангом самого релевантного изображения внутри этой группы, которое называется Ведущим изображением (Lead Image). Если хотя бы одно изображение в серии имеет высокий фактор релевантности, оно вытянет всю группу на более высокую позицию в выдаче Яндекс Картинок.

    Что такое Image Signature и как она используется?

    Image Signature — это набор вычисленных характеристик изображения, используемый для определения визуальной схожести. В патенте она включает три основных компонента: Color Histogram (распределение цветов), HOG (Histogram of Gradient — структура и формы) и Prevailing Colors (преобладающие цвета). Система сравнивает сигнатуры изображений с одной страницы, чтобы решить, нужно ли их группировать.

    Как SEO-специалист может повлиять на то, чтобы изображения были признаны «визуально схожими»?

    Нужно создавать контент, который естественно содержит схожие изображения. Это подразумевает использование единого стиля оформления, схожего фона, одинакового освещения или съемку одного и того же объекта с разных ракурсов (например, в товарных галереях или пошаговых инструкциях). Чем больше схожесть в цветах, формах и структуре, тем выше вероятность группировки.

    Влияет ли этот патент на обычный текстовый поиск Яндекса?

    Нет, этот патент описывает методы и системы, специфичные для поиска по изображениям (Image Search). Он влияет на то, как формируется выдача в Яндекс Картинках, а не на ранжирование документов в основном веб-поиске, хотя успешная оптимизация под Серии может увеличить общий трафик на сайт из вертикали картинок.

    Стоит ли разбивать фотогалерею на несколько страниц (пагинация)?

    С точки зрения этого патента, это плохая практика. Поскольку одним из условий формирования Серии является нахождение изображений на одной веб-странице, разбивка галереи на разные URL (например, при пагинации с изменением URL) предотвратит их группировку в единую Серию. Лучше разместить всю коллекцию на одном URL.

    Что происходит, когда пользователь кликает на Серию изображений в выдаче?

    Патент (Claim 36) описывает механизм, при котором клик на Визуальное представление группы вызывает отображение расширенной версии (Expanded Version) без покидания страницы результатов поиска (without leaving the SERP). Это может быть оверлей или встроенный просмотрщик, позволяющий листать изображения Серии и получать дополнительную информацию о них.

    Использует ли система текстовые метаданные (alt, title) для группировки изображений?

    Нет. Для процесса группировки (формирования SeriesID) система использует исключительно визуальные характеристики (Image Signature) и URL источника. Текстовые метаданные используются на этапе ранжирования для определения релевантности изображений запросу, но не для определения их визуальной схожести.

    В чем разница между ImageID и SeriesID?

    ImageID – это идентификатор уникального изображения (файла). Если одно и то же изображение размещено на 10 разных сайтах, у него будет один ImageID. SeriesID – это идентификатор группы похожих изображений, найденных на конкретной одной странице. К одному SeriesID привязано несколько разных ImageID, найденных на этом URL.

    Навигация
    • Описание
    • Детальный разбор
    • Выводы
    • Практика
    • Вопросы и ответы
    • Наверх
    Telegram
    © 2025 SEO HARDCORE

    Type above and press Enter to search. Press Esc to cancel.