Яндекс патентует механизм для улучшения выдачи в Поиске по Картинкам путем группировки визуально похожих изображений, найденных на одной веб-странице, в «Серии». Эти серии отображаются в выдаче как единый, визуально отличимый блок и ранжируются по релевантности лучшего изображения в группе. Это позволяет пользователям быстрее находить коллекции связанных изображений, такие как пошаговые инструкции или фотогалереи.
Описание
Какую задачу решает
Патент решает проблему неэффективности традиционной выдачи поиска по картинкам, которая представляет собой массив отдельных миниатюр, отсортированных строго по релевантности. Это затрудняет поиск коллекций связанных изображений (например, пошаговых инструкций, разных ракурсов одного объекта или хроники событий), так как связанные картинки могут быть разбросаны по всей SERP. Изобретение призвано улучшить пользовательский опыт, группируя связанные изображения в организованные коллекции.
Что запатентовано
Запатентована система и метод представления результатов поиска по картинкам, где в выдачу интегрируются как отдельные изображения (individual images), так и группы изображений (или «Серии»). Суть изобретения заключается в способе идентификации, ранжирования и отображения этих групп. Группы формируются из изображений, которые являются визуально похожими и расположены на одной веб-странице. Группа ранжируется на основе ранга самого релевантного изображения в ней (highest ranked image) и представляется в виде визуально отличимого блока (visual representation).
Как это работает
Система работает в несколько этапов. На этапе индексации анализируются изображения, извлекаются их характеристики (размер, Color Histogram, HOG). Изображения группируются (присваивается SeriesID) только если они визуально похожи И находятся на одной веб-странице. При получении запроса система ранжирует изображения. На этапе формирования выдачи группы ранжируются по рангу наивысшего ранжированного изображения внутри группы. SERP отображает массив результатов, где группы визуально выделены (например, блок из нескольких миниатюр) и могут предлагать интерактивное взаимодействие без ухода с SERP.
Актуальность для SEO
Высокая. Концепция группировки связанных изображений (Серии/Коллекции) активно используется в современных системах поиска по картинкам, включая Яндекс.Картинки. Хотя конкретные методы определения визуальной схожести, упомянутые в патенте (HOG, гистограммы), возможно, дополнены более современными нейросетевыми подходами, базовая логика группировки по источнику и ранжирования по лучшему элементу остается крайне актуальной и соответствует наблюдаемому поведению поисковой системы.
Важность для SEO
Влияние на SEO значительно (8/10), особенно для Image SEO. Патент демонстрирует механизм, который отдает предпочтение страницам, содержащим богатые коллекции визуально связанных изображений. Создание качественных серий на одной странице может значительно повысить видимость, так как вся группа получает ранг лучшего изображения в ней и занимает больше места на SERP.
Детальный разбор
Термины и определения
- Color Histogram (Цветовая гистограмма)
- Представление количества пикселей в изображении (или его части), попадающих в определенные диапазоны цветов. Используется для определения визуальной схожести.
- Group of Images (Группа изображений / Серия)
- Набор изображений, объединенных по критериям визуальной схожести и нахождения на одной веб-странице.
- Highest Ranked Image (Изображение с наивысшим рангом / Лидирующее изображение)
- Изображение внутри группы, которое поисковая система сочла наиболее релевантным запросу. Ранг этого изображения определяет позицию всей группы в результатах поиска.
- HOG (Histogram of Gradient / Гистограмма градиентов)
- Представление вариаций интенсивности цветов в изображении. Используется для определения структуры и формы объектов и является частью оценки схожести.
- ImageID (Идентификатор изображения)
- Уникальный идентификатор, присваиваемый изображению после анализа. Идентичные изображения, найденные на разных страницах, получают одинаковый ImageID.
- Individual Image (Отдельное изображение)
- Изображение в результатах поиска, которое не является частью группы (либо не соответствует критериям, либо группа была расформирована из-за малого размера).
- SeriesID (Идентификатор Серии/Группы)
- Идентификатор, присваиваемый группе визуально похожих изображений, найденных на одной веб-странице.
- Visual Representation (Визуальное представление)
- Способ отображения группы изображений на SERP. Должен быть визуально отличим от отдельных изображений и включать как минимум одну миниатюру из группы (например, стопка, плитка, ряд миниатюр).
Ключевые утверждения (Анализ Claims)
Патент фокусируется на методе представления и ранжирования групп изображений в поисковой выдаче.
Claim 1 (Независимый пункт): Описывает основной метод предоставления графической информации.
- Получение поискового запроса.
- Выполнение поиска.
- Отправка ранжированных результатов, включающих как минимум одну группу изображений и как минимум одно отдельное изображение. Каждое изображение имеет ранг.
- Отправка инструкций для отображения SERP, включающей отдельные изображения и визуальное представление группы.
- Ключевой момент 1 (Ранжирование): Визуальное представление группы и отдельные изображения отображаются в массиве в соответствии с рангом. При этом группа ранжируется в соответствии с рангом изображения с наивысшим рангом в этой группе.
- Ключевой момент 2 (Отображение): Визуальное представление группы визуально отличимо от отдельных изображений и включает как минимум одно изображение из группы.
Зависимые пункты (Выборка): Детализируют критерии группировки и способы отображения.
Claim 7 и 13: Уточняют критерии формирования группы.
- Изображения в группе являются визуально похожими (Claim 7). (Claims 8-12 уточняют, что схожесть определяется по гистограмме цветов, HOG, преобладающим цветам, размеру и пропорциям).
- Изображения в группе получены с одной веб-страницы (Claim 13).
Claim 18: Уточняет размер группы.
- Группа изображений включает как минимум четыре изображения. (В описании также упоминается возможность порога в 3 изображения).
Claim 26 и 29: Описывают взаимодействие пользователя с группой.
- При выборе пользователем визуального представления группы система показывает расширенную версию группы (expanded version или второе представление) без ухода с SERP (without leaving the SERP).
Где и как применяется
Изобретение затрагивает несколько этапов поисковой архитектуры, преимущественно в вертикали Поиска по изображениям.
CRAWLING & INDEXING (Офлайн-процессы)
Основная работа по идентификации и группировке происходит на этом этапе:
- Извлечение признаков: Система анализирует каждое найденное изображение, вычисляя его характеристики (Сигнатуру): размер, Color Histogram, HOG и преобладающие цвета. В описании патента упоминается разделение изображения на ячейки (например, 3×3) для более точного анализа.
- Идентификация (ImageID): Изображениям присваивается ImageID для дедупликации.
- Группировка (SeriesID): Система анализирует изображения на одной веб-странице. Если они визуально похожи (на основе сравнения сигнатур) и находятся на одной странице, им присваивается общий SeriesID.
RANKING (Ранжирование)
На этапе ранжирования система определяет релевантность отдельных изображений запросу. Ключевой момент патента происходит при сортировке результатов:
- Фильтрация групп: Группы с слишком малым количеством изображений (например, менее 3 или 4) могут быть расформированы, и их изображения рассматриваются как отдельные.
- Определение ранга группы: Ранг группы устанавливается равным рангу ее лидирующего изображения (Highest Ranked Image).
BLENDER & Генерация SERP (Онлайн-процессы)
На этапе формирования выдачи (Image SERP) система компонует результаты:
- Сборка массива: Отдельные изображения и группы (представленные через их Visual Representation) выстраиваются в массив в соответствии с их рангами.
- Формирование представления: Система генерирует специфическое отображение для групп (например, ряд из миниатюр, плитку или стопку), чтобы визуально отличить их. В представление включается лидирующее изображение.
- Интерактивность: Добавляются элементы управления для взаимодействия с группой (например, раскрытие карусели без ухода с SERP).
На что влияет
- Типы контента: Наибольшее влияние оказывается на страницы, содержащие коллекции связанных изображений: фотогалереи, портфолио, пошаговые инструкции (DIY), страницы товаров с несколькими ракурсами, репортажи.
- Специфические запросы: Влияет на информационные и коммерческие запросы, где пользователь заинтересован увидеть вариации или последовательность (например, «как сложить оригами», «интерьер кухни фото»).
- Ниши: Ecommerce, DIY, Кулинария, Новости, Дизайн, Фотография.
Когда применяется
Алгоритм группировки применяется на этапе индексации для всех страниц, содержащих изображения. Механизм ранжирования и специального отображения применяется при генерации выдачи Поиска по Картинкам.
- Условие активации на SERP: Наличие в выдаче группы изображений, которая (1) содержит достаточное количество изображений (порог, упомянутый в патенте, – не менее 3 или 4) и (2) имеет лидирующее изображение с достаточно высоким рангом, чтобы попасть на SERP.
Пошаговый алгоритм
Процесс А: Офлайн-индексация и Группировка
- Сбор данных: Краулеры обходят веб-страницы и находят изображения. Сохраняются миниатюры и метаданные.
- Анализ и Извлечение Признаков: Для каждого изображения вычисляются характеристики (Сигнатура): размер, Color Histogram, HOG, преобладающие цвета. Патент предлагает разделять изображение на ячейки (например, 3×3) и вычислять сигнатуру для каждой ячейки.
- Идентификация: Изображению присваивается ImageID. Система проверяет наличие дубликатов.
- Группировка (Формирование Серий):
- Система анализирует изображения, расположенные на одной веб-странице.
- Сравнение сигнатур изображений для определения визуальной схожести (используя алгоритмы типа Euclidean distance или Manhattan distance, упомянутые в описании).
- Если изображения признаны похожими и находятся на одной странице, им присваивается общий SeriesID.
Процесс Б: Обработка запроса и Генерация SERP
- Получение запроса и Поиск: Система получает запрос и ищет релевантные изображения в базе данных.
- Ранжирование изображений: Каждому релевантному изображению присваивается ранг (оценка релевантности).
- Обработка групп:
- Система идентифицирует группы (SeriesID), содержащие релевантные изображения.
- Фильтрация малых групп: Если группа содержит меньше порогового числа изображений (например, < 4), она расформировывается.
- Определение ранга группы: Для оставшихся групп определяется лидирующее изображение (Highest Ranked Image). Ранг группы приравнивается к рангу этого изображения.
- Сортировка результатов: Отдельные изображения и группы сортируются вместе на основе их рангов.
- Генерация SERP: Система формирует выдачу. Для групп создается Visual Representation (например, ряд из миниатюр).
Какие данные и как использует
Данные на входе
- Контентные/Мультимедиа факторы: Непосредственно данные самого изображения (пиксели) для анализа визуальных характеристик. Размер и пропорции изображения.
- Технические факторы: URL веб-страницы. Критически важный фактор, используемый как критерий источника для группировки.
- Структурные факторы (Метаданные): Метаданные изображения (автор, дата создания, ключевые слова) – используются для определения релевантности (ранга), но не для группировки.
- Географические факторы: Географическое положение, связанное с веб-страницей. Упоминается, что поиск может быть ограничен группами с веб-страниц, географически соответствующих пользователю.
Какие метрики используются и как они считаются
- Сигнатура Изображения (Image Signature): Составная метрика, включающая:
- Color Histogram (Цветовая гистограмма).
- HOG (Гистограмма градиентов).
- Преобладающие цвета.
- Визуальная Схожесть (Visual Similarity): Метрика, определяющая степень похожести двух изображений. Рассчитывается путем сравнения их сигнатур с использованием методов измерения расстояния (Manhattan distance, Euclidean distance). Если расстояние меньше порога, изображения считаются похожими.
- Ранг Изображения (Image Rank): Стандартная оценка релевантности изображения запросу.
- Ранг Группы (Group Rank): Метрика, равная максимальному рангу среди всех изображений, входящих в данную группу (Max(Image Rank)).
Выводы
- Группировка по Источнику и Схожести: Яндекс активно идентифицирует коллекции изображений. Ключевые критерии для попадания в группу (Серию) — это нахождение на одной и той же веб-странице И визуальная схожесть изображений.
- Ранжирование Серий по Лидеру (Halo Effect): Позиция всей группы в поиске по картинкам определяется рангом самого релевантного изображения в этой группе. Одно сильное изображение может «вытянуть» в топ всю коллекцию.
- Визуальные Характеристики Критичны: Для определения схожести используются технические методы анализа изображений (Color Histogram, HOG). Это означает, что изображения в серии должны иметь схожую цветовую гамму, структуру и пропорции.
- Порог по Количеству: Чтобы быть представленной как группа, серия должна содержать минимальное количество изображений (упоминается 3 или 4). Маленькие группы расформировываются.
- Улучшенный UX и Вовлеченность: Группы представлены в выдаче как визуально отличимые блоки и позволяют просматривать коллекцию (например, в виде карусели) без ухода с SERP, что увеличивает время взаимодействия с контентом.
Практика
Best practices (это мы делаем)
- Концентрация серийных изображений на одном URL: Размещайте все связанные изображения (шаги инструкции, разные ракурсы товара, фотографии из одного события) на одной странице. Это необходимое условие для формирования Серии.
- Обеспечение визуальной консистентности: Чтобы система идентифицировала изображения как похожие, они должны быть выполнены в едином стиле, иметь схожую цветовую палитру, освещение и пропорции. Это критично для страниц товаров (одинаковый фон, ракурсы) и пошаговых инструкций (одинаковый стиль оформления).
- Оптимизация «Лидирующего» изображения: Поскольку вся группа ранжируется по лучшему изображению, убедитесь, что хотя бы одно изображение в серии максимально оптимизировано под целевой запрос (метаданные, alt-текст, окружающий текст). Это изображение «вытянет» всю группу в топ.
- Достижение порога по количеству: Стремитесь размещать минимум 4 связанных изображения на странице, чтобы избежать расформирования группы из-за малого размера.
Worst practices (это делать не надо)
- Разделение коллекций по разным URL: Создание отдельной страницы для каждого шага инструкции или для каждого ракурса товара (например, через пагинацию галереи с изменением URL). Это препятствует формированию Серии согласно этому патенту.
- Визуальный разнобой в коллекциях: Использование на одной странице изображений с сильно различающимися стилями, размерами и цветовыми схемами. Система может не признать их визуально похожими.
- Использование только одного изображения на странице: Это исключает возможность формирования группы и получения расширенного визуального представления на SERP.
Стратегическое значение
Патент подчеркивает стремление Яндекса структурировать визуальную информацию и предоставлять пользователям не просто картинки, а визуальные ответы и коллекции. Для SEO это означает, что стратегия работы с изображениями должна быть комплексной. Страницы, предоставляющие исчерпывающий визуальный ответ на запрос пользователя в виде серии качественных и консистентных изображений, получают стратегическое преимущество в Поиске по Картинкам.
Практические примеры
Сценарий 1: Оптимизация страницы товара (Ecommerce)
- Задача: Продвинуть страницу товара «Красное платье XYZ» в поиске по картинкам.
- Действия: Разместить на странице 6 фотографий платья. Все фото сделаны в одном стиле: белый фон, одинаковое освещение, схожие пропорции (визуальная схожесть). Фотографии включают вид спереди, сзади, детали ткани, платье на модели.
- Оптимизация: Фотография «Вид спереди» наиболее оптимизирована под запрос (Alt=»Красное платье XYZ вид спереди»).
- Результат работы системы: Яндекс идентифицирует 6 изображений как визуально похожие и находящиеся на одном URL. Он группирует их в Серию. Если фото «Вид спереди» ранжируется высоко (например, Топ-5), вся Серия отображается на этой позиции в виде блока из нескольких миниатюр.
Сценарий 2: Создание пошаговой инструкции (Контентный проект)
- Задача: Создать инструкцию «Как завязать галстук виндзорским узлом».
- Действия: Создать 8 изображений, иллюстрирующих каждый шаг. Использовать единый стиль инфографики (одинаковые цвета фона, шрифты, стиль рисунка). Разместить все 8 изображений последовательно в теле одной статьи.
- Результат работы системы: Яндекс анализирует HOG и Color Histogram, признает изображения похожими и группирует их в Серию. В выдаче по запросу «как завязать галстук» пользователь видит блок, представляющий эту инструкцию, и может просмотреть ее в карусели прямо на SERP.
Вопросы и ответы
Какие два главных условия для того, чтобы Яндекс сгруппировал изображения в Серию?
Согласно патенту, для формирования группы (Серии) необходимо выполнение двух условий одновременно: во-первых, изображения должны быть расположены на одной и той же веб-странице (единый источник). Во-вторых, изображения должны быть визуально похожими друг на друга, что определяется путем анализа их технических характеристик (цветовая гистограмма, гистограмма градиентов и т.д.).
Как определяется позиция Серии изображений в результатах поиска?
Позиция всей Серии определяется рангом самого релевантного изображения внутри этой группы (Highest Ranked Image). Если хотя бы одно изображение из группы очень релевантно запросу и занимает высокую позицию, вся группа будет показана на этой позиции, эффективно «подтягивая» остальные изображения коллекции в топ выдачи.
Что произойдет, если на странице всего 2 похожих изображения?
В патенте упоминается, что система применяет фильтрацию по количеству изображений в группе. Если группа содержит слишком мало изображений (в описании приводятся примеры порога в 3 или 4 картинки), то группа расформировывается. В этом случае эти 2 изображения будут участвовать в ранжировании как отдельные (Individual Images), а не как Серия.
Как понять, что изображения достаточно «визуально похожи» для группировки?
Схожесть определяется автоматически на основе анализа сигнатур изображений: Color Histogram (распределение цветов) и HOG (структура и формы). Для SEO-специалиста это означает, что изображения должны иметь консистентный стиль: схожую цветовую гамму, одинаковый фон, похожие пропорции и освещение. Например, фотографии товара, сделанные в одной студии, скорее всего, будут признаны похожими.
Влияет ли текст на странице или Alt-атрибуты на группировку изображений?
Нет, согласно этому патенту, текст и метаданные влияют на определение релевантности (ранга) отдельного изображения, но не на сам процесс группировки. Группировка основана исключительно на URL источника и визуальной схожести самих изображений.
Что дает этот механизм для Ecommerce сайтов?
Он дает значительное преимущество страницам товаров с богатыми фотогалереями. Размещение нескольких качественных фотографий товара с разных ракурсов, выполненных в едином стиле, позволяет сформировать Серию. Это увеличивает видимость товара в поиске по картинкам (занимает больше места на SERP) и позволяет пользователю лучше ознакомиться с товаром прямо из выдачи.
Что происходит, когда пользователь кликает на группу изображений на SERP?
Патент описывает механизм взаимодействия, при котором клик на группу вызывает отображение «расширенной версии» (Expanded version) без ухода пользователя с SERP (Claim 26, 29). Это может быть реализовано в виде лайтбокса, карусели или слайдера, позволяющего просмотреть все изображения группы прямо в интерфейсе поисковой системы.
Как этот патент влияет на структуру сайта и пагинацию галерей?
Он стимулирует размещение всех связанных изображений на одном URL. Если галерея реализована через пагинацию, где каждое изображение или небольшая группа изображений получает уникальный URL, система не сможет объединить их в одну большую Серию. Это аргумент в пользу реализации галерей с помощью JavaScript на одной странице или использования «ленивой загрузки».
Может ли одно и то же изображение входить в разные Серии?
Да. Если идентичное изображение (с одинаковым ImageID) размещено на двух разных веб-страницах и на каждой из них оно окружено разными наборами похожих картинок, то оно войдет в две разные Серии (с разными SeriesID), каждая из которых привязана к своему URL.
Насколько актуальны методы определения схожести, описанные в патенте (HOG, гистограммы)?
Эти методы были стандартными на момент подачи патента (2013-2014 гг.). Сегодня поисковые системы, вероятно, используют более продвинутые методы на основе глубокого обучения и векторных представлений (эмбеддингов) для определения семантической и визуальной схожести. Однако это не отменяет самой логики группировки, описанной в патенте, меняется лишь точность определения этой схожести.