
Google использует алгоритм (концептуально называемый VisualRank) для ранжирования изображений и других медиафайлов путем создания «виртуальных ссылок» между ними. Эти ссылки основаны на визуальной схожести контента, данных о кликах пользователей и контексте размещения (URL analysis). Это позволяет оценить качество и авторитетность медиафайлов даже без явных гиперссылок, при этом система активно избегает показа слишком похожих (дублирующихся) результатов.
Патент решает проблему объективной оценки качества и ранжирования объектов, которые не имеют явных гиперссылок (например, изображения, видео, аудиофайлы, товары). Традиционные методы ранжирования изображений часто полагаются на окружающий текст, что может быть неточно и приводить к выдаче низкокачественных или нерелевантных изображений. Изобретение предлагает метод применения алгоритмов анализа ссылок (подобных PageRank) к таким объектам для определения их качества на основе самого контента, контекста и взаимодействия пользователей.
Запатентована система для генерации оценок ранжирования на основе ссылок (link-based ranking scores) для объектов без явных ссылок. Система создает «виртуальные ссылки» (virtual links), которые представляют собой «Вероятности перехода» (Transitional Probabilities) между объектами. Эти вероятности рассчитываются на основе метрик схожести контента (например, визуальных признаков), данных о поведении пользователей (click-data) и анализа связанных документов.
Система функционирует как Марковская сеть, где объекты являются узлами, а виртуальные ссылки — переходами:
Similarity Metric) между парами объектов на основе их контента, либо собираются данные о кликах (click-data).Transitional Probability P(A→B). Ключевой особенностью является использование функции конвертации (Conversion Function), которая штрафует объекты, слишком похожие друг на друга (дубликаты), чтобы избежать избыточности.Quality(A)) и анализа URL/документов (LINKSIM(A,B)).Transitional Probabilities используются как виртуальные ссылки в алгоритме анализа ссылок (концептуально – VisualRank) для определения итоговой оценки качества каждого объекта.Высокая. Ранжирование в поиске по картинкам, видео и товарам является критически важной задачей для Google. Понимание того, как Google оценивает медиафайлы не только по связанному тексту, но и по их визуальным характеристикам, уникальности, контексту размещения и вовлеченности пользователей, имеет ключевое значение. Описанные концепции лежат в основе современных систем медиа-поиска.
Высокое (85/100). Патент имеет критическое значение для специалистов, занимающихся Image SEO, Video SEO и продвижением в E-commerce (Product Search). Он описывает фундаментальный механизм, определяющий «авторитетность» или «качество» медиафайла на основе его визуального содержания, контекста размещения (URL analysis) и того, как пользователи взаимодействуют с ним и похожими объектами. Это напрямую влияет на видимость контента в медиа-вертикалях поиска.
Similarity Metric в Transitional Probability. Она разработана так, чтобы увеличивать вероятность перехода при росте схожести, но резко снижать её после определенного порога (Cutoff Point), чтобы штрафовать дубликаты.Transitional Probabilities — как связи (виртуальные ссылки) между ними.Transitional Probabilities. Концептуально можно назвать VisualRank.Transitional Probabilities.Claim 1 (Независимый пункт): Описывает основной метод ранжирования изображений.
Transitional Probabilities между изображениями (вероятность перехода пользователя от одного к другому).conversion operation), которая связывает меру схожести с конкретным значением вероятности.Transitional Probabilities на основе анализа документов, связанных с изображениями (например, анализ URL-адресов страниц, где размещены изображения).Ranking Scores) для изображений, используя модифицированные вероятности.Claim 4 (Зависимый от 1): Детализирует критически важный механизм функции конвертации.
Операция конвертации включает функцию, значение которой увеличивается до достижения точки отсечения (cutoff point), а затем уменьшается после этой точки. Это реализация интуиции, что пользователи предпочитают похожие изображения, но игнорируют почти идентичные (избыточные) результаты.
Claim 5 (Зависимый от 1): Уточняет механизм модификации вероятностей из Claim 1.
Модификация Transitional Probabilities основана на анализе URL (URL analysis) документов, связанных с изображениями. Это означает, что контекст размещения (например, на одном сайте или на связанных сайтах) влияет на силу виртуальной ссылки (LINKSIM).
Claim 6 (Зависимый от 1): Добавляет еще один фактор модификации.
Модификация Transitional Probabilities также основывается на независимой от запроса мере качества изображений (query-independent measure of quality).
Claim 9 (Зависимый от 1): Описывает альтернативный источник данных для расчета вероятностей.
Определение Transitional Probabilities может быть основано на данных о кликах (click-data), собранных от пользователей.
Claim 11, 15, 29 (Независимые пункты): Обобщают процесс для различных типов объектов (изображения, аудио, видео, книги, товары) и описывают базовый механизм расчета оценки на основе схожести и конвертации.
Изобретение затрагивает несколько этапов поисковой архитектуры, влияя на индексирование, сбор данных и ранжирование медиафайлов.
CRAWLING – Сбор данных (Data Acquisition)
На этом этапе система собирает поведенческие данные (Click-data) из журналов взаимодействия пользователей с поисковой выдачей или другими интерфейсами. Эти данные фиксируют последовательности просмотра объектов.
INDEXING – Индексирование и извлечение признаков
Основная часть предварительных вычислений происходит здесь:
Image Features (гистограммы, SIFT и т.д.).Quality(A) (резкость, насыщенность).LINKSIM(A,B).Ranking Scores могут быть предварительно рассчитаны для всего корпуса объектов или для отдельных категорий (Query-Independent).RANKING – Ранжирование
Алгоритм может применяться на этапе ранжирования двумя способами:
Ranking Scores (VisualRank) в качестве сигнала качества при ранжировании результатов, отобранных по текстовой релевантности.Ranking Scores только для набора объектов, отобранных в ответ на конкретный запрос. Это позволяет получить более точную оценку качества в контексте данного запроса.Входные данные:
Image Features) для каждого объекта.Click-data.Quality(A) и LINKSIM(A,B).Выходные данные:
Ranking Score (VisualRank) для каждого объекта в наборе.Cutoff Point) в Conversion Function. Если сходство превышает порог (например, 0.8 в примере из патента), вероятность перехода резко снижается для борьбы с дубликатами.Процесс А: Расчет Ranking Scores на основе схожести контента
Image Features.Quality(A) и LINKSIM(A,B).Content-based Similarity Metric путем сравнения их признаков.Transitional Probabilities P(A→B).Conversion Function, которая штрафует значения схожести выше порога (Cutoff Point), чтобы снизить вероятность перехода к дубликатам.Quality(A) и LINKSIM(A,B). Патент предлагает формулу: P(A→B)≈Quality(A)⋅LINKSIM(A,B)⋅SIMILARITY(A,B).Transitional Probabilities для расчета итоговых оценок ранжирования. Это делается путем решения Марковской сети (аналогично PageRank), например, путем нахождения главного собственного вектора (dominant eigenvector) матрицы переходов.Ranking Scores используются для упорядочивания объектов при показе пользователю.Процесс Б: Расчет на основе Click-data
Click-data, фиксируя последовательности кликов пользователей.Transitional Probabilities рассчитываются напрямую из Click-data. Например, если после просмотра A пользователи перешли к B в 10% случаев, то P(A→B)=0.10. (Эти вероятности также могут быть модифицированы, как в шаге 5 Процесса А).Image Features: гистограммы интенсивности, цвета, краев, текстуры; вейвлет-анализ; инвариантные признаки, такие как SIFT (Scale-Invariant Feature Transform).Transitional Probabilities.Quality(A)).LINKSIM(A,B).Image Features двух объектов с использованием функций сравнения.Similarity Metric через Conversion Function (с порогом отсечения дубликатов).Click-data.Quality(A) и LINKSIM(A,B).Transitional Probabilities (аналогично расчету PageRank).Transitional Probabilities) являются не только визуальная схожесть или Click-data. Они обязательно модифицируются с учетом технического качества объекта (Quality(A)) и контекста размещения на сайте/в сети (LINKSIM(A,B) / URL Analysis).Conversion Function с точкой отсечения (Cutoff Point) гарантирует, что предпочтение отдается похожим, но различным результатам.Click-data мощным сигналом ранжирования.LINKSIM(A,B). Это подчеркивает важность авторитетности хост-страницы и структуры сайта для Image SEO.Cutoff Point.Quality(A) (резкость, насыщенность) напрямую влияет на Transitional Probability и, следовательно, на итоговый VisualRank.LINKSIM / URL Analysis). Размещайте ключевые изображения на сильных страницах сайта и используйте четкую структуру URL и перелинковку. Изображения на тесно связанных страницах усиливают друг друга.Click-data является источником для расчета виртуальных ссылок, необходимо оптимизировать изображения для получения кликов в поиске (CTR) и стимулировать дальнейшее взаимодействие (например, просмотр связанных изображений в галереях). Последовательности кликов укрепляют виртуальные ссылки.Cutoff Point).Quality(A) и снизит итоговый VisualRank.LINKSIM(A,B).Этот патент подтверждает, что ранжирование медиафайлов — это сложный процесс, выходящий далеко за рамки анализа тегов ALT и окружающего текста. Google активно использует машинное зрение, поведенческие данные и анализ контекста размещения (URL analysis) для определения авторитетности изображений и видео. Стратегия SEO должна включать создание уникального, высококачественного визуального контента, его правильное размещение на сайте и оптимизацию пользовательского опыта.
Сценарий: Ранжирование изображений товара в E-commerce (VisualRank в действии)
Cutoff Point), ослабляя виртуальные ссылки между ними. Уникальные фото достаточно различны, чтобы избежать штрафа.Quality(A)) и размещены на сильных страницах (высокий LINKSIM). Эти факторы значительно усиливают их Transitional Probabilities.Click-data), это дополнительно укрепляет виртуальные ссылки, ведущие к ним.Ranking Score и ранжируются выше в Google Images и Product Search, чем стандартные фото.Что такое VisualRank, упоминаемый в анализе?
VisualRank — это концептуальный термин, используемый для описания изобретения (сам патент называет это Ranking Score). Это аналог PageRank, но для медиафайлов (изображений, видео). Он измеряет качество и авторитетность изображения на основе «виртуальных ссылок» от других похожих изображений.
Как Google определяет, что изображения похожи?
Google использует методы компьютерного зрения для извлечения визуальных признаков (Image Features). В патенте упоминаются гистограммы интенсивности, цвета, краев, текстуры, а также более сложные методы, такие как SIFT (Scale-Invariant Feature Transform). Схожесть определяется путем сравнения этих признаков.
Патент говорит о штрафе за избыточность (Cutoff Point). Значит ли это, что использование дубликатов вредно для SEO?
Да, это один из ключевых выводов. Система использует Conversion Function, которая резко снижает силу виртуальной ссылки, если изображения слишком похожи (выше порога Cutoff Point). Это означает, что система предпочитает разнообразие и может ранжировать почти идентичные изображения ниже, чем похожие, но уникальные варианты.
Влияет ли авторитет моего сайта или страницы на ранжирование изображений?
Да, напрямую. Claim 1 патента требует модификации виртуальных ссылок на основе анализа связанных документов (URL analysis или LINKSIM). Изображения, размещенные на авторитетных, тематически связанных страницах, получают преимущество в ранжировании.
Как поведение пользователей (Click-data) влияет на ранжирование изображений согласно этому патенту?
Click-data может использоваться напрямую для создания виртуальных ссылок. Если пользователи часто переходят от просмотра изображения A к просмотру изображения B в рамках одной сессии, система увеличивает Transitional Probability между ними. Это делает вовлеченность пользователей (CTR и последующие клики) важным фактором ранжирования в медиа-поиске.
Какие технические характеристики изображения важны для этого алгоритма?
Патент упоминает независимые от запроса меры качества Quality(A). К ним относятся резкость (focus), количество цветов и насыщенность (saturation). Изображения с лучшими техническими характеристиками получают преимущество при расчете виртуальных ссылок.
Применяется ли этот алгоритм к видео?
Да. Хотя основной упор в описании сделан на изображения, патент явно указывает (Claims 11, 15, 29), что система может применяться к другим типам объектов, включая аудио, видео, книги и товары. Для видео, вероятно, анализируются ключевые кадры или видео-признаки.
Этот VisualRank рассчитывается в реальном времени или заранее?
Патент описывает оба варианта. Он может быть рассчитан офлайн для всего индекса или для категорий (Query-Independent). Также он может рассчитываться динамически в реальном времени только для набора результатов, соответствующих конкретному запросу (Query-Dependent).
Что важнее для SEO в контексте этого патента: визуальное сходство, качество или контекст размещения?
Все три фактора критичны и перемножаются для определения силы виртуальной ссылки. Визуальное сходство (SIMILARITY) создает базовую связь, но она модифицируется техническим качеством (Quality(A)) и контекстом размещения (LINKSIM(A,B)). Нельзя игнорировать ни один из этих аспектов.
Как я могу использовать эти знания для оптимизации изображений товаров в интернет-магазине?
Ключевая стратегия — отказаться от стандартных фотографий производителя. Создавайте собственные уникальные, технически качественные фотографии с разных ракурсов и размещайте их на оптимизированных карточках товаров. Это позволит избежать штрафа за избыточность (Cutoff Point) и повысить VisualRank за счет качества (Quality(A)) и контекста (LINKSIM).

Мультимедиа
SERP

Мультимедиа
SERP
Семантика и интент

SERP
Поведенческие сигналы

Ссылки
Поведенческие сигналы
Мультимедиа

Поведенческие сигналы
SERP
Мультимедиа

Local SEO
Поведенческие сигналы
Свежесть контента

Персонализация
Ссылки

Семантика и интент
EEAT и качество

Индексация
Поведенческие сигналы
Семантика и интент

Knowledge Graph
Семантика и интент
Персонализация

SERP
Персонализация
Поведенческие сигналы

Структура сайта
SERP
Ссылки

Ссылки
EEAT и качество
Свежесть контента

Семантика и интент
Ссылки
Knowledge Graph

Семантика и интент
Поведенческие сигналы
Персонализация
