Google использует этот механизм для выбора наиболее качественной и авторитетной веб-страницы в качестве целевой (Landing Page) для результатов поиска по картинкам. Если изображение или его близкие копии присутствуют на нескольких сайтах, система определяет страницу с наивысшей оценкой важности (Web Score) и направляет пользователя именно на нее. Также учитываются характеристики размещения изображения на странице.
Описание
Какую задачу решает
Патент решает проблему выбора оптимальной целевой страницы (Landing Page) в результатах поиска по изображениям. Поскольку одно и то же изображение или его визуально похожие варианты (Similar Images, близкие дубликаты) часто размещаются на множестве веб-страниц разного качества, система должна определить наилучший источник. Цель — направить пользователя на страницу наивысшего качества или наибольшей важности, где изображение представлено в наилучшем контексте.
Что запатентовано
Запатентована система и метод для идентификации канонической целевой страницы для изображения или группы похожих изображений. Суть изобретения заключается в использовании оценки качества или важности веб-страницы (Web Score), генерируемой алгоритмом ранжирования, для определения того, какой из множества сайтов, содержащих изображение, должен быть использован в качестве источника в Google Image Search.
Как это работает
Система группирует похожие изображения и сравнивает качество страниц, на которых они размещены. Патент описывает два основных варианта реализации:
- Вариант 1 (Двухэтапный отбор, Claim 1): Сначала для каждого отдельного экземпляра изображения выбирается лучшая страница, на которой он размещен (по Web Score). Затем эти страницы-победители сравниваются между собой в рамках группы похожих изображений, и выбирается абсолютный лидер.
- Вариант 2 (Прямой отбор, описан в Description): Все страницы, содержащие любую версию изображения из группы похожих изображений, сразу сравниваются между собой, и выбирается страница с наивысшим Web Score.
В обоих случаях страница-победитель становится Landing Page. Также могут учитываться дополнительные сигналы (Web Page Features), такие как размер изображения и его позиция на странице.
Актуальность для SEO
Высокая. Поиск по изображениям (Google Image Search) является важным источником трафика. Выбор качественного и авторитетного источника контента остается ключевым приоритетом для Google. Этот механизм напрямую определяет, как Google атрибутирует визуальный контент и куда направляет пользователей, что делает его крайне актуальным для SEO.
Важность для SEO
Патент имеет значительное влияние на SEO (75/100). Он напрямую определяет, какой сайт получит клик из результатов поиска по картинкам. Это подчеркивает, что для успеха в Google Image Search критически важно, чтобы страница, на которой размещено изображение, обладала высоким качеством, авторитетностью (высоким Web Score) и обеспечивала оптимальный контекст и презентацию изображения.
Детальный разбор
Термины и определения
- Landing Page (Целевая страница)
- Веб-страница, на которую перенаправляется пользователь после клика по результату поиска изображений. Цель патента — выбрать наилучшую Landing Page среди всех кандидатов.
- Web Score (Оценка веб-страницы)
- Метрика, генерируемая алгоритмом ранжирования, которая является мерой важности (importance) веб-страницы относительно других веб-страниц. Может быть независимой от запроса (например, авторитетность) или зависимой от запроса (оценка релевантности).
- Similar Images (Похожие изображения)
- Набор изображений, которые считаются визуально похожими. В контексте патента это означает разные изображения, производные от одного и того же исходного изображения (Source Image), например, путем обрезки, изменения размера, цветокоррекции (near-duplicates).
- Web Page Features (Характеристики веб-страницы)
- Дополнительные сигналы, которые могут учитываться при выборе Landing Page. Примеры: размер изображения, соотношение сторон, позиция изображения на странице, количество изображений на странице, текстовый контент страницы.
Ключевые утверждения (Анализ Claims)
Патент описывает два основных варианта реализации. Claim 1 описывает первый, двухэтапный вариант.
Claim 1 (Независимый пункт): Описывает метод идентификации целевых страниц (Вариант 1).
Этап 1: Предварительный отбор.
- Для каждого изображения из множества:
- Идентифицируются веб-страницы, содержащие это конкретное изображение (точный дубликат).
- Для каждой страницы получается Web Score.
- Выбирается страница с наивысшим Web Score для этого конкретного изображения.
Этап 2: Финальный выбор.
- Определяются наборы похожих изображений (Similar Images) только среди тех изображений, для которых были выбраны страницы на Этапе 1.
- Для каждого набора Similar Images:
- Выбирается Landing Page. Эта страница является той выбранной ранее страницей (из Этапа 1), которая имеет наивысший Web Score по сравнению с другими выбранными страницами в этом же наборе.
Система сначала находит лучшую страницу для каждого отдельного файла изображения, а затем группирует похожие файлы и выбирает лучшую страницу среди победителей первого этапа.
Claim 4 (Зависимый): Уточняет, что Web Score может основываться на мере релевантности веб-страницы запросу. В этом случае выбор Landing Page зависит от конкретного запроса.
Claim 5 (Зависимый): Вводит дополнительные факторы. Выбор Landing Page может дополнительно основываться на Web Page Features.
Claims 6-10 (Зависимые от 5): Детализируют эти характеристики:
- Claim 6: Размер изображения (image size).
- Claim 7: Соотношение сторон изображения (image aspect ratio).
- Claim 8: Позиция изображения на странице (position on the web page).
- Claim 9: Общее количество изображений на странице (number of images).
- Claim 10: Текстовый контент страницы (textual content).
Где и как применяется
Изобретение затрагивает этапы индексирования и ранжирования в контексте системы поиска по изображениям (Image Search System).
INDEXING – Индексирование и извлечение признаков
Это ключевой этап для подготовки данных:
- Обработка изображений: Система анализирует изображения для выявления дубликатов и определения наборов Similar Images.
- Извлечение признаков страницы: Для веб-страниц рассчитываются и сохраняются Web Scores.
- Извлечение контекста размещения: Извлекаются и индексируются Web Page Features — размер изображения на странице, его позиция и т.д.
- Ассоциация данных: В индексе изображений (Image Index) сохраняются связи между изображениями, страницами и характеристиками этих страниц. Логика выбора Landing Page может применяться уже на этом этапе, если Web Score не зависит от запроса.
RANKING – Ранжирование (в Image Search)
Во время обработки запроса система идентифицирует релевантные изображения. Для каждого набора Similar Images определяется Landing Page. Если Web Score зависит от запроса (Claim 4), окончательный выбор Landing Page происходит на этом этапе в реальном времени.
Входные данные:
- Изображения и веб-страницы, на которых они размещены.
- Web Scores для каждой веб-страницы.
- Web Page Features (размер, позиция и т.д.).
- (Опционально) Поисковый запрос.
Выходные данные:
- Ассоциация между набором Similar Images и одной выбранной Landing Page.
На что влияет
- Конкретные типы контента: Наибольшее влияние оказывается на контент, который часто дублируется: стоковые фотографии, изображения товаров в E-commerce, новостные фотографии, инфографика.
- Специфические запросы: Влияет на все типы запросов. Если Web Score зависит от запроса (Claim 4), выбор Landing Page может меняться. Например, для запроса «история Чикаго» предпочтение будет отдано историческому сайту, а для запроса «рестораны Чикаго» — сайту о развлечениях, даже если оба используют одну и ту же фотографию горизонта Чикаго.
Когда применяется
Алгоритм применяется каждый раз, когда система поиска по изображениям формирует выдачу и должна принять решение о том, какую целевую страницу ассоциировать с изображением, которое существует на двух или более веб-страницах.
Пошаговый алгоритм
В патенте описаны два основных варианта. Ниже представлен разбор Варианта 1 (согласно Claim 1) и Варианта 2 (согласно Description).
Алгоритм 1 (Двухэтапный отбор, Claim 1)
- Этап 1: Выбор лучшей страницы для каждого экземпляра
- Идентификация и Оценка: Для каждого уникального файла изображения система идентифицирует все веб-страницы, которые его содержат, и получает их Web Scores.
- Локальный выбор: Система выбирает веб-страницу с максимальным Web Score для данного файла.
- Этап 2: Выбор лучшей страницы для группы схожих изображений
- Группировка: Система формирует наборы Similar Images из изображений, прошедших Этап 1.
- Сравнение победителей: Для каждого набора сравниваются Web Scores страниц, выбранных на Этапе 1c.
- Финальный выбор: Страница с наивысшим Web Score выбирается в качестве Landing Page для всего набора. При этом могут учитываться Web Page Features.
Алгоритм 2 (Прямой отбор, Description)
- Группировка: Система формирует наборы Similar Images.
- Идентификация пула страниц: Для каждого набора идентифицируются *все* веб-страницы, содержащие *любое* изображение из этого набора.
- Оценка и Выбор: Система получает Web Scores для всех страниц в пуле и выбирает страницу с наивысшим баллом как Landing Page для всего набора.
Какие данные и как использует
Данные на входе
Система использует комбинацию данных, относящихся к изображениям и веб-страницам.
- Мультимедиа факторы:
- Сами изображения (для анализа визуальной схожести).
- Размер изображения (Image Size) на странице (Claim 6).
- Соотношение сторон изображения (Image Aspect Ratio) (Claim 7).
- Структурные факторы:
- Позиция изображения на веб-странице (Position on the web page) (Claim 8).
- Общее количество изображений на странице (Number of images) (Claim 9).
- Контентные факторы:
- Текстовый контент страницы (Textual content) (Claim 10).
- Сигналы Ранжирования (Внешние):
- Web Score страницы (мера важности или релевантности).
Какие метрики используются и как они считаются
Ключевой метрикой является Web Score.
- Web Score: Мера важности веб-страницы. Патент не определяет формулу расчета, но указывает, что он генерируется алгоритмом ранжирования. Упоминаются два типа:
- Query-Independent: Общая мера авторитетности или качества страницы.
- Query-Dependent: Мера релевантности страницы конкретному поисковому запросу (Claim 4).
- Similarity Threshold (Порог схожести): Метрика для определения того, являются ли изображения Similar Images.
- Агрегация оценок: Система использует Web Score как основной фактор выбора, но может использовать Web Page Features в качестве дополнительных критериев. Например, предпочтение может отдаваться странице, где изображение крупнее или расположено выше, при прочих равных Web Scores.
Выводы
- Качество и авторитетность страницы критичны для Image SEO: Основной вывод — трафик из поиска по изображениям направляется на страницу с наивысшим Web Score. Общая авторитетность, качество и релевантность веб-страницы (сигналы из основного веб-поиска) напрямую определяют ее успех в поиске по картинкам.
- Google стремится найти лучший контекст, а не обязательно первоисточник: Механизм направлен на идентификацию наиболее авторитетного или релевантного ресурса, использующего изображение, даже если этот ресурс не является создателем изображения.
- Контекст и размещение изображения имеют значение (Web Page Features): Патент явно подтверждает (Claims 5-10), что размер изображения, его видимость (позиция на странице) и окружающий текст влияют на выбор Landing Page. Изображение должно быть важной частью контента страницы.
- Релевантность запросу может переопределить авторитетность: Если Web Score зависит от запроса (Claim 4), то менее авторитетная, но более релевантная страница может быть выбрана в качестве Landing Page для конкретного интента.
- Консолидация дубликатов: Система агрессивно группирует похожие изображения (дубликаты и близкие варианты) и назначает им единую, лучшую Landing Page.
Практика
Best practices (это мы делаем)
- Размещать ключевые изображения на сильных страницах: Убедитесь, что важные изображения размещены на страницах, которые имеют высокий авторитет (Web Score) или хорошо оптимизированы под целевые запросы. Не размещайте важный визуальный контент на «слабых» страницах.
- Оптимизировать контекст и релевантность страницы: Текстовый контент страницы должен быть качественным и релевантным изображению. Это повышает Web Score (особенно зависимый от запроса) и улучшает контекст (Claim 10).
- Использовать крупные и заметные изображения: Поскольку размер (Claim 6) и позиция (Claim 8) изображения учитываются, следует размещать ключевые изображения на видном месте (ближе к началу страницы) и в достаточно крупном размере.
- Создавать оригинальный визуальный контент: Для оригинальных изображений ваш сайт с большей вероятностью будет иметь наивысший Web Score. Если другие сайты скопируют ваше изображение, этот механизм будет продолжать направлять трафик на ваш сайт (при условии достаточного Web Score вашей страницы).
- Оптимизация E-commerce: Для изображений товаров убедитесь, что карточка товара (PDP) является наиболее авторитетной и релевантной страницей по сравнению со страницами категорий или блога, чтобы именно она выбиралась в качестве Landing Page.
Worst practices (это делать не надо)
- Использование популярных изображений на низкокачественных страницах: Если вы используете изображение, которое уже размещено на более авторитетных сайтах, вероятность того, что ваша страница будет выбрана в качестве Landing Page, минимальна.
- Размещение важных изображений в «подвале» или маленького размера: Это снижает значимость Web Page Features (размер, позиция) и может привести к выбору другой Landing Page, даже если ваш Web Score конкурентоспособен.
- Массовое копирование чужих изображений (Image Aggregation): Стратегии, основанные на агрегации чужих изображений на страницах с низким качеством контента, неэффективны. Механизм патента направляет трафик к источникам с более высоким Web Score.
- Игнорирование качества страницы: Фокус только на оптимизации Alt-текста и имени файла изображения недостаточен. Без сильной Landing Page эти усилия не принесут результата в виде трафика из Image Search.
Стратегическое значение
Патент демонстрирует глубокую интеграцию сигналов ранжирования веб-поиска (Web Score) в поиск по изображениям. Это подтверждает стратегическую важность комплексного подхода к SEO: авторитетность и качество контента (E-E-A-T) влияют на видимость во всех вертикалях, включая Google Images. Долгосрочная стратегия должна фокусироваться на создании оригинального контента и размещении его на авторитетных, хорошо структурированных страницах, где изображения играют центральную роль и представлены оптимальным образом.
Практические примеры
Сценарий 1: Изображение товара (E-commerce)
Фотография нового смартфона размещена на трех страницах:
- Официальная карточка товара на сайте производителя (Высокий авторитет).
- Детальный обзор на авторитетном техническом портале (Очень высокий авторитет).
- Низкокачественный аффилиатный сайт (Низкий авторитет).
Применение: Google сравнивает Web Scores этих трех страниц.
Результат (Общий запрос): Страница технического портала (2), скорее всего, будет выбрана в качестве Landing Page из-за наивысшего Web Score. Аффилиатный сайт (3) игнорируется.
Результат (Специфический запрос): Если пользователь ищет «обзор смартфона», Web Score страницы (2) может быть еще выше из-за релевантности запросу. Если ищет «купить смартфон», Web Score страницы (1) может стать выше, и она будет выбрана в качестве Landing Page.
Сценарий 2: Влияние размера изображения (Web Page Features)
Два сайта (А и Б) имеют схожий Web Score и используют одну и ту же инфографику.
- Сайт А: Разместил инфографику в полном размере в центре статьи.
- Сайт Б: Разместил уменьшенную версию (thumbnail) в боковой колонке.
Применение: Google сравнивает Web Scores и Web Page Features (в частности, размер и позицию).
Результат: Сайт А будет выбран в качестве Landing Page, так как он лучше представляет изображение пользователю (Claims 6 и 8).
Вопросы и ответы
Что такое Web Score в контексте этого патента?
Web Score — это метрика, определяющая важность или качество веб-страницы, генерируемая алгоритмом ранжирования. Она может быть независимой от запроса (например, общая авторитетность страницы) или зависимой от запроса (насколько страница релевантна конкретному запросу). Это основной фактор, который Google использует для выбора лучшей целевой страницы среди всех страниц, содержащих изображение.
Как Google определяет, какие изображения являются похожими (Similar Images)?
Патент определяет Similar Images как изображения, производные от одного и того же исходного изображения (Source Image). Это включает точные дубликаты, а также варианты, полученные путем изменения размера, обрезки (cropping), масштабирования или незначительной цветокоррекции. Система использует технологии компьютерного зрения для группировки этих изображений.
Если мой сайт авторитетнее, но изображение на нем меньше, чем у конкурента, кто получит трафик?
Web Score (авторитетность) является основным фактором. Однако патент (Claims 5 и 6) указывает, что размер изображения (Web Page Features) также учитывается при выборе Landing Page. Если разница в авторитетности значительна, вы, скорее всего, выиграете. Если же Web Scores близки, то больший размер изображения у конкурента может стать решающим фактором в его пользу.
Что делать, если кто-то украл мое оригинальное изображение и разместил на более авторитетном сайте?
Это сложная ситуация. Согласно патенту, система выберет страницу с наивысшим Web Score, что может означать более авторитетный сайт, даже если он не является первоисточником контента. Ваша стратегия должна заключаться в повышении авторитетности вашего сайта, обеспечении максимальной релевантности вашей страницы (повышая Web Score, зависимый от запроса) и оптимизации представления изображения (размер, позиция).
Влияет ли позиция изображения на странице на выбор Landing Page?
Да, влияет. Патент явно упоминает позицию изображения на странице (Claim 8) как одну из характеристик (Web Page Features), которые могут учитываться. Размещение изображения на более видном месте (например, в верхней части страницы) может повысить вероятность выбора этой страницы в качестве Landing Page.
Может ли одна и та же картинка иметь разные Landing Pages в зависимости от запроса?
Да, это возможно. Если система использует Web Score, зависимый от запроса (Claim 4), то выбор Landing Page будет зависеть от релевантности страниц конкретному запросу. Для разных интентов могут быть выбраны разные страницы, содержащие одно и то же изображение.
Как этот патент влияет на использование стоковых фотографий?
Патент делает использование стоковых фотографий менее эффективным для привлечения трафика из Image Search. Поскольку стоковые фото размещаются на множестве сайтов, включая очень авторитетные, ваша страница должна обладать исключительно высоким Web Score, чтобы конкурировать с ними. Стратегически выгоднее инвестировать в создание уникального визуального контента.
Влияет ли Alt-текст изображения на выбор Landing Page согласно этому патенту?
Патент напрямую не упоминает Alt-текст. Однако он упоминает «текстовый контент страницы» (Claim 10) как фактор, влияющий на выбор. Кроме того, текстовый контент (включая Alt-текст) влияет на расчет Web Score (особенно зависимого от запроса). Таким образом, косвенно Alt-текст влияет на процесс, помогая системе понять контекст и повышая релевантность страницы.
В чем разница между двумя вариантами реализации, описанными в патенте?
Вариант 1 (Claim 1) — двухэтапный. Сначала выбирается лучшая страница для каждого отдельного файла, затем сравниваются эти победители. Вариант 2 (Description) — одноэтапный. Сразу сравниваются все страницы, содержащие любые похожие изображения. Вариант 1 может быть более эффективным с вычислительной точки зрения, так как он быстро отсеивает множество низкокачественных страниц.
Что важнее для Image SEO в свете этого патента: оптимизация самого изображения или оптимизация страницы?
Оптимизация страницы (Landing Page) имеет решающее значение. Патент фокусируется на выборе лучшей страницы на основе ее Web Score. Хотя оптимизация представления изображения (размер, позиция) важна как Web Page Feature, она вторична по отношению к общей авторитетности и релевантности страницы, на которой оно размещено.