Close Menu
    Telegram
    SEO HARDCORE
    • Разборы патентов
      • Патенты Google
      • Патенты Яндекс
    • Скоро
      SEO инструменты
    • Скоро
      SEO аналитика
    SEO HARDCORE
    Разборы патентов • Патенты Google

    Как Google определяет каноническое (авторитетное) изображение для человека, используя качество сайтов и визуальный консенсус

    SCORING IMAGES RELATED TO ENTITIES (Оценка изображений, связанных с сущностями)
    • US9098552B2
    • Google LLC
    • 2015-08-04
    • 2013-02-05
    2013 EEAT и качество Knowledge Graph Мультимедиа Патенты Google

    Google использует многоступенчатую систему для выбора наиболее авторитетного изображения (например, официального портрета) для человека. Система оценивает качество веб-страниц, на которых размещено изображение (используя сигналы, не зависящие от контента), и анализирует, насколько часто визуально похожие версии этого изображения используются другими высококачественными сайтами. Итоговый балл авторитетности также учитывает четкость распознавания лица и качество кадрирования.

    • Описание
    • Детальный разбор
    • Выводы
    • Практика
    • Вопросы и ответы
    • Наверх

    Описание

    Какую задачу решает

    Патент решает задачу идентификации наиболее авторитетного (authoritative image) и репрезентативного изображения для конкретной сущности, в частности для человека. В интернете существует множество изображений одной и той же персоны, различающихся по качеству, содержанию и контексту. Цель изобретения — разработать механизм оценки (скоринга), который позволяет алгоритмически выбрать лучшее изображение (например, идеальный «headshot») для представления этой сущности в результатах поиска (например, в Knowledge Panel или Image Search).

    Что запатентовано

    Запатентована система расчета оценки авторитетности изображения (Image Authority Score, IAS). Этот расчет базируется на двух ключевых компонентах. Первый — это качество ресурсов (веб-страниц), на которых размещено изображение (Image Resource Quality Score, IRQS). Второй — это Image Score (IS), который измеряет консенсус авторитетных источников относительно данного визуального представления (т.е. насколько широко изображение и его похожие копии используются качественными сайтами).

    Как это работает

    Система работает следующим образом:

    • Сбор данных: Идентифицируются изображения, связанные с конкретным человеком, и ресурсы, которые их содержат.
    • Оценка качества ресурсов: Для каждого ресурса получается Quality Score. Важно, что эта оценка, согласно Claim 1, определяется независимо от контента страницы (например, аналог PageRank или авторитетность домена).
    • Расчет IRQS: Для каждого изображения рассчитывается Image Resource Quality Score (IRQS) на основе оценок качества содержащих его ресурсов (например, максимальная или средняя оценка).
    • Анализ сходства: Для каждого изображения определяется набор визуально похожих изображений («соседей»), часто с фокусом на области лица.
    • Расчет Image Score (IS): Рассчитывается оценка, которая отражает совокупный IRQS похожих изображений по отношению к общему IRQS всех изображений этой сущности. Этот показатель выше, если изображение имеет много похожих копий на качественных сайтах.
    • Дополнительные факторы: В оценку IS могут включаться Facial Recognition Confidence Score (четкость лица) и Portrait Score (качество кадрирования).
    • Расчет IAS: Генерируется итоговый Image Authority Score (IAS) путем комбинирования IRQS и IS. Изображения ранжируются по IAS для выбора лучшего.

    Актуальность для SEO

    Высокая. Идентификация и выбор канонического изображения для сущностей является критически важной задачей для Knowledge Graph, Панелей знаний и Поиска по картинкам. Описанные механизмы, связывающие авторитетность изображения с авторитетностью хостинг-сайта (E-E-A-T хоста) и консенсусом, полностью соответствуют современным векторам развития поиска.

    Важность для SEO

    Патент имеет высокое значение (85/100) для SEO, особенно для управления репутацией (SERM), Entity SEO и оптимизации изображений. Он раскрывает конкретный механизм, по которому Google выбирает главное изображение для человека. Понимание того, что авторитетность зависит не только от качества вашего сайта, но и от того, насколько широко это же изображение используется другими авторитетными источниками, напрямую влияет на стратегии публикации и распространения официальных изображений.

    Детальный разбор

    Термины и определения

    Entity (Сущность)
    Объект реального мира. В контексте патента основной фокус сделан на людях (particular person).
    Facial Recognition Confidence Score (FRCS)
    Оценка уверенности системы распознавания лиц в том, что изображение содержит лицо, а также потенциально оценка четкости и ясности этого лица.
    Image Authority Score (IAS)
    Итоговая оценка авторитетности изображения для данной сущности. Рассчитывается на основе Image Resource Quality Score и Image Score. Используется для ранжирования и выбора лучшего изображения.
    Image Resource Quality Score (IRQS)
    Оценка качества изображения, основанная на Quality Scores ресурсов (веб-страниц), которые содержат это изображение. Может быть максимальной или средней оценкой качества среди всех хост-ресурсов.
    Image Score (IS)
    Оценка, отражающая относительную популярность конкретного визуального представления сущности среди высококачественных источников. Рассчитывается на основе IRQS визуально похожих изображений («соседей») по отношению к IRQS всех изображений сущности.
    Neighbors / Set of similar images (Соседи / Набор похожих изображений)
    Изображения, которые имеют меру визуального сходства с данным изображением выше определенного порога (similarity measure threshold). Сходство может определяться по всему изображению или только по области лица.
    Portrait Score (PS)
    Оценка, указывающая, насколько хорошо изображение соответствует характеристикам «хорошего портрета». Оценивает степень, в которой рамка (bounding box), определяющая область лица, соответствует заданным значениям (например, размер, положение, поля, соотношение сторон).
    Quality Score (Оценка качества ресурса)
    Метрика, представляющая качество ресурса (веб-страницы) по отношению к другим ресурсам. В патенте (Claim 1) отмечается, что эта оценка определяется независимо от содержания ресурса (independent of the content of the resource).

    Ключевые утверждения (Анализ Claims)

    Claim 1 (Независимый пункт): Описывает основной метод оценки изображений, связанных с конкретным человеком.

    1. Система идентифицирует множество изображений, связанных с человеком.
    2. Для ресурсов, содержащих эти изображения, получается Quality Score. Критическое уточнение: этот Quality Score определяется независимо от содержания ресурса.
    3. Для каждого изображения выполняется:
      1. Генерация Image Resource Quality Score (IRQS) на основе Quality Scores ресурсов, включающих это изображение.
      2. Идентификация набора похожих изображений (Similar Images), соответствующих порогу сходства.
      3. Генерация Image Score (IS). Ключевой механизм расчета: IS основан на IRQS ресурсов, включающих похожие изображения, пропорционально (in proportion to) IRQS ресурсов, включающих все изображения данного человека.
      4. Генерация Image Authority Score (IAS) на основе IRQS и IS.

    Ядро изобретения заключается в использовании независимых от контента оценок качества хостов (например, PageRank или авторитетности домена) и концепции «визуального консенсуса», когда авторитетность одного изображения подтверждается использованием похожих изображений на других авторитетных сайтах.

    Claim 3 и 4 (Зависимые): Уточняют расчет IRQS.

    IRQS может быть либо средним (Claim 3), либо максимальным (Claim 4) значением Quality Scores всех ресурсов, содержащих данное изображение.

    Claim 6 и 7 (Зависимые): Детализируют методы определения сходства.

    • Уточняется, что изображения содержат лицо, обнаруженное процессами распознавания (Claim 6).
    • Мера сходства может основываться на сравнении только частей изображений, содержащих лица, а не целых изображений (Claim 7). Это позволяет игнорировать фон и кадрирование.

    Claim 8 и 9 (Зависимые): Детализируют расчет Image Score.

    • Image Score может дополнительно учитывать Facial Recognition Confidence Score (уверенность в наличии и четкости лица) (Claim 8).
    • Image Score может дополнительно учитывать Portrait Score (насколько изображение соответствует формату идеального портрета) (Claim 9).

    Где и как применяется

    Изобретение затрагивает несколько этапов поиска, используя данные, рассчитанные во время индексирования, для влияния на ранжирование и представление изображений сущности.

    INDEXING – Индексирование и извлечение признаков
    На этом этапе происходят ключевые предварительные вычисления:

    • Оценка ресурсов: Рассчитываются и сохраняются Quality Scores для веб-ресурсов (независимые от контента метрики).
    • Анализ изображений: Изображения индексируются, ассоциируются с сущностями. Происходит распознавание лиц, расчет Facial Recognition Confidence Score и Portrait Score.
    • Анализ сходства: Вычисляются меры визуального сходства между изображениями.

    RANKING / RERANKING – Ранжирование / Переранжирование
    Этот механизм преимущественно применяется офлайн для предварительного выбора лучшего изображения для сущности (например, для Knowledge Graph), но также может использоваться как сигнал при ранжировании результатов поиска изображений.

    • Система вычисляет IRQS для изображений сущности, используя сохраненные Quality Scores.
    • Система вычисляет Image Score (IS), агрегируя данные о похожих изображениях и их IRQS, а также учитывая FRCS и PS.
    • Система комбинирует все метрики в финальный Image Authority Score (IAS) и ранжирует изображения.

    METASEARCH – Метапоиск и Смешивание
    Выбранное наиболее авторитетное изображение используется для представления сущности в различных блоках выдачи (Knowledge Panels, карусели).

    Входные данные:

    • Набор изображений, ассоциированных с сущностью (Человеком).
    • Quality Scores ресурсов, содержащих эти изображения (независимые от контента).
    • Данные визуального анализа (меры сходства, FRCS, PS).

    Выходные данные:

    • Ранжированный список изображений сущности с рассчитанными Image Authority Scores.
    • Идентификатор канонического (наиболее авторитетного) изображения.

    На что влияет

    • Конкретные типы контента: В первую очередь влияет на изображения людей (портреты, хедшоты). Хотя патент называется «Scoring Images Related to Entities», все примеры и специфические метрики (FRCS, PS) относятся к людям.
    • Специфические запросы: Запросы, связанные с именами людей (информационные, навигационные).
    • Определенные форматы контента: Система явно предпочитает форматы, схожие с портретами (Portrait Score), и изображения с четко распознаваемыми лицами (FRCS).

    Когда применяется

    • Условия работы: Алгоритм применяется, когда поисковой системе необходимо выбрать одно или несколько наиболее репрезентативных изображений для известной личности.
    • Временные рамки: Расчеты, вероятно, производятся периодически (офлайн) для обновления оценок авторитетности по мере изменения интернета (появления новых изображений, изменения качества сайтов).

    Пошаговый алгоритм

    Процесс определения авторитетного изображения для человека.

    1. Идентификация изображений: Определить набор всех изображений (I), связанных с конкретным человеком (E).
    2. Получение оценок качества ресурсов: Для каждого ресурса (R), на котором размещено изображение из набора (I), получить независимую от контента оценку качества Quality Score (QS).
    3. Расчет IRQS: Для каждого изображения (i) вычислить Image Resource Quality Score (IRQS). Например, используя максимальный или средний QS среди всех ресурсов, содержащих (i).
    4. Идентификация похожих изображений: Для каждого изображения (i) определить набор похожих изображений (Neighbors(i)). Сходство определяется на основе визуальных характеристик (часто с фокусом на области лица) и должно превышать порог.
    5. Расчет Image Score (IS): Для каждого изображения (i) вычислить Image Score (IS). Он рассчитывается на основе IRQS похожих изображений пропорционально IRQS всех изображений данного человека.

      Пример формулы из патента:

      IS(i) = [Сумма IRQS(j) для всех j в Neighbors(i)] / [Сумма IRQS(k) для всех k в наборе I]

    6. Корректировка Image Score (Опционально): Скорректировать IS, используя дополнительные факторы: Facial Recognition Confidence Score (FRCS) и Portrait Score (PS). Например, умножив базовый IS на FRCS и PS.
    7. Расчет Image Authority Score (IAS): Для каждого изображения (i) вычислить финальную оценку IAS путем комбинирования IRQS(i) и IS(i) (например, путем их перемножения).
    8. Ранжирование и выбор: Ранжировать изображения по IAS и выбрать изображение с наивысшим рейтингом как каноническое.

    Какие данные и как использует

    Данные на входе

    Патент опирается на несколько ключевых типов данных, игнорируя традиционные контентные факторы (alt-текст, заголовки):

    • Ссылочные факторы / Факторы авторитетности сайта: Критически важные данные. Используется Quality Score ресурса. В патенте явно указано (Claim 1), что этот скор определяется independent of the content of the resource. Это подразумевает использование глобальных сигналов авторитетности сайта (например, ссылочных сигналов типа PageRank или других метрик E-E-A-T на уровне домена/страницы).
    • Мультимедиа факторы (Визуальный анализ):
      • Визуальное сходство: Данные, полученные с помощью методов анализа изображений (SIFT, edge detection, pixel matching и т.д.), для определения похожести.
      • Данные распознавания лиц: Информация о наличии лица, его положении (bounding box) и оценка уверенности (Facial Recognition Confidence Score).
    • Структурные факторы (Компоновка изображения): Размеры, соотношение сторон изображения, размер и положение лица относительно границ кадра (используются в расчете Portrait Score).

    Какие метрики используются и как они считаются

    • Image Resource Quality Score (IRQS): Агрегация Quality Scores хост-ресурсов. Методы агрегации: Среднее или Максимум.
    • Image Score (IS): Измеряет консенсус авторитетных источников (визуальную авторитетность).
      Формула: IS(i) = (Σ IRQS похожих изображений) / (Σ IRQS всех изображений сущности).
    • Facial Recognition Confidence Score (FRCS): Результат работы системы распознавания лиц. Может использоваться как множитель для IS.
    • Portrait Score (PS): Оценка компоновки кадра. В патенте приводится детальная формула, которая оценивает, сколько пикселей необходимо добавить (Needed Width/Height Margin), чтобы разместить рамку лица в пределах желаемых размеров изображения с заданными полями и соотношением сторон. Чем меньше нужно добавлять, тем выше оценка. Пример формулы: Portrait score (i) = 1 — ((NWM/SIW) + (NHM/SIH))/2.
    • Image Authority Score (IAS): Финальная метрика. Комбинация IRQS и IS (например, произведение).

    Выводы

    1. Авторитетность хоста критична для авторитетности изображения: Ключевым фактором является Quality Score сайта, на котором размещено изображение. Причем подчеркивается (Claim 1), что это оценка, независимая от контента. Это означает, что размещение изображения на сайте с высоким общим авторитетом (сильным ссылочным профилем, высоким E-E-A-T) напрямую повышает его IRQS.
    2. Консенсус авторитетов определяет каноническое изображение (Image Score): Ключевая инновация патента — Image Score. Он измеряет не просто популярность изображения, а консенсус среди высококачественных сайтов. Изображение становится авторитетным, если его (или его похожие копии) часто используют авторитетные источники.
    3. Формула Image Score поощряет доминирующие визуальные кластеры: Расчет IS как пропорции от общего IRQS означает, что система ищет визуальный кластер (группу похожих изображений), который аккумулирует наибольший «вес качества».
    4. Предпочтение четким и правильно отформатированным портретам: Включение Facial Recognition Confidence Score (FRCS) и Portrait Score (PS) означает, что система предпочитает четкие, хорошо скомпонованные изображения с легко распознаваемыми лицами, подходящие на роль «headshot».
    5. Сходство может определяться только по лицу: Система может игнорировать фон или другие элементы изображения, фокусируясь на сходстве лиц при определении Similar Images (Claim 7). Это позволяет группировать разные версии одного и того же портрета.

    Практика

    Best practices (это мы делаем)

    Эти рекомендации направлены на то, чтобы помочь Google выбрать желаемое изображение в качестве канонического для человека (например, CEO, автора, эксперта).

    • Приоритет размещения на авторитетных ресурсах (Повышение IRQS): Активно работайте над тем, чтобы официальное изображение размещалось на максимально авторитетных страницах. Это включает как собственный сайт (например, страница «О нас», биография), так и внешние ресурсы (СМИ, Википедия, отраслевые каталоги). Чем выше Quality Score этих страниц, тем лучше.
    • Обеспечение консистентности и синдикации (Повышение IS): Способствуйте широкому распространению одного и того же официального изображения. Image Score растет, когда много высококачественных сайтов используют одно и то же (или очень похожее) изображение. Предоставляйте пресс-киты с официальными фотографиями и поощряйте их использование.
    • Оптимизация технических характеристик (Повышение PS и FRCS): Используйте профессиональные фото, которые соответствуют критериям Portrait Score (правильное кадрирование, лицо в центре, достаточные поля) и Facial Recognition Confidence Score (высокая четкость, хорошее освещение лица).

    Worst practices (это делать не надо)

    • Распространение множества разных официальных портретов: Это размывает «вес качества» (IRQS) между разными визуальными кластерами, уменьшая Image Score для каждого отдельного изображения и затрудняя системе выбор авторитетного варианта.
    • Использование некачественных или плохо скадрированных фото: Использование размытых изображений, групповых фото или изображений, где лицо частично скрыто, снижает FRCS и Portrait Score, уменьшая шансы стать авторитетным изображением.
    • Манипуляции с размещением на низкокачественных сайтах: Размещение изображений на большом количестве спамных или низкокачественных сайтов не принесет пользы, так как их низкий Quality Score приведет к низкому IRQS и, следовательно, низкому итоговому IAS.
    • Игнорирование того, какие изображения используют Топ-СМИ: Если крупные авторитетные источники уже сформировали консенсус вокруг определенного изображения, попытка продвинуть совершенно другое изображение потребует значительных усилий по его синдикации на ресурсах сравнимого или более высокого качества.

    Стратегическое значение

    Этот патент является ключевым элементом Entity SEO и управления репутацией (SERM). Он демонстрирует, что выбор канонического изображения — это результат измеримого процесса, основанного на авторитетности источников и консенсусе. Он подтверждает, что сигналы авторитетности сайта (PageRank и аналоги) играют роль не только в веб-поиске, но и в представлении сущностей. Стратегия должна объединять SEO, PR и контент-маркетинг для управления визуальной репутацией.

    Практические примеры

    Сценарий: Продвижение официального фото CEO компании

    Задача: Сделать так, чтобы Google выбрал новое профессиональное фото CEO в качестве канонического изображения в Панели знаний.

    1. Подготовка актива (Оптимизация PS и FRCS): Создается новое фото. Оно четкое, лицо хорошо освещено и правильно скадрировано.
    2. Внутреннее размещение (Повышение IRQS): Фотография публикуется на официальном сайте компании (предполагается, что у него хороший Quality Score) в разделе «Руководство».
    3. Внешнее распространение (Повышение IS):
      • Обновляются профили CEO на авторитетных платформах (например, LinkedIn).
      • Компания выпускает пресс-релиз с новостью, включающий это фото, который публикуется крупными СМИ.
      • CEO участвует в отраслевой конференции, и организаторы используют это фото на странице спикеров.
    4. Ожидаемый результат: Система Google индексирует эти новые размещения. Image Score этого нового фото увеличивается, так как сумма IRQS его копий на авторитетных сайтах растет. Его итоговый Image Authority Score превосходит оценки старых фотографий, и Google обновляет каноническое изображение.

    Вопросы и ответы

    Что такое «Quality Score» ресурса, упомянутый в патенте, и почему важно, что он не зависит от контента?

    Quality Score — это оценка качества или авторитетности веб-страницы или сайта. Указание на то, что он «независим от контента» (independent of the content, Claim 1), критически важно. Это означает, что система полагается на сигналы, такие как ссылочный профиль (PageRank), авторитетность домена или другие общие сигналы качества сайта, а не на анализ текста страницы. Для SEO это означает, что для повышения авторитетности изображения его нужно размещать на сайтах, которым Google доверяет в целом.

    Что важнее: чтобы изображение было на одном очень авторитетном сайте или на многих сайтах среднего качества?

    Оба фактора важны. Размещение на очень авторитетном сайте дает высокий Image Resource Quality Score (IRQS), особенно если IRQS рассчитывается как максимальное значение. Однако для высокого Image Score (IS) необходимо, чтобы изображение (или его копии) использовалось широко, формируя авторитетный кластер (консенсус). Идеальная стратегия — добиться размещения на максимальном количестве высокоавторитетных сайтов.

    Как рассчитывается Image Score (IS) и что он означает?

    Image Score (IS) показывает, насколько авторитетно конкретное визуальное представление (фото и его похожие копии) по сравнению со всеми изображениями человека. Формула делит сумму IRQS всех похожих изображений на сумму IRQS всех изображений этой сущности. Высокий IS означает, что значительная часть «авторитета», связанного с сущностью в интернете, сконцентрирована именно вокруг этого визуального образа.

    Как Google определяет, что изображения похожи? Учитывается ли фон?

    Патент описывает использование стандартных техник анализа изображений, но особо выделяет сравнение на основе распознавания лиц (Claim 7). Система может сравнивать только те части изображений, которые содержат лица (bounding boxes). Это позволяет идентифицировать одно и то же фото, даже если оно было обрезано, изменено в размере или имеет другой фон.

    Что такое Portrait Score (PS) и как его оптимизировать?

    Portrait Score (PS) оценивает, насколько хорошо изображение соответствует формату идеального портрета. Он анализирует размер и положение лица относительно границ изображения. Для оптимизации PS нужно использовать профессиональное кадрирование: лицо должно быть в центре, не слишком близко к краям, и занимать оптимальный процент площади изображения.

    Влияет ли на выбор канонического изображения alt-текст или окружающий контент?

    Согласно этому патенту, механизм расчета Image Authority Score не использует alt-текст или окружающий контент. Базовый Quality Score ресурса также не зависит от контента. Эти факторы важны для общей релевантности в Image Search, но для определения авторитетности (каноничности) используются авторитетность хоста и характеристики самого изображения.

    Применяется ли этот патент только к людям?

    Хотя название патента говорит о «Сущностях», его содержание, Claims и специфические метрики (Facial Recognition Confidence Score, Portrait Score) сфокусированы исключительно на людях. Возможно, базовая логика (IRQS и IS) применяется и к другим сущностям (например, логотипам или продуктам), но без использования метрик, связанных с лицами.

    Влияет ли качество самого файла изображения (разрешение, размер) на Image Authority Score?

    Да, косвенно. Высокое разрешение и четкость влияют на Facial Recognition Confidence Score (FRCS). Если лицо размыто или имеет низкое разрешение, FRCS будет низким, что понизит итоговый Image Authority Score. Система предпочитает визуально качественные изображения.

    Если изображение присутствует на двух сайтах – один с высоким QS и один с низким QS, какой балл будет использован?

    Это зависит от метода агрегации при расчете Image Resource Quality Score (IRQS). Патент упоминает два варианта (Claim 3 и 4): использование среднего значения (average) или максимального значения (highest quality score). Если используется максимум, то будет учтена оценка высококачественного сайта, что более выгодно для SEO.

    Что делать, если Google выбрал нежелательное фото в качестве канонического?

    Необходимо проанализировать, почему это фото получило высокий Image Authority Score (вероятно, оно широко используется на авторитетных ресурсах). Стратегия замещения включает создание и агрессивное распространение нового, более качественного изображения на ресурсах с высоким Quality Score, чтобы перетянуть авторитетность на новый кластер изображений, в идеале заменяя старое фото на этих ресурсах.

    Навигация
    • Описание
    • Детальный разбор
    • Выводы
    • Практика
    • Вопросы и ответы
    • Наверх
    Telegram
    © 2025 SEO HARDCORE

    Type above and press Enter to search. Press Esc to cancel.