
Google использует многоэтапный процесс для выбора наиболее репрезентативного (evocative) изображения для сущности (например, для Knowledge Panel). Система оценивает, насколько тематически связаны с сущностью как само изображение, так и веб-страницы, на которых оно размещено. Изображения с нерелевантных страниц отфильтровываются. Финальный выбор делается на основе визуальных характеристик, таких как распознавание лиц, логотипов или флагов.
Патент решает задачу автоматического выбора одного, наиболее репрезентативного или запоминающегося (evocative) изображения для конкретной сущности (человека, места, организации и т.д.). Это необходимо для представления сущности в поисковой выдаче, например, в Панели знаний (Knowledge Panel). Цель — гарантировать, что выбранное изображение тематически связано с сущностью и обладает оптимальными визуальными характеристиками.
Запатентована система для идентификации и ранжирования изображений, связанных с сущностью. Ключевым механизмом является оценка изображений не только по их собственным характеристикам, но и по контексту их размещения. Система рассчитывает оценки тематической релевантности (topical relatedness) как для самого изображения (Entity-Image Score), так и для веб-страницы, на которой оно размещено (Entity-Resource Score). Финальный выбор делается на основе Image Rank Score, учитывающего визуальные характеристики.
Система работает по одному из нескольких сценариев (или их гибриду):
Overall Entity Score (комбинация релевантности изображения и страницы сущности). Каждое изображение присваивается наиболее релевантной сущности.Entity Queries), и находит топовые изображения по этим запросам.Entity-Resource Score), оно удаляется из рассмотрения.Image Rank Score, который учитывает визуальные характеристики (размер, разрешение, распознавание лиц/логотипов). Выбирается лучшее изображение.Высокая. С развитием Knowledge Graph и увеличением визуальных элементов в SERP, автоматический выбор репрезентативного изображения для сущностей критически важен для Google. Описанные механизмы, связывающие тематичность контента (topicality) с визуальным представлением сущности, остаются фундаментальными для работы поиска и формирования Knowledge Panels.
Патент имеет высокое значение для SEO, особенно в области управления репутацией (ORM), брендинга и Entity SEO. Он раскрывает, что для выбора главного изображения сущности Google отдает приоритет изображениям, размещенным на страницах, которые система считает наиболее авторитетными и тематически связанными с этой сущностью. Визуальное качество и оптимизация самого изображения важны, но они не помогут, если хост-страница нерелевантна.
topical relatedness) между самим изображением и конкретной сущностью. Основан на метаданных изображения, URL, имени файла, окружающем тексте.visual characteristics), контенте изображения (лица, логотипы, флаги) и может также учитывать Entity-Image Score и количество ресурсов, использующих изображение.Entity-Image Score и Entity-Resource Score. Используется для определения, какую сущность лучше всего представляет данное изображение.Патент содержит два основных независимых пункта (Claim 1 и Claim 14), описывающих разные подходы к выбору изображения.
Claim 1 (Независимый пункт): Описывает подход, основанный на анализе всего корпуса ресурсов (Corpus-Wide Assignment).
Overall Entity Score по отношению к одной или нескольким сущностям.Overall Entity Score рассчитывается на основе (i) Entity-Image Score (релевантность изображения сущности) И (ii) Entity-Resource Score (релевантность хост-страницы сущности).Overall Entity Score (обычно той, у которой он максимален).Image Rank Score, основанный как минимум на visual characteristics изображения.Image Rank Scores.Claim 14 (Независимый пункт): Описывает подход, основанный на анализе запросов (Query-based approach).
Entity Queries для сущности.Entity-Resource Score (мера тематичности контента ресурса по отношению к сущности).Image Rank Score, основанный как минимум на visual characteristics.Image Rank Scores.Зависимые пункты (Claims 4, 18, 19, 20): Детализируют расчет Image Rank Score в зависимости от типа сущности:
depiction of a face).depiction of a flag).depiction of a logo).Изобретение применяется на разных этапах поисковой архитектуры для обеспечения данными и выбора финального изображения.
INDEXING – Индексирование и извлечение признаков
Основная часть работы происходит на этом этапе в офлайн-режиме. Система анализирует ресурсы, извлекает изображения, идентифицирует сущности и вычисляет ключевые метрики: Entity-Resource Scores, Entity-Image Scores и Overall Entity Scores. Также происходит анализ визуальных характеристик и распознавание контента (лица, логотипы). Изображения ассоциируются с сущностями и сохраняются в Entity Index и Resource Index.
QUNDERSTANDING – Понимание Запросов
Система определяет (часто офлайн на основе исторических данных), какие запросы являются Entity Queries. Это используется в методах, основанных на запросах, для поиска кандидатов.
RANKING – Ранжирование (Image Search)
При использовании подхода на основе запросов (Claim 14) система выполняет стандартный или ограниченный поиск по изображениям для сбора кандидатов.
METASEARCH – Метапоиск и Смешивание
На этом этапе система использует результаты офлайн-обработки для формирования элементов SERP. Когда поисковая система определяет необходимость показать информацию о сущности (например, Knowledge Panel), она запрашивает у Image Selection Apparatus заранее выбранное репрезентативное изображение для этой сущности.
Алгоритм применяется во время периодической офлайн-обработки данных для обновления выбора репрезентативных изображений для сущностей в базе данных.
threshold number) ресурсов, на которых оно размещено, имеют Entity-Resource Score, удовлетворяющий пороговому значению (threshold score).Патент описывает несколько вариантов реализации. Ниже приведены два основных.
Алгоритм А: Анализ всего корпуса (Основан на Claim 1 / FIG. 4)
Entity-Resource Score (насколько страница связана с сущностью).Entity-Image Score (насколько изображение связано с сущностью).Overall Entity Score путем комбинации (например, взвешенного среднего) предыдущих двух оценок.Overall Entity Score максимален.Image Rank Score и проверка, что оно не размещено на нежелательных ресурсах (unqualified resources).Алгоритм Б: Анализ на основе запросов (Основан на Claim 14 / FIG. 2)
Entity Queries.Entity-Resource Score.Entity-Resource Score выше порога).Image Rank Score (аналогично Алгоритму А).Image Rank Score.Система использует широкий спектр факторов для вычисления различных оценок.
Факторы для Entity-Resource Score (Тематичность страницы):
Факторы для Entity-Image Score (Тематичность изображения):
content presented proximal to the image).Факторы для Image Rank Score (Ранжирование изображений):
depiction of a face) для людей (может включать проверку пола); наличие флага для стран; наличие логотипа (depiction of a logo) для организаций.Entity-Image Score или Overall Entity Score.Факторы для определения Entity Queries:
weighted average) из Entity-Image Score и Entity-Resource Score.Entity-Resource Score (порог тематичности) и пороговое количество тематичных ресурсов, необходимых для того, чтобы изображение прошло фильтрацию (в Алгоритме Б).Entity-Resource Score (тематичность хост-страницы сущности) используется либо как компонент для расчета Overall Entity Score (Алгоритм А), либо как жесткий фильтр (Алгоритм Б). Изображения, не размещенные на тематичных страницах, имеют мало шансов стать главным изображением сущности.Entity-Image Score) и страницы (Entity-Resource Score). Для достижения успеха необходима оптимизация обоих компонентов.Image Rank Score, который сильно зависит от визуальных качеств и соответствия типу сущности (лицо для человека, логотип для компании, флаг для страны).Entity-Resource Score направлен на предотвращение ситуаций, когда нерелевантное изображение становится репрезентативным только потому, что оно часто встречается в поиске по имени сущности.Overall Entity Score), что помогает разрешать неоднозначности (например, фото с несколькими людьми).Entity-Resource Score. Это, как правило, страница «О нас», биография или главная страница, которая должна быть максимально сфокусирована на этой сущности (упоминания в Title, H1, основном тексте).Entity-Image Score. Используйте чистые, описательные имена файлов, alt-тексты и заголовки (если применимо), которые четко идентифицируют сущность. Окружающий текст также должен быть релевантен сущности.Image Rank Score учитывает специфические визуальные характеристики, используйте четкие портреты для людей (face detection), официальные логотипы для компаний (logo detection) и флаги для стран (flag detection).Image Rank Score.Entity-Resource Score по отношению к сущности «Компания».Image Rank Score.Entity-Resource Score). Система использует контекст страницы как основной фильтр или компонент оценки.Патент подтверждает стратегию Google на использование Topical Authority (тематического авторитета) для оценки контента, включая изображения. Для SEO это означает, что управление представлением бренда в Knowledge Graph напрямую зависит от качества и тематичности контента на сайте. Невозможно оптимизировать изображение в отрыве от страницы, на которой оно размещено. Стратегия должна фокусироваться на создании авторитетных страниц, посвященных ключевым сущностям бизнеса.
Сценарий: Выбор логотипа компании для Knowledge Panel
examplecorp-logo.svg. Прописать alt="Логотип компании ExampleCorp". Окружить логотип текстом о компании.Entity-Resource Score для «ExampleCorp», а новый логотип имеет высокий Entity-Image Score и Image Rank Score. Это приведет к его выбору в качестве главного изображения сущности.Что важнее для выбора главного изображения сущности: качество самой картинки или авторитетность/тематичность страницы, где она размещена?
Оба фактора критически важны, но они работают на разных этапах. Тематичность страницы (Entity-Resource Score) часто действует как первичный фильтр. Если изображение размещено на нерелевантных страницах, оно, скорее всего, будет исключено из рассмотрения. Среди изображений, прошедших этот фильтр, побеждает то, у которого выше качество и лучше визуальные характеристики (Image Rank Score).
Как рассчитывается Entity-Resource Score (тематичность страницы)?
Патент указывает, что этот балл основан на анализе контента страницы. Ключевые факторы включают количество упоминаний сущности или её псевдонимов, местоположение этих упоминаний (Title, основной контент имеют больший вес), а также форматирование текста. Страница, полностью посвященная сущности, получит более высокий балл, чем страница, где сущность упоминается мимоходом.
Как Google понимает, что изображено на картинке при расчете Image Rank Score?
Система использует технологии компьютерного зрения, адаптированные под тип сущности. Если сущность — человек, активируется распознавание лиц (face detection), и предпочтение отдается четким портретам. Для организаций используется распознавание логотипов (logo detection), а для стран — распознавание флагов (flag detection). Также учитываются базовые визуальные характеристики: размер, разрешение и соотношение сторон.
Мой логотип размещен на главной странице, но Google все равно выбирает другое изображение для Knowledge Panel. Почему?
Это может происходить по нескольким причинам. Возможно, ваша главная страница недостаточно сфокусирована на сущности (низкий Entity-Resource Score) по сравнению со страницей, откуда взято текущее изображение (например, статья в Википедии). Также возможно, что ваш логотип имеет низкие визуальные характеристики (низкий Image Rank Score) или плохо оптимизированные метаданные (низкий Entity-Image Score).
Влияет ли оптимизация изображений (alt, title, имя файла) на этот процесс?
Да, напрямую. Эти элементы используются для расчета Entity-Image Score — показателя тематической связи между изображением и сущностью. Хорошо оптимизированные метаданные повышают этот балл, что, в свою очередь, увеличивает Overall Entity Score и может повлиять на финальный Image Rank Score.
Как система обрабатывает изображения, на которых изображено несколько сущностей (например, групповое фото)?
В подходе, основанном на анализе корпуса (Алгоритм А), система рассчитывает Overall Entity Score для каждой сущности на изображении. Изображение присваивается только той сущности, которая получила максимальную оценку. Эта оценка сильно зависит от контекста страницы: если фото двух людей чаще появляется на страницах про человека А, оно будет присвоено человеку А.
Что такое Entity Queries и как они используются?
Entity Queries — это запросы, которые Google считает однозначными запросами информации о сущности (например, «Apple» как запрос о компании). Они определяются на основе исторического поведения пользователей. В одном из вариантов алгоритма (Алгоритм Б) они используются для первичного сбора изображений-кандидатов путем выполнения поиска по картинкам.
Влияет ли разметка Schema.org (например, свойство logo или image) на этот процесс?
Патент напрямую не упоминает использование структурированных данных Schema.org. Однако он упоминает использование «метаинформации» ресурса и изображения. Логично предположить, что структурированные данные могут служить дополнительным сигналом для расчета Entity-Image Score или Entity-Resource Score, подтверждая связь между контентом и сущностью.
Если одно и то же изображение используется на многих сайтах, это хорошо?
Да, это положительный фактор. Патент указывает, что количество ресурсов, включающих изображение, может использоваться при расчете Image Rank Score. Однако важно, чтобы эти ресурсы были тематически связаны с сущностью (имели высокий Entity-Resource Score). Использование изображения на множестве авторитетных и релевантных сайтов повышает его шансы быть выбранным.
Как бороться с негативным изображением, которое Google выбрал для сущности?
Необходимо сместить фокус системы на более предпочтительные изображения. Для этого нужно создать и продвинуть альтернативные изображения, размещенные на страницах с более высоким Entity-Resource Score, чем у источника негатива. Также эти альтернативы должны обладать лучшими визуальными характеристиками (высокий Image Rank Score). Это требует комплексной работы над контентом и ORM.

Мультимедиа
SERP

Семантика и интент
Мультимедиа
SERP

Семантика и интент
Мультимедиа
Персонализация

Knowledge Graph
Семантика и интент

Мультимедиа
EEAT и качество
SERP

Персонализация
SERP
Ссылки

Поведенческие сигналы
Семантика и интент
Антиспам

Local SEO
Поведенческие сигналы
Свежесть контента

Knowledge Graph
Семантика и интент
Ссылки

Поведенческие сигналы
SERP

Персонализация
Семантика и интент
Мультимедиа

Ссылки
Структура сайта
Семантика и интент

Персонализация
Поведенческие сигналы
Семантика и интент

Семантика и интент
Структура сайта
Ссылки

Local SEO
Поведенческие сигналы
