Close Menu
    Telegram
    SEO HARDCORE
    • Разборы патентов
      • Патенты Google
      • Патенты Яндекс
    • Скоро
      SEO инструменты
    • Скоро
      SEO аналитика
    SEO HARDCORE
    Разборы патентов • Патенты Google

    Как Google идентифицирует и отображает изображения лиц людей рядом с результатами поиска

    PROVIDING IMAGES OF NAMED RESOURCES IN RESPONSE TO A SEARCH QUERY (Предоставление изображений именованных ресурсов в ответ на поисковый запрос)
    • US9411827B1
    • Google LLC
    • 2016-08-09
    • 2008-07-24
    2008 Knowledge Graph Индексация Мультимедиа Патенты Google

    Google использует систему для улучшения поисковой выдачи по запросам, содержащим имена людей. Система анализирует релевантные веб-страницы, обнаруживает наличие лиц (Face Detection) и определяет личность человека на фото, используя текстовые сигналы (alt-text, имя файла, окружающий текст). Наиболее качественное изображение лица затем отображается в сниппете.

    • Описание
    • Детальный разбор
    • Выводы
    • Практика
    • Вопросы и ответы
    • Наверх

    Описание

    Какую задачу решает

    Патент решает проблему повышения информативности и удобства страницы результатов поиска (SERP) для запросов, содержащих имя человека. Стандартные текстовые сниппеты не всегда позволяют пользователю быстро верифицировать релевантность результата. Изобретение улучшает пользовательский опыт, предоставляя визуальное подтверждение (фотографию искомого человека) непосредственно в выдаче, что ускоряет оценку релевантности без необходимости клика по ссылке.

    Что запатентовано

    Запатентована система, которая дополняет результаты поиска изображениями лиц при обнаружении имени человека в запросе. Система комбинирует офлайн-обработку (индексация изображений, обнаружение лиц, извлечение текстовых описаний) и онлайн-обработку (понимание запроса, сопоставление личности, оценка качества изображения). Ключевой аспект — выбор наиболее подходящего изображения лица из релевантного документа и его отображение в SERP.

    Как это работает

    Система работает в два основных этапа:

    Офлайн (Индексация):

    • Система (Image Search Facility) сканирует ресурсы и идентифицирует изображения.
    • Применяются алгоритмы обнаружения лиц (face detection algorithms), чтобы определить, содержит ли изображение лицо (face image).
    • Извлекается и сохраняется связанная описательная информация (descriptive information или descriptive resources): имя файла, alt-text, метаданные, окружающий текст.

    Онлайн (Обработка запроса):

    • Система определяет, содержит ли запрос имя человека, используя вероятностные модели (probability model).
    • Анализируются топовые ресурсы, найденные поисковой системой.
    • Система идентифицирует face images в этих ресурсах, используя данные из индекса.
    • Определяется соответствие личности: проверяется, совпадает ли имя в запросе с descriptive information изображения.
    • Если найдено несколько подходящих изображений, они оцениваются по качеству (Score), и выбирается лучшее.
    • Выбранное изображение отображается вместе с результатами поиска.

    Актуальность для SEO

    Высокая. Отображение изображений рядом с результатами поиска, особенно для сущностей (включая людей), является стандартной функцией современных поисковых систем. Механизмы, описанные в патенте (приоритет от 2008 года), такие как использование alt-text и контекста для идентификации содержания изображения, а также оценка качества изображения, остаются фундаментальными для SEO оптимизации изображений и их представления в универсальном поиске.

    Важность для SEO

    Влияние на SEO значительное (65/100). Патент не описывает алгоритмы ранжирования веб-страниц, но напрямую влияет на представление результатов поиска (SERP Features) и, следовательно, на CTR. Он подчеркивает критическую важность правильной оптимизации изображений (alt-text, имена файлов, контекст) для обеспечения видимости контента. Это особенно важно для сайтов, продвигающих авторов, экспертов или публичных личностей.

    Детальный разбор

    Термины и определения

    Alt-text (Альтернативный текст)
    Текст в HTML-документе, описывающий изображение. Используется системой как один из ключевых источников описательной информации для идентификации личности на фото.
    Computer-searchable index (Компьютерный поисковый индекс)
    База данных (или репозиторий), в которой хранится информация об изображениях, их типы (например, face image) и связанные с ними описания, собранные до получения запроса.
    Descriptive Information / Descriptive resources (Описательная информация)
    Информация, связанная с изображением, которая используется для определения его содержания и идентификации личности. Включает имя файла, alt-text, метаданные изображения и текст, окружающий изображение на странице.
    Face detection algorithms (Алгоритмы обнаружения лиц)
    Программное обеспечение (упоминаются Viola, Jones, Rowley и др.), используемое на этапе индексации для определения наличия человеческого лица на изображении (Face Detection). Это отличается от распознавания личности (Face Recognition).
    Face image (Изображение лица)
    Изображение, которое было идентифицировано системой как содержащее лицо человека.
    Image Search Facility (Система поиска изображений)
    Компонент системы, отвечающий за индексацию изображений, определение их типа, извлечение описаний и выбор изображений для отображения в результатах поиска.
    Probability model (Вероятностная модель)
    Статистическая модель, используемая для определения вероятности того, что термин в поисковом запросе является именем человека (именем, отчеством или фамилией).
    Score (Оценка качества изображения)
    Метрика, присваиваемая изображению лица для оценки его качества. Учитывает размер, разрешение, цветность, размер лица на фото и количество лиц.

    Ключевые утверждения (Анализ Claims)

    Claim 1 (Независимый пункт): Описывает основной процесс обработки запроса, содержащего имя человека.

    1. Система получает запрос, включающий имя человека.
    2. Идентифицируется набор документов, релевантных запросу.
    3. Генерируется набор результатов поиска, ссылающихся на эти документы.
    4. Ключевое действие: Как минимум один результат поиска включает изображение лица (face image) человека, чье имя указано в запросе.
    5. Ключевое условие: Это изображение выбирается из числа изображений лиц разных людей, присутствующих в документе. Это указывает на необходимость не просто найти лицо, но и идентифицировать личность на основе описания.
    6. Сгенерированный набор результатов (включая изображение) предоставляется для отображения.

    Claim 3 (Зависимый от 1): Детализирует механизм выбора изображения при наличии нескольких кандидатов в документе.

    1. Каждому изображению присваивается оценка (Score), отражающая его качество.
    2. Изображения ранжируются на основе этих оценок.
    3. Выбирается изображение с наивысшим рангом (highest rank).
    4. Это изображение предоставляется для отображения в результатах поиска.

    Claim 4 (Зависимый от 3): Уточняет факторы, используемые для расчета оценки (Score). Оценка определяется на основе размера изображения (size), разрешения изображения (resolution) или цветов изображения (colors).

    Claim 8 и 9 (Зависимые от 1): Описывают инфраструктуру, подчеркивая зависимость от офлайн-обработки.

    • Система использует информацию из computer-searchable index (Claim 8).
    • Выбор основывается на данных из репозитория (repository of images), созданного до получения запроса пользователя (Claim 9).

    Где и как применяется

    Изобретение затрагивает несколько этапов поисковой архитектуры, интегрируя обработку изображений в процесс формирования выдачи.

    INDEXING – Индексирование и Извлечение признаков
    Основная часть работы происходит офлайн. Image Search Facility выполняет:

    • Сканирование и идентификацию изображений.
    • Применение face detection algorithms для классификации изображений как face image.
    • Извлечение descriptive resources (alt-text, имена файлов, метаданные).
    • Сохранение данных в computer-searchable index.

    QUNDERSTANDING – Понимание Запросов
    На этом этапе система анализирует запрос в реальном времени. Используются probability models (например, Байесовские оценки) и списки исключений (фразы, которые не являются именами, например, «Jasmine Rice»), чтобы определить, содержит ли запрос имя человека.

    RANKING – Ранжирование
    Основная поисковая система идентифицирует набор релевантных документов (веб-страниц) стандартным образом. Патент не влияет на этот этап.

    METASEARCH – Метапоиск и Смешивание (Universal Search & Blending)
    Здесь происходит основное применение патента в реальном времени. Система получает результаты от этапа RANKING и для топовых результатов проверяет:

    1. Являются ли изображения в ресурсе face images (используя данные из INDEXING).
    2. Соответствует ли личность на фото имени в запросе (сопоставление имени из QUNDERSTANDING с descriptive resources из INDEXING).
    3. Если кандидатов несколько, применяется механизм оценки (Score) и ранжирования изображений.
    4. Лучшее изображение смешивается с результатами поиска для формирования финальной SERP.

    Входные данные:

    • Поисковый запрос пользователя.
    • Набор релевантных ресурсов (результаты поиска).
    • Computer-searchable index (данные об изображениях: классификация face image, descriptive resources, метрики качества).

    Выходные данные:

    • Модифицированный набор результатов поиска (SERP), где рядом с некоторыми ссылками отображаются выбранные изображения лиц.

    На что влияет

    • Специфические запросы: Влияет исключительно на запросы, которые система идентифицирует как содержащие имя человека (информационные, навигационные запросы о людях).
    • Конкретные типы контента: Влияет на представление страниц, содержащих изображения людей с соответствующими описаниями (страницы «О нас», биографии авторов, новостные статьи о людях, профили).
    • Конкретные ниши или тематики: Наибольшее влияние в нишах, связанных с новостями, развлечениями, а также в корпоративном сегменте и контентных проектах, где важна персонализация авторов (включая YMYL).

    Когда применяется

    • Триггеры активации: Система активируется, когда probability model определяет высокую вероятность того, что поисковый запрос содержит имя человека.
    • Условия применения: Применяется, только если в релевантных результатах поиска найдены изображения, которые (а) классифицированы как face image и (б) имеют descriptive resources, позволяющие сопоставить их с именем в запросе.
    • Ограничения: В патенте упоминается, что механизм может применяться только к топовым результатам (например, топ-20) или только к результатам на первой странице выдачи для оптимизации производительности.

    Пошаговый алгоритм

    Процесс А: Офлайн-обработка и Индексация

    1. Сканирование ресурсов: Система сканирует ресурсы, размещенные на контент-хостах.
    2. Идентификация изображений: Определяется, является ли ресурс изображением (например, на основе расширения файла: JPG, TIFF, PNG).
    3. Обнаружение лиц (Face Detection): К изображению применяются face detection algorithms для определения вероятности того, что оно является face image.
    4. Извлечение информации: Извлекается descriptive information: имя файла, alt-text, метаданные (разрешение и т.д.), окружающий текст.
    5. Сохранение: Изображение (или данные о нем) и извлеченная информация сохраняются в computer-searchable index.

    Процесс Б: Обработка запроса в реальном времени

    1. Определение имени в запросе: Система анализирует запрос и определяет, содержит ли он имя человека, используя probability models и списки исключений.
    2. Получение результатов поиска: Система получает набор ресурсов, идентифицированных поисковой системой как релевантные запросу.
    3. Фильтрация ресурсов: Для топовых ресурсов проверяется наличие изображений.
    4. Проверка на наличие лиц: Проверяется, является ли изображение в ресурсе face image (используя данные из индекса). Если нет, изображение игнорируется в контексте этого алгоритма.
    5. Сопоставление личности (Идентификация): Система определяет, является ли лицо на изображении лицом искомого человека. Это делается путем сравнения имени в запросе с descriptive information. Рассчитывается комбинированная вероятность совпадения. Если вероятность низкая, изображение игнорируется.
    6. Оценка и выбор изображения: Если найдено несколько подходящих face images, им присваивается Score на основе качества (размер, разрешение, цветность, композиция). Выбирается изображение с наивысшей оценкой.
    7. Предоставление результата: Выбранное изображение предоставляется вместе с результатами поиска, ассоциированное с соответствующим ресурсом.

    Какие данные и как использует

    Данные на входе

    Патент фокусируется на использовании следующих данных для идентификации и выбора изображений:

    • Контентные факторы (Текстовые):
      • Alt-text: Критически важный сигнал для идентификации личности на фото.
      • Текст на странице: Текст, окружающий изображение, используется для определения контекста и подтверждения личности.
    • Технические факторы (Файловые):
      • Имя файла: Используется как сигнал для идентификации личности.
      • Тип файла (расширение): Используется для определения того, является ли ресурс изображением.
    • Мультимедиа факторы (Метаданные и Содержимое):
      • Содержимое изображения: Используется для обнаружения наличия лица (face detection).
      • Размер изображения (File size) и Разрешение (Image resolution).
      • Цветность (Color content): Предпочтение отдается цветным изображениям перед черно-белыми.
      • Композиция: Размер лица на изображении, количество лиц на изображении.

    Какие метрики используются и как они считаются

    • Вероятность имени (Probability that a term is a name): Метрика для определения того, является ли запрос именем. Рассчитывается с использованием Байесовской оценки (Bayesian estimate), сравнивая частоту термина в качестве имени в обучающих данных (name in training data) с его базовой частотой в запросах (term in query).
    • Вероятность соответствия личности: Комбинированная вероятность того, что face image отображает искомого человека. Рассчитывается на основе совпадения имени с descriptive information (alt-text, имя файла, контекст).
    • Score (Оценка качества изображения): Метрика для выбора лучшего изображения среди кандидатов. Система присваивает более высокие оценки изображениям на основе:
      • Большего размера файла и разрешения.
      • Цветности (предпочтение цветным).
      • Композиции (предпочтение изображениям, где лицо занимает большую часть кадра и где меньше других лиц).

    Выводы

    1. Идентификация личности основана на тексте, а не на биометрии: Патент четко разделяет Face Detection (определение наличия лица) и идентификацию личности. Идентификация полагается исключительно на descriptive information (alt-text, имя файла, окружающий текст). Технологии биометрического распознавания лиц (Facial Recognition) для установления личности в патенте не используются.
    2. Критичность текстовой оптимизации изображений: Для того чтобы изображение было выбрано для показа в SERP, оно должно быть корректно аннотировано. Alt-text, имя файла и контекст являются основными факторами для сопоставления изображения с запросом.
    3. Важность качества и композиции изображения: Система активно оценивает качество изображений (Score). При наличии нескольких кандидатов предпочтение отдается более крупным, четким, цветным изображениям, где лицо хорошо видно (портретам), а не групповым фото.
    4. Зависимость от предварительной индексации: Эффективность системы зависит от офлайн-процесса, во время которого изображения должны быть просканированы, лица обнаружены, а описания извлечены и сохранены в индексе. Это позволяет быстро формировать выдачу в реальном времени.
    5. Улучшение SERP для сущностей (Люди): Патент описывает конкретный механизм улучшения представления результатов поиска для определенного типа сущностей (людей), что является частью стратегии универсального поиска (Metasearch/Blending).

    Практика

    Best practices (это мы делаем)

    • Оптимизация изображений ключевых лиц (Авторы, Эксперты, Руководство): Обеспечьте наличие высококачественных портретных фотографий ключевых персон на сайте (например, на страницах биографий, в статьях, на странице «О нас»).
    • Точное и описательное заполнение Alt-text: Для изображений людей всегда заполняйте alt-text, указывая полное имя человека, точно так, как его могут искать пользователи. Например, alt=»Иван Петров, SEO-эксперт». Это критически важный сигнал для идентификации.
    • Оптимизация имен файлов: Используйте имена файлов, содержащие имя человека. Например, ivan-petrov-seo-expert.jpg. Это является одним из descriptive resources, упомянутых в патенте.
    • Контекстуальное окружение изображений: Размещайте изображения людей рядом с текстом, который ясно указывает на их личность (например, в подписи к фото или в биографическом блоке). Система использует окружающий текст для подтверждения личности.
    • Улучшение качества и композиции изображений: Следуйте критериям оценки качества (Score) из патента: загружайте изображения достаточного размера и разрешения, предпочитайте цветные фото, выбирайте кадры, где лицо крупное и нет большого количества других людей.

    Worst practices (это делать не надо)

    • Игнорирование Alt-text или использование общих фраз: Отсутствие alt-text или использование описаний типа alt=»фото автора» не позволит системе надежно сопоставить изображение с именем в запросе.
    • Использование групповых фото в качестве основного изображения персоны: Система понижает в приоритете изображения с несколькими лицами или те, где лицо занимает малую часть кадра.
    • Загрузка изображений низкого качества: Маленькие, нечеткие или черно-белые изображения получат низкий Score и вряд ли будут выбраны для отображения в SERP при наличии альтернатив.
    • Использование неинформативных имен файлов: Имена файлов типа IMG_1234.jpg не дают системе сигналов о содержании изображения.

    Стратегическое значение

    Патент подтверждает стратегию Google по интеграции различных типов контента в основную выдачу (Universal Search) и улучшению представления сущностей. Для SEO это подчеркивает необходимость комплексной оптимизации мультимедиа контента. Правильная оптимизация изображений авторов и экспертов становится важным элементом стратегии E-E-A-T, так как повышает их видимость в поиске, улучшает представление сниппетов и может положительно влиять на CTR.

    Практические примеры

    Сценарий: Оптимизация страницы автора статьи для отображения фото в SERP

    1. Задача: Убедиться, что при поиске по имени автора «Анна Иванова» в выдаче рядом со ссылкой на ее статью или профиль отображается ее фотография.
    2. Анализ контента: На странице есть блок об авторе с фотографией. Текущее имя файла author-pic.jpg, alt-text отсутствует.
    3. Действия по оптимизации (на основе патента):
      • Улучшение качества (Score): Заменить фото на цветной портрет размером 600x600px, где лицо занимает значительную часть кадра.
      • Оптимизация имени файла (Descriptive resource 1): Переименовать файл в anna-ivanova-biografiya.jpg.
      • Оптимизация Alt-text (Descriptive resource 2): Добавить alt=»Анна Иванова, автор статьи».
      • Оптимизация контекста (Descriptive resource 3): Убедиться, что непосредственно рядом с фото есть текст или подпись, упоминающая «Анна Иванова».
    4. Ожидаемый результат: На этапе индексации система распознает фото как face image. При запросе «Анна Иванова» система сопоставит имя с alt-text, именем файла и контекстом, присвоит изображению высокий Score и отобразит его в SERP.

    Вопросы и ответы

    Использует ли Google технологию распознавания лиц (Facial Recognition) для определения личности на фото согласно этому патенту?

    Нет. Патент описывает использование алгоритмов обнаружения лиц (Face Detection) только для определения наличия лица на изображении. Для идентификации личности (сопоставления лица с именем в запросе) система полагается исключительно на текстовые сигналы (descriptive resources): alt-text, имя файла и окружающий текст.

    Что важнее для выбора изображения: его качество или точность описания?

    Оба фактора критичны и работают последовательно. Сначала система должна идентифицировать личность на основе описания (alt-text, контекст). Если идентификация не прошла, качество не имеет значения. Если же система нашла несколько подходящих изображений, то выбирается изображение с наивысшей оценкой качества (Score).

    Как система определяет качество изображения (Score)?

    В патенте явно указаны критерии для расчета Score. Более высокие оценки получают изображения большего размера и разрешения, цветные изображения (по сравнению с черно-белыми), а также изображения, где лицо занимает большую часть кадра и присутствует минимальное количество других лиц (предпочтение портретам).

    Как система понимает, что запрос содержит именно имя человека, а не просто набор слов?

    Система использует вероятностную модель (probability model), например, Байесовскую оценку. Она сравнивает вероятность того, что термин является именем (на основе обучающих данных), с базовой вероятностью его появления в запросах. Также используются списки исключений для фраз, которые похожи на имена, но ими не являются (например, «Jasmine Rice»).

    Если на моем сайте нет Alt-text у фотографий, будут ли они показаны в выдаче?

    Это маловероятно. Хотя система использует и другие descriptive resources (имя файла, окружающий текст), alt-text является одним из самых сильных и явных сигналов для идентификации содержания изображения. Без него системе будет сложно надежно сопоставить фото с именем в запросе.

    Влияет ли этот патент на ранжирование сайта в органическом поиске?

    Патент не описывает механизмы ранжирования веб-документов. Он описывает механизм улучшения представления уже найденных результатов поиска (Metasearch/Blending). Однако, отображение изображения в сниппете может значительно повысить CTR результата, что косвенно влияет на трафик и поведенческие сигналы.

    Что делать, если Google показывает неправильное фото человека рядом с моим сайтом?

    Это означает, что система ошибочно сопоставила другое изображение с именем в запросе. Необходимо проверить все изображения на странице: убедиться, что у нужного фото максимально точный alt-text и контекст, а у других изображений alt-text не вводит в заблуждение. Также стоит улучшить качество нужного изображения, чтобы его Score был выше.

    Работает ли этот механизм в реальном времени или использует кэш?

    Патент описывает гибридный подход. Обнаружение лиц (Face Detection) и извлечение описаний происходит офлайн на этапе индексации и сохраняется в индексе. Сопоставление с запросом, оценка качества и выбор финального изображения происходят в реальном времени при обработке запроса, используя эти предварительно проиндексированные данные.

    Может ли система показать несколько изображений рядом с одной ссылкой?

    Да, патент (Claim 2) упоминает такую возможность. Например, одно изображение может отображаться по умолчанию, а другие (также идентифицированные как релевантные) могут быть показаны в виде миниатюр (thumbnails) или обрезанных частей (cropped portions) при наведении курсора на ссылку.

    Как этот патент связан с E-E-A-T и авторством контента?

    Он имеет важную косвенную связь. Помогая Google корректно идентифицировать и визуализировать изображения авторов контента или экспертов компании, вы усиливаете сигналы E-E-A-T. Визуальное представление автора рядом со статьей в SERP может повысить доверие пользователя и улучшить восприятие экспертизы и авторитетности ресурса.

    Навигация
    • Описание
    • Детальный разбор
    • Выводы
    • Практика
    • Вопросы и ответы
    • Наверх
    Telegram
    © 2025 SEO HARDCORE

    Type above and press Enter to search. Press Esc to cancel.