Close Menu
    Telegram
    SEO HARDCORE
    • Разборы патентов
      • Патенты Google
      • Патенты Яндекс
    • Скоро
      SEO инструменты
    • Скоро
      SEO аналитика
    SEO HARDCORE
    Разборы патентов • Патенты Google

    Как Google оценивает возраст людей по изображениям для анализа контента и персонализации поиска

    ESTIMATING AGE USING MULTIPLE CLASSIFIERS (Оценка возраста с использованием нескольких классификаторов)
    • US8831362B1
    • Google LLC
    • 2014-09-09
    • 2011-08-10
    2011 Безопасный поиск Мультимедиа Патенты Google Персонализация

    Google использует гибридную технику компьютерного зрения для оценки возраста людей на изображениях. Комбинируя результаты нескольких простых бинарных классификаторов возраста (например, «ребенок или взрослый») с помощью регрессора, Google генерирует конкретные оценки возраста. Эти демографические данные используются для понимания визуального контента и адаптации поисковой выдачи или рекламы.

    • Описание
    • Детальный разбор
    • Выводы
    • Практика
    • Вопросы и ответы
    • Наверх

    Описание

    Какую задачу решает

    Патент решает задачу точной и вычислительно эффективной оценки возраста человека по изображению. Он направлен на преодоление ограничений традиционных монолитных регрессионных моделей, которые требуют больших объемов обучающих данных с точной маркировкой возраста. Изобретение позволяет использовать более доступные данные для бинарной классификации и повышает эффективность оценки возраста.

    Что запатентовано

    Запатентован метод оценки характеристики объекта (в частности, возраста человека) с использованием гибридного подхода, сочетающего классификацию и регрессию. Система использует несколько Binary Classifiers (бинарных классификаторов), каждый из которых обучен различать две возрастные группы (например, «старше 40» или «младше 40»). Затем Confidence Values (значения уверенности) от этих классификаторов агрегируются и обрабатываются Regressor (регрессором) для получения окончательной скалярной оценки возраста.

    Как это работает

    Система работает следующим образом:

    • Получение изображения: Система получает изображение человека (из индексируемого контента или изображение пользователя).
    • Бинарная классификация: Изображение подается на вход нескольким предварительно обученным Binary Classifiers. Каждый оценивает вероятность принадлежности человека к определенной возрастной группе (например, «Младенец?», «Ребенок или Взрослый?»).
    • Получение значений уверенности: Каждый классификатор выдает Confidence Value, отражающее его уверенность в классификации.
    • Агрегация: Значения уверенности собираются в низкоразмерный вектор (low-dimensional vector).
    • Регрессия: Regressor обрабатывает этот вектор и преобразует его в конкретную оценку возраста (например, «84 года»).
    • Применение: Оценка возраста используется для анализа контента или адаптации результатов поиска и рекламы.

    Актуальность для SEO

    Высокая. Хотя конкретные методы компьютерного зрения эволюционировали с момента подачи патента (2013 год), фундаментальная концепция использования демографических данных для анализа изображений и персонализации поиска является центральной для Google. Патент подтверждает намерение Google оценивать возраст и использовать эту информацию для влияния на результаты поиска и предоставления релевантного контента.

    Важность для SEO

    Патент имеет высокое значение для понимания возможностей Google в области Image SEO и персонализации. Он демонстрирует, что Google может анализировать изображения на веб-страницах (авторов, моделей, иллюстрации) и извлекать детальные демографические сигналы. Кроме того, он подтверждает, что демографические данные пользователя (например, возраст, оцененный по фото профиля) могут использоваться как сигнал для адаптации SERP.

    Детальный разбор

    Термины и определения

    Binary Classifier (Бинарный классификатор)
    Модель машинного обучения, обученная классифицировать входные данные как принадлежащие к одному из двух классов. В контексте патента — определяет принадлежность к одной из двух возрастных групп (например, «ребенок» против «взрослый») или принадлежность/непринадлежность к конкретной группе (например, «средний возраст» против «не средний возраст»).
    Confidence Value (Значение уверенности)
    Непрерывное скалярное значение (часто от 0 до 1), выдаваемое классификатором, которое отражает степень уверенности (degree of confidence) модели в результате классификации.
    Regressor (Регрессор)
    Компонент системы, который принимает агрегированные Confidence Values (обычно в виде вектора) и преобразует их в окончательную скалярную оценку (например, конкретный возраст).
    Low-dimensional vector (Низкоразмерный вектор)
    Структура данных, в которую собираются Confidence Values от всех бинарных классификаторов перед подачей на вход регрессору.
    Ground Truth Data (Данные наземной истины)
    Набор данных (изображений), помеченных известной информацией о возрасте изображенных людей. Используются для обучения классификаторов и регрессора.
    Face Finder (Поисковик лиц)
    Компонент, который определяет местоположение и размер лиц на изображении.
    Landmarker (Разметчик ориентиров)
    Компонент, который идентифицирует позиции и ориентацию конкретных черт лица (глаза, нос, рот) после обнаружения лица.
    Poly-Feature (Поли-признак)
    Представление нескольких каскадных типов признаков, обученных совместно для улучшения дискриминации. Используется при анализе изображения.

    Ключевые утверждения (Анализ Claims)

    Claim 1 (Независимый пункт): Описывает общий метод оценки характеристики объекта.

    1. Система получает представление объекта (например, изображение).
    2. Представление подается на несколько Binary Classifiers. Каждый обучен выдавать (i) результат классификации объекта относительно определенной характеристики и (ii) Confidence Value, отражающее степень уверенности в этом результате.
    3. Система агрегирует Confidence Values от всех классификаторов.
    4. Система генерирует оценочное значение для характеристики объекта на основе агрегированных Confidence Values.

    Ядро изобретения — это использование агрегированных показателей уверенности от нескольких бинарных классификаторов для оценки непрерывной характеристики.

    Claim 6 (Зависимый от 1): Уточняет, что характеристикой может быть возраст объекта (age of the object).

    Claim 7 (Зависимый от 1): Уточняет, что агрегация может включать взвешивание (weighting) одного или нескольких Confidence Values. Это означает, что результаты одних классификаторов могут считаться более важными, чем других.

    Claim 9 (Зависимый от 1): Детализирует процесс агрегации и генерации оценки.

    1. Агрегация включает ввод Confidence Values в Regressor, который отображает вектор на скалярное значение.
    2. Генерация оценки основывается, по крайней мере частично, на этом скалярном значении.

    Где и как применяется

    Изобретение затрагивает несколько этапов поиска, связанных с анализом контента и пониманием пользователя.

    INDEXING – Индексирование и извлечение признаков
    На этом этапе технология применяется для анализа изображений, найденных на веб-страницах или в Google Images. Система извлекает демографические признаки (оценку возраста) людей, изображенных на фотографиях (например, авторов статей, моделей в карточках товаров). Эти данные сохраняются как аннотации к изображению или документу.

    QUNDERSTANDING – Понимание Запросов
    Если система имеет доступ к демографическим данным пользователя (например, через фото профиля Google, при условии разрешения), оценка возраста может использоваться для лучшей интерпретации интента запроса, особенно для неоднозначных запросов, где интент зависит от возраста пользователя.

    RERANKING – Переранжирование (Персонализация)
    Применение, прямо указанное в патенте. Система может использовать оценку возраста текущего пользователя для адаптации результатов поиска или рекламы (ads). Результаты, которые считаются более релевантными для возрастной группы пользователя, могут быть повышены в выдаче.

    Входные данные:

    • Изображение или видео (либо анализируемого контента, либо пользователя).
    • Набор обученных Binary Classifiers и Regressor.

    Выходные данные:

    • Оценочное значение возраста (скалярное значение).

    На что влияет

    • Конкретные типы контента: Влияет на контент, где важны изображения людей: статьи с фотографиями авторов, профили, карточки товаров с моделями, новостной контент.
    • Специфические запросы: Влияет на запросы в Image Search, связанные с демографией. Также влияет на запросы, где результаты сильно зависят от возраста пользователя (мода, финансы, здоровье, развлечения) через персонализацию.
    • Реклама: Патент прямо упоминает использование оценки возраста для показа релевантной рекламы.

    Когда применяется

    • Триггеры активации: Алгоритм активируется, когда системе доступно изображение для анализа (при индексировании контента или при доступе к изображению пользователя) и когда необходимо извлечь демографические данные.
    • Условия применения: Применяется, когда на изображении обнаружено лицо (с помощью Face Finder) и можно определить ключевые черты (с помощью Landmarker).
    • Конфиденциальность: Патент подчеркивает, что при сборе личной информации (изображений/возраста) пользователям должна быть предоставлена возможность согласиться или отказаться (opt in/out), и данные могут быть анонимизированы.

    Пошаговый алгоритм

    Этап 1: Предварительная обработка изображения

    1. Получение изображения: Система получает входное изображение.
    2. Обнаружение лиц: Face Finder анализирует изображение для определения местоположения и размера лиц.
    3. Разметка ориентиров: Landmarker идентифицирует позиции ключевых черт лица (глаза, нос, рот).
    4. Нормализация изображения (Image Normalization): Изображение лица нормализуется (например, поворачивается, масштабируется до фиксированного расстояния между глазами) для обеспечения консистентности входных данных.

    Этап 2: Классификация и Регрессия

    1. Множественная классификация: Нормализованное изображение подается на вход набору Binary Classifiers (в патенте упоминается возможность использования от 5 до 15).
    2. Вычисление уверенности: Каждый классификатор выполняет сканирование признаков (используя, например, Poly-features) и выдает Confidence Value, указывающее вероятность принадлежности к одному из двух классов.
    3. Агрегация в вектор: Все Confidence Values собираются в low-dimensional vector. Опционально может применяться взвешивание.
    4. Регрессия: Вектор подается на вход Regressor. Регрессор (например, использующий метод наименьших квадратов — least square fitting) отображает вектор на окончательное скалярное значение возраста.
    5. Вывод результата: Система выдает оценку возраста.

    Какие данные и как использует

    Данные на входе

    • Мультимедиа факторы: Основные данные — это изображения или видео. Система анализирует пиксельные данные для извлечения визуальных признаков, связанных со старением (текстура кожи, морщины, форма лица).
    • Пользовательские факторы: Если целью является персонализация, система может использовать изображения пользователя (например, фото профиля) для оценки его возраста.

    Какие метрики используются и как они считаются

    • Confidence Value (Значение уверенности): Ключевая внутренняя метрика. Вычисляется каждым бинарным классификатором, часто нормализуется в диапазоне от 0 до 1 с использованием логистического отображения (Logistic Map).
    • Age Estimation (Оценка возраста): Конечная метрика. Вычисляется регрессором на основе вектора Confidence Values.
    • Методы анализа изображений: Патент упоминает использование Poly-features (каскадные типы признаков) и техники сканирования для анализа визуальных данных.
    • Алгоритмы машинного обучения: Используются техники для тренировки классификаторов (например, деревья решений — decision trees, бустированные каскады — boosted cascades; упоминается фреймворк Viola Jones Face Detector как основа) и регрессоров (например, least square fitting).
    • Агрегация данных: Сбор значений уверенности в low-dimensional vector. Патент также упоминает возможность генерации полиномиальных комбинаций (polynomic combinations) значений уверенности при агрегации.

    Выводы

    1. Подтверждение использования демографии в поиске: Патент прямо заявляет, что цель этой технологии — оценка возраста для адаптации результатов поиска, показа контента и рекламы. Это подтверждает, что демографические данные пользователя являются фактором персонализации SERP.
    2. Детальный анализ изображений (Image Understanding): Google обладает технологией для извлечения тонких демографических сигналов из изображений, размещенных на сайтах. Это не просто определение наличия лица, а оценка конкретного возраста, что критично для Image SEO.
    3. Гибридный подход к оценке: Патент описывает эффективный метод оценки непрерывных характеристик путем комбинирования результатов простых бинарных классификаторов. Этот подход (комбинирование простых сигналов через регрессор) может применяться и для оценки других сложных метрик в поиске.
    4. Важность визуального контента для понимания аудитории и авторов: Система может использовать изображения на сайте для понимания демографии авторов (что потенциально связано с E-E-A-T) или целевой аудитории контента.
    5. Приоритет эффективности: Выбор в пользу гибридной модели с низкоразмерными векторами указывает на стремление к быстродействию и возможности работы с разнородными обучающими данными (Ground Truth Data).

    Практика

    Best practices (это мы делаем)

    • Обеспечение демографического соответствия контента: Убедитесь, что визуальный контент на странице (фотографии, иллюстрации) соответствует демографии целевой аудитории текстового контента. Если статья предназначена для пенсионеров, использование изображений, на которых Google идентифицирует только молодых людей, может создать сигнал несоответствия релевантности.
    • Качественные и реалистичные изображения авторов (E-E-A-T): Используйте реальные, четкие фотографии авторов в биографиях и микроразметке. Google может анализировать эти изображения. Фотография, соответствующая опыту и возрасту эксперта в определенной области (например, врач с многолетним стажем), может служить косвенным подтверждающим сигналом авторитетности.
    • Оптимизация изображений в E-commerce: При использовании фотографий моделей для демонстрации товаров учитывайте, что Google может оценивать их возраст. Выбор моделей должен строго соответствовать целевому сегменту рынка продукта для повышения релевантности в Image Search.
    • Управление профилем Google: Понимайте, что фотография, используемая в аккаунте Google (например, Google Business Profile), может использоваться для оценки возраста и последующей персонализации выдачи и рекламы для этого аккаунта.

    Worst practices (это делать не надо)

    • Использование вводящих в заблуждение изображений (Clickbait visuals): Использование изображений, демография которых не соответствует содержанию статьи. Система может обнаружить это несоответствие при анализе контента.
    • Использование фейковых или нерелевантных стоковых фото для авторов: Использование фотографий молодых моделей в качестве авторов серьезного контента (например, YMYL-тематик), где ожидается опыт. Хотя патент фокусируется на оценке возраста, это может быть частью более широкого анализа персоны автора и его соответствия теме.
    • Игнорирование визуальной составляющей при таргетинге: Фокусироваться только на ключевых словах для привлечения определенной демографической группы, игнорируя при этом визуальное оформление сайта и его соответствие целевой аудитории.

    Стратегическое значение

    Патент подчеркивает важность компьютерного зрения в современном поиске. Для Google изображения являются богатым источником данных, включая демографические сигналы. Стратегически, SEO-специалисты должны рассматривать визуальный контент не просто как оформление, а как набор сигналов, которые анализируются системами машинного обучения. Это также подтверждает, что персонализация на основе демографии является неотъемлемой частью работы поиска, и оптимизация должна учитывать не только интент, но и контекст пользователя.

    Практические примеры

    Сценарий: Оптимизация страницы услуг по планированию пенсии (YMYL)

    1. Задача: Повысить релевантность и авторитетность страницы, ориентированной на людей предпенсионного и пенсионного возраста (55+).
    2. Действия на основе патента:
      • Проверить все изображения на странице. Заменить стоковые фото молодых людей на фотографии целевой аудитории (55+).
      • Добавить фотографии финансовых консультантов. Убедиться, что это реальные фото экспертов, чей визуально оцениваемый возраст соответствует заявленному опыту.
      • Добавить фото отзывов от реальных клиентов, принадлежащих к целевой возрастной группе.
    3. Ожидаемый результат: Google при индексации использует технологию оценки возраста и определяет, что визуальный контент демографически соответствует тематике страницы (планирование пенсии). Это обеспечивает консистентность сигналов релевантности и может положительно влиять на восприятие авторитетности контента (E-E-A-T) и его авторов.

    Вопросы и ответы

    Говорит ли этот патент о том, что Google использует камеры устройств для определения возраста пользователя в реальном времени?

    Патент описывает такую возможность в качестве примера применения. В описании приведены сценарии, где камера фиксирует пользователя (например, смотрящего интернет-телевизор), система оценивает его возраст и немедленно адаптирует контент. Однако для реализации этого на практике требуются соответствующие разрешения пользователя на доступ к камере и обработку данных.

    Как Google использует оценку возраста для изменения результатов поиска?

    В патенте указано, что «результаты поисковых запросов, отправленных индивидуумом, могут основываться, по крайней мере частично, на оцененном возрасте индивидуума». Это означает, что возраст используется как сигнал персонализации на этапе переранжирования (Reranking). Если система считает, что определенный контент лучше подходит для возрастной группы пользователя, она может повысить его в выдаче.

    Может ли Google определить возраст автора статьи по его фотографии?

    Да, технология, описанная в патенте, предназначена именно для этого — оценки возраста человека по изображению. Если на сайте размещена фотография автора (например, в блоке биографии или в микроразметке Author), Google может проанализировать ее во время индексирования и извлечь оценку возраста как демографический сигнал, связанный с этим автором.

    Как это влияет на E-E-A-T и YMYL-тематики?

    Хотя патент фокусируется только на оценке возраста, эта информация может быть частью более широкой оценки авторитетности (E-E-A-T). В YMYL-тематиках (например, медицина, финансы) опыт часто коррелирует с возрастом. Если визуально оцениваемый возраст автора соответствует его заявленному опыту, это может служить косвенным подтверждающим сигналом.

    Что такое гибридный подход (Binary Classifiers + Regressor) и почему он важен?

    Вместо одной сложной модели, предсказывающей точный возраст, система использует много простых моделей, отвечающих на вопросы типа «Да/Нет» (например, «Это младенец?»). Затем Regressor объединяет их ответы. Это более эффективно с точки зрения вычислений и требует меньше точно размеченных данных для обучения, что ускоряет разработку и внедрение.

    Влияет ли этот патент на оптимизацию изображений (alt-тексты, названия файлов)?

    Патент не описывает анализ текстовых атрибутов изображений. Он полностью сосредоточен на анализе визуального содержания (пикселей) с помощью компьютерного зрения. Alt-тексты и названия файлов по-прежнему важны для SEO, но описанная технология работает независимо от них.

    Стоит ли использовать стоковые фотографии на сайте в свете этого патента?

    Использование стоковых фотографий допустимо, но важно следить за их релевантностью. Патент показывает, что Google анализирует демографию на фото. Если стоковые фото не соответствуют вашей целевой аудитории или создают ложное впечатление об авторах контента, это может негативно сказаться на консистентности сигналов релевантности.

    Насколько точна эта технология оценки возраста?

    Патент не приводит конкретных показателей точности, но описывает механизм, позволяющий выдавать конкретную скалярную оценку (например, «84 года»), а не просто широкую категорию. Точность зависит от качества обучения классификаторов и регрессора, а также от качества входного изображения.

    Как система обрабатывает изображения с несколькими людьми разного возраста?

    Система сначала использует Face Finder для обнаружения всех лиц на изображении. Затем процесс оценки возраста (Landmarking, Classification, Regression) применяется к каждому обнаруженному лицу индивидуально. В патенте также упоминается сценарий, когда система может идентифицировать нескольких пользователей (например, ребенка и взрослого) и предоставить семейно-ориентированный контент.

    Применяется ли эта технология только к лицам?

    Хотя описание и примеры фокусируются на анализе лиц (упоминаются Face Finder и Landmarker), Claim 1 сформулирован шире и говорит о «представлении объекта», а Claim 3 уточняет, что это может быть «часть человеческого тела». Теоретически, метод может применяться шире, но основной фокус патента — на лицах.

    Навигация
    • Описание
    • Детальный разбор
    • Выводы
    • Практика
    • Вопросы и ответы
    • Наверх
    Telegram
    © 2025 SEO HARDCORE

    Type above and press Enter to search. Press Esc to cancel.