Как Яндекс идентифицирует ключевые объекты на странице (логотипы, баннеры, формы) с помощью анализа кода и визуального рендеринга

Яндекс использует технологию для точной идентификации объектов на веб-странице (таких как реклама, логотипы, карты или формы). Система анализирует не только исходный код (HTML/CSS), но и финальный визуальный вид страницы после рендеринга. Это позволяет Яндексу понимать структуру страницы и расположение элементов так, как их видит пользователь, что критично для оценки качества и юзабилити сайта.

Описание

Какую задачу решает

Патент решает задачу точной и надежной идентификации ключевых элементов (целевых объектов) на веб-странице, таких как реклама, логотипы или формы. Анализ исключительно исходного кода (HTML/DOM) часто недостаточен из-за сложности современного веба (динамическая верстка, JavaScript, обфускация кода). Изобретение позволяет системе «увидеть» финальное состояние страницы после рендеринга, анализируя визуальные характеристики элементов. Это критически важно для оценки качества страницы, выявления агрессивной или перекрывающей контент рекламы и понимания реальной структуры страницы, видимой пользователю.

Что запатентовано

Запатентован способ идентификации целевых объектов на веб-странице, который комбинирует анализ инструкций отрисовки (исходного кода) и обязательный анализ характеристик уже отрисованного (визуального) объекта. Система использует набор предопределенных правил (включая «нежесткие» правила) и, возможно, машинное обучение для вычисления вероятности того, что анализируемый элемент является искомым объектом (например, рекламным баннером).

Как это работает

Система (реализованная, например, в краулере, эмулирующем браузер) получает инструкции отрисовки (HTML/CSS/JS). Сначала она парсит код для выявления потенциальных кандидатов на целевой объект. Затем страница отрисовывается (рендерится). Ключевым этапом является процесс проверки, который применяется к отрисованной версии кандидата. Проверка использует правила, основанные на характеристиках отрисованного объекта (визуальных свойствах) и, опционально, на характеристиках кода. На основе результатов проверки назначается параметр вероятности. Если он превышает порог, объект считается идентифицированным.

Актуальность для SEO

Высокая. Визуальный анализ страниц (Visual Parsing/Rendering) является критически важным компонентом современных поисковых систем. Он необходим для оценки Page Experience, Core Web Vitals, удобства интерфейса и борьбы с некачественной рекламой. Методы, основанные на анализе финального состояния рендеринга, крайне актуальны для понимания современного веба, насыщенного JavaScript.

Важность для SEO

Влияние на SEO значительно (8/10). Патент описывает фундаментальный механизм того, как Яндекс воспринимает структуру, юзабилити и визуальное представление сайта. Эта технология позволяет идентифицировать проблемы, влияющие на пользовательский опыт (например, расположение и объем рекламы, доступность форм). Если система выявляет негативные паттерны (например, реклама перекрывает контент), эти данные используются алгоритмами оценки качества (Anti-Quality, Proxima), что напрямую влияет на ранжирование сайта.

Детальный разбор

Термины и определения

Целевой объект (Target Object): Ключевой элемент на веб-странице, который система пытается идентифицировать. В патенте приведены примеры: логотип, карта, баннер, реклама и форма для ввода данных.
Инструкции отрисовки (Rendering Instructions): Данные, необходимые для отображения веб-страницы, включая HTML, CSS, JavaScript.
Кандидат на целевой объект (Candidate Target Object): Элемент веб-страницы, идентифицированный на этапе разбора (парсинга) инструкций как потенциально являющийся целевым объектом.
Процесс проверки (Verification Process): Этап анализа кандидата для подтверждения того, что он является целевым объектом. Выполняется на отрисованной версии веб-страницы и может также включать анализ инструкций отрисовки.
Характеристики отрисованного объекта (Rendered Object Characteristics): Свойства элемента после рендеринга. Подразумеваются визуальные характеристики: размер, позиция на экране, видимость, цвет и т.д.
Характеристики кода (Code Characteristics): Свойства элемента, извлеченные из инструкций отрисовки (исходного кода). Например, HTML-теги, атрибуты, CSS-классы, структура DOM.
Набор предварительно определенных правил (Set of Predefined Rules): Правила, созданные заранее (например, на основе оценок экспертов или через машинное обучение) на основе характеристик известных целевых объектов. Правила могут быть специфичны для разных типов объектов.
«Нежесткое» правило (Soft/Fuzzy Rule): Правило, которое влияет на вероятность, но не является строгим бинарным условием (да/нет).
Параметр вероятности (Probability Parameter): Численная оценка, указывающая на уверенность системы в том, что кандидат является целевым объектом.

Ключевые утверждения (Анализ Claims)

Ядро патента заключается в обязательном анализе визуального представления страницы для идентификации объектов, в отличие от методов, основанных только на анализе исходного кода.

Claim 1 (Независимый пункт — Способ): Описывает основной метод идентификации целевого объекта.

Получение инструкций отрисовки веб-страницы.
Разбор инструкций для идентификации кандидата на целевой объект.
Отрисовка (рендеринг) веб-страницы.
Выполнение процесса проверки на отрисованной версии страницы для подтверждения кандидата.
Критически важно: Проверка включает применение предопределенных правил к характеристикам отрисованного объекта (визуальным характеристикам).
Назначение параметра вероятности на основе результатов проверки правил.

Claim 3 (Зависимый пункт): Расширяет Claim 1, добавляя анализ исходного кода в процесс проверки (гибридный подход).

На этапе разбора также идентифицируется тип кандидата (например, потенциальный логотип).
Процесс проверки дополнительно включает применение правил, основанных на характеристиках кода, специфичных для этого типа (оцененных экспертом).
Параметр вероятности основывается как на результатах визуальной проверки (из Claim 1), так и на результатах проверки кода.

Claim 5 (Зависимый пункт): Уточняет типы целевых объектов: логотип, карта, баннер, реклама, форма для ввода данных.

Claim 10 (Зависимый пункт): Указывает, что выполнение процесса проверки может осуществляться посредством алгоритма машинного обучения.

Claim 11 и 12 (Зависимые пункты): Уточняют природу правил. По меньшей мере одно правило может быть «нежестким» (Claim 11), и некоторые правила могут негативно воздействовать на параметр вероятности (Claim 12) (т.е. правила-пессимизаторы).

Claim 15 (Независимый пункт — Устройство): Описывает компьютерное устройство с процессором, реализующим браузер, который выполняет способ, описанный в Claim 1. Это подчеркивает, что технология интегрирована в компонент, способный к полноценному рендерингу веб-страниц.

Где и как применяется

Изобретение применяется на ранних этапах обработки веб-страницы для понимания ее структуры и содержания.

CRAWLING – Сканирование и Сбор данных
Технология используется на этапе рендеринга страницы поисковым роботом. Робот (используя браузерный движок, как указано в Claim 15) загружает и отрисовывает страницу. После рендеринга запускается описанный процесс проверки для идентификации ключевых объектов.

INDEXING – Индексирование и извлечение признаков
Идентифицированные объекты используются для извлечения признаков о странице. Например, данные о расположении, размере и количестве рекламных блоков, наличии форм, логотипа и т.д. Эти признаки сохраняются в индексе (Forward Index).

Взаимодействие с системами качества (QUALITY LAYER)
Извлеченные признаки используются для расчета метрик качества:

Anti-Quality (Антикачество): Использует данные об идентифицированной рекламе для пессимизации сайтов за токсичную рекламу (Pop-ups, перекрывающие контент) или превышение плотности рекламных блоков. Визуальный анализ критичен для этого.
Proxima: Может использовать данные о наличии и расположении ключевых элементов (логотипы, формы) и балансе рекламы/контента для оценки удобства и надежности страницы.

На что влияет

Оценка User Experience (UX) и Page Layout: Система позволяет автоматически оценивать, насколько удобна страница для пользователя, не мешает ли реклама основному контенту, насколько заметны ключевые функциональные элементы (формы).
Конкретные типы контента: Влияет на все типы страниц, но особенно важен для контентных проектов и сайтов, монетизирующихся за счет рекламы, где важно соблюдать баланс между рекламой и полезным содержимым.
Борьба с манипуляциями: Позволяет обнаруживать попытки маскировки элементов или обмана системы путем запутывания DOM, так как анализ фокусируется на финальном визуальном результате.

Когда применяется

Условия применения: Алгоритм применяется при сканировании и индексации веб-страниц, требующих рендеринга (т.е. практически всех современных сайтов).
Триггеры активации: Активируется после загрузки и выполнения всех инструкций отрисовки (HTML/CSS/JS) для анализа финального состояния страницы.

Пошаговый алгоритм

Получение данных: Система получает инструкции отрисовки (HTML/CSS/JS), связанные с веб-страницей.
Разбор инструкций (Парсинг): Анализ исходного кода для идентификации кандидатов на целевой объект и определения их потенциального типа (например, «потенциальный логотип», «потенциальная реклама»).
Отрисовка (Рендеринг): Система отрисовывает веб-страницу на основе полученных инструкций (например, в виртуальном браузере).
Выполнение процесса проверки (Верификация): Для каждого кандидата выполняется анализ:
1. Определение значений характеристик отрисованного объекта (визуальные параметры: размер, положение, видимость и т.д.).
2. Определение значений характеристик кода (параметры исходного кода: теги, классы, атрибуты).
3. Применение набора предварительно определенных правил (специфичного для типа кандидата) к этим характеристикам. Этот шаг часто выполняется с помощью алгоритма машинного обучения.
Назначение параметра вероятности: На основе результатов проверки правил (включая «нежесткие» и негативные правила) вычисляется вероятность того, что кандидат является целевым объектом.
Принятие решения: Если параметр вероятности превышает предварительно определенный порог, кандидат подтверждается как целевой объект.
Сбор данных: Сохранение информации об идентифицированных объектах (тип, связанные инструкции отрисовки) для дальнейшего использования в индексе.

Какие данные и как использует

Данные на входе

Система использует два основных типа данных: данные до рендеринга и данные после рендеринга.

Технические/Структурные факторы (Характеристики кода): Данные, извлекаемые из инструкций отрисовки.
- Структура DOM-дерева.
- HTML-теги (например, <div>, <img>, <form>, <iframe>).
- CSS-классы и идентификаторы (ID).
- Атрибуты элементов.
- Подключенные скрипты (JavaScript) и стили.
Визуальные факторы (Характеристики отрисованного объекта): Данные, получаемые после рендеринга страницы.
- Геометрия элемента (ширина, высота).
- Положение элемента на экране (координаты X, Y).
- Видимость элемента (visibility, display, opacity).
- Визуальное перекрытие элемента другими объектами.
- Цветовые характеристики.

Какие метрики используются и как они считаются

Параметр Вероятности (Probability Parameter): Ключевая метрика, рассчитываемая системой. Это агрегированная оценка, основанная на выполнении набора правил.
Предварительно определенные правила (Predefined Rules): Набор эвристик или признаков для ML-модели. В патенте указано (Claim 3), что характеристики кода определяются на основе оценки экспертов (асессоров), что подразумевает использование размеченных данных для обучения.
Алгоритмы машинного обучения (Machine Learning): Патент явно упоминает возможность использования ML (Claim 10) для выполнения процесса проверки. Вероятно, используется классификатор, обученный на наборе визуальных и кодовых характеристик для определения типа объекта.
Типы правил: Используются «нежесткие» правила (Claim 11), вносящие вклад в вероятность, и правила, которые могут негативно воздействовать на итоговый параметр вероятности (Claim 12).
Пороговые значения: Система использует предварительно определенный порог для параметра вероятности (Claim 4). Если порог превышен, идентификация подтверждается.

Выводы

Визуальное восприятие страницы критически важно: Яндекс анализирует не только код, но и финальный результат рендеринга. Это означает, что система стремится понять страницу так, как ее видит пользователь.
Гибридный подход к анализу: Точная идентификация объектов достигается за счет комбинации анализа DOM (характеристики кода) и анализа визуального представления (характеристики отрисованного объекта).
Фундамент для оценки качества (Proxima/Antiquality): Этот патент описывает технологию, которая позволяет автоматически собирать данные о структуре страницы, расположении рекламы и удобстве интерфейса. Эти данные являются входными для алгоритмов оценки качества и Page Layout.
Целенаправленный поиск ключевых элементов: Система активно ищет рекламу, баннеры, формы и логотипы. Понимание того, как эти элементы расположены и как они выглядят, напрямую влияет на оценку сайта.
Неэффективность маскировки в коде: Попытки скрыть элементы или запутать парсер через сложный DOM или обфускацию могут быть неэффективны, так как система анализирует визуальный результат. Если элемент виден пользователю, он будет проанализирован системой.

Практика

Best practices (это мы делаем)

Соблюдение стандартов качества рекламы: Размещайте рекламу так, чтобы она не мешала восприятию основного контента и не была агрессивной (например, соответствие стандартам Coalition for Better Ads). Система точно идентифицирует рекламные блоки и их расположение с помощью визуального анализа, что влияет на оценку качества страницы.
Обеспечение чистой и логичной визуальной верстки: Убедитесь, что визуальная структура страницы логична на разных устройствах. Основной контент должен быть легко доступен, а ключевые элементы (формы, навигация, логотип) должны быть визуально различимы и корректно расположены.
Оптимизация стабильности рендеринга (Core Web Vitals): Метрика Cumulative Layout Shift (CLS) напрямую связана со стабильностью визуального представления. Стабильный рендеринг обеспечивает корректный анализ визуальных характеристик системой. Избегайте неожиданных смещений контента при загрузке.
Семантическая верстка: Используйте семантические теги (например, <form>, <nav>, <header>). Это улучшает Характеристики Кода и помогает системе (в сочетании с визуальным анализом) точнее идентифицировать элементы.
Обеспечение доступности ресурсов для рендеринга: Убедитесь, что робот Яндекса имеет доступ ко всем CSS и JS файлам, необходимым для корректной отрисовки страницы.

Worst practices (это делать не надо)

Агрессивная и мешающая реклама: Использование Pop-ups, Interstitial ads (межстраничные объявления), большого количества рекламы в первом экране, липких баннеров, перекрывающих контент. Система точно идентифицирует эти форматы через визуальный анализ и может пессимизировать страницу (Anti-Quality).
Маскировка рекламы под контент (Мимикрия): Попытки сделать рекламные блоки визуально неотличимыми от основного контента. Система использует комбинацию визуальных и кодовых правил (например, код вызова рекламной сети), чтобы выявить такие блоки.
Клоакинг и скрытие элементов с помощью сложных CSS/JS трюков: Попытки обмануть систему, показывая разный контент в DOM и в отрисованной версии, или скрывая элементы от пользователя/робота. Так как анализируется финальный рендер, такие манипуляции могут быть обнаружены.
Запутанная верстка и нестабильный Layout: Сложные и непредсказуемые методы верстки, вызывающие смещения контента (высокий CLS), могут привести к некорректной оценке структуры страницы и ухудшению UX-факторов.

Стратегическое значение

Патент подтверждает стратегический приоритет Яндекса на оценку реального пользовательского опыта (User Experience). Page Layout и удобство интерфейса — это не абстрактные понятия, а измеримые факторы, которые анализируются автоматически с помощью технологий визуального рендеринга. Эта технология является фундаментом для работы алгоритмов качества (Proxima, Antiquality). Долгосрочная SEO-стратегия должна включать глубокую работу над UX/UI, скоростью и стабильностью рендеринга наравне с контентом и ссылками.

Практические примеры

Сценарий 1: Идентификация агрессивной рекламы

Ситуация: На сайте при загрузке появляется полноэкранный Pop-up баннер, загруженный через обфусцированный JavaScript.
Анализ Кода: Система обнаруживает скрипт, добавляющий элемент в DOM.
Анализ Рендеринга: Система отрисовывает страницу и фиксирует, что появился элемент, который занимает всю площадь экрана (визуальная характеристика) и перекрывает основной контент.
Применение Правил (ML): Активируются правила (ML-модель), идентифицирующие Pop-up или Interstitial Ad. Рассчитывается высокая вероятность.
Результат: Элемент идентифицируется как агрессивная реклама. Данные передаются алгоритмам Anti-Quality, что может привести к пессимизации страницы за плохой UX.

Сценарий 2: Оценка юзабилити коммерческой страницы

Ситуация: Страница карточки товара в интернет-магазине.
Анализ Кода: Система идентифицирует теги <form>, <button> (Характеристики Кода), относящиеся к добавлению в корзину.
Анализ Рендеринга: Система определяет визуальное расположение формы/кнопки. Она фиксирует, что элемент находится на первом экране, заметен и не перекрыт другими блоками (Визуальные Характеристики).
Применение Правил: Система оценивает доступность и заметность функционального элемента.
Результат: Форма успешно идентифицирована, ее удобное расположение фиксируется как позитивный UX-сигнал (Proxima), подтверждающий функциональность страницы.

Вопросы и ответы

В чем ключевое отличие этого метода от простого анализа DOM-дерева?

Ключевое отличие заключается в том, что система анализирует финальную отрисованную версию страницы, а не только исходный код. Простой анализ DOM может быть неточным, так как CSS и JavaScript могут радикально изменить внешний вид и расположение элементов. Этот метод позволяет системе «увидеть» страницу так, как ее видит пользователь, анализируя визуальные характеристики (размер, положение, видимость) после рендеринга.

Какие именно объекты система ищет на странице?

В патенте (Claim 5) явно указаны следующие категории целевых объектов: логотип, карта, баннер, реклама и форма для ввода данных. Этот список демонстрирует фокус системы на идентификации элементов, важных для брендинга, монетизации, навигации и конверсии.

Как этот патент связан с оценкой качества сайта (ИКС, Proxima, Anti-Quality)?

Этот патент описывает фундаментальную технологию сбора данных для оценки качества. Чтобы алгоритмы типа Proxima или Anti-Quality могли оценить удобство страницы (UX) или наличие агрессивной рекламы, им нужно сначала точно идентифицировать эти элементы на странице и понять их расположение. Именно эту задачу и решает описанный механизм визуального и кодового анализа.

Влияет ли эта технология на ранжирование напрямую?

Напрямую нет. Это не алгоритм ранжирования, а система идентификации и сбора данных. Однако данные, которые она собирает (например, количество и расположение рекламы, структура страницы, удобство интерфейса), используются как входные сигналы для факторов ранжирования, связанных с качеством страницы, Page Layout и User Experience.

Что такое «Характеристики отрисованного объекта»?

Это визуальные свойства элемента после того, как браузер (или краулер) применил все стили (CSS) и выполнил скрипты (JS). К ним относятся точные геометрические размеры (ширина, высота), координаты расположения на экране, фактический цвет, видимость элемента, а также его положение относительно других элементов (например, перекрывает ли он что-то).

Смогу ли я скрыть рекламу от Яндекса с помощью обфускации кода или сложных скриптов?

Это маловероятно и рискованно. Поскольку система анализирует финальный отрисованный результат, то, что видит пользователь, видит и система. Даже если код обфусцирован, но в результате его выполнения на странице появляется блок с визуальными характеристиками рекламы, система его идентифицирует, используя комбинацию визуальных признаков и анализа кода.

Используется ли машинное обучение в этом процессе?

Да, патент (Claim 10) явно указывает, что процесс проверки (верификации) может осуществляться посредством алгоритма машинного обучения. Вероятно, ML-модель используется для анализа комбинации визуальных и кодовых характеристик и расчета итогового параметра вероятности, основываясь на данных, размеченных экспертами (асессорами).

Что означают «нежесткие» правила, упомянутые в патенте?

«Нежесткие» правила (Fuzzy rules) означают, что система не использует строгую бинарную логику (да/нет), а работает вероятностно. Например, если размер баннера немного отличается от стандарта, это не приведет к немедленному отказу в идентификации, а лишь немного понизит итоговый параметр вероятности. Это делает систему более гибкой и устойчивой к изменениям в веб-дизайне.

Как наличие сложного JavaScript (например, React/Vue/SPA) влияет на работу системы?

Это не должно мешать работе системы, а наоборот, делает ее необходимой. Система анализирует результат после выполнения JavaScript и финального рендеринга страницы. Поскольку технология реализована на базе браузера (Claim 15), она способна обрабатывать динамический контент так же, как это делает обычный браузер пользователя.

Как SEO-специалисту учитывать работу этого алгоритма на своем сайте?

Необходимо фокусироваться на финальном пользовательском опыте. Следует избегать агрессивной рекламы, следить за тем, чтобы реклама не мешала основному контенту, обеспечивать удобное расположение ключевых элементов (форм, навигации). Также критически важно оптимизировать Core Web Vitals, особенно CLS (стабильность верстки), чтобы обеспечить корректный визуальный анализ страницы роботом.