
Google агрегирует описания (метки) изображения или видео со всех сайтов, где этот контент размещен. Чтобы метка была принята как надежная («Final Label») и использовалась для ранжирования, она должна подтверждаться несколькими независимыми группами источников (консенсус). Этот механизм двойной группировки (по домену и по смыслу) снижает влияние спама и значительно повышает релевантность поиска медиаконтента.
Патент решает проблему ненадежности и зашумленности текстовых описаний, связанных с нетекстовым контентом (изображения, видео, аудио) на отдельно взятой веб-странице. Текст рядом с изображением (proximate text) или его метаданные могут быть неточными, спамными или контекстуальным шумом, что ухудшает качество поиска. Изобретение направлено на выявление точных и надежных меток путем достижения консенсуса между несколькими источниками.
Запатентована система для выбора высоконадежных меток (Final Labels) для нетекстового контента путем внедрения механизма консенсуса. Система агрегирует все исходные метки (Initial Labels) со всех страниц, где размещен контент. Ключевая инновация заключается в том, что метка принимается, только если она подтверждается пороговым количеством независимых групп источников, что обеспечивает валидацию данных и защиту от манипуляций.
Система использует многоэтапный процесс фильтрации:
Initial Labels для нетекстового элемента со всех источников.Matching Web Pages) – например, все метки с одного домена или от одного издателя. 2) По схожести содержания (Matching Labels) – например, метки с похожим текстом или концепцией.Final Label, только если она встречается в пороговом количестве различных групп.Final Label, базовый рейтинг контента (Baseline Result Score) значительно увеличивается с помощью Boost Factor.Высокая. Точная интерпретация и маркировка изображений и видео критически важны для качества вертикального поиска (Google Images, Video) и интеграции мультимедиа в основную выдачу. Методы достижения консенсуса для валидации данных и борьбы со спамом являются фундаментальными в современных системах Information Retrieval.
Патент имеет высокое значение (8.5/10) для стратегий Image SEO и Video SEO. Он детально описывает, как Google определяет, каким ключевым словам доверять. Это означает, что оптимизация на одной конкретной странице (например, через alt-text) может быть неэффективна, если она не соответствует тому, как этот контент описывается в среднем по интернету. Консистентность описаний и естественное распространение контента на разнообразных ресурсах становятся ключевыми факторами ранжирования.
Baseline Result Score, если запрос совпадает с Final Label. Его значение зависит от Match Score.Initial Labels, сгруппированных по общему признаку. Группы формируются на основе Matching Web Pages или Matching Labels.Initial Labels, имеющие достаточную степень схожести (Label Similarity Score выше порога). Схожесть может быть текстуальной (общие слова) или семантической (общая концепция, высокая cosine similarity).same publisher).Final Label.Claim 1 и Claim 17 (Независимые пункты): Описывают ядро системы и метода валидации меток.
Initial Labels для нетекстового элемента, каждый с идентификатором источника.Matching Web Pages (один домен или издатель). Исходные метки из этих страниц группируются в отдельные Initial Label Groups.Matching Labels (похожий текст, концепция или cosine similarity). Эти метки группируются в другие отдельные Initial Label Groups.Final Labels те N-граммы, которые присутствуют в как минимум пороговом количестве (Threshold Number) сформированных ранее Initial Label Groups.Ключевая инновация — требование консенсуса не по количеству упоминаний, а по количеству различных групп. Группировка по источнику специально предназначена для нейтрализации манипуляций со стороны одного сайта.
Claim 18 (Зависимый): Описывает применение Final Labels в ранжировании.
Final Label.Result Score) для этого элемента увеличивается.Claim 21, 22, 23 (Зависимые): Детализируют механизм повышения.
Baseline Result Score на Boost Factor (>1.0).Match Score между запросом и Final Label.Boost Factor выбирается на основе Match Score и может быть пропорционален ему (чем лучше совпадение, тем выше бустинг).Claim 32 (Зависимый): Упоминает обработку уникальных меток.
Initial Label Groups и также участвовать в расчете консенсуса.Изобретение затрагивает несколько этапов поисковой архитектуры, связывая процессы индексирования и ранжирования для нетекстового контента.
CRAWLING и INDEXING (Предварительный этап) – Сбор данных и извлечение признаков
На этом этапе система обнаруживает нетекстовый контент, идентифицирует все страницы, где он используется (включая дубликаты или близкие копии), и извлекает Initial Labels (окружающий текст, метаданные). Эти данные сохраняются (например, в Label Store).
INDEXING (Основной процесс / Офлайн-анализ)
Основной алгоритм патента (выбор Final Labels) работает на этом этапе. Система (Image Search Component) анализирует агрегированные Initial Labels, выполняет двойное группирование и определяет Final Labels на основе консенсуса. Эти финальные метки индексируются и ассоциируются с нетекстовым элементом.
RANKING / RERANKING – Ранжирование и Переранжирование
Во время обработки запроса (например, в Google Images или Video) система использует предварительно рассчитанные Final Labels. Вычисляется Match Score между запросом и метками. Если совпадение есть, система рассчитывает Boost Factor и применяет его к Baseline Result Score. Это влияет на финальную позицию контента в выдаче.
Входные данные:
Initial Labels для нетекстового элемента.Выходные данные:
Final Labels, ассоциированных с нетекстовым элементом.multiple web pages).Final Labels.threshold number) групп меток для достижения консенсуса. Также используется порог сходства (similarity threshold) для определения Matching Labels.Процесс А: Выбор Финальных Меток (Офлайн / Индексирование)
Initial Labels (текст и URL источника).Matching Web Pages (например, по домену или издателю).Initial Label Group.Matching Labels (например, по текстовой схожести или концепции).Initial Label Group.Initial Label Group генерируются N-граммы (слова и фразы) на основе текста меток внутри группы.Initial Label Groups, в которых встречается каждая N-грамма.Final Labels.Процесс Б: Применение в Ранжировании (Онлайн / Query Time)
Match Score между запросом и набором Final Labels нетекстового элемента.Boost Factor, основанный на значении Match Score (может быть пропорционален ему).Baseline Result Score нетекстового элемента увеличивается (например, умножается) с использованием Boost Factor.Система фокусируется на контекстуальных и технических факторах, связанных с размещением контента.
Matching Web Pages.Initial Labels).Final Label.Matching Labels. Может рассчитываться как: Cosine similarity measure (косинусное сходство).Final Label.Baseline Result Score. В патенте указано, что он может быть пропорционален Match Score.Final Label) требуется подтверждение (консенсус) из нескольких независимых групп источников или контекстов.Matching Web Pages) в одну группу нейтрализует попытки спама. Многократное повторение ключевого слова на одном сайте будет засчитано как один «голос» в пользу этого ключевого слова.Final Label, он должен появиться в разных группах. Это подчеркивает важность того, чтобы контент был описан схожим образом на разных доменах (разнообразие источников) и/или разными релевантными фразами (разнообразие контекстов).Final Labels не просто определяют релевантность, но и активно повышают ранжирование через Boost Factor. Наличие высоконадежной метки, совпадающей с запросом, может значительно улучшить позиции контента.Matching Labels, cosine similarity), что указывает на применение семантического анализа для группировки меток.Proximate Text (окружающий текст, подписи), метаданных (включая имена файлов) и атрибутов (например, alt text). Это формирует качественные Initial Labels, которые с большей вероятностью найдут подтверждение у других источников.Initial Label Groups.Final Labels за счет консенсуса между вашим сайтом и сайтами партнеров.Matching Labels), даже если слова разные. Это увеличивает вероятность формирования разнообразных групп, подтверждающих основную тему контента.Matching Web Pages) и дадут только один голос при расчете консенсуса.Initial Labels. Если эти метки не найдут подтверждения в других источниках, они будут отфильтрованы.publisher). В этом случае все они попадут в одну Initial Label Group.Патент подтверждает стратегию Google по борьбе с манипуляциями и повышению точности поиска за счет анализа сигналов со всего интернета. Для SEO это означает, что оптимизация нетекстового контента — это не только On-Page задача, но и Off-Page. Стратегия должна включать PR и контент-маркетинг, направленные на то, чтобы ключевые визуальные активы компании появлялись в правильном контексте на авторитетных ресурсах, тем самым формируя необходимый консенсус.
Сценарий 1: Оптимизация изображения продукта в E-commerce (Успех)
Изображение: Фотография кроссовок "Nike Air Max 90, синие".
Final Label.Final Label.Final Label.Boost Factor, так как запрос хорошо совпадает с валидированными Final Labels. Текст о "распродаже" игнорируется.Сценарий 2: Попытка манипуляции (Неудача)
Initial Labels. Но все они с одного домена (Matching Web Pages). Они группируются в ОДНУ Initial Label Group.Final Label. Изображение не ранжируется по страховым запросам.Как система обрабатывает несколько разных описаний одного изображения на одном домене?
Согласно патенту, страницы с одного домена или от одного издателя определяются как Matching Web Pages. Все исходные метки (Initial Labels) с этих страниц объединяются в одну Initial Label Group. Это означает, что весь домен рассматривается как один источник мнения (один «голос») в процессе достижения консенсуса, что предотвращает манипуляции путем многократного повторения ключевых слов на одном сайте.
Что важнее для формирования Final Label: схожесть источников или схожесть текста меток?
Важны оба аспекта, так как система генерирует группы на основе обоих критериев параллельно. Final Label должна появиться в пороговом количестве групп, независимо от того, как эти группы были сформированы. Цель системы — обеспечить максимальное разнообразие подтверждающих сигналов, поэтому идеальная ситуация — когда метка подтверждается разными доменами и разными релевантными формулировками.
Как система определяет «Matching Labels», если текст разный?
Патент предусматривает несколько методов определения схожести меток (Label Similarity Score). Это может быть не только наличие общих слов, но и наличие слов, относящихся к одной концепции (семантическая близость), или высокая оценка cosine similarity. Это указывает на использование NLP для понимания смысла меток, а не только их текстового совпадения.
Влияет ли этот патент только на Google Images или на основной поиск тоже?
Патент описывает поиск по нетекстовому контенту в целом (Images, Video, Audio). Результаты этого процесса напрямую влияют на основной поиск (Web Search) через механизмы Universal Search. Если изображение или видео получает высокий скорректированный рейтинг благодаря Final Labels и Boost Factor, оно с большей вероятностью будет показано в мультимедийных блоках (карусели изображений, видео-блоки) на странице выдачи.
Насколько сильным может быть Boost Factor?
Повышение может быть значительным. Патент указывает, что Boost Factor — это значение больше 1.0, используемое для умножения базовой оценки. Также указано, что коэффициент может быть пропорционален Match Score (качеству совпадения запроса и Final Label). Это предполагает, что хорошо подтвержденные метки, точно соответствующие запросу, могут дать значительное преимущество в ранжировании.
Как этот механизм влияет на SEO для стоковых фотографий или изображений, которые часто используются повторно?
Этот механизм идеально подходит для анализа таких изображений. Поскольку они используются в разных контекстах на многих сайтах, система соберет много Initial Labels. Механизм консенсуса отфильтрует специфический контекст отдельных статей и выделит то, что действительно изображено на фото. Ваш собственный контекст добавит новые данные, но может не переопределить уже сложившийся консенсус.
Что произойдет, если изображение используется только на одной странице?
Если изображение используется только на одной странице, механизм консенсуса не может быть полноценно применен, так как будет сформировано недостаточно Initial Label Groups для достижения порога. В этом случае система, вероятно, будет полагаться на стандартные методы ранжирования (Baseline Result Score) без применения значительного Boost Factor, описанного в этом патенте.
Учитывает ли система авторитетность сайтов, с которых берутся метки?
Патент не упоминает использование авторитетности или качества сайта (Site Quality) в этом конкретном процессе выбора Final Labels или расчета Boost Factor. Он фокусируется на достижении консенсуса через разнообразие групп. Однако авторитетность сайта, вероятно, учитывается при расчете исходного Baseline Result Score.
Как обрабатываются метки на разных языках?
В описании патента упоминается, что схожесть меток (Label Similarity) может основываться на переводах. Например, слово на английском и его эквивалент на другом языке могут считаться схожими. Это предполагает, что система может достигать консенсуса кросс-лингвально, объединяя метки на разных языках, если они семантически эквивалентны.
Что такое «Proximate Text» и насколько он важен?
Proximate Text — это текст, который отображается в пределах порогового количества пикселей от нетекстового элемента на веб-странице или в том же разделе. Он является одним из основных источников для Initial Labels, наряду с метаданными и именами файлов. Его важность высока, так как он формирует контекст, который система анализирует для понимания содержания изображения или видео.

Мультимедиа
Семантика и интент
SERP

Мультимедиа
SERP

Индексация
Мультимедиа
Семантика и интент

Мультимедиа
Индексация
Семантика и интент

Мультимедиа
SERP
Семантика и интент

Персонализация
Поведенческие сигналы
Семантика и интент

EEAT и качество
Антиспам
SERP

Ссылки
SERP

Семантика и интент
SERP
Поведенческие сигналы

Поведенческие сигналы
SERP

Knowledge Graph
Семантика и интент
Персонализация

Поведенческие сигналы
Антиспам
SERP

Персонализация
Поведенческие сигналы
SERP

Local SEO
Поведенческие сигналы

Семантика и интент
SERP
Поведенческие сигналы
