SEO HARDCORE
  • Разборы патентов
    • Патенты Google
  • Скоро SEO инструменты
  • Скоро SEO аналитика
  • seohardcore
SEO HARDCORE
назад

Как Google использует визуальное сходство изображений для проверки качества перевода и улучшения кросс-язычного поиска (CLIR)

VALIDATING TRANSLATIONS USING VISUAL SIMILARITY BETWEEN VISUAL MEDIA SEARCH RESULTS (Валидация переводов с использованием визуального сходства между результатами поиска по визуальным медиа)
  • US8538957B1
  • Google LLC
  • 2009-06-03
  • 2013-09-17
  • Мультиязычность
  • Мультимедиа
  • EEAT и качество
  • Семантика и интент
  • Описание
  • Разбор
  • Выводы
  • Практика
  • FAQ
  • Похожие

Google проверяет точность перевода фраз, сравнивая визуальное сходство результатов поиска по картинкам и видео для исходной фразы и её перевода. Если топовые визуальные результаты похожи и показывают высокое качество взаимодействия, перевод считается валидным. Этот механизм используется для расширения запроса и показа релевантного контента на других языках (Cross-Lingual Information Retrieval).

Описание

Какую проблему решает

Патент решает проблему неточности и неоднозначности автоматических переводов, которые часто не улавливают нюансы использования слов в разных языках. Например, английское "mouse" означает и животное, и компьютерное устройство, тогда как итальянское "topo" — только животное. Это приводит к ошибкам при кросс-язычном поиске (Cross-Lingual Information Retrieval, CLIR). Цель изобретения — валидировать переводы, проверяя, соответствуют ли они одному и тому же визуальному концепту.

Что запатентовано

Запатентована система (Translation Validator), которая использует визуальные данные как язык-независимый способ подтверждения качества перевода. Основная идея: если две фразы на разных языках означают одно и то же, то результаты поиска по изображениям или видео (Visual Media Search Results, VMSR) для этих фраз должны быть визуально похожи. Система сравнивает наборы VMSR и вычисляет оценку сходства (Similarity Score).

Как это работает

Система работает по принципу "визуального обоснования" (Visual Grounding):

  • Выборка VMSR: Для исходной фразы и перевода система определяет наиболее репрезентативные изображения/видео. Выборка основывается на поведении пользователей (Click Data) — выбираются самые кликабельные результаты.
  • Расчет визуального сходства: Система сравнивает визуальные признаки (цвет, форма и т.д.) изображений из двух наборов и рассчитывает Similarity Score.
  • Оценка качества: Дополнительно рассчитывается Quality of Results Statistic (например, CTR, Dwell Time) для результатов по переведенному запросу.
  • Валидация: Перевод признается валидным, только если И Similarity Score, И Quality of Results Statistic удовлетворяют установленным порогам.
  • Применение (CLIR): Валидированные переводы используются для расширения запросов пользователя и поиска релевантного контента на других языках.

Актуальность для SEO

Высокая. Кросс-язычный поиск и понимание концепций независимо от языка являются центральными элементами современных поисковых технологий (например, MUM). Использование визуальных данных для понимания семантики языка (Visual Grounding) остается крайне актуальным трендом. Хотя конкретные алгоритмы компьютерного зрения эволюционировали с 2009 года, базовый принцип патента активно используется.

Важность для SEO

Патент имеет значительное влияние (6.5/10), особенно для международного SEO и оптимизации визуального контента (Image/Video SEO). Он раскрывает механизм, с помощью которого Google связывает запросы на разных языках на основе визуальных концепций. Это подчеркивает важность консистентного визуального представления и оптимизации изображений на всех целевых рынках для улучшения видимости в сценариях кросс-язычного поиска.

Детальный разбор

Термины и определения

Candidate Translation / Candidate Related Phrases (Кандидат перевода / Кандидатные связанные фразы)
Предполагаемый перевод исходной фразы на другой язык или связанная фраза (в том же или другом языке), которая требует валидации концептуального соответствия.
Click Data (Данные о кликах)
Данные о поведении пользователей, показывающие, как часто пользователи выбирают определенный результат поиска. Используются для выбора репрезентативных VMSR.
Cross-Lingual Information Retrieval (CLIR) (Кросс-язычный информационный поиск)
Процесс поиска информации, написанной на языке, отличном от языка запроса пользователя.
Dwell Time (Время пребывания)
Время, которое пользователь проводит за просмотром результата поиска после клика. Используется при расчете Quality of Results Statistic.
Feature Score (Оценка признака)
Численная оценка визуального сходства между двумя отдельными изображениями (парой), основанная на сравнении их визуальных признаков (цвет, форма, текстура и т.д.).
Quality of Results Statistic (Статистика качества результатов)
Метрика, оценивающая качество или полезность поисковой выдачи для данного запроса. Основывается на данных о поведении пользователей (например, CTR, Dwell Time).
Similarity Score (Оценка сходства)
Агрегированная метрика, оценивающая общую визуальную схожесть между набором VMSR для исходной фразы и набором VMSR для кандидата перевода.
Translation Validator (Валидатор перевода)
Система, описанная в патенте, которая проверяет точность переводов или связанных фраз.
Visual Media Search Results (VMSR) (Результаты поиска по визуальным медиа)
Изображения, видео или другие визуальные объекты, возвращаемые поисковой системой в ответ на текстовый запрос.

Ключевые утверждения (Анализ Claims)

Claim 1 (Независимый пункт): Описывает основной метод валидации перевода, включая двойную проверку.

  1. Система получает фразу (Язык A) и кандидатов перевода (Язык B).
  2. Получается первая группа VMSR (для фразы) и вторая группа VMSR (для кандидата).
  3. Для каждого кандидата генерируется Quality of Results Statistic. Эта статистика оценивает качество поисковой выдачи по запросу, соответствующему кандидату.
  4. Для каждого кандидата вычисляется Similarity Score (оценка визуального сходства между первой и второй группой VMSR).
  5. Выбор кандидатов основывается одновременно на их Similarity Score И их Quality of Results Statistic.
  6. Выбранные кандидаты ассоциируются с фразой как валидные переводы.

Критически важный момент: Валидация требует соответствия двум критериям одновременно — визуальному сходству И качеству выдачи по переводу. Перевод не будет валидирован, если он ведет на низкокачественную выдачу.

Claim 2 (Зависимый от 1): Детализирует расчет Similarity Score.

  1. Генерируются Feature Scores для пар VMSR (один из первой группы, один из второй). Feature Score оценивает визуальное сходство конкретной пары.
  2. Итоговый Similarity Score генерируется на основе агрегации этих Feature Scores.

Claim 5 (Зависимый от 1): Уточняет метод выбора VMSR.

Группы VMSR идентифицируются на основе данных, указывающих на поведение пользователей (data indicative of user behavior), т.е. Click Data. Для сравнения берутся наиболее востребованные пользователями (кликабельные) изображения.

Claim 6 (Зависимый от 1): Описывает применение валидированного перевода (CLIR).

  1. Система получает новый поисковый запрос, соответствующий исходной фразе.
  2. Идентифицируются ранее валидированные переводы.
  3. Генерируется набор поисковых результатов, основанный как на исходном запросе, так и на валидированных переводах (смешивание кросс-язычной выдачи).

Где и как применяется

Изобретение затрагивает несколько этапов поисковой архитектуры, фокусируясь на понимании запросов и расширении поиска.

INDEXING – Индексирование и извлечение признаков
На этом этапе происходят офлайн-процессы:

  • Извлечение и индексация визуальных признаков (features) из изображений и видео.
  • Анализ журналов поиска и агрегация поведения пользователей (User Search Histories, Click Data) для определения популярности результатов.

QUNDERSTANDING – Понимание Запросов
Это основная область применения. Система использует описанный механизм для построения базы данных валидированных переводов (Translation Database). Это улучшает понимание соответствия между терминами в разных языках на основе визуальных данных (Visual Grounding). Также этот механизм используется для расширения запроса (Query Expansion) в рамках CLIR и потенциально для генерации подсказок (Query Suggestions).

METASEARCH – Метапоиск и Смешивание
Применение валидированных переводов (Claim 6). Когда пользователь вводит запрос, система может идентифицировать валидный перевод и выполнить параллельный поиск по обоим запросам в соответствующих языковых индексах, а затем смешать (Blending) результаты для улучшения полноты выдачи.

Входные данные:

  • Исходная фраза и кандидаты перевода.
  • User Search Histories (включая Click Data и Dwell Time).
  • Индекс визуальных медиа с извлеченными визуальными признаками.

Выходные данные:

  • Валидированные переводы, сохраненные в Translation Database.
  • (При использовании в CLIR): Расширенный набор поисковых результатов, включающий контент на разных языках.

На что влияет

  • Конкретные типы контента: В первую очередь влияет на поиск по изображениям и видео (Visual Search). Также влияет на веб-поиск через механизм кросс-язычного смешивания результатов.
  • Специфические запросы: Наиболее эффективно для запросов, связанных с конкретными, визуально представимыми концепциями (объекты, места, животные, продукты). Менее эффективно для абстрактных понятий.
  • Конкретные ниши: E-commerce (названия продуктов), туризм (достопримечательности), международные сайты.
  • Языковые и географические ограничения: Специально разработано для преодоления языковых барьеров и улучшения международного поиска.

Когда применяется

  • Офлайн-процесс: Система периодически анализирует фразы и генерирует/обновляет базу данных валидированных переводов.
  • Онлайн-процесс (CLIR): Когда пользователь вводит запрос, система может использовать ранее валидированный перевод для расширения поиска. Это особенно актуально, если результатов на языке пользователя недостаточно или если концепт более популярен на другом языке.

Пошаговый алгоритм

Процесс валидации перевода

  1. Получение входных данных: Система получает исходную фразу (P) и кандидата перевода (T).
  2. Выбор репрезентативных VMSR:
    1. Анализируются User Search Histories для запросов P и T.
    2. Выбираются топовые VMSR для P (Группа 1) и T (Группа 2) на основе Click Data (наиболее кликабельные изображения).
  3. Расчет Quality of Results Statistic: Для запроса T вычисляется метрика качества выдачи, основанная на поведении пользователей (например, CTR, Dwell Time).
  4. Расчет визуального сходства (Similarity Score):
    1. Генерация Feature Scores: Для каждой пары изображений (одно из Группы 1, одно из Группы 2) рассчитывается Feature Score на основе сравнения векторов визуальных признаков.
    2. Агрегация: Feature Scores агрегируются (например, путем усреднения топовых оценок) для получения общего Similarity Score.
  5. Валидация и Выбор: Кандидат T считается валидным переводом P, если И Similarity Score удовлетворяет первому порогу, И Quality of Results Statistic удовлетворяет второму порогу.
  6. Сохранение: Валидированный перевод сохраняется в Translation Database.

Какие данные и как использует

Данные на входе

Патент явно указывает на использование следующих типов данных:

  • Поведенческие факторы: Критически важные данные. Используются User Search Histories для анализа взаимодействия пользователей с результатами поиска. Конкретно используются:
    • Click Data: Частота выбора результатов. Используется для выбора репрезентативных VMSR.
    • Dwell Time: Время просмотра результата (упоминаются "short clicks", "medium clicks", "long clicks"). Используется для расчета Quality of Results Statistic.
    • Click Through Rate (CTR): Используется как возможная реализация Quality of Results Statistic.
  • Мультимедиа факторы: Визуальные признаки (features), извлеченные из VMSR. Упоминаются: цвета, формы, края, углы, ключевые точки. Для извлечения используются алгоритмы типа Canny, SIFT, SURF, GLOH и т.д.

Какие метрики используются и как они считаются

  • Feature Score: Оценка сходства между двумя изображениями. Рассчитывается путем сравнения векторов визуальных признаков. В патенте приводится пример использования косинусного расстояния (Cosine distance) между векторами признаков X и Y:

    Cosine Distance=X⋅Y∥X∥⋅∥Y∥\text{Cosine Distance} = \frac{X \cdot Y}{\|X\| \cdot \|Y\|}

    Также упоминаются расстояние Хэмминга, индекс Жаккара и Евклидово расстояние.
  • Similarity Score: Агрегированная оценка сходства между двумя наборами изображений. Рассчитывается путем агрегации Feature Scores. Методы включают усреднение топовых Feature Scores для снижения влияния выбросов.
  • Quality of Results Statistic: Оценка качества выдачи по запросу. Рассчитывается на основе анализа поведения пользователей (CTR или анализ Dwell Time).

Выводы

  1. Визуальные сигналы как валидатор семантики (Visual Grounding): Google использует визуальное сходство как объективный, язык-независимый метод для подтверждения того, что фразы на разных языках (или даже в одном языке) означают одно и то же. Изображения служат мостом между языками.
  2. Поведение пользователей определяет значение: Система полагается на Click Data для определения того, какие изображения лучше всего представляют значение фразы. Изображения, на которые чаще кликают в Image Search, становятся "визуальным определением" запроса.
  3. Двойная валидация перевода (Сходство + Качество): Для валидации перевода недостаточно только визуального сходства (Similarity Score). Необходимо также, чтобы выдача по переведенному запросу была качественной и полезной пользователям (Quality of Results Statistic).
  4. Цель — улучшение CLIR: Основное применение патента — это улучшение кросс-язычного поиска. Система позволяет расширять запрос пользователя точным переводом для поиска релевантного контента на других языках.
  5. Разрешение неоднозначности (Полисемия): Механизм помогает бороться с неоднозначностью слов, используя визуальный контекст. Например, система может отличить "mouse" (животное) от "mouse" (устройство) по внешнему виду результатов и валидировать перевод только для соответствующего значения.

Практика

Best practices (это мы делаем)

  • Обеспечение визуальной консистентности (International SEO): Для ключевых концепций, продуктов и брендов необходимо поддерживать согласованное визуальное представление на всех языковых версиях сайта. Если изображение продукта на французском сайте визуально идентично изображению на английском, это увеличивает Similarity Score между соответствующими запросами и укрепляет связь между переводами.
  • Оптимизация изображений под репрезентативность и CTR: Необходимо стремиться к тому, чтобы именно ваши изображения становились репрезентативными VMSR для ключевых запросов. Используйте четкие, высококачественные и привлекательные изображения, которые явно иллюстрируют концепцию запроса, чтобы максимизировать их Click Data в Image Search.
  • Четкая визуальная релевантность: Обеспечьте сильную корреляцию между текстовым контентом и размещенными изображениями. Визуальный контент должен однозначно иллюстрировать тему. Это помогает системе правильно интерпретировать значение ваших ключевых слов через визуальные данные.
  • Мониторинг выдачи Image Search на разных рынках: Анализируйте, какие изображения ранжируются по вашим ключевым запросам в разных странах. Если наборы изображений визуально сильно различаются, это сигнал о том, что Google может не устанавливать прочную семантическую связь между этими терминами.

Worst practices (это делать не надо)

  • Использование нерелевантных или общих стоковых фото: Размещение изображений, которые слабо связаны с темой, ухудшает способность системы понять контекст страницы через визуальные данные и не поможет в процессе валидации ваших ключевых фраз.
  • Кликбейт в Image Search: Использование изображений, оптимизированных для привлечения кликов, но не соответствующих содержанию. Это может привести к низким показателям Quality of Results Statistics (например, низкий Dwell Time), что повредит валидации согласно Claim 1.
  • Использование радикально разного визуального стиля для одного объекта: Если компания использует совершенно разные фотографии для одного и того же продукта на разных рынках без четкой связи, это может снизить Similarity Score и затруднить кросс-язычную ассоциацию.

Стратегическое значение

Патент подтверждает стратегию Google по переходу от анализа текста к пониманию концепций, используя мультимодальные данные. Визуальный контент является ключевым элементом этой стратегии, выступая в роли универсального "языка". Для SEO это означает, что оптимизация визуального контента — это не просто получение трафика из картинок, но и важный элемент для улучшения семантического понимания всего сайта, особенно в международном контексте. Успех в Image Search может влиять на общее понимание запросов (Query Understanding).

Практические примеры

Сценарий: Оптимизация карточки товара для международного E-commerce

  1. Задача: Интернет-магазин продает модель кроссовок "Nebula X1" по всему миру и хочет убедиться, что Google установил связь между запросами "Nebula X1 sneakers" (EN) и "baskets Nebula X1" (FR).
  2. Действия SEO-специалиста:
    1. Обеспечить, чтобы в обеих языковых версиях использовались высококачественные, идентичные или очень похожие фотографии продукта.
    2. Оптимизировать Alt-текст и окружающий контент на соответствующих языках для повышения ранжирования в Image Search.
  3. Механизм Google: Пользователи в обеих странах кликают на эти консистентные изображения. Они становятся репрезентативными VMSR для обоих запросов. Система валидации сравнивает эти VMSR и видит высокий Similarity Score и хороший Quality of Results Statistic.
  4. Результат: Перевод валидирован. Если пользователь во Франции ищет "Nebula X1 sneakers" (на английском), Google может использовать CLIR и подмешать результаты из французского индекса (используя валидный перевод "baskets Nebula X1"), улучшая выдачу и повышая видимость товара.

Вопросы и ответы

Как система определяет, какие именно изображения использовать для сравнения?

Система не использует все релевантные изображения. Патент (Claim 5) подчеркивает, что выбор основывается на "данных, указывающих на поведение пользователей". На практике это означает выбор Топ-N изображений, которые получают наибольшее количество кликов (Click Data) по данному запросу в поиске по картинкам. Они считаются наиболее репрезентативными.

Что такое "Quality of Results Statistic" и почему это важно?

Это метрика, оценивающая качество поисковой выдачи для переведенной фразы, например, CTR или анализ Dwell Time (время взаимодействия). Это важно, потому что Google не хочет валидировать перевод, даже если он визуально похож, если поисковая выдача по этому переводу низкого качества или не полезна пользователям. Для валидации нужны и сходство, и качество.

Как этот патент влияет на международное SEO?

Он напрямую влияет через механизм Cross-Lingual Information Retrieval (CLIR). Если Google валидировал перевод между фразами на разных языках с помощью этого метода, он может автоматически расширить запрос пользователя и показать результаты на другом языке. Это позволяет вашему контенту ранжироваться по кросс-язычным запросам без прямой оптимизации под них.

Как система справляется с неоднозначными терминами (полисемией), например, "mouse"?

Это одно из преимуществ метода. Для слова "mouse" система получит два визуальных кластера: животные и устройства. Если исходная фраза на итальянском "topo" (только животное), ее изображения будут визуально похожи только на кластер "животное". Система определит, что перевод валиден только для этого значения, помогая разрешить неоднозначность.

Означает ли это, что качество изображений на моем сайте влияет на текстовое ранжирование?

Косвенно, да. Качество, релевантность и популярность (клики) ваших изображений в Image Search определяют, насколько хорошо Google понимает визуальный контекст связанных с ними ключевых слов. Это понимание используется для валидации переводов и общего понимания запросов (Query Understanding), что влияет на видимость сайта.

Применяется ли этот метод для валидации синонимов в одном языке?

Да. Хотя основной фокус патента — это переводы, в тексте упоминается, что валидатор может также использоваться для проверки отношений между "кандидатными связанными фразами" (Candidate Related Phrases) независимо от языка. Он может проверить, описывают ли две разные фразы в одном языке один и тот же концепт, основываясь на визуальном сходстве их результатов.

Какие визуальные признаки анализирует Google?

Патент упоминает широкий спектр признаков: цвета, формы, края, углы, точки интереса. Также упоминаются конкретные алгоритмы, популярные на момент подачи заявки, такие как SIFT (Scale-invariant feature transform) и SURF (Speeded Up Robust Features). Современные системы используют более продвинутые методы, но принцип анализа визуальных характеристик остается тем же.

Что делать, если я использую разные картинки для одного и того же товара в разных странах?

Если визуальные представления будут сильно отличаться, система может не обнаружить высокого Similarity Score между названиями товара на разных языках. Это может ослабить связь между переводами и потенциально ухудшить работу кросс-язычного поиска (CLIR) для вашего контента. Рекомендуется сохранять визуальную консистентность.

Что важнее для SEO в контексте этого патента: Alt-текст или само изображение?

Оба элемента важны. Alt-текст помогает изображению ранжироваться по запросу в Image Search и получать клики. Но именно визуальные характеристики самого изображения (пиксели, формы) используются для расчета Similarity Score. Если изображение нерелевантно тексту, оно не поможет в валидации концепции.

Как это влияет на абстрактные темы без четкого визуального представления?

Для абстрактных тем (например, "философия") этот механизм менее эффективен, так как результаты поиска по картинкам будут очень разнообразными и не иметь единого визуального образа. В таких случаях Google будет больше полагаться на текстовые и семантические сигналы для валидации переводов и связей.

Похожие патенты

Как Google использует IDF и CTR для выбора языка перевода запросов в поиске по картинкам и видео (CLIR)
Google применяет механизм кросс-язычного поиска (CLIR) для улучшения выдачи изображений и видео. Система автоматически переводит запрос пользователя на другие языки, выбирая наиболее подходящий на основе частотности терминов (IDF) в его корпусе. Результаты поиска по переведенному запросу подмешиваются в основную выдачу, а их ранжирование зависит от статистики качества (например, CTR) этого запроса.
  • US8577910B1
  • 2013-11-05
  • Мультиязычность

  • Мультимедиа

  • Поведенческие сигналы

Как Google решает, когда переводить запрос пользователя на другие языки, а когда уважать его языковой выбор
Google использует систему фильтрации для управления межъязыковым поиском (CLIR). Система анализирует язык запроса, язык интерфейса пользователя и его местоположение. Если пользователь вводит запрос на языке, отличном от языка интерфейса, Google предполагает мультиязычность и не переводит запрос, экономя ресурсы. Перевод активируется, если язык запроса совпадает с языком интерфейса, особенно если локальных результатов мало.
  • US9824147B1
  • 2017-11-21
  • Мультиязычность

  • Персонализация

  • Семантика и интент

Как Google использует анализ параллельных анкорных текстов и кликов пользователей для перевода запросов и кросс-язычного поиска
Google использует механизм для автоматического перевода запросов с одного языка или набора символов на другой. Система создает вероятностный словарь, анализируя, как анкорные тексты на разных языках ссылаются на одни и те же страницы (параллельные анкоры). Вероятности перевода затем уточняются на основе того, на какие результаты кликают пользователи. Это позволяет осуществлять кросс-язычный поиск (CLIR).
  • US8706747B2
  • 2014-04-22
  • Мультиязычность

  • Семантика и интент

  • Ссылки

Как Google использует машинный перевод для поиска контента на иностранных языках (Cross-Language Information Retrieval)
Google использует механизмы Cross-Language Information Retrieval (CLIR) для поиска релевантного контента независимо от языка запроса. Система может перевести запрос пользователя на другие языки и искать в индексах этих языков (Query Translation), либо заранее перевести контент сайтов на язык пользователя (Document Translation). Это позволяет предоставлять пользователю лучшие результаты, даже если они изначально опубликованы на иностранном языке.
  • US7890493B2
  • 2011-02-15
  • Мультиязычность

  • Индексация

Как Google автоматически определяет, на каких языках искать ответ на запрос пользователя (CLIR)
Google использует механизм для автоматического определения наиболее релевантных языков для поиска по запросу пользователя. Система анализирует термины, связанные с запросом, и их привязку к различным языкам на основе структурированных данных (например, Википедии). Если система определяет, что ценный контент существует на других языках, она переводит запрос, выполняет поиск и подмешивает переведенные результаты в выдачу.
  • US8862595B1
  • 2014-10-14
  • Мультиязычность

Популярные патенты

Как Google использует исторические данные о поведении пользователей для сохранения эффективных синонимов
Google постоянно обновляет модели, определяющие синонимы для расширения запросов. Этот патент описывает защитный механизм: если новая модель отключает синоним, который исторически давал хорошие результаты (пользователи были довольны выдачей), система автоматически вернет этот синоним в работу, опираясь на накопленные данные о поведении пользователей.
  • US8762363B1
  • 2014-06-24
  • Семантика и интент

  • Поведенческие сигналы

  • SERP

Как Google использует свой индекс для автоматического обновления устаревших ссылок в закладках, истории поиска и на веб-страницах
Система Google поддерживает актуальность различных коллекций URL (закладки пользователей, история поиска, электронные письма), используя основной поисковый индекс как эталон канонических адресов. Если сохраненный URL устарел, система автоматически заменяет его на актуальную версию. Также описан механизм уведомления владельцев сайтов о неработающих исходящих ссылках.
  • US20130144836A1
  • 2013-06-06
  • Ссылки

  • Индексация

  • Техническое SEO

Как Google предсказывает намерения пользователя и выполняет поиск до ввода запроса (Predictive Search)
Google использует механизм для прогнозирования тем, интересующих пользователя в конкретный момент времени, основываясь на его истории и контексте. При обнаружении сигнала о намерении начать поиск (например, открытие страницы поиска), система проактивно выполняет запрос по предсказанной теме и мгновенно показывает результаты или перенаправляет пользователя на релевантный ресурс.
  • US8510285B1
  • 2013-08-13
  • Семантика и интент

  • Персонализация

  • Поведенческие сигналы

Как Google классифицирует запросы как навигационные или исследовательские, чтобы регулировать количество показываемых результатов
Google использует систему для динамического определения количества отображаемых результатов поиска. Система классифицирует запрос как навигационный (поиск конкретного места/ресурса) или исследовательский (поиск вариантов). Классификация основана на анализе компонентов оценки релевантности (совпадение по названию vs. категории) и энтропии исторических кликов. При навигационном интенте количество результатов сокращается.
  • US9015152B1
  • 2015-04-21
  • Семантика и интент

  • Поведенческие сигналы

  • Local SEO

Как Google использует данные веб-поиска и клики пользователей для классификации бизнесов и построения иерархии категорий
Google анализирует логи веб-поиска (введенные ключевые слова и последующие клики по результатам), чтобы понять, как пользователи интуитивно классифицируют бизнесы. Эти данные используются для автоматического построения динамической иерархической структуры категорий. Эта структура затем применяется для улучшения точности поиска, в частности, для оптимизации моделей распознавания речи в голосовых системах.
  • US7840407B2
  • 2010-11-23
  • Поведенческие сигналы

  • Семантика и интент

  • Структура сайта

Как Google использует машинное обучение и данные о длительности сессий для выявления битых Deep Links в мобильных приложениях
Google использует систему машинного обучения для анализа того, как долго пользователи взаимодействуют с контентом в приложении после перехода по Deep Link (Presentation Duration). Анализируя распределение этих временных интервалов, система классифицирует ссылку как рабочую или битую без необходимости прямого сканирования контента. Это позволяет Google удалять неработающие ссылки из индекса.
  • US10628511B2
  • 2020-04-21
  • Ссылки

  • Индексация

  • Поведенческие сигналы

Как Google использовал специальные токены в запросе (например, «+») для прямой навигации на верифицированные социальные страницы в обход SERP
Google может интерпретировать специальные токены в поисковом запросе (например, «+») как намерение пользователя найти официальную социальную страницу сущности. Если система идентифицирует верифицированный профиль, соответствующий запросу с высокой степенью уверенности, она может перенаправить пользователя прямо на эту страницу, минуя стандартную поисковую выдачу.
  • US9275421B2
  • 2016-03-01
  • Семантика и интент

  • SERP

  • Ссылки

Как Google подменяет ссылки в выдаче, чтобы обойти медленные редиректы на мобильные версии сайтов
Google оптимизирует скорость загрузки, определяя, когда клик по результату поиска вызовет условный редирект (например, с десктопной версии на мобильную). Система заранее подменяет исходную ссылку в выдаче на конечный URL редиректа. Это позволяет устройству пользователя сразу загружать нужную страницу, минуя промежуточный запрос и экономя время.
  • US9342615B2
  • 2016-05-17
  • Техническое SEO

  • SERP

  • Ссылки

Как Google динамически обновляет выдачу в реальном времени, если пользователь не кликает на результаты
Google отслеживает взаимодействие с поисковой выдачей в реальном времени. Если пользователь просматривает результаты, но не кликает на них в течение определенного времени (определяемого моделью поведения), система интерпретирует это как имплицитную отрицательную обратную связь. На основе анализа этих «отвергнутых» результатов Google автоматически пересматривает запрос (корректируя веса или заменяя термины) и динамически предоставляет новый набор результатов.
  • US20150169576A1
  • 2015-06-18
  • Поведенческие сигналы

  • SERP

  • Семантика и интент

Как Google проверяет работоспособность Deep Links и обратную совместимость перед индексированием контента мобильных приложений
Google использует автоматизированную систему верификации для индексирования контента мобильных приложений. Перед добавлением в индекс система эмулирует запуск приложения по Deep Link, проверяя корректность загрузки, отсутствие ошибок и соответствие контента связанной веб-странице. Также система тестирует обратную совместимость ссылок при обновлениях приложения, гарантируя, что в поиск попадают только функциональные результаты.
  • US9645980B1
  • 2017-05-09
  • Индексация

  • Ссылки

  • Техническое SEO

seohardcore