SEO HARDCORE
  • Разборы патентов
    • Патенты Google
  • Скоро SEO инструменты
  • Скоро SEO аналитика
  • seohardcore
SEO HARDCORE
назад

Как Google персонализирует результаты поиска изображений на основе языка и местоположения пользователя

CUSTOMIZING IMAGE SEARCH FOR USER ATTRIBUTES (Кастомизация поиска изображений на основе атрибутов пользователя)
  • US8504547B1
  • Google LLC
  • 2008-04-23
  • 2013-08-06
  • Персонализация
  • Мультимедиа
  • Поведенческие сигналы
  • Local SEO
  • Описание
  • Разбор
  • Выводы
  • Практика
  • FAQ
  • Похожие

Google персонализирует Поиск Изображений, анализируя исторические данные о кликах. Система сравнивает, на что кликает общая популяция пользователей, с тем, что предпочитают пользователи с тем же языком и местоположением. Если предпочтения значительно различаются, Google переранжирует изображения в соответствии с локальным консенсусом, обеспечивая культурно и контекстуально релевантные результаты.

Описание

Какую проблему решает

Патент решает проблему неоднозначности запросов в поиске по изображениям и субъективности визуальной релевантности. Одно и то же изображение может восприниматься по-разному в зависимости от культурного, языкового и географического контекста пользователя. Изобретение направлено на улучшение релевантности результатов поиска изображений путем адаптации выдачи к предпочтениям конкретных групп пользователей (сегментированных по языку и местоположению), предотвращая ситуации, когда глобально популярные изображения оказываются нерелевантными на локальном уровне.

Что запатентовано

Запатентована система и метод для условного переранжирования результатов поиска изображений на основе сегментированного поведения пользователей. Система определяет, следует ли использовать глобальные данные о кликах (statistics of accesses) или данные о кликах, специфичные для атрибутов пользователя (язык и местоположение). Решение принимается путем сравнения сходства (set similarity) между предпочтениями глобальной аудитории и предпочтениями конкретного сегмента пользователей.

Как это работает

Механизм работает следующим образом:

  • Идентификация атрибутов: При получении запроса система определяет атрибуты пользователя (например, язык и местоположение).
  • Генерация двух наборов данных: Система идентифицирует два набора популярных изображений (Top K lists) для данного запроса:
    • First Set: Основан на кликах всех пользователей (глобальные данные).
    • Second Set: Основан на кликах пользователей с теми же атрибутами, что и у текущего пользователя (специфичные данные).
  • Расчет сходства: Вычисляется степень сходства (Set Similarity Score) между двумя наборами, обычно путем измерения степени их пересечения.
  • Принятие решения о ранжировании:
    • Если сходство высокое (выше порога), результаты ранжируются на основе глобальных данных (First Set).
    • Если сходство низкое (ниже порога), результаты ранжируются на основе специфичных данных (Second Set), так как предпочтения сегмента значительно отличаются от глобальных.

Актуальность для SEO

Высокая. Локализация, понимание культурного контекста и намерений пользователя остаются критически важными задачами для Google, особенно в поиске изображений, где визуальная интерпретация сильно варьируется в разных регионах и культурах. Этот механизм предоставляет конкретный способ использования поведенческих данных для улучшения локальной релевантности.

Важность для SEO

Патент имеет значительное влияние (7.5/10) на стратегии международного SEO и продвижения в Поиске Изображений. Он демонстрирует, что глобальная популярность или стандартная оптимизация изображения недостаточны для успеха на всех рынках. Изображения должны резонировать с конкретной целевой демографической группой (местоположение/язык), так как именно их поведение определяет финальное ранжирование в случае расхождения предпочтений.

Детальный разбор

Термины и определения

Attribute / Attribute-Pair (Атрибут / Пара атрибутов)
Характеристики пользователя, используемые для сегментации. В патенте основное внимание уделяется языку (language attribute) и местоположению (locale attribute), часто объединяемым в пару (например, Indian-English).
First Set of Images (Первый набор изображений)
Набор изображений, популярных среди первой группы пользователей (пользователи с различными атрибутами, т.е. общая популяция), которые ранее вводили соответствующий запрос. Обычно это глобальный Top K List.
Second Set of Images (Второй набор изображений)
Набор изображений, популярных среди второй группы пользователей, имеющих те же специфические атрибуты (язык/местоположение), что и текущий пользователь. Это специфичный для атрибутов Top K List.
Set Similarity Score (Оценка сходства наборов)
Метрика, определяющая степень сходства между First Set и Second Set. В патенте описан метод расчета на основе количества общих изображений (пересечения), а не порядка.
Statistics of Accesses (Статистика доступов)
Исторические данные о взаимодействии пользователей с результатами поиска. На практике это данные о кликах (click data) или CTR для конкретных изображений по конкретным запросам.
Threshold (Порог)
Заданное значение Set Similarity Score. Если оценка сходства ниже порога, активируется специфичное ранжирование; если выше – используется глобальное.
Top K List (Топ-K список)
Список из K наиболее часто выбираемых изображений в ответ на запрос.

Ключевые утверждения (Анализ Claims)

Claim 1 (Независимый пункт): Описывает основной процесс адаптации поиска изображений.

  1. Система получает запрос на изображения.
  2. Получает результаты, релевантные запросу.
  3. Выбирает First plurality of images (Первое множество изображений) на основе first click data (клики пользователей с различными атрибутами – общая популяция).
  4. Выбирает Second plurality of images (Второе множество изображений) на основе second click data (клики пользователей, имеющих те же атрибуты языка и местоположения, что и текущий пользователь).
  5. Вычисляет сходство (similarity) между Первым и Вторым множествами. Уточняется, что вычисление включает сравнение количества общих изображений между множествами.
  6. Ранжирует результаты поиска на основе вычисленного сходства.
  7. Предоставляет упорядоченные результаты.

Claim 2 (Зависимый): Детализирует логику ранжирования при низком сходстве.

Если сходство между Первым и Вторым множествами меньше заданного порогового значения (specified threshold value), ранжирование основывается, по крайней мере, на second click data (специфичных для атрибутов пользователя).

Claim 3 (Зависимый): Детализирует логику ранжирования при высоком сходстве.

Если сходство больше или равно заданному пороговому значению, ранжирование основывается, по крайней мере, на first click data (глобальных данных).

Claims 4 и 5 (Зависимые): Уточняют природу Первого и Второго множеств.

Они определяются как Top K images (Топ-K изображений), идентифицированные как наиболее часто выбираемые (most frequently selected) соответствующими группами пользователей (общей популяцией и специфичным сегментом).

Где и как применяется

Изобретение применяется в системе поиска изображений (Image Search) и затрагивает финальные этапы обработки запроса.

INDEXING – Индексирование и извлечение признаков
На этом этапе изображения индексируются. Также происходит офлайн-обработка логов поведения пользователей для агрегации statistics of accesses, сегментированной по атрибутам пользователей (язык/местоположение). Эти данные сохраняются для использования в реальном времени.

RANKING – Ранжирование
На этом этапе генерируется начальный набор изображений, удовлетворяющих запросу, с использованием стандартных сигналов релевантности (например, упоминается information retrieval score, такой как TF-IDF).

RERANKING – Переранжирование
Основное применение патента происходит на этом этапе. Система использует атрибуты текущего пользователя и предварительно рассчитанные данные о кликах для корректировки финального порядка выдачи.

  1. Определение атрибутов: Идентифицируются язык и местоположение пользователя.
  2. Получение данных о поведении: Извлекаются First Set (глобальный Топ-K) и Second Set (специфичный Топ-K) для данного запроса и атрибутов.
  3. Расчет сходства и выбор логики: Вычисляется Set Similarity Score и сравнивается с порогом для выбора источника данных для ранжирования (глобального или специфичного).
  4. Финальное упорядочивание: Результаты переупорядочиваются на основе выбранного набора данных о кликах.

Входные данные:

  • Запрос пользователя на изображения.
  • Атрибуты пользователя (Язык, Местоположение).
  • Начальный набор релевантных изображений.
  • Исторические данные о кликах (Statistics of Accesses), сегментированные по атрибутам.

Выходные данные:

  • Переранжированный список результатов поиска изображений, адаптированный к предпочтениям пользовательского сегмента.

На что влияет

  • Конкретные типы контента: Влияет исключительно на изображения (статичные, движущиеся, изображения внутри мультимедиа контента), как указано в патенте.
  • Специфические запросы: Наибольшее влияние оказывается на запросы, где визуальная интерпретация сильно зависит от культуры, традиций или локальных особенностей (например, запросы о еде, одежде, праздниках, знаменитостях, местных событиях).
  • Языковые и географические ограничения: Механизм напрямую зависит от языка и географии. Он разработан для улучшения релевантности в различных локалях и языковых группах.

Когда применяется

  • При каких условиях работает алгоритм: Алгоритм оценки активируется при каждом запросе в поиске изображений для определения наиболее подходящей модели ранжирования.
  • Триггеры активации переранжирования: Переранжирование на основе специфичных данных (Second Set) активируется только тогда, когда Set Similarity Score между глобальными и специфичными предпочтениями ниже установленного порога.
  • Исключения и особые случаи: Если для конкретного запроса или сегмента недостаточно данных о кликах для формирования надежного Second Set, система, вероятно, будет полагаться на глобальные данные (First Set) или стандартные сигналы ранжирования. Патент упоминает возможность отбрасывания изображений с недостаточным количеством кликов.

Пошаговый алгоритм

Процесс обработки запроса на изображения в реальном времени:

  1. Получение запроса и атрибутов: Система получает запрос от пользователя и определяет его специфические атрибуты (язык и местоположение).
  2. Идентификация релевантных изображений: Поисковая система определяет коллекцию изображений, удовлетворяющих запросу.
  3. Формирование Первого набора (Глобальный Топ-K): Идентифицируется первый набор изображений (First Set) на основе статистики доступов всех пользователей (глобальной популяции), которые ранее вводили этот запрос.
  4. Формирование Второго набора (Специфичный Топ-K): Идентифицируется второй набор изображений (Second Set) на основе статистики доступов пользователей, имеющих те же атрибуты, что и текущий пользователь.
  5. Расчет сходства наборов: Вычисляется степень сходства (Set Similarity Score) между Первым и Вторым наборами. Например, используется формула, основанная на пересечении изображений в обоих наборах.
  6. Сравнение с порогом: Полученная оценка сходства сравнивается с заранее определенным порогом.
  7. Выбор логики ранжирования:
    • Если сходство >= порога: Система определяет, что предпочтения сегмента схожи с глобальными. Ранжирование производится на основе статистики доступов всех пользователей (Шаг 8а).
    • Если сходство < порога: Система определяет, что предпочтения сегмента отличаются. Ранжирование производится на основе статистики доступов пользователей с указанными атрибутами (Шаг 8б).
  8. Финальное упорядочивание:
    8а. Результаты упорядочиваются на основе глобальных данных о кликах.
    8б. Результаты переупорядочиваются на основе специфичных данных о кликах.
  9. Представление результатов: Упорядоченные результаты поиска представляются пользователю.

Какие данные и как использует

Данные на входе

Патент фокусируется на использовании атрибутов пользователя и поведенческих данных для переранжирования.

  • Поведенческие факторы: Критически важные данные. Statistics of accesses (статистика доступов или click data). Эти данные агрегируются по запросам и сегментируются по атрибутам пользователей.
  • Географические факторы: Locale attribute (атрибут местоположения). Может определяться по IP-адресу, домену поисковой системы (например, google.it), профилю пользователя или cookies.
  • Пользовательские факторы (Язык): Language attribute (языковой атрибут). Может определяться по языку интерфейса, выбору языка пользователем, языку запроса или настройкам браузера.

Какие метрики используются и как они считаются

  • Top K Lists: Списки наиболее популярных изображений для глобальной и специфичной аудитории. Формируются путем сортировки изображений по количеству кликов (count of times the image was selected).
  • Set Similarity Score: Метрика для сравнения двух Top K Lists. Патент предлагает конкретную формулу для расчета:

Выводы

  1. Релевантность изображений контекстуальна: Патент признает, что визуальная релевантность субъективна и сильно зависит от местоположения и языка пользователя. Глобально популярное изображение может быть нерелевантным в определенном культурном контексте.
  2. Поведенческие сигналы как мера релевантности: Statistics of accesses (данные о кликах) используются как основной индикатор для определения предпочтений пользователей и, следовательно, релевантности в конкретном контексте.
  3. Сегментация поведения пользователей: Google агрегирует и поддерживает отдельные профили поведения (Top K lists) для различных сегментов пользователей, определенных по языку и местоположению.
  4. Условное применение локализации: Система не всегда отдает приоритет локализованным данным. Локализованный консенсус (Second Set) используется только тогда, когда он значительно отличается (Set Similarity Score ниже порога) от глобального консенсуса (First Set).
  5. Эффективность системы: Механизм сравнения сходства позволяет системе экономить ресурсы, применяя сложное переранжирование только тогда, когда это действительно необходимо для улучшения качества выдачи.

Практика

Best practices (это мы делаем)

  • Исследование визуальных предпочтений целевой аудитории: При работе с международными сайтами необходимо анализировать, какие типы изображений предпочитает аудитория в целевом регионе. Не полагайтесь на предпочтения вашего домашнего рынка.
  • Локализация визуального контента: Адаптируйте изображения на локализованных версиях сайта. Используйте культурно и контекстуально релевантные изображения (модели, цвета, символы), которые резонируют с местной аудиторией. Их клики сформируют Second Set.
  • Оптимизация под локальный интент: Оптимизируйте изображения (и окружающий контент) под намерение локального пользователя, а не только под глобальную интерпретацию ключевого слова.
  • Мониторинг эффективности в Image Search по странам: Отслеживайте производительность ваших изображений в поиске, сегментируя данные по странам. Если изображение плохо ранжируется в целевой стране, несмотря на хорошую оптимизацию, возможно, его визуальное содержание не соответствует локальным предпочтениям (Second Set).

Worst practices (это делать не надо)

  • Использование универсальных стоковых фото: Применение одних и тех же глобально стандартизированных стоковых фотографий для всех международных версий сайта. Это может привести к низкой вовлеченности локальных пользователей и, как следствие, к понижению в ранжировании в Image Search.
  • Игнорирование культурных особенностей: Использование изображений, которые могут быть неприемлемыми или неправильно интерпретированными в целевой культуре.
  • Предположение о едином ранжировании: Ошибка считать, что изображение, которое хорошо ранжируется в одной стране (например, США), автоматически будет хорошо ранжироваться в другой (например, Японии или Индии).

Стратегическое значение

Патент подтверждает важность локализации за пределами простого перевода текста. Визуальная коммуникация должна быть адаптирована к целевому рынку. Для международного SEO это означает, что поведенческие данные пользователей в целевом регионе напрямую определяют успех в ранжировании изображений. Система может предпочесть изображение с меньшим количеством глобальных сигналов (например, ссылок), если оно демонстрирует высокую вовлеченность среди пользователей конкретного языкового и географического сегмента.

Практические примеры

Сценарий: Оптимизация изображений для интернет-магазина одежды

  1. Запрос: "Свадебное платье" (Wedding dress).
  2. Ситуация в США (Locale: US, Language: English): Глобальные данные (First Set) и специфичные данные (Second Set) показывают предпочтение классических белых платьев. Set Similarity Score высокий. Ранжирование стандартное.
  3. Ситуация в Индии (Locale: India, Language: English): Глобальные данные (First Set) показывают белые платья. Однако специфичные данные (Second Set) показывают, что пользователи в Индии гораздо чаще кликают на изображения традиционных цветных (красных, золотых) сари или лехенга по этому запросу.
  4. Действие системы: Set Similarity Score низкий (ниже порога). Система переключает ранжирование для пользователя из Индии на Second Set.
  5. Действие SEO-специалиста: Для индийской версии сайта необходимо убедиться, что в приоритете находятся изображения традиционных нарядов, так как именно они будут лучше ранжироваться в локальном поиске изображений, отвечая предпочтениям аудитории.

Вопросы и ответы

Применяется ли этот патент к обычному веб-поиску?

Патент явно описывает методы для Image Search (поиска изображений), включая статичные, движущиеся изображения и изображения в мультимедийном контенте. Хотя принципы локализации применяются и в веб-поиске, описанный механизм сравнения Top K Lists на основе кликов специфичен для контекста поиска изображений.

Как система определяет местоположение и язык пользователя?

Патент упоминает несколько методов. Местоположение может определяться по IP-адресу, домену поисковой системы (например, google.it или google.in), данным профиля пользователя или cookies. Язык может определяться по языку интерфейса, настройкам браузера, явному выбору пользователя или языку самого запроса.

Что такое "First Set" и "Second Set" простыми словами?

First Set – это список изображений, которые популярны по данному запросу среди всех пользователей мира (глобальный консенсус). Second Set – это список изображений, которые популярны по этому же запросу только среди пользователей из вашего региона и говорящих на вашем языке (локальный консенсус).

Что произойдет, если для моего региона или запроса недостаточно данных о кликах?

Если данных недостаточно для формирования надежного Second Set (локального консенсуса), система, скорее всего, будет по умолчанию использовать First Set (глобальный консенсус) или стандартные факторы ранжирования. Патент упоминает, что изображения с количеством кликов ниже определенного порога могут быть отброшены.

Как именно Google рассчитывает сходство между двумя наборами?

Основной метод, описанный в патенте, заключается в измерении степени пересечения (overlap) между двумя Top K Lists. Считается количество общих изображений, деленное на минимальный размер из двух списков. Это означает, что система проверяет, насколько совпадают сами изображения в списках, а не их порядок.

Важен ли порядок изображений в Top K списках для расчета сходства?

Согласно основной формуле, предложенной в патенте (Set Similarity Score), порядок не имеет значения; важен только факт присутствия изображения в обоих списках. Однако патент также упоминает возможность использования альтернативных методов (таких как Kendall's Tau или Spearman's Rho), которые учитывают порядок.

Как я могу оптимизировать свои изображения для конкретной страны?

Исследуйте и используйте визуальные элементы, стиль и тематику, которые культурно и контекстуально привлекательны для пользователей в этой стране. Поскольку их клики определяют Second Set, создание контента, который резонирует с локальной аудиторией, является ключом к высокому ранжированию в локальном поиске изображений.

Это персонализация или локализация?

Технически это форма локализации или сегментации. Система адаптирует результаты на основе общих атрибутов группы пользователей (язык и местоположение), а не на основе индивидуальной истории поиска конкретного пользователя.

Что означает низкий показатель сходства (Low Similarity Score)?

Низкий показатель сходства означает, что пользователи в данном конкретном регионе предпочитают совершенно другие изображения по этому запросу, чем пользователи в среднем по миру. Это служит триггером для Google, чтобы переключиться на локализованное ранжирование.

Почему Google не всегда использует локализованные данные для ранжирования?

Во-первых, для эффективности и экономии ресурсов – если локальные предпочтения совпадают с глобальными, нет необходимости в дополнительной обработке. Во-вторых, для обеспечения стабильности и качества, особенно в случаях, когда локальных данных недостаточно или они зашумлены.

Похожие патенты

Как Google использует клики пользователей для генерации альтернативных запросов и автоматической разметки изображений
Google анализирует исторические данные о том, какие запросы приводили к кликам по конкретному изображению. Эти запросы используются как автоматические метки (labels) для индексации и как предлагаемые альтернативные запросы при взаимодействии пользователя с этим изображением в выдаче. Система позволяет уточнять поиск на основе коллективного поведения и переносить метки между визуально похожими изображениями.
  • US20150161175A1
  • 2015-06-11
  • Индексация

  • Поведенческие сигналы

  • Семантика и интент

Как Google использует клики пользователей в поиске по картинкам для понимания содержания изображений и улучшения таргетинга
Google анализирует поведение пользователей в поиске по картинкам для идентификации содержания изображений. Если пользователи ищут определенный запрос (идею) и массово кликают на конкретное изображение в результатах, система связывает это изображение с данным запросом (концепцией). Эти данные используются для улучшения ранжирования в поиске картинок и для предложения релевантных ключевых слов рекламодателям, загружающим схожие изображения.
  • US11409812B1
  • 2022-08-09
  • Поведенческие сигналы

  • Семантика и интент

  • SERP

Как Google использует клики по изображениям для определения схожести запросов и картинок (Поведенческая схожесть)
Google анализирует поведение пользователей в поиске по картинкам, чтобы определить схожесть двух запросов (или двух изображений). Если пользователи часто кликают на одни и те же изображения в ответ на разные запросы, эти запросы считаются похожими. Этот механизм (Коллаборативная фильтрация) позволяет находить связи независимо от языка или типа запроса (текст/изображение) и используется для генерации рекомендаций.
  • US8280881B1
  • 2012-10-02
  • Поведенческие сигналы

  • Семантика и интент

  • Мультимедиа

Как Google использует query-specific модели для переранжирования изображений на основе их визуальных характеристик в реальном времени
Google использует систему для корректировки ранжирования изображений непосредственно в момент запроса (онлайн). Для популярных запросов система заранее обучает индивидуальные модели релевантности на основе исторических данных о кликах. При получении нового запроса система активирует наиболее подходящую модель и использует визуальные характеристики (цвет, текстура) для переоценки и переранжирования результатов, обеспечивая точное соответствие визуального контента интенту пользователя.
  • US10311096B2
  • 2019-06-04
  • Мультимедиа

  • SERP

  • Поведенческие сигналы

Как Google комбинирует визуальное сходство и поведение пользователей для переранжирования поиска по картинкам
Google использует механизм для перекрестной проверки релевантности изображений, объединяя поведенческие сигналы (клики) с визуальным анализом. Если изображение часто кликают и оно визуально похоже на другие релевантные изображения по запросу (совместная релевантность), его рейтинг агрессивно повышается. Если оно редко кликается и визуально отличается (совместная нерелевантность), его рейтинг понижается. Это защищает выдачу от кликбейта.
  • US8209330B1
  • 2012-06-26
  • Поведенческие сигналы

  • SERP

  • Мультимедиа

Популярные патенты

Как Google объединяет данные о ссылках и кликах для расчета авторитетности страниц (Query-Independent Score)
Google использует механизм расчета независимой от запроса оценки авторитетности (Query-Independent Score) с помощью дополненного графа ресурсов. Этот граф объединяет традиционные ссылки между страницами с данными о поведении пользователей, такими как клики по результатам поиска (CTR). Авторитетность передается не только через ссылки, но и через запросы, позволяя страницам с высоким уровнем вовлеченности пользователей набирать авторитет, даже если у них мало обратных ссылок.
  • US8386495B1
  • 2013-02-26
  • Поведенческие сигналы

  • Ссылки

  • SERP

Как Google определяет скрытый локальный интент в запросах для повышения релевантности местных результатов
Google использует механизм для определения того, подразумевает ли запрос (например, «ресторан») поиск локальной информации, даже если местоположение не указано. Система анализирует агрегированное поведение пользователей для расчета «степени неявной локальной релевантности» запроса. Если этот показатель высок, Google повышает в ранжировании результаты, соответствующие местоположению пользователя.
  • US8200694B1
  • 2012-06-12
  • Local SEO

  • Поведенческие сигналы

  • Семантика и интент

Как Google обучается на поведении пользователя для персонализации весов источников в поисковой выдаче
Google использует сигналы интереса пользователя (клики, время просмотра) для динамической корректировки весов различных источников данных (например, ключевых слов, тем, типов контента). Система определяет, какие источники наиболее полезны для конкретного пользователя, и повышает их значимость при ранжировании последующих результатов поиска, тем самым персонализируя выдачу.
  • US8631001B2
  • 2014-01-14
  • Персонализация

  • Поведенческие сигналы

  • SERP

Как Google создает мгновенные интерактивные результаты на SERP, предварительно загружая и персонализируя скрытый контент
Google использует механизм для создания интерактивных блоков ответов (Answer Boxes), таких как Погода или Панели Знаний. Система отправляет пользователю не только видимый результат, но и дополнительный скрытый контент («карточки»), выбранный на основе истории взаимодействий пользователя. При взаимодействии с блоком (свайп или клик) дополнительный контент отображается мгновенно, без отправки нового запроса на сервер.
  • US9274683B2
  • 2016-03-01
  • SERP

  • Персонализация

  • Поведенческие сигналы

Как Google связывает документы на основе поведения пользователей, времени взаимодействия и контентной близости для персонализации поиска
Google использует систему для определения "меры ассоциации" между различными документами (статьями, веб-страницами, письмами). Ассоциация рассчитывается на основе того, насколько близко по времени пользователь взаимодействовал с этими документами, насколько похож их контент и совпадают ли метаданные (например, автор). Эти связи используются для понимания пути пользователя и персонализации последующих результатов поиска.
  • US8131754B1
  • 2012-03-06
  • Поведенческие сигналы

  • Персонализация

  • Семантика и интент

Как Google позволяет пользователям "углубиться" в контент установленного мобильного приложения прямо из веб-выдачи
Google использует этот механизм для интеграции контента из нативных приложений в веб-поиск. Если приложение установлено у пользователя и система определяет высокую релевантность его контента запросу, в выдачу добавляется специальный элемент (например, "Больше результатов из приложения X"). Клик по этому элементу запускает новый поиск, показывая множество deep links только из этого приложения, не покидая интерфейс поиска.
  • US10579687B2
  • 2020-03-03
  • SERP

  • Семантика и интент

  • Ссылки

Как Google игнорирует часто меняющийся контент и ссылки в нем, определяя "временные" блоки шаблона сайта
Google использует механизм для отделения основного контента от динамического шума (реклама, виджеты, дата). Система сравнивает разные версии одной страницы, чтобы найти часто меняющийся контент. Затем она анализирует HTML-структуру (путь) этого контента и статистически определяет, является ли этот структурный блок "временным" для всего сайта. Такой контент игнорируется при индексации и таргетинге рекламы, а ссылки в нем могут не учитываться при расчете PageRank.
  • US8121991B1
  • 2012-02-21
  • Индексация

  • Техническое SEO

  • Структура сайта

Как Google выбирает Sitelinks, анализируя визуальное расположение и структуру DOM навигационных меню
Google использует механизм для генерации Sitelinks путем рендеринга страницы и анализа DOM-структуры. Система определяет визуальное расположение (координаты X, Y) гиперссылок и группирует их на основе визуальной близости и общих родительских элементов. Sitelinks выбираются исключительно из доминирующей группы (например, главного меню), а ссылки из других групп игнорируются.
  • US9053177B1
  • 2015-06-09
  • SERP

  • Ссылки

  • Структура сайта

Как Google использует семантические связи внутри контента для переранжирования и повышения разнообразия выдачи
Google использует метод для переоценки и переранжирования поисковой выдачи путем анализа семантических взаимодействий между терминами внутри документов. Система строит графы локальных и глобальных связей, а затем определяет взаимосвязи между самими документами на основе их семантического вклада (даже без гиперссылок). Это позволяет повысить разнообразие выдачи, особенно по неоднозначным запросам.
  • US7996379B1
  • 2011-08-09
  • Семантика и интент

  • Ссылки

  • SERP

Как Google использует «Локальный авторитет» для переранжирования документов на основе их взаимосвязей внутри конкретной выдачи
Google может улучшить ранжирование, анализируя структуру ссылок внутри начального набора результатов поиска. Документы, на которые часто ссылаются другие высокорелевантные документы по этому же запросу («локальные эксперты»), получают повышение. Этот процесс включает строгие фильтры для обеспечения независимости этих ссылок-голосов.
  • US6526440B1
  • 2003-02-25
  • Ссылки

  • Антиспам

  • SERP

seohardcore