SEO HARDCORE
  • Разборы патентов
    • Патенты Google
  • Скоро SEO инструменты
  • Скоро SEO аналитика
  • seohardcore
SEO HARDCORE
назад

Как Google использует язык интерфейса пользователя и поведенческие сигналы для определения языковой релевантности документа

IDENTIFYING LANGUAGES RELEVANT TO RESOURCES (Идентификация языков, релевантных ресурсам)
  • US9208231B1
  • Google LLC
  • 2011-11-28
  • 2015-12-08
  • Мультиязычность
  • Поведенческие сигналы
  • SERP
  • Персонализация
  • Описание
  • Разбор
  • Выводы
  • Практика
  • FAQ
  • Похожие

Google определяет, для носителей каких языков релевантен документ, анализируя агрегированные данные о кликах. Система изучает, какой языковой интерфейс поиска (например, google.fr или google.de) использовали пользователи, кликнувшие на результат. Учитывая поведенческие факторы, такие как время пребывания на странице (Dwell Time) и позиция клика, Google рассчитывает Оценку Языковой Релевантности. Это позволяет определить целевую аудиторию страницы независимо от языка ее контента.

Описание

Какую проблему решает

Патент решает проблему точного определения языковой релевантности ресурса в сложных сценариях, когда традиционный анализ контента ненадежен. Это касается многоязычных страниц (например, ресурсы для изучения языков), нетекстового контента (изображения, видео) или контента, представляющего интерес для носителей разных языков (например, англоязычный сайт о международной знаменитости). Изобретение позволяет определить, для кого фактически полезен ресурс, основываясь на поведении пользователей.

Что запатентовано

Запатентована система идентификации языков, релевантных документу, основанная на анализе агрегированных поведенческих данных. Система вычисляет Language Relevance Scores (Оценки языковой релевантности) на основе того, какой Search Engine User Interface Language (Язык интерфейса поисковой системы) использовали пользователи, перешедшие на этот документ из поиска. Ключевой особенностью является взвешивание этих кликов с использованием сигналов вовлеченности (например, Dwell Time) и контекста клика.

Как это работает

Система работает путем анализа Click Data (Данных о кликах) в два этапа:

  • Офлайн-анализ: Система регистрирует, с какого языкового интерфейса (например, google.fr) был совершен переход на ресурс. Каждый клик взвешивается на основе сигналов качества: клики с длительным временем визита, клики по низким позициям или клики, ради которых пользователь пропустил результаты на своем родном языке, получают больший вес. Затем для каждого языка рассчитывается Language Relevance Score, основанный на взвешенной доле кликов. Эти данные сохраняются в индексе.
  • Онлайн-ранжирование: Во время обработки запроса эти оценки используются для повышения или понижения ресурса в зависимости от того, совпадает ли язык текущего пользователя с языками, для которых ресурс имеет высокий Language Relevance Score.

Актуальность для SEO

Высокая. Поведенческие факторы (User Engagement) и точность международного ранжирования остаются критически важными для Google. Этот патент описывает надежный механизм определения языковой релевантности, который не зависит от анализа текста на странице и напрямую связан с концепцией удовлетворенности пользователя (User Satisfaction).

Важность для SEO

Патент имеет высокое значение (8/10) для SEO, особенно для международных и многоязычных проектов. Он демонстрирует, что для ранжирования в определенном языковом сегменте недостаточно просто иметь контент на этом языке или настроить hreflang; необходимо, чтобы носители этого языка демонстрировали реальную вовлеченность (высокий Dwell Time) при переходе из поиска. Это также открывает возможности для кросс-языкового ранжирования, если контент имеет сильную межъязыковую привлекательность.

Детальный разбор

Термины и определения

Click Data (Данные о кликах)
Агрегированная и анонимизированная информация о запросах ресурса, инициированных выбором результата в поиске. Включает интерфейс, с которого пришел запрос, и поведенческие метрики.
Duration of a visit (Продолжительность визита)
Метрика вовлеченности, используемая как фактор взвешивания. Соответствует концепции Dwell Time (время до возврата в выдачу). Короткие визиты могут снижать вес клика.
Language Relevance Score (LRS) (Оценка языковой релевантности)
Метрика, рассчитываемая для ресурса по отношению к конкретному языку. Определяет, насколько ресурс интересен носителям этого языка. Рассчитывается как взвешенная доля кликов от пользователей этого языка.
Language Relevance System (Система языковой релевантности)
Компонент, отвечающий за обработку Click Data и генерацию Language Relevance Scores.
Relevant Language Data (RLD) (Данные о релевантных языках)
Выходные данные системы, часто в виде вектора оценок (например, EN: 0.9, FR: 0.8, DE: 0.4), которые сохраняются в индексе (Resource Index) и используются при ранжировании.
Search Engine User Interface Language (Язык интерфейса поисковой системы)
Язык интерфейса, который использовал пользователь при совершении клика (например, язык google.fr – французский). Является основным сигналом для определения интереса языковой группы.
Weight (Вес клика)
Множитель, применяемый к отдельному клику для учета его качества и контекста. Основан на поведенческих и контекстуальных факторах.

Ключевые утверждения (Анализ Claims)

Claim 1 (Независимый пункт): Описывает основной метод определения и использования языковой релевантности в процессе ранжирования.

  1. Система получает поисковый запрос через интерфейс на определенном языке.
  2. Идентифицируется ресурс, соответствующий запросу.
  3. Система анализирует исторические Click Data для этого ресурса: для каждого зарегистрированного клика определяется язык интерфейса, через который он был сделан.
  4. Рассчитываются Language Relevance Scores на основе количества запросов (кликов), связанных с каждым языком интерфейса.
  5. Определяется набор релевантных языков для ресурса.
  6. Оценка ранжирования (search result score) ресурса корректируется на основе того, входит ли язык текущего запроса в набор релевантных языков ресурса.

Claim 4 (Зависимый от 1): Детализирует расчет Language Relevance Scores с использованием взвешивания.

Расчет оценок включает присвоение веса (Weight) каждому из множества запросов (кликов) и вычисление оценок на основе этих весов. Система использует не просто количество кликов, а их качество или значимость.

Claims 5-9 (Зависимые от 4): Определяют факторы, используемые для расчета веса конкретного запроса (клика).

  • Claim 5: Вес основан на вероятности того, что пользователь понимает язык ресурса (например, учет вероятности мультилингвизма пользователя).
  • Claim 6: Вес основан на продолжительности визита (duration of a visit) к ресурсу (Dwell Time).
  • Claim 7: Вес основан на самом языке интерфейса (например, для нормализации объемов трафика между разными языками).
  • Claim 8: Вес основан на позиции результата поиска, выбранного пользователем. Клики по более низким позициям могут получать больший вес.
  • Claim 9: Вес основан на том, где находился выбранный результат относительно результатов на родном языке пользователя. Если пользователь пропускает результаты на своем языке ради данного ресурса, вес клика увеличивается.

Где и как применяется

Изобретение затрагивает этапы индексирования (для расчета и хранения данных) и ранжирования (для их применения).

INDEXING – Индексирование и извлечение признаков
Language Relevance System работает преимущественно в офлайн-режиме. Она обрабатывает агрегированные Click Data из логов поиска, вычисляет Language Relevance Scores и генерирует Relevant Language Data (языковой вектор). Эти данные сохраняются в Resource Index и ассоциируются с конкретным документом.

RANKING – Ранжирование / RERANKING – Переранжирование
На этапе ранжирования поисковая система извлекает сохраненные RLD для документа-кандидата. Система сравнивает язык текущего пользователя (определенный по языку запроса, настройкам или интерфейсу) с языковым вектором документа. Если язык пользователя имеет высокий LRS для данного документа, оценка ранжирования документа корректируется (повышается).

Входные данные:

  • Идентификатор ресурса (URL).
  • Агрегированные Click Data для ресурса, включающие: язык интерфейса, продолжительность визита (Dwell Time), позиция клика в выдаче, информация о других результатах в выдаче, индикаторы мультиязычности пользователя.

Выходные данные:

  • Relevant Language Data (Вектор языковой релевантности) для ресурса, сохраненный в индексе.

На что влияет

  • Международное SEO: Оказывает критическое влияние на ранжирование сайтов в разных языковых версиях поиска.
  • Многоязычные страницы: Помогает системе понять основную целевую аудиторию страницы, содержащей текст на нескольких языках.
  • Нетекстовый контент: Позволяет определить языковую релевантность для изображений, видео или интерактивных элементов, где текстовый анализ затруднен.
  • Контент с кросс-языковым интересом: Влияет на видимость контента для аудитории, говорящей на языке, отличном от языка контента (например, техническая документация на английском, востребованная по всему миру).

Когда применяется

  • Расчет оценок: Происходит периодически в офлайн-режиме по мере накопления достаточного объема Click Data для ресурса.
  • Применение при ранжировании: Активируется во время обработки запроса при оценке релевантности документов-кандидатов.
  • Пороговые значения: Язык добавляется в RLD только если его LRS превышает определенный порог. Пороги могут быть разными для разных языков (например, ниже для редких языков и выше для английского).

Пошаговый алгоритм

Процесс А: Офлайн-расчет Оценок Языковой Релевантности (LRS)

  1. Выбор ресурса: Система выбирает ресурс для анализа.
  2. Доступ к данным о кликах: Извлекаются агрегированные Click Data для этого ресурса за определенный период.
  3. Идентификация языка и контекста клика: Для каждого клика определяется язык интерфейса поисковой системы и контекстуальные данные (продолжительность визита, позиция и т.д.).
  4. Расчет веса клика (Weight Calculation): Для каждого клика вычисляется вес на основе факторов (Claims 5-9):
    • Продолжительность визита (Dwell Time): Короткие визиты получают меньший вес.
    • Позиция клика: Клики по низким позициям получают больший вес.
    • Пропуск родных результатов: Если пользователь пропустил результаты на своем языке, вес увеличивается.
    • Вероятность мультиязычности пользователя: Клики от вероятных мультиязычных пользователей могут получать меньший вес.
    • Нормализация по языку: Вес может корректироваться в зависимости от общего объема трафика с данного языка.
  5. Агрегация и расчет LRS: Для каждого языка суммируются веса кликов. LRS для языка N рассчитывается как отношение суммы весов кликов с языка N к общей сумме весов всех кликов ресурса.
  6. Применение порогов и фильтрация: Языки, чьи LRS превышают установленный порог, выбираются как релевантные.
  7. Сохранение RLD: Вектор релевантных языков и их оценок сохраняется в индексе.

Процесс Б: Применение при ранжировании

  1. Получение запроса: Поисковая система получает запрос и определяет языковой контекст пользователя.
  2. Отбор кандидатов: Идентифицируются ресурсы, релевантные запросу.
  3. Извлечение RLD: Для кандидатов извлекаются сохраненные данные RLD.
  4. Корректировка ранжирования: Оценка ранжирования ресурса корректируется, если язык пользователя совпадает с одним из языков в RLD ресурса. Степень корректировки зависит от значения LRS.

Какие данные и как использует

Данные на входе

Патент фокусируется исключительно на поведенческих и пользовательских факторах для определения языковой релевантности.

  • Поведенческие факторы:
    • Click Data: Основной источник данных.
    • Duration of a visit (Dwell Time): Используется для оценки качества клика и удовлетворенности пользователя.
    • Позиция клика в SERP: Используется для оценки значимости клика.
    • Поведение в SERP: Анализ пропущенных результатов (особенно на родном языке пользователя).
  • Пользовательские и Географические факторы:
    • Search Engine User Interface Language: Язык интерфейса, используемый при клике (например, по домену google.fr или настройкам).
    • Языковые настройки пользователя (для определения мультиязычности).
    • Вероятность того, что пользователь является мультиязычным.
    • IP-адрес (упоминается как возможный способ идентификации страны или региона).

Какие метрики используются и как они считаются

  • Language Relevance Score (LRS): Основная метрика. Рассчитывается по формуле:

Выводы

  1. Языковая релевантность определяется поведением, а не только контентом: Google активно использует агрегированные поведенческие данные для определения целевой языковой аудитории документа. Это позволяет системе понять релевантность независимо от языка, на котором написан текст, или технических сигналов (например, hreflang).
  2. Валидация кликов через вовлеченность (Dwell Time): Система не просто считает клики. Она использует механизмы взвешивания, где Dwell Time (Claim 6) является критически важным фактором. Только качественные, удовлетворяющие интент клики (длительные визиты) вносят значительный вклад в LRS.
  3. Учет контекста клика (SERP Behavior): Система придает больший вес кликам, сделанным по результатам на низких позициях (Claim 8) или если пользователь пропустил результаты на своем родном языке ради данного ресурса (Claim 9). Это указывает на сильное намерение и высокую релевантность.
  4. Возможность кросс-языкового ранжирования и дисамбигуация: Документ на языке X может быть признан высокорелевантным для пользователей языка Y, если они демонстрируют вовлеченность. Это также позволяет разрешать неоднозначность многоязычных страниц, определяя, кто на самом деле является потребителем контента.
  5. Нормализация и фильтрация шума: Система корректирует вес кликов, чтобы учесть мультилингвальных пользователей (Claim 5) и нормализовать данные между языками с разным объемом трафика (Claim 7), избегая смещения оценок.

Практика

Best practices (это мы делаем)

  • Фокус на удовлетворении интента и Dwell Time: Критически важно создавать контент, который удерживает пользователя на странице. Необходимо максимизировать Dwell Time и минимизировать быстрые возвраты в выдачу, так как это напрямую влияет на вес клика (Claim 6) и итоговый LRS для языка пользователя.
  • Локализация важнее перевода: Для международного SEO контент должен быть адаптирован так, чтобы вызывать вовлеченность у местной аудитории. Низкая вовлеченность приведет к низкому LRS, даже если контент технически корректен и переведен.
  • Мониторинг поведенческих метрик в разрезе языков/стран: Анализируйте показатели вовлеченности (время на странице, показатель отказов) для разных языковых сегментов. Низкая вовлеченность от носителей языка X приведет к снижению LRS для этого языка.
  • Оптимизация под кросс-языковой интерес: Если ваш контент имеет глобальную привлекательность (например, технические статьи, обзоры, визуальный контент), убедитесь, что он понятен и ценен для международной аудитории. Позитивные поведенческие сигналы от них позволят ранжироваться в их локальных выдачах без перевода.
  • Создание ценности для "уверенных кликов": Работайте над контентом так, чтобы пользователи были готовы кликнуть на ваш результат, даже если им приходится пропускать другие результаты, в том числе на их родном языке (Claim 9). Такие клики получают повышенный вес.

Worst practices (это делать не надо)

  • Использование некачественного машинного перевода: Если пользователи переходят на автоматически переведенную страницу и быстро уходят из-за низкого качества текста, это генерирует клики с низким весом (из-за короткого Dwell Time), что снижает LRS для этого языка.
  • Привлечение нецелевого международного трафика (Кликбейт): Использование заголовков, которые привлекают клики, но не соответствуют содержанию. Эти клики будут иметь минимальный вес из-за быстрого возврата в выдачу и не помогут в ранжировании.
  • Игнорирование поведенческих сигналов: Полагаться только на наличие переведенного контента и техническую оптимизацию (например, hreflang) без анализа реальной удовлетворенности пользователей. Система оценивает фактическое использование, а не потенциальное.

Стратегическое значение

Патент подтверждает стратегическую важность поведенческих сигналов как прямых факторов ранжирования. Он показывает, что Google измеряет демонстрируемую релевантность через взаимодействие с пользователем, а не просто оценивает потенциальную релевантность через анализ контента. Для долгосрочной стратегии международного SEO это означает переход от модели "перевод контента" к модели "удовлетворение потребностей локальной аудитории".

Практические примеры

Сценарий 1: Дисамбигуация многоязычной страницы

Сайт для изучения французского языка англоговорящими. Страница содержит 50% текста на английском и 50% на французском.

  • Проблема: Традиционный анализ контента не может определить основной язык.
  • Применение патента: Google анализирует Click Data. 95% кликов приходят от пользователей, использующих google.co.uk (Английский интерфейс). Эти пользователи демонстрируют высокий Dwell Time. Пользователи с google.fr (Французский интерфейс) быстро уходят.
  • Результат: Система присваивает высокий LRS для английского языка и низкий для французского. Страница будет хорошо ранжироваться для англоязычных пользователей.

Сценарий 2: Кросс-языковая релевантность (Технический блог)

Высококачественная статья на английском языке о новой JavaScript библиотеке.

  • Применение патента: Разработчики из России (используя google.ru) ищут информацию по этой теме. Они находят английскую статью, кликают на нее, несмотря на наличие менее качественных результатов на русском языке (повышенный вес клика за пропуск, Claim 9), и проводят много времени, изучая код (повышенный вес за Dwell Time, Claim 6).
  • Результат: Система присваивает статье высокий LRS для русского языка, несмотря на то, что она на английском. Статья начинает ранжироваться выше в российской выдаче по релевантным запросам.

Вопросы и ответы

Означает ли этот патент, что язык самого контента не имеет значения для ранжирования?

Не совсем. Язык контента по-прежнему важен для базовой релевантности. Однако этот патент описывает механизм, который может скорректировать релевантность на основе того, кто фактически потребляет контент. Если носители языка находят контент бесполезным (что выражается в коротком Dwell Time), Language Relevance Score будет низким, независимо от языка текста.

Как именно измеряется "Duration of a visit" (Dwell Time) и как это влияет на вес клика?

Патент определяет это как время, которое проходит до того, как пользователь возвращается на страницу результатов поиска после клика на ресурс (Claim 6). Если пользователь не возвращается, это также учитывается. Клики, приводящие к коротким визитам, получают меньший вес, так как это может указывать на то, что пользователь не нашел информацию полезной или не понял язык ресурса.

Что означает "вероятность того, что пользователь мультиязычен" и почему такие клики могут получать меньший вес?

Система может оценивать вероятность мультиязычности на основе настроек пользователя или истории его взаимодействия с контентом (Claim 5). Клики от мультиязычных пользователей могут получать меньший вес, потому что их интерес к ресурсу не обязательно свидетельствует об интересе всей языковой группы. Например, если только русско-английские билингвы кликают на английский сайт из русской выдачи, это не значит, что сайт релевантен всем русскоязычным пользователям.

Как позиция клика в выдаче влияет на Language Relevance Score (Claim 8)?

Патент утверждает, что вес клика может быть основан на его позиции. Если пользователь кликнул на результат, находящийся низко в выдаче, этот клик может получить больший вес, так как он свидетельствует о высокой заинтересованности. И наоборот, вес кликов по первому результату может быть снижен, так как пользователи часто кликают на него автоматически.

Что происходит, если пользователь пропускает результаты на своем родном языке (Claim 9)?

Это сильный позитивный сигнал. Если пользователь, использующий французский интерфейс, пропускает результаты на французском языке, чтобы кликнуть на ваш результат (независимо от его языка), вес этого клика увеличивается. Это указывает системе, что ваш ресурс более предпочтителен для этой языковой аудитории, чем доступные альтернативы на их родном языке.

Каково влияние этого механизма на автоматически переведенный контент?

Этот механизм является сильной защитой против некачественного автоматического перевода. Даже если такой контент привлекает клики, низкое качество текста обычно приводит к быстрым отказам (короткий Dwell Time). Это генерирует клики с низким весом, и, как следствие, Language Relevance Score для целевого языка будет очень низким, что приведет к понижению в ранжировании.

Как этот патент взаимодействует с атрибутом hreflang?

Hreflang сообщает Google о наличии альтернативных версий страницы. Описанный механизм работает параллельно. Hreflang помогает определить, какую версию показать, а Language Relevance Score влияет на то, насколько высоко эта версия будет ранжироваться. Если hreflang настроен корректно, но целевая аудитория демонстрирует низкую вовлеченность (низкий LRS), страница все равно будет ранжироваться плохо.

Может ли этот механизм помочь ранжироваться нетекстовому контенту (например, изображениям или видео) на международном уровне?

Да, это одно из преимуществ, упомянутых в патенте. Поскольку механизм основан на поведении пользователей, а не на анализе текста, он может эффективно определять языковую релевантность для ресурсов, где текст отсутствует. Если пользователи из Германии часто кликают на определенное видео и долго его смотрят, оно получит высокий LRS для немецкого языка.

Рассчитывается ли Language Relevance Score на уровне страницы или всего сайта?

Согласно патенту, процесс анализа и расчета оценок выполняется для конкретного ресурса (first resource), то есть на уровне отдельной страницы (документа). Система анализирует данные о кликах, относящиеся именно к этому URL.

Как быстро система реагирует на изменения в поведении пользователей?

Расчет LRS происходит в офлайн-режиме путем анализа данных о кликах за определенный период. Патент упоминает возможность обновления оценок через предопределенные интервалы времени или после накопления определенного количества новых кликов. Это означает, что система не реагирует мгновенно, но адаптируется по мере изменения паттернов поведения.

Похожие патенты

Как Google ранжирует контент на других языках, основываясь на поведении пользователей с одинаковыми языковыми настройками
Google использует статистику кликов (CTR), сегментированную по языковым предпочтениям пользователей, для корректировки ранжирования. Если пользователи, предпочитающие язык X, часто кликают на результат на языке Y, этот результат будет повышен в выдаче для других пользователей с предпочтением языка X. Это позволяет ранжировать контент, популярный у определенной языковой группы, независимо от языка самого контента.
  • US8375025B1
  • 2013-02-12
  • Мультиязычность

  • Поведенческие сигналы

  • Персонализация

Как Google фильтрует поведенческие сигналы, используя совместимость языков и стран пользователей
Google уточняет ранжирование, анализируя, откуда (страна) и на каком языке (язык пользователя) поступали исторические клики по документу. Если эти характеристики считаются «несовместимыми» с текущим пользователем, поведенческие сигналы (клики) от этих групп могут быть исключены или понижены в весе. Это предотвращает искажение релевантности данными от кардинально отличающихся аудиторий.
  • US8498974B1
  • 2013-07-30
  • Поведенческие сигналы

  • Мультиязычность

  • Персонализация

Как Google определяет язык и языковую релевантность страницы, анализируя контекст входящих и исходящих ссылок
Google использует контекст входящих и исходящих ссылок для определения языковой релевантности ресурса. Система анализирует язык анкоров, URL, контент ссылающихся и целевых страниц, а также качество ссылок и тип страницы (например, «языковой шлюз»). Это позволяет точно идентифицировать релевантные языки, даже если на самой странице мало текста.
  • US9098582B1
  • 2015-08-04
  • Ссылки

  • Мультиязычность

  • Семантика и интент

Как Google определяет язык поискового запроса, используя язык интерфейса, статистику слов и поведение пользователей
Google использует вероятностную модель для точной идентификации языка поискового запроса. Система комбинирует три ключевых фактора: статистику частотности слов в разных языках, язык интерфейса пользователя (например, Google.fr) и исторические данные о том, на какие результаты пользователи кликали ранее. Это позволяет корректно обрабатывать многоязычные и неоднозначные запросы для применения правильных синонимов и стемминга.
  • US8442965B2
  • 2013-05-14
  • Мультиязычность

  • Поведенческие сигналы

Как Google решает, когда переводить запрос пользователя и показывать результаты на другом языке, сравнивая релевантность и распознавая сущности
Google анализирует запрос пользователя, переводит его на другой язык (например, английский) и сравнивает релевантность результатов в обоих языках. Если контент на иностранном языке значительно релевантнее, система подмешивает его в выдачу. При этом учитываются локальные и иностранные сущности в запросе, а также качество автоматического перевода.
  • US20090083243A1
  • 2009-03-26
  • Мультиязычность

  • Семантика и интент

  • SERP

Популярные патенты

Как Google предсказывает намерения пользователя и выполняет поиск до ввода запроса (Predictive Search)
Google использует механизм для прогнозирования тем, интересующих пользователя в конкретный момент времени, основываясь на его истории и контексте. При обнаружении сигнала о намерении начать поиск (например, открытие страницы поиска), система проактивно выполняет запрос по предсказанной теме и мгновенно показывает результаты или перенаправляет пользователя на релевантный ресурс.
  • US8510285B1
  • 2013-08-13
  • Семантика и интент

  • Персонализация

  • Поведенческие сигналы

Как Google создает и наполняет Панели Знаний (Knowledge Panels), используя шаблоны сущностей и популярность фактов
Google использует систему для отображения Панелей Знаний (Knowledge Panels) рядом с результатами поиска. Когда запрос относится к конкретной сущности (человеку, месту, компании), система выбирает соответствующий шаблон и наполняет его контентом из разных источников. Выбор фактов для отображения основан на том, как часто пользователи искали эту информацию в прошлом.
  • US9268820B2
  • 2016-02-23
  • Knowledge Graph

  • SERP

  • Семантика и интент

Как Google использует паттерны просмотра пользователей (Co-Visitation) и временную близость для определения тематики нетекстового контента (изображений и видео)
Google использует механизм для понимания контента без текста (изображения, видео), анализируя, какие другие (текстовые) страницы пользователи посещают в рамках той же сессии. Ключевые слова с этих текстовых страниц заимствуются и присваиваются нетекстовому ресурсу. Критически важным фактором является время перехода: чем быстрее пользователь перешел между ресурсами, тем больший вес получают ключевые слова.
  • US8572096B1
  • 2013-10-29
  • Поведенческие сигналы

  • Семантика и интент

  • Мультимедиа

Как Google A/B тестирует и оптимизирует сниппеты (заголовки, описания, изображения) для повышения CTR
Google использует механизм для оптимизации отображения контента (сниппетов). Система показывает разные варианты заголовков, описаний или изображений для одной и той же ссылки разным пользователям или на разных платформах. Затем она измеряет кликабельность (CTR) каждого варианта и выбирает наиболее эффективный для дальнейшего использования, учитывая также тип устройства пользователя.
  • US9569432B1
  • 2017-02-14
  • SERP

  • Поведенческие сигналы

  • Персонализация

Как Google вычисляет важность сущностей внутри документа, используя контекст, ссылки и поведение пользователей, для улучшения ранжирования
Google использует систему для определения относительной важности сущностей (люди, места, даты) внутри документа (книги или веб-страницы) независимо от поискового запроса. Важность рассчитывается на основе того, где сущность упомянута (контекст, структура), насколько точно она определена, ссылаются ли на этот раздел внешние источники и как часто его просматривают пользователи. Эти оценки важности сущностей затем используются как сигнал для ранжирования самого документа в результатах поиска.
  • US7783644B1
  • 2010-08-24
  • Поведенческие сигналы

  • Индексация

  • Семантика и интент

Как Google анализирует текст вокруг ссылки (Rare Words) для борьбы со спамом и определения шаблонных ссылок
Google использует механизм для оценки качества ссылок, выходящий за рамки анкорного текста. Система анализирует редкие слова (rare words) в тексте, непосредственно окружающем ссылку, чтобы определить её уникальный контекст. Ранжирование улучшается при наличии разнообразия этих контекстов. Ссылки с повторяющимся контекстом (спам, Google-бомбинг или шаблонные/сквозные ссылки) идентифицируются и дисконтируются.
  • US8577893B1
  • 2013-11-05
  • Антиспам

  • Ссылки

  • Семантика и интент

Как Google персонализирует поисковые подсказки (Autocomplete) на основе недавно просмотренного медиаконтента
Google использует информацию о недавно потребленном пользователем медиаконтенте (видео, аудио, книги, игры) для персонализации поисковых подсказок. Система извлекает атрибуты (аспекты) из этого контента, такие как названия, имена актеров или артистов, и повышает в ранжировании те подсказки, которые соответствуют этим атрибутам. Влияние потребления медиа на подсказки зависит от времени, прошедшего с момента просмотра, типа контента и того, делился ли им пользователь.
  • US9268880B2
  • 2016-02-23
  • Персонализация

  • Семантика и интент

  • Мультимедиа

Как Google использует реальные данные о скорости загрузки страниц (RUM) для повышения быстрых и понижения медленных сайтов в выдаче
Google собирает данные о времени загрузки страниц у реальных пользователей (RUM) и использует их для корректировки ранжирования. Система сравнивает скорость сайта с глобальными порогами, основанными на процентилях. Если сайт медленнее большинства других (например, медленнее 85% или 96%), его рейтинг понижается. Очень быстрые сайты могут получать повышение. Оценка скорости учитывает географию и тип устройства пользователя.
  • US8645362B1
  • 2014-02-04
  • Техническое SEO

  • Поведенческие сигналы

  • SERP

Как Google использует машинное обучение для прогнозирования желаемого типа контента (Web, Images, News) и формирования смешанной выдачи (Universal Search)
Google анализирует исторические журналы поиска (пользователь, запрос, клики), чтобы обучить модель машинного обучения. Эта модель предсказывает вероятность того, что пользователь хочет получить результаты из определенного репозитория (например, Картинки или Новости). Google использует эти прогнозы, чтобы решить, в каких индексах искать и как смешивать результаты на финальной странице выдачи (Universal Search).
  • US7584177B2
  • 2009-09-01
  • Семантика и интент

  • SERP

  • Персонализация

Как Google использует данные о реальных повторных посещениях (Quality Visit Measure) и социальных взаимодействиях для ранжирования локального бизнеса
Google использует данные о физических посещениях пользователей для оценки качества локального бизнеса. Система рассчитывает «Quality Visit Measure», придавая значительно больший вес местам, куда люди возвращаются повторно, приводят друзей или посещают по рекомендации. Этот показатель используется как сильный сигнал качества для ранжирования в локальном поиске и Google Maps, снижая зависимость от онлайн-отзывов.
  • US10366422B2
  • 2019-07-30
  • Поведенческие сигналы

  • Local SEO

seohardcore