SEO HARDCORE
  • Разборы патентов
    • Патенты Google
  • Скоро SEO инструменты
  • Скоро SEO аналитика
  • seohardcore
SEO HARDCORE
назад

Как Google (YouTube) анализирует трафик конкурирующих видео для рекомендации улучшений метаданных

VIDEO METADATA ASSOCIATION RECOMMENDATION (Рекомендация по ассоциации метаданных видео)
  • US10318581B2
  • Google LLC
  • 2016-04-13
  • 2019-06-11
  • Поведенческие сигналы
  • Мультимедиа
  • Семантика и интент
  • SERP
  • Описание
  • Разбор
  • Выводы
  • Практика
  • FAQ
  • Похожие

Google использует систему для анализа конкуренции между видео на основе общих поисковых запросов и времени просмотра. Система выявляет поисковые запросы, которые приводят трафик на конкурирующие (например, производные) видео, и сравнивает их с метаданными оригинального видео. Если обнаруживаются релевантные термины, отсутствующие у оригинала, они рекомендуются автору для улучшения видимости.

Описание

Какую проблему решает

Патент решает проблему конкуренции за просмотры на видеохостинговых платформах, особенно между оригинальными видео (Original Videos) и производными видео (Derivative Videos), которые используют контент оригинала. Изобретение направлено на улучшение видимости оригинального контента путем предоставления авторам data-driven рекомендаций по оптимизации метаданных, основанных на анализе трафика конкурентов.

Что запатентовано

Запатентована система для автоматического выявления и рекомендации улучшений метаданных видео. Система анализирует логи поиска, определяет конкурирующие видео на основе схожести запросов, по которым они получают трафик (измеренный по времени просмотра), и выявляет термины, используемые в запросах к конкурентам, но отсутствующие в метаданных анализируемого (оригинального) видео.

Как это работает

Ключевой механизм работы системы:

  • Анализ логов поиска: Сбор данных о поисковых запросах, показанных результатах и времени просмотра (View Durations) для каждого видео.
  • Определение конкуренции: Расчет Competition Score между парами видео. Для этого используются векторные представления видео (где весами являются времена просмотра по каждому запросу) и вычисляется их сходство (например, косинусное).
  • Анализ трафика конкурентов: Идентификация поисковых запросов, которые генерируют значительное время просмотра для конкурирующих видео.
  • Сравнение метаданных: Сравнение терминов из этих успешных запросов с метаданными оригинального видео.
  • Рекомендация: Если релевантные термины отсутствуют у оригинала, система предлагает автору добавить их (Metadata Improvement).

Актуальность для SEO

Высокая. Управление правами, монетизация и продвижение оригинального контента на платформах типа YouTube остаются приоритетными задачами. Описанные в патенте механизмы анализа конкуренции и рекомендации по метаданным, вероятно, интегрированы в инструменты аналитики для авторов (например, YouTube Analytics) и системы управления контентом.

Важность для SEO

Патент имеет значительное влияние (8/10) для специалистов по Video SEO и продвижению на YouTube. Он описывает конкретный механизм, который помогает авторам понять, по каким именно запросам они теряют трафик в пользу конкурентов (включая копии их контента), и предоставляет прямые, основанные на данных рекомендации по улучшению метаданных (заголовков, описаний, тегов). Это напрямую влияет на стратегию оптимизации видеоконтента.

Детальный разбор

Термины и определения

Channel Originality (Оригинальность канала)
Метрика (от 0 до 1), измеряющая общую оригинальность контента на канале. Рассчитывается на основе агрегированных показателей конкуренции (gSCS) и времени просмотра видео канала.
Collective Search Competition Score (gSCS)
Агрегированная метрика, измеряющая степень конкуренции одного видео со всеми остальными видео коллективно.
Competition Score (Search Competition Score, SCS)
Метрика (от 0 до 1), измеряющая схожесть поисковых запросов, за которые конкурируют два видео. Рассчитывается как косинусное сходство между векторами просмотров видео.
Derivative Video (Производное видео)
Видео, которое не создано оригинальным автором, но использует контент из Original Video (полностью или частично).
Metadata Improvement (Улучшение метаданных)
Поисковый термин, который приводит трафик на конкурирующее видео, но отсутствует в метаданных анализируемого видео. Рекомендуется к добавлению.
Original Video (Оригинальное видео)
Видео, содержащее оригинальный контент, загруженное создателем или авторизованным партнером.
Query Space (Пространство запросов)
Векторное пространство, где каждое измерение соответствует поисковому запросу.
Search Records (Записи поиска)
Записи в логах поиска, включающие поисковый запрос, результирующие видео и связанные с ними View Durations.
Video Vector (Вектор видео)
Векторное представление видео в Query Space, где значением в каждом измерении является View Duration по соответствующему запросу.
View Durations (Время просмотра)
Продолжительность времени, в течение которого видео просматривалось пользователем в ответ на конкретный поисковый запрос.

Ключевые утверждения (Анализ Claims)

Claim 1 и 2 (Независимые пункты): Описывают основной метод рекомендации метаданных.

  1. Система получает логи поиска (Search Records), содержащие запросы, результаты и время просмотра (View Durations).
  2. Идентифицируются два конкурирующих видео (Видео 1 и Видео 2). Конкуренция определяется тем, что оба видео появлялись в результатах одного и того же поискового запроса.
  3. Определяется набор поисковых запросов, направленных на Видео 1 (т.е. по которым Видео 1 было результатом).
  4. Из этого набора запросов извлекаются поисковые термины.
  5. Эти термины сравниваются с метаданными Видео 2.
  6. Если метаданные Видео 2 не содержат определенный термин из запросов к Видео 1, этот термин идентифицируется как Metadata Improvement для Видео 2.
  7. Это улучшение предоставляется пользователю, связанному с Видео 2 (например, автору).

Claim 4 (Зависимый): Определяет, как именно идентифицируются конкурирующие видео.

  • Идентификация происходит путем расчета Competition Score. Этот балл указывает на степень конкуренции между Видео 1 и Видео 2 за просмотры пользователей и основывается на анализе запросов, направленных на оба видео, и связанных с ними View Durations.

Claim 6 (Зависимый): Детализирует механизм расчета Competition Score.

  1. Для Видео 1 генерируется первый вектор, представляющий время просмотра видео в ответ на первый набор запросов.
  2. Для Видео 2 аналогичным образом генерируется второй вектор.
  3. Измеряется степень сходства между первым и вторым векторами. (В описании патента уточняется, что используется косинусное сходство).
  4. На основе измеренного сходства рассчитывается Competition Score.

Где и как применяется

Изобретение применяется в рамках специализированной поисковой вертикали – системы видеохостинга (например, YouTube), и затрагивает процессы индексирования, ранжирования и аналитики.

INDEXING – Индексирование и извлечение признаков
На этом этапе система (Ingest Server) обрабатывает загруженные видео, извлекает и сохраняет метаданные (теги, описания, заголовки), которые впоследствии используются для анализа и сравнения.

RANKING – Ранжирование
Система поиска видео (Video Search Server) обрабатывает запросы и ранжирует результаты. Этот процесс генерирует логи поиска (Search Records) и данные о времени просмотра (View Durations), которые являются входными данными для запатентованной системы. Кроме того, результаты расчета конкуренции (например, Channel Originality) могут использоваться как сигнал для корректировки ранжирования (например, для понижения Derivative Videos).

Аналитика и Рекомендации (Вне основного потока ранжирования)
Основное применение патента происходит в аналитической системе (Video Competition Engine), которая работает с накопленными данными.

  1. Обработка данных (Офлайн/Пакетная): Video Competition Engine обрабатывает логи поиска для расчета Competition Scores между видео.
  2. Генерация рекомендаций: Система анализирует трафик конкурентов и выявляет Metadata Improvements.
  3. Интерфейс пользователя: Результаты анализа и рекомендации представляются автору через аналитический интерфейс (Competition Monitoring and Presentation Module).

Входные данные:

  • Логи поиска (Search Records): запросы, идентификаторы видео в результатах, View Durations.
  • Метаданные видео.

Выходные данные:

  • Competition Scores (SCS и gSCS).
  • Метрика Channel Originality.
  • Рекомендации Metadata Improvement.
  • Аналитические отчеты о распределении трафика между конкурентами.

На что влияет

  • Конкретные типы контента: Влияет исключительно на видеоконтент на хостинговых платформах. Особенно критично для контента, который часто копируется, перезаливается или перерабатывается (музыкальные клипы, мемы, вирусные видео, обучающие материалы).
  • Специфические запросы: Влияет на видимость видео по широкому спектру информационных, развлекательных и транзакционных запросов в рамках видеоплатформы.

Когда применяется

  • Условия работы алгоритма: Алгоритм расчета конкуренции работает периодически (офлайн или по расписанию) на основе накопленных логов поиска за определенный период.
  • Триггеры активации (для рекомендации): Рекомендация генерируется при выполнении двух условий: 1) Идентифицировано конкурирующее видео (Competition Score выше определенного порога); 2) Это видео получает трафик по запросам, термины которых отсутствуют в метаданных анализируемого видео.

Пошаговый алгоритм

Процесс А: Расчет конкуренции между видео

  1. Сбор данных: Получение логов поиска, включающих Search Records.
  2. Идентификация данных: Извлечение поисковых запросов и связанных с ними View Durations для каждого видео.
  3. Генерация векторов: Создание векторов (Video Vector) для представления видео. Каждый компонент вектора соответствует общему времени просмотра видео в ответ на конкретный запрос. V={Vn}V = \{V_n\}.
  4. Расчет парной конкуренции: Определение Search Competition Score (SCS) между парой видео, используя косинусное сходство их векторов. SCS(Vi,Vj)=Vi⋅Vj∣Vi∣∣Vj∣SCS(V_i, V_j) = \frac{V_i \cdot V_j}{|V_i||V_j|}.
  5. Расчет коллективной конкуренции (Опционально): Определение Collective Search Competition Score (gSCS) путем агрегации парных SCS.
  6. Расчет оригинальности канала (Опционально): Расчет Channel Originality на основе gSCS и общего времени просмотра видео канала.

Процесс Б: Рекомендация метаданных

  1. Идентификация конкурентов: Идентификация анализируемого видео и его конкурирующих видео (например, тех, чей SCS из Процесса А превышает порог).
  2. Анализ трафика конкурентов: Идентификация поисковых запросов, по которым конкурирующие видео получали просмотры.
  3. Извлечение терминов: Идентификация поисковых терминов в этих запросах.
  4. Сравнение метаданных: Сравнение этих поисковых терминов с метаданными анализируемого видео.
  5. Генерация рекомендации: Если термин отсутствует в метаданных, он идентифицируется как Metadata Improvement.
  6. Предоставление рекомендации: Отображение рекомендации автору видео.

Какие данные и как использует

Данные на входе

  • Контентные факторы (Метаданные): Теги, заголовки, описания видео. Эти данные используются на этапе сравнения для выявления отсутствующих терминов.
  • Поведенческие факторы:
    • Логи поиска (Search Logs/Records): Основной источник данных. Включают текст поисковых запросов пользователей.
    • Время просмотра (View Durations): Критически важный показатель. Используется как вес для каждого запроса при построении векторов видео. Именно время просмотра, а не просто клик, определяет важность запроса для видео.
    • Количество просмотров (View Counts): Используется в аналитических отчетах для отображения статистики.

Какие метрики используются и как они считаются

Система вычисляет несколько ключевых метрик для оценки конкуренции и оригинальности:

  • Video Vector (Вектор Видео): Представление видео на основе времени просмотра по запросам. V={Vn}∈QV = \{V_n\} \in Q (где Q - пространство запросов, V_n - время просмотра по запросу n).
  • Search Competition Score (SCS): Измеряет парную конкуренцию как косинусное сходство между двумя векторами видео. SCS(Vi,Vj)=Vi⋅Vj∣Vi∣∣Vj∣SCS(V_i, V_j) = \frac{V_i \cdot V_j}{|V_i||V_j|}.
  • Collective Search Competition Score (gSCS): Измеряет коллективную конкуренцию путем агрегации парных SCS. gSCS(vi)=f−1(∑jf(SCS(vi,vj)))gSCS(v_i) = f^{-1}(\sum_j f(SCS(v_i, v_j))).
  • Channel Originality (Оригинальность Канала): Взвешенное среднее значение gSCS для всех видео канала. O(c)=1−∑v∈CgSCS(v)⋅watchtime(v)∑v∈Cwatchtime(v)O(c) = 1 - \frac{\sum_{v \in C} gSCS(v) \cdot \text{watchtime}(v)}{\sum_{v \in C} \text{watchtime}(v)}.

Выводы

  1. Время просмотра (View Duration) как ключевой сигнал релевантности: Патент демонстрирует, что для оценки релевантности видео запросу используется не просто факт клика, а именно View Duration. Время просмотра служит весом для запроса при построении векторной модели видео.
  2. Конкуренция основана на общности запросов и удержании: Два видео считаются конкурирующими, если они оба получают значительное время просмотра по одним и тем же запросам. Это измеряется через косинусное сходство векторов просмотров (Competition Score).
  3. Прямой механизм для анализа упущенной семантики: Система предоставляет авторам конкретный, основанный на данных способ выявления ключевых слов, по которым они теряют трафик. Это анализ не просто метаданных конкурентов, а реальных поисковых запросов, которые привели к просмотрам конкурентов.
  4. Фокус на защите оригинального контента: Система явно разработана для помощи Original Videos в конкуренции с Derivative Videos. Она не только помогает улучшить видимость оригиналов, но и может использоваться (через корректировку ранжирования) для понижения копий.
  5. Оригинальность канала как фактор ранжирования: Введение метрики Channel Originality предполагает, что общая оригинальность контента на канале может влиять на его репутацию, возможности монетизации и ранжирование его видео в целом.

Практика

Best practices (это мы делаем)

Рекомендации для специалистов по Video SEO (YouTube):

  • Комплексная оптимизация метаданных: Необходимо максимально полно заполнять заголовки, описания и теги, охватывая все релевантные поисковые интенты, синонимы и возможные формулировки. Патент подтверждает, что упущенная семантика напрямую ведет к потере трафика в пользу конкурентов.
  • Регулярный анализ отчетов по источникам трафика: Критически важно изучать отчеты (аналогичные показанному на FIG. 4 в патенте), чтобы понять, по каким запросам пользователи находят видео. Если система показывает запросы, которые не были явно оптимизированы, их нужно добавить в метаданные.
  • Использование встроенных рекомендаций платформы: Если YouTube предлагает автоматические рекомендации по добавлению тегов или улучшению описания (что может быть реализацией этого патента), их следует приоритетно использовать, так как они основаны на реальных данных об упущенном трафике.
  • Фокус на удержании аудитории (View Duration): Поскольку View Duration является весом в векторной модели, создание контента с высоким удержанием критически важно. Это повышает "вес" видео по релевантным запросам и усиливает его конкурентные позиции.

Worst practices (это делать не надо)

  • Минималистичные метаданные: Загрузка видео с коротким заголовком и без описания/тегов делает его крайне уязвимым. Конкуренты или копии (Derivative Videos) с лучшей оптимизацией смогут легко перехватить поисковый трафик.
  • Создание каналов с неоригинальным контентом: Система направлена на выявление Derivative Videos. Каналы, состоящие преимущественно из копий или компиляций чужого контента, рискуют получить низкий Channel Originality, что может привести к пессимизации или проблемам с монетизацией.
  • Кликбейт без удержания: Использование кликбейтных заголовков или значков для привлечения кликов неэффективно, если View Duration остается низким. Это не даст значительного веса в векторном представлении видео.

Стратегическое значение

Патент подтверждает стратегию Google по использованию сложных поведенческих метрик (время просмотра в контексте конкретного запроса) для оценки релевантности и качества контента на видеоплатформах. Для долгосрочной SEO-стратегии на YouTube это означает, что техническая оптимизация метаданных должна идти рука об руку с работой над качеством контента и удержанием аудитории. Также патент подчеркивает важность создания уникального контента и защиты авторских прав, вводя метрики для оценки оригинальности на уровне видео и канала.

Практические примеры

Сценарий: Оптимизация метаданных обучающего видео

  1. Ситуация: Автор загружает видео "Как настроить гитару для начинающих" (Original Video). Другой пользователь скачивает его, делает небольшие изменения и перезаливает как "Быстрый способ настройки гитары" (Derivative Video).
  2. Анализ конкуренции: Система рассчитывает Competition Score и определяет, что оба видео конкурируют за схожую аудиторию.
  3. Анализ трафика: Система фиксирует, что Derivative Video получает значительное View Duration по запросу "настройка гитары без тюнера".
  4. Сравнение метаданных: Система проверяет метаданные Original Video и видит, что фраза "без тюнера" там отсутствует, хотя метод, показанный в видео, это позволяет.
  5. Рекомендация: Система предлагает автору Original Video добавить термин "без тюнера" в описание или теги (Metadata Improvement).
  6. Результат: Original Video начинает лучше ранжироваться по этому специфическому запросу, возвращая себе трафик, который уходил на копию.

Вопросы и ответы

Как система определяет, что два видео конкурируют?

Конкуренция определяется не по схожести контента или метаданных напрямую, а по схожести поисковых запросов, которые приводят к их просмотру. Система строит векторы для каждого видео, где измерениями являются запросы, а значениями — время просмотра (View Duration) по этим запросам. Если косинусное сходство (Competition Score) между векторами высоко, видео считаются конкурентами.

Что важнее для этой системы: клики (CTR) или время просмотра (View Duration)?

Время просмотра (View Duration) является критически важным. Именно оно используется в качестве веса в формулах расчета конкуренции. Видео, которое получает много кликов, но мало времени просмотра по запросу, будет иметь меньший вес по этому запросу в своем векторе, чем видео с высоким удержанием.

Касается ли этот патент только борьбы с копиями видео?

Хотя патент часто упоминает Original Videos и Derivative Videos (копии или переработки), описанный механизм универсален. Он может использоваться для анализа конкуренции между любыми двумя видео, которые борются за одну и ту же поисковую аудиторию, даже если их контент не пересекается напрямую.

Что такое "Оригинальность Канала" (Channel Originality) и как она влияет на SEO?

Channel Originality — это метрика, которая оценивает, насколько уникален контент канала в целом, основываясь на агрегированных показателях конкуренции его видео. Высокая оригинальность может служить позитивным сигналом для ранжирования, улучшения репутации канала и предоставления преимуществ (например, в монетизации).

Как я могу увидеть эти рекомендации по улучшению метаданных?

Патент описывает backend-механизм. На практике эти рекомендации могут быть интегрированы в панель управления автора (например, YouTube Studio) в виде предложений по добавлению тегов, улучшению заголовков или в аналитических отчетах, показывающих упущенные поисковые запросы.

Может ли эта система рекомендовать термины, которые не связаны с моим видео?

Теоретически это возможно, если конкурирующее видео получает трафик по широкому спектру запросов. Однако, поскольку конкуренция определяется на основе схожести уже существующих запросов (высокий Competition Score), рекомендуемые термины, скорее всего, будут семантически близки к тематике вашего видео.

Влияет ли этот патент на традиционный поиск Google (Web Search)?

Патент описывает систему в контексте Video Hosting System (например, YouTube). Прямого влияния на ранжирование веб-страниц в основном поиске Google он не оказывает, но демонстрирует общий подход к использованию времени взаимодействия (Dwell Time/View Duration) как сигнала релевантности.

Что делать, если конкурент использует спамные метаданные для перехвата трафика?

Система анализирует запросы, которые привели к реальным просмотрам (View Durations). Если спамные метаданные конкурента приводят к низкому удержанию, вес этих запросов в его векторе будет мал. Если же они релевантны и обеспечивают удержание, система порекомендует вам также использовать эти термины, если они применимы к вашему контенту.

Как использовать этот патент для улучшения SEO моего видео?

Необходимо сосредоточиться на двух аспектах: 1) Максимально полное заполнение метаданных для охвата всех релевантных запросов, чтобы минимизировать упущенный трафик. 2) Создание контента с высоким удержанием, чтобы увеличить вес вашего видео по этим запросам в векторной модели системы.

Как рассчитывается Collective Search Competition Score (gSCS)?

gSCS рассчитывается путем нелинейной агрегации всех парных Competition Scores (SCS) между данным видео и всеми остальными. Формула гарантирует, что если хотя бы одно видео имеет SCS=1 (идеальный конкурент/копия), то gSCS также будет равен 1. Это помогает выявить видео, которые сильно конкурируют с другими.

Похожие патенты

Как Google анализирует страницу-источник перехода для формирования рекомендаций медиаконтента
Google анализирует контекст запроса медиаконтента (например, видео), определяя источник перехода (referral source). Система сканирует исходную страницу, чтобы найти другой контент, размещенный на ней (например, другие встроенные видео), и использует эту информацию для формирования списка рекомендаций, показываемых пользователю после просмотра.
  • US9563627B1
  • 2017-02-07
  • Семантика и интент

  • Персонализация

  • Краулинг

Как Google (YouTube) ранжирует рекомендуемые видео, балансируя релевантность, монетизацию и вероятность просмотра рекламы
Google использует систему для ранжирования рекомендуемых (дополнительных) видео на платформах типа YouTube. Система учитывает не только релевантность и потенциал монетизации видео, но и «экспериментальные данные» о том, как пользователи взаимодействуют с рекламой в этом видео. Цель — показывать видео, где пользователи с большей вероятностью досмотрят рекламу, максимизируя доход и минимизируя отток пользователей.
  • US9405775B1
  • 2016-08-02
  • Мультимедиа

  • Поведенческие сигналы

Как Google создает видео-нарезки (Composite Videos) на лету, используя текстовый запрос и анализ аудиодорожек
Google может анализировать аудиодорожки (транскрипты) видео для идентификации конкретных сегментов, где произносятся слова из запроса пользователя. Система автоматически объединяет эти сегменты из разных видео в одно новое сводное видео (Composite Video). Для выбора сегментов используются метрики релевантности, популярности и свежести исходного контента.
  • US9672280B2
  • 2017-06-06
  • Мультимедиа

  • Индексация

  • Семантика и интент

Как Google (YouTube) использует последовательность просмотров и общее время просмотра для определения и ранжирования похожих видео
Google использует поведенческие сигналы для определения похожих видео на платформах типа YouTube. Система анализирует, какие видео пользователи смотрят одно за другим в течение короткого времени (ко-просмотры). Если пользователи положительно взаимодействуют (например, долго смотрят) с Видео А и сразу после этого с Видео Б, система считает их связанными. Финальный список рекомендаций ранжируется с учетом временной близости просмотров и общего времени просмотра (Total Watch Time).
  • US9088808B1
  • 2015-07-21
  • Поведенческие сигналы

  • Мультимедиа

  • Персонализация

Как Google ранжирует и рекомендует источники контента (каналы, профили) на основе внутренних ссылок, аннотаций и кликов по ним
Google использует механизм для ранжирования и рекомендации источников контента (например, YouTube-каналов или профилей) внутри платформ. Система анализирует, как часто источник упоминается в аннотациях, описаниях и комментариях к контенту, который просматривал пользователь. Ключевым фактором ранжирования является не только количество упоминаний, но и общее число кликов (активаций) по этим ссылкам.
  • US9235625B2
  • 2016-01-12
  • Ссылки

  • Поведенческие сигналы

  • Мультимедиа

Популярные патенты

Как Google использует данные сессий и разнообразие результатов для генерации блока "Связанные запросы"
Google анализирует поисковые сессии пользователей, чтобы найти запросы, которые часто следуют за одним и тем же предшествующим запросом (родственные запросы). Затем система фильтрует эти потенциальные "Связанные запросы", чтобы убедиться, что они предлагают разнообразные результаты по сравнению с исходным запросом и другими предложениями, помогая пользователям исследовать смежные, но отличные темы.
  • US8244749B1
  • 2012-08-14
  • Семантика и интент

  • Персонализация

  • Поведенческие сигналы

Как Google персонализирует поиск, повышая в выдаче объекты, которые пользователь ранее явно отметил как интересные
Google использует механизм персонализации поисковой выдачи. Если пользователь явно отметил определенный объект (например, место, компанию, веб-страницу) как интересующий его, этот объект получит значительное повышение в ранжировании при последующих релевантных запросах этого пользователя. Уровень повышения зависит от степени интереса, указанной пользователем.
  • US20150242512A1
  • 2015-08-27
  • Персонализация

  • Поведенческие сигналы

  • SERP

Как Google использует время пребывания на странице (Dwell Time) для оценки качества и корректировки ранжирования
Google анализирует продолжительность визитов пользователей на страницы из результатов поиска (Dwell Time). Система рассчитывает метрику, сравнивающую количество «длинных кликов» (длительных визитов) с общим количеством кликов для конкретного документа по конкретному запросу. Этот показатель используется как сигнал качества, независимый от позиции в выдаче, для повышения или понижения документа в ранжировании.
  • US8661029B1
  • 2014-02-25
  • Поведенческие сигналы

  • SERP

Как Google связывает документы на основе поведения пользователей, времени взаимодействия и контентной близости для персонализации поиска
Google использует систему для определения "меры ассоциации" между различными документами (статьями, веб-страницами, письмами). Ассоциация рассчитывается на основе того, насколько близко по времени пользователь взаимодействовал с этими документами, насколько похож их контент и совпадают ли метаданные (например, автор). Эти связи используются для понимания пути пользователя и персонализации последующих результатов поиска.
  • US8131754B1
  • 2012-03-06
  • Поведенческие сигналы

  • Персонализация

  • Семантика и интент

Как Google использует историю поиска, поведение и многофакторные профили пользователей для персонализации поисковой выдачи
Google создает детальные профили пользователей на основе истории запросов, взаимодействия с результатами (клики, время просмотра) и анализа контента посещенных страниц. Эти профили (включающие интересы по терминам, категориям и ссылкам) используются для корректировки стандартных оценок ранжирования. Степень персонализации динамически регулируется уровнем уверенности системы в профиле (Confidence Score).
  • US9298777B2
  • 2016-03-29
  • Персонализация

  • Поведенческие сигналы

  • SERP

Как Google использует исторические данные о документах, ссылках и поведении пользователей для определения свежести, качества и борьбы со спамом
Фундаментальный патент Google, описывающий использование временных рядов данных для ранжирования. Система анализирует историю документа (дату создания, частоту и объем обновлений), историю ссылок (скорость появления, возраст, изменения анкоров), тренды запросов и поведение пользователей. Эти данные используются для определения свежести контента, выявления неестественной активности (спама) и оценки легитимности домена.
  • US7346839B2
  • 2008-03-18
  • Свежесть контента

  • Антиспам

  • Ссылки

Как Google использует LLM для генерации поисковых сводок (SGE), основываясь на контенте веб-сайтов, и итеративно уточняет ответы
Google использует Большие Языковые Модели (LLM) для создания сводок (AI-ответов) в результатах поиска. Для повышения точности и актуальности система подает в LLM не только запрос, но и контент из топовых результатов поиска (SRDs). Патент описывает, как система выбирает источники, генерирует сводку, проверяет факты, добавляет ссылки на источники (linkifying) и аннотации уверенности. Кроме того, система может динамически переписывать сводку, если пользователь взаимодействует с одним из источников.
  • US11769017B1
  • 2023-09-26
  • EEAT и качество

  • Ссылки

  • SERP

Как Google использует анализ сопутствующих ссылок (co-citation) и нормализацию веса для определения связанных сайтов и конкурентов
Google анализирует структуру ссылок для поиска сайтов, связанных с выбранным документом и находящихся на том же уровне обобщения (например, конкурентов). Система определяет, на какие еще сайты ссылаются источники, цитирующие исходный документ (co-citation). Для повышения точности вес ссылок нормализуется: снижается влияние множественных ссылок с одного хоста и ссылок со страниц-каталогов (хабов).
  • US6754873B1
  • 2004-06-22
  • Ссылки

  • SERP

  • Техническое SEO

Как Google использует контекст пользователя для генерации неявных поисковых запросов и проактивного показа результатов
Система Google отслеживает контекст пользователя в реальном времени (набираемый текст, открытые документы, письма). На основе этого контекста автоматически генерируются множественные неявные запросы. Система объединяет результаты из разных источников (локальных и глобальных) и проактивно показывает их пользователю, используя поведенческие данные (клики) для улучшения релевантности.
  • US7664734B2
  • 2010-02-16
  • Поведенческие сигналы

  • Персонализация

  • Семантика и интент

Как Google использует внешние данные для оценки репутации сущностей и их взаимной привлекательности в вертикальном поиске
Google использует систему для улучшения вертикального поиска (например, вакансий, недвижимости) путем оценки взаимной привлекательности двух разных типов сущностей (например, соискателя и вакансии). Система агрегирует данные из внешних источников для выявления скрытых атрибутов и расчета «Репутационной значимости» каждой сущности. На основе этих данных определяется метрика «Двухстороннего соответствия», которая используется для ранжирования.
  • US10853432B2
  • 2020-12-01
  • Семантика и интент

  • SERP

  • Поведенческие сигналы

seohardcore