SEO HARDCORE
  • Разборы патентов
    • Патенты Google
  • Скоро SEO инструменты
  • Скоро SEO аналитика
  • seohardcore
SEO HARDCORE
назад

Как Google использует попарные сравнения (Side-by-Side тесты) для агрегации оценок качества и создания эталонного рейтинга

METHOD AND APPARATUS FOR GENERATING A PREFERENCE RANKING (Метод и устройство для генерации рейтинга предпочтений)
  • US7587391B1
  • Google LLC
  • 2006-06-13
  • 2009-09-08
  • SERP
  • Описание
  • Разбор
  • Выводы
  • Практика
  • FAQ
  • Похожие

Патент описывает математический метод, который Google использует для оценки качества поиска на основе попарных сравнений результатов людьми (асессорами). Система собирает данные о предпочтениях (Side-by-Side тесты) и использует модель, аналогичную PageRank (основанную на Марковских процессах), для агрегации этих оценок в единый, устойчивый к шуму рейтинг качества (Preference Ranking). Эти данные служат эталоном для обучения и валидации алгоритмов ранжирования.

Описание

Какую проблему решает

Патент решает проблему надежной агрегации субъективных, часто противоречивых и зашумленных оценок качества, полученных от пользователей (асессоров), в единый глобальный рейтинг. Традиционные методы, такие как анализ ссылок (PageRank), уязвимы для спама и отражают мнение авторов, а не пользователей. Анализ кликов (click-tracking) слишком зашумлен, а прямые опросы сложно агрегировать. Изобретение предлагает устойчивый метод для определения "эталона качества" (Ground Truth) на основе человеческих предпочтений.

Что запатентовано

Запатентован метод генерации рейтинга предпочтений (Preference Ranking) на основе попарных сравнений (Pairwise Comparisons) элементов (например, результатов поиска). Суть заключается в использовании математического аппарата, аналогичного PageRank, – вычислении доминирующего собственного вектора (Dominant Eigenvector) матрицы смежности (Adjacency Matrix). Однако матрица смежности строится не на основе ссылок, а на основе агрегированных данных о предпочтениях пользователей.

Как это работает

Система работает следующим образом:

  • Сбор данных: Пользователям (асессорам) предъявляются пары элементов для сравнения (Side-by-Side). Фиксируется предпочтение (победа, проигрыш или ничья).
  • Матрица Рейтингов: Данные агрегируются в Rating Matrix, содержащую количество побед/проигрышей/ничьих (W/L/T) для каждой пары.
  • Матрица Смежности: Rating Matrix преобразуется в Adjacency Matrix с использованием формулы взвешенного соотношения проигрышей (weighted loss ratio).
  • Вычисление Рейтинга: Вычисляется Dominant Eigenvector этой матрицы (используя Markov process). Значения в векторе определяют итоговый Preference Ranking элементов.

Актуальность для SEO

Высокая. Хотя патент подан в 2006 году, описанная методология остается фундаментальной для оценки качества поиска. Попарное сравнение (Side-by-Side) является стандартным инструментом для асессоров Google (Quality Raters). Агрегация этих оценок для создания эталонных данных (Ground Truth), используемых для обучения и валидации алгоритмов машинного обучения (включая системы, связанные с E-E-A-T и Helpful Content), критически важна.

Важность для SEO

Влияние на SEO значительное, но косвенное (7.5/10). Патент не описывает алгоритм ранжирования в реальном времени. Он описывает, как Google *оценивает* качество результатов поиска, используя человеческие суждения. Полученный Preference Ranking служит эталоном качества, на который настраиваются основные алгоритмы ранжирования. Для SEO это подтверждает необходимость фокусироваться на качестве контента, которое удовлетворит асессора при прямом сравнении с конкурентами.

Детальный разбор

Термины и определения

Adjacency Matrix (Матрица смежности)
Квадратная матрица, представляющая предпочтения между элементами. Элемент матрицы aija_{ij} определяется как взвешенное соотношение проигрышей (weighted loss ratio) между элементом i и элементом j.
Damping Factor (Коэффициент затухания)
Параметр (d), используемый при итеративном вычислении собственного вектора (аналогично PageRank), который обеспечивает сходимость алгоритма. В патенте приведен пример d=0.85.
Dominant Eigenvector (Доминирующий собственный вектор)
Вектор, вычисляемый из Adjacency Matrix. Значения этого вектора определяют итоговый Preference Ranking. Это дает более точное различие в качестве (числа с плавающей запятой), чем простая сортировка.
Pairwise Comparison (Попарное сравнение / Side-by-Side)
Метод оценки качества, при котором пользователю (асессору) предъявляются два элемента одновременно для определения предпочтения.
Preference Ranking (Рейтинг предпочтений)
Итоговый результат работы алгоритма; глобальное ранжирование набора элементов, основанное на агрегированных попарных предпочтениях пользователей.
Rating Matrix (Матрица рейтингов)
Промежуточная матрица, хранящая исходные данные о предпочтениях для каждой пары элементов (W/L/T).
W/L/T (Wins/Losses/Ties)
Количество побед (Wins), проигрышей (Losses) и ничьих (Ties) при сравнении двух элементов пользователями.

Ключевые утверждения (Анализ Claims)

Claim 1 (Независимый пункт): Описывает основной процесс создания рейтинга предпочтений для набора элементов (где каждый элемент является результатом поиска).

  1. Система получает набор элементов (результатов поиска).
  2. Система собирает предпочтения пользователей между парами элементов (выбор пар, представление пользователям, сбор оценок).
  3. Используя предпочтения, система вычисляет Adjacency Matrix.
  4. Используя Adjacency Matrix, система вычисляет Preference Ranking.
  5. Система присваивает рейтинг и предоставляет ранжированные результаты пользователю.

Claim 4 (Зависимый от 3): Детализирует способ вычисления Adjacency Matrix (размером nxn для n элементов). Это ядро изобретения.

Элемент aija_{ij} вычисляется следующим образом:

  • Если предпочтения между i и j неизвестны: aij=0a_{ij} = 0.
  • Если i ≠ j (не диагональные элементы, Weighted Loss Ratio): aij=losses(i,j)(wins(i,j)+losses(i,j)+ties(i,j))⋅na_{ij} = \frac{losses(i,j)}{(wins(i,j)+losses(i,j)+ties(i,j)) \cdot n}.
  • Если i = j (диагональные элементы, Нормализация): aii=1−∑k≠iaika_{ii} = 1 - \sum_{k \neq i} a_{ik}. (Обеспечивает, что сумма элементов строки равна 1).

Claim 5 (Зависимый от 1): Уточняет, что вычисление Preference Ranking включает вычисление Dominant Eigenvector для Adjacency Matrix.

Claim 6 (Зависимый от 1): Уточняет, что вычисление Dominant Eigenvector использует итеративный процесс с применением Damping Factor.

Где и как применяется

Этот патент описывает инфраструктуру оценки качества, а не компонент системы ранжирования в реальном времени. Он не встраивается напрямую в стандартный конвейер обработки запросов (Crawling-Indexing-Ranking).

Оценка качества и генерация обучающих данных (Evaluation & Training Data Generation)

Основное применение патента — это офлайн-процессы, направленные на оценку эффективности работы поисковой системы и создание эталонных наборов данных (Ground Truth).

  1. Оценка результатов RANKING: Система используется для анализа результатов, сгенерированных на этапе RANKING. Путем сбора человеческих предпочтений генерируется Preference Ranking. Этот рейтинг затем сравнивается с рейтингом, сгенерированным поисковой системой, для оценки ее качества (например, при A/B тестировании обновлений).
  2. Обучение моделей RANKING: Preference Ranking служит в качестве "идеального" ранжирования (Ground Truth). Эти данные используются для обучения и тонкой настройки моделей машинного обучения (например, на этапе L2/L3 Ranking), чтобы они лучше соответствовали человеческим предпочтениям.

Входные данные:

  • Набор элементов для оценки (например, Топ-20 результатов поиска).
  • Сырые данные о предпочтениях асессоров (W/L/T) для выбранных пар элементов.

Выходные данные:

  • Dominant Eigenvector (Preference Ranking) — вектор числовых оценок качества для каждого элемента.

На что влияет

  • Типы контента и форматы: Патент универсален и может применяться для оценки любых сравниваемых элементов: веб-страниц, документов, изображений, продуктов, рекламы, видео. Он также позволяет сравнивать качество между разными типами контента (например, новость против изображения), что важно для оценки Универсального Поиска (METASEARCH).
  • Специфические ниши: Наиболее критичен в YMYL-тематиках, где точность оценки качества имеет решающее значение для валидации алгоритмов, отвечающих за E-E-A-T.

Когда применяется

  • Условия работы: Алгоритм применяется в офлайн-режиме в рамках инфраструктуры оценки качества (Quality Evaluation pipelines). Он не используется в реальном времени.
  • Триггеры активации: Необходимость оценить новый алгоритм ранжирования (A/B тестирование), провести мониторинг качества выдачи или сгенерировать свежие обучающие данные для ML-моделей.

Пошаговый алгоритм

Процесс генерации рейтинга предпочтений:

  1. Получение набора элементов: Система получает набор из n элементов (например, результаты поиска).
  2. Выборка пар для оценки: Из всех возможных пар выбирается подмножество. Выборка может быть случайной или использовать технику прогрессивного уточнения (progressive-refinement technique).
  3. Представление пар пользователям (Pairwise Comparison): Выбранные пары представляются асессорам в формате Side-by-Side с исходным запросом.
  4. Сбор предпочтений и заполнение Матрицы Рейтингов: Система получает оценки (Левый лучше, Правый лучше, Одинаково) и заполняет Rating Matrix данными W/L/T (Wins/Losses/Ties).
  5. Вычисление Матрицы Смежности: Система вычисляет Adjacency Matrix из Rating Matrix, используя формулу Weighted Loss Ratio и нормализацию (см. Метрики).
  6. Вычисление Доминирующего Собственного Вектора: Система итеративно вычисляет Dominant Eigenvector для Adjacency Matrix с использованием Damping Factor (например, 0.85).
  7. Генерация Рейтинга Предпочтений: Полученный вектор определяет Preference Ranking.
  8. Использование Рейтинга: Preference Ranking используется для оценки качества результатов поиска или как обучающие данные.

Какие данные и как использует

Данные на входе

Патент фокусируется исключительно на использовании данных о предпочтениях.

  • Поведенческие факторы (Human Judgment Data): Единственный тип входных данных для расчета — это прямые оценки предпочтений, полученные от асессоров в ходе попарных сравнений (W/L/T).
  • Контентные факторы (Неявно): Сами элементы (веб-страницы и т.д.), которые предъявляются асессорам. Алгоритм агрегации не анализирует контент, но контент влияет на предпочтения асессоров.

Какие метрики используются и как они считаются

  1. Rating Matrix (W/L/T): Агрегация исходных данных о количестве побед, проигрышей и ничьих для каждой пары (i, j).
  2. Adjacency Matrix (A): Рассчитывается из Rating Matrix. Для набора из n элементов, элемент aija_{ij} определяется по формулам:
    • При i ≠ j (Weighted Loss Ratio): aij=losses(i,j)(wins(i,j)+losses(i,j)+ties(i,j))⋅na_{ij} = \frac{losses(i,j)}{(wins(i,j) + losses(i,j) + ties(i,j)) \cdot n}
    • При i = j (Нормализация): aii=1−∑k≠iaika_{ii} = 1 - \sum_{k \ne i} a_{ik}
  3. Dominant Eigenvector (R): Итоговый рейтинг. Вычисляется путем итеративного решения уравнения, включающего Adjacency Matrix (A) и Damping Factor (d):

    R=((1−d)

    Выводы

    1. Оценка качества, а не ранжирование в реальном времени: Патент описывает инфраструктурный механизм для офлайн-оценки качества поиска. Он критически важен для формирования эталона качества (Ground Truth), на который опираются основные алгоритмы ранжирования.
    2. Предпочтение попарным сравнениям: Google считает попарное сравнение (Side-by-Side) более надежным методом сбора человеческих оценок, чем анализ кликов или прямые опросы. Это подтверждает методологию работы асессоров.
    3. Устойчивость к шуму и противоречиям: Использование метода на основе собственного вектора (Markov process) позволяет агрегировать большое количество субъективных и противоречивых оценок (например, циклические предпочтения A>B, B>C, C>A) в единый стабильный рейтинг.
    4. Математика PageRank для человеческих суждений: Патент демонстрирует применение математического аппарата PageRank к анализу графа предпочтений. Входные данные меняются (ссылки на предпочтения), но принцип агрегации остается тем же.
    5. Рейтинг против Упорядочивания: Система генерирует именно рейтинг (числовые оценки с плавающей запятой), а не просто порядковый список. Это дает более точное представление о степени различия в качестве между элементами.

    Практика

    Best practices (это мы делаем)

    • Фокус на соответствии требованиям асессоров (Quality Rater Guidelines): Поскольку этот патент описывает метод агрегации оценок асессоров для создания Ground Truth, первостепенной задачей SEO является максимальное соответствие критериям качества, которыми руководствуются асессоры (E-E-A-T, Needs Met). Алгоритмы Google обучаются воспроизводить эти оценки.
    • Использование попарного сравнения для внутреннего аудита: Применяйте методологию Side-by-Side для оценки качества своего контента в сравнении с конкурентами. Задавайте вопрос: "Является ли наша страница явно лучше, чем страница конкурента X по запросу Y с точки зрения пользователя?".
    • Приоритет явного превосходства над конкурентами: Так как оценка качества основана на сравнениях (Wins/Losses), стратегически важно стремиться к тому, чтобы ваш контент был предпочтительнее контента конкурентов в большинстве случаев.
    • Улучшение UX/UI и дизайна: В попарных сравнениях визуальное представление, удобство использования и отсутствие отвлекающих факторов могут играть решающую роль в предпочтении одного результата другому.

    Worst practices (это делать не надо)

    • Ориентация только на поведенческие метрики (клики, CTR): Патент явно указывает, что анализ кликов является зашумленным и ненадежным методом оценки качества. Не следует полагаться на эти метрики как на истинный показатель качества.
    • Оптимизация под алгоритмы в ущерб пользователю: Использование тактик, которые ухудшают восприятие контента человеком. Асессоры (и обученные на их данных алгоритмы) предпочтут более качественный и полезный контент конкурента.
    • Игнорирование инструкций для асессоров (QRG): Рассматривать QRG как второстепенный документ. Этот патент доказывает, что данные асессоров лежат в основе измерения качества Google.

    Стратегическое значение

    Патент подчеркивает фундаментальную роль человеческой оценки в экосистеме поиска Google. Несмотря на развитие ИИ, именно агрегированные предпочтения людей (асессоров) формируют эталон, к которому стремятся алгоритмы. Это подтверждает стратегическую необходимость инвестиций в качество контента, экспертность и пользовательский опыт (E-E-A-T и Helpful Content), так как именно эти параметры оцениваются в ходе попарных сравнений (Human-Centric SEO).

    Практические примеры

    Сценарий: Внутренний аудит качества контента с использованием методологии попарного сравнения

    1. Цель: Оценить качество ключевой статьи в сравнении с Топ-3 конкурентами по целевому запросу.
    2. Подготовка: Выбрать целевой запрос. Определить 4 страницы для оценки: Ваша страница (P1) и страницы конкурентов (P2, P3, P4).
    3. Сбор данных (Pairwise Comparison): Привлечь несколько независимых экспертов или фокус-группу. Показать им исходный запрос и пары страниц в случайном порядке (P1 vs P2, P1 vs P3 и т.д.). Попросить выбрать предпочтительную страницу в каждой паре.
    4. Агрегация: Для точной оценки использовать метод из патента: создать Rating Matrix (W/L/T), вычислить Adjacency Matrix по формуле взвешенного соотношения проигрышей и рассчитать Dominant Eigenvector (можно использовать специализированное ПО или библиотеки Python).
    5. Результат: Получение объективного рейтинга качества 4 страниц (например, P1=0.45, P2=0.30, P3=0.15, P4=0.10). Это дает количественную оценку превосходства над конкурентами и указывает на направления для доработки.

    Вопросы и ответы

    Является ли это алгоритмом ранжирования, который Google использует в реальном времени?

    Нет. Этот патент описывает метод для *оценки* качества результатов поиска и агрегации человеческих суждений. Он используется офлайн для генерации эталонных данных (Ground Truth), которые затем применяются для обучения и валидации основных алгоритмов ранжирования.

    Использует ли этот алгоритм клики реальных пользователей из поиска (CTR)?

    Патент не использует данные о кликах. Более того, в описании изобретения прямо говорится, что пассивные методы наблюдения, такие как анализ кликов (click-tracking), являются "зашумленными и сложными для интерпретации". Этот метод предложен как более надежная альтернатива.

    Кто эти "пользователи", которые выражают предпочтения?

    Хотя патент использует общий термин "users", в контексте оценки качества поиска Google это почти наверняка относится к асессорам (Quality Raters). Именно они выполняют задачи попарного сравнения (Side-by-Side) для оценки качества выдачи.

    В чем ключевое отличие этого метода от PageRank?

    Математический аппарат схож – оба метода используют Марковский процесс и вычисляют доминирующий собственный вектор матрицы смежности. Однако входные данные принципиально разные: PageRank анализирует ссылки (мнение авторов), а этот метод анализирует предпочтения пользователей/асессоров (мнение пользователей).

    Почему Google предпочитает попарное сравнение (Side-by-Side) другим методам оценки?

    Патент указывает, что прямые опросы удовлетворенности сложно агрегировать из-за различий в мнениях. Попарное сравнение проще для пользователя (нужно выбрать лучший из двух вариантов) и предоставляет данные, которые можно эффективно и устойчиво к шуму агрегировать с помощью описанного математического метода.

    Что такое "Матрица смежности" (Adjacency Matrix) в этом патенте?

    Это матрица, где каждый элемент рассчитывается по специальной формуле "взвешенного соотношения проигрышей" (weighted loss ratio). Эта формула учитывает количество побед, проигрышей и ничьих, а также общее количество элементов, обеспечивая нормализацию и равный вес для каждого сравнения.

    Как система справляется с противоречивыми оценками (например, A>B, B>C, но C>A)?

    Именно для решения этой проблемы используется вычисление собственного вектора. Этот математический метод (Markov process) позволяет найти глобальный оптимальный рейтинг, который наилучшим образом согласуется со всеми имеющимися данными, даже если они содержат локальные противоречия или шум.

    Что означает, что система выдает "рейтинг", а не "упорядочивание"?

    Традиционная сортировка выдает порядковые номера (1, 2, 3). Этот метод выдает числовые оценки (например, 0.52, 0.29, 0.18). Это позволяет не только понять, что А лучше B, но и насколько именно А лучше B в контексте данного набора данных, что дает более точное представление о качестве.

    Какое практическое значение этот патент имеет для моей SEO-стратегии?

    Стратегически он подтверждает, что вы должны стремиться к явному превосходству над конкурентами. Так как асессоры сравнивают ваш сайт с другими в формате Side-by-Side, ваша цель – быть предпочтительным выбором. Это подчеркивает важность глубокого понимания интента и предоставления максимально полезного контента (Helpful Content).

    Актуален ли этот патент, учитывая развитие ИИ и машинного обучения?

    Да, абсолютно актуален. Человеческие оценки, агрегированные с помощью этой методологии, служат "золотым стандартом" (ground truth) для обучения и валидации современных моделей машинного обучения и ИИ-систем ранжирования. ИИ учится предсказывать, какой результат предпочел бы человек.

    Похожие патенты

    Как Google комбинирует поведенческие сигналы из разных поисковых систем для улучшения ранжирования
    Google использует механизм для улучшения ранжирования путем объединения данных о поведении пользователей (клики и время взаимодействия) из разных поисковых систем (например, Веб-поиск и Поиск по Видео). Если в основной системе данных недостаточно, система заимствует данные из другой, применяя весовой коэффициент и фактор сглаживания для контроля смещения и обеспечения релевантности.
    • US8832083B1
    • 2014-09-09
    • Поведенческие сигналы

    • SERP

    Как Google тестирует, сравнивает и выбирает лучшие алгоритмы ранжирования
    Патент описывает инфраструктуру Google для сравнения и оценки различных алгоритмов ранжирования (Scoring Functions). Система выбирает два алгоритма, которые дают максимально разные результаты (Diversity Score), показывает обе выдачи для сравнения (Side-by-Side) и собирает данные для определения лучшего алгоритма, фильтруя при этом ненадежную обратную связь.
    • US8060497B1
    • 2011-11-15
    • SERP

    Как Google рассчитывает «VisualRank» для изображений и медиафайлов, используя виртуальные ссылки на основе схожести и поведения пользователей
    Google использует алгоритм (концептуально называемый VisualRank) для ранжирования изображений и других медиафайлов путем создания «виртуальных ссылок» между ними. Эти ссылки основаны на визуальной схожести контента, данных о кликах пользователей и контексте размещения (URL analysis). Это позволяет оценить качество и авторитетность медиафайлов даже без явных гиперссылок, при этом система активно избегает показа слишком похожих (дублирующихся) результатов.
    • US8732187B1
    • 2014-05-20
    • Ссылки

    • Мультимедиа

    • Поведенческие сигналы

    Как Google нормализует и объединяет разнородные сигналы для ранжирования критериев таргетинга в рекламных системах
    Патент Google, описывающий методы ранжирования критериев распространения контента (например, ключевых слов или мест размещения для рекламы). Система объединяет основной сигнал (например, релевантность) с вспомогательными (CTR, показы), используя математические трансформации для уменьшения искажений данных (Skewness) и гарантируя, что отсутствие данных по сигналу не пессимизирует критерий. Патент относится к AdTech, а не к органическому поиску.
    • US9501549B1
    • 2016-11-22
    • Поведенческие сигналы

    Как Google использует сеть доверия между экспертами для расчета Trust Rank и ранжирования контента
    Google использует механизм для определения авторитетности контента путем анализа того, какие эксперты (сущности) доверяют друг другу и как они классифицируют (маркируют) контент в интернете. Система рассчитывает «Рейтинг Доверия» (Trust Rank) для каждой сущности и использует его для повышения в выдаче контента, отмеченного доверенными источниками, интегрируя сигналы репутации в алгоритм ранжирования.
    • US7603350B1
    • 2009-10-13
    • EEAT и качество

    • Knowledge Graph

    • SERP

    Популярные патенты

    Как Google вычисляет важность сущностей внутри документа, используя контекст, ссылки и поведение пользователей, для улучшения ранжирования
    Google использует систему для определения относительной важности сущностей (люди, места, даты) внутри документа (книги или веб-страницы) независимо от поискового запроса. Важность рассчитывается на основе того, где сущность упомянута (контекст, структура), насколько точно она определена, ссылаются ли на этот раздел внешние источники и как часто его просматривают пользователи. Эти оценки важности сущностей затем используются как сигнал для ранжирования самого документа в результатах поиска.
    • US7783644B1
    • 2010-08-24
    • Поведенческие сигналы

    • Индексация

    • Семантика и интент

    Как Google использует данные о кликах пользователей (CTR и Click Ratio) для определения официального сайта по навигационным запросам
    Google анализирует журналы запросов, чтобы определить, какой результат пользователи подавляюще предпочитают по конкретному запросу. Если результат демонстрирует исключительно высокий CTR и/или Click Ratio по популярному запросу, система помечает его как «авторитетную страницу». Затем этот результат может отображаться на выдаче с особым выделением, потенциально переопределяя стандартное ранжирование.
    • US8788477B1
    • 2014-07-22
    • Поведенческие сигналы

    • EEAT и качество

    • SERP

    Как Google выбирает, сортирует и форматирует динамические Sitelinks на основе типа контента и свежести страниц
    Патент Google описывает систему генерации Sitelinks (саб-ссылок), которые ведут непосредственно на конечный контент (статьи, видео, товары), а не на разделы сайта. Система определяет категорию контента и применяет специфические правила сортировки (например, по свежести для новостей), которые отличаются от стандартного ранжирования. Также используется специальное форматирование для улучшения навигации в SERP.
    • US9081832B2
    • 2015-07-14
    • Ссылки

    • SERP

    • Свежесть контента

    Как Google использует позиционный CTR (Selection Rate) для ранжирования и группировки вертикалей в Универсальном поиске
    Google использует механизм для структурирования поисковой выдачи путем группировки результатов по категориям (вертикалям), таким как Новости, Видео или Веб. Система определяет порядок этих категорий, основываясь на ожидаемой частоте кликов (Selection Rate/CTR) тех позиций, которые занимают результаты категории в исходном смешанном ранжировании. Это определяет структуру Универсального поиска (Universal Search).
    • US8498984B1
    • 2013-07-30
    • SERP

    • Поведенческие сигналы

    Как Google игнорирует часто меняющийся контент и ссылки в нем, определяя "временные" блоки шаблона сайта
    Google использует механизм для отделения основного контента от динамического шума (реклама, виджеты, дата). Система сравнивает разные версии одной страницы, чтобы найти часто меняющийся контент. Затем она анализирует HTML-структуру (путь) этого контента и статистически определяет, является ли этот структурный блок "временным" для всего сайта. Такой контент игнорируется при индексации и таргетинге рекламы, а ссылки в нем могут не учитываться при расчете PageRank.
    • US8121991B1
    • 2012-02-21
    • Индексация

    • Техническое SEO

    • Структура сайта

    Как Google (YouTube) анализирует трафик конкурирующих видео для рекомендации улучшений метаданных
    Google использует систему для анализа конкуренции между видео на основе общих поисковых запросов и времени просмотра. Система выявляет поисковые запросы, которые приводят трафик на конкурирующие (например, производные) видео, и сравнивает их с метаданными оригинального видео. Если обнаруживаются релевантные термины, отсутствующие у оригинала, они рекомендуются автору для улучшения видимости.
    • US10318581B2
    • 2019-06-11
    • Поведенческие сигналы

    • Мультимедиа

    • Семантика и интент

    Как Google использует вовлеченность пользователей на связанных страницах (Reachability Score) для ранжирования основного документа
    Google рассчитывает «Оценку Достижимости» (Reachability Score), анализируя, как пользователи взаимодействуют со страницами, на которые ссылается основной документ (внутренние и исходящие ссылки). Если пользователи активно переходят по этим ссылкам (высокий CTR) и проводят время на целевых страницах (высокое время доступа), основной документ получает повышение в ранжировании. Этот механизм измеряет потенциальную глубину и качество пользовательской сессии.
    • US8307005B1
    • 2012-11-06
    • Поведенческие сигналы

    • Ссылки

    • SERP

    Как Google использует LLM для генерации поисковых сводок (SGE), основываясь на контенте веб-сайтов, и итеративно уточняет ответы
    Google использует Большие Языковые Модели (LLM) для создания сводок (AI-ответов) в результатах поиска. Для повышения точности и актуальности система подает в LLM не только запрос, но и контент из топовых результатов поиска (SRDs). Патент описывает, как система выбирает источники, генерирует сводку, проверяет факты, добавляет ссылки на источники (linkifying) и аннотации уверенности. Кроме того, система может динамически переписывать сводку, если пользователь взаимодействует с одним из источников.
    • US11769017B1
    • 2023-09-26
    • EEAT и качество

    • Ссылки

    • SERP

    Как Google персонализирует поисковые подсказки (Autocomplete) на основе недавно просмотренного медиаконтента
    Google использует информацию о недавно потребленном пользователем медиаконтенте (видео, аудио, книги, игры) для персонализации поисковых подсказок. Система извлекает атрибуты (аспекты) из этого контента, такие как названия, имена актеров или артистов, и повышает в ранжировании те подсказки, которые соответствуют этим атрибутам. Влияние потребления медиа на подсказки зависит от времени, прошедшего с момента просмотра, типа контента и того, делился ли им пользователь.
    • US9268880B2
    • 2016-02-23
    • Персонализация

    • Семантика и интент

    • Мультимедиа

    Как Google использует гибридную классификацию и данные о кликах пользователей для точного определения тематики контента
    Google использует многоэтапный процесс для классификации контента в детальные иерархические категории. Система комбинирует традиционные методы классификации с анализом поисковых запросов и кликов пользователей (подтвержденных результатов поиска). Это позволяет точно определить узкоспециализированную тематику документа, фильтруя нерелевантные категории и взвешивая релевантность на основе TF-IDF и глубины иерархии.
    • US8145636B1
    • 2012-03-27
    • Семантика и интент

    • Поведенческие сигналы

    seohardcore