SEO HARDCORE
  • Разборы патентов
    • Патенты Google
  • Скоро SEO инструменты
  • Скоро SEO аналитика
  • seohardcore
SEO HARDCORE
назад

Как Google идентифицирует аудио, видео и изображения, даже если они были изменены (растянуты, замедлены или ускорены)

TRANSFORMATION INVARIANT MEDIA MATCHING (Трансформационно-инвариантное сопоставление медиаконтента)
  • US9143784B2
  • Google LLC
  • 2013-09-12
  • 2015-09-22
  • Мультимедиа
  • Описание
  • Разбор
  • Выводы
  • Практика
  • FAQ
  • Похожие

Google использует технологию для создания цифровых отпечатков медиаконтента (аудио, изображений, видео), которые устойчивы к различным трансформациям, таким как изменение скорости воспроизведения или соотношения сторон. Система анализирует относительное расположение ключевых маркеров в сигнале (например, пиков в аудио или краев на изображении), а не их абсолютные значения. Это позволяет Google распознавать контент, даже если он был отредактирован или искажен.

Описание

Какую проблему решает

Патент решает проблему надежной идентификации медиаконтента (аудио, видео, изображений), который подвергся трансформациям, таким как временное растяжение (time stretching), изменение скорости воспроизведения или изменение соотношения сторон (aspect ratio alterations). Традиционные методы сопоставления, использующие фиксированные системы координат, часто терпят неудачу при таких изменениях, так как извлеченные признаки оказываются нестабильными («хрупкими»). Изобретение направлено на создание устойчивой и эффективной системы распознавания модифицированного контента.

Что запатентовано

Запатентована система генерации инвариантных к трансформациям идентификаторов (цифровых отпечатков) для медиаконтента. Суть изобретения заключается в адаптивном кодировании относительного порядка (relative ordering) сигнальных маркеров (например, пиков или краев) в контенте, а не их абсолютных значений или позиций. Для этого используются методы геометрии опорных точек (Reference Point Geometry) и гистограммы отношений (Ratio Histograms), часто в сочетании с хешированием по принципу "Победитель получает всё" (Winner Takes All (WTA) Hashing).

Как это работает

Система обрабатывает медиаконтент, представленный в виде сигнального изображения (Signal Image), например, спектрограммы аудио или кадра видео.

  • Извлечение признаков: Идентифицируются ключевые сигнальные маркеры (Signal Markers) – пики в аудиосигнале или края (edges) на изображении.
  • Адаптивное измерение: Система измеряет относительные характеристики. Это могут быть расстояния от опорной точки до других маркеров или соотношения расстояний между последовательными краями (AB/BC). Эти соотношения сохраняются даже при растяжении контента.
  • Кодирование порядка (WTA Hashing): Полученные измерения обрабатываются с помощью WTA Hashing. Эта функция кодирует ранговое сходство (какой элемент больше), а не сами значения. Это делает итоговый отпечаток устойчивым к масштабированию и искажениям.
  • Сопоставление: Полученный инвариантный код используется для поиска в базе данных (например, Hash Table) известных медиафайлов.

Актуальность для SEO

Высокая. Идентификация медиаконтента критически важна для Google (Google Images, Video Search) и платформ типа YouTube (Content ID). С ростом объема пользовательского контента и легкости его модификации, технологии, способные распознавать трансформированный контент (изменение скорости, пропорций), остаются крайне актуальными для дедупликации, каноникализации и управления авторскими правами.

Важность для SEO

Влияние на SEO оценивается как высокое, особенно для мультимедийного SEO (Video и Image Search). Хотя это инфраструктурный патент, не описывающий сигналы ранжирования, он определяет, как Google понимает уникальность медиаконтента. Он напрямую влияет на дедупликацию и каноникализацию медиафайлов. Патент демонстрирует, что попытки «уникализировать» контент путем простых трансформаций (растягивание, изменение скорости) неэффективны.

Детальный разбор

Термины и определения

Fingerprint (Цифровой отпечаток) / Transformation Invariant Identifier
Компактный идентификатор медиаконтента, устойчивый к его модификациям (растяжение, масштабирование).
Pair-wise Order Measure (PO) (Мера попарного порядка)
Метрика, измеряющая сходство между двумя векторами на основе количества пар признаков, которые согласуются в своем порядке (ранге).
Ratio Histograms (Гистограммы отношений)
Метод для изображений. Основан на вычислении отношений расстояний между последовательными краями (например, AB/BC). Эти отношения инвариантны к изменению соотношения сторон.
Reference Point Geometry (Геометрия опорных точек)
Метод для сигналов (например, аудио). Основан на измерении расстояний от выбранной опорной точки до других точек сигнала на разных уровнях.
Signal Image (Сигнальное изображение)
Представление медиаконтента для анализа (например, спектрограмма аудио, график интенсивности или само изображение/кадр видео).
Signal Markers (Сигнальные маркеры)
Ключевые особенности в Signal Image, используемые для измерений (например, пики интенсивности, края).
Winner Takes All (WTA) Hashing (Хеширование по принципу "Победитель получает всё")
Техника хеширования, которая кодирует относительный порядок (ранг) значений признаков, а не их абсолютные величины. Она определяет, какой признак является "победителем" (максимальным) в подмножестве.

Ключевые утверждения (Анализ Claims)

Патент US9143784B2 является разделенным (divisional) патентом. Его Claims (1-20) сфокусированы исключительно на методе Reference Point Geometry в сочетании со специфической реализацией WTA Hashing.

Claim 1 (Независимый пункт): Описывает систему генерации хеш-значения.

  1. Выбор опорной точки (reference point) в Signal Image.
  2. Определение набора расстояний от этой опорной точки до других точек на различных уровнях изображения.
  3. Генерация хеш-значения с использованием WTA Hash Function, примененной к этим расстояниям.
  4. Функция WTA детально определена в Claim 1:
    1. Генерируется набор из 'm' перестановок (permutations).
    2. Для каждой перестановки Θi\Theta_{i}:
      • Расстояния переставляются согласно Θi\Theta_{i}.
      • Инициализируется разреженный код cxic_{xi}.
      • cxic_{xi} устанавливается равным расстоянию (или его индексу, согласно Algorithm 1 в описании) с максимальным значением в переставленном наборе.
    3. Итоговое хеш-значение является набором этих кодов (cx0cx1...cxm−1c_{x0}, c_{x1}, ..., c_{xm-1}).

      Ядром изобретения является использование WTA для кодирования относительного порядка измерений (расстояний). Если сигнал растягивается (например, аудио замедляется), абсолютные расстояния изменяются, но их относительный порядок (какое расстояние самое длинное, второе по длине и т.д.) часто сохраняется. WTA-хеш фиксирует этот порядок, делая результирующее хеш-значение трансформационно-инвариантным.

      Claim 2 (Зависимый): Уточняет применение: сравнение хеш-значения с Hash Table известного медиаконтента для идентификации.

      Где и как применяется

      Изобретение является инфраструктурной технологией обработки медиаконтента.

      CRAWLING – Сканирование и Сбор данных
      Система собирает медиафайлы (аудио, видео, изображения).

      INDEXING – Индексирование и извлечение признаков
      Основной этап применения. Компонент генерации отпечатков (Fingerprinting Component) обрабатывает медиаконтент.

      1. Предобработка: Контент преобразуется в Signal Image (например, спектрограмму).
      2. Извлечение Признаков (Feature Extraction): Применяются методы Reference Point Geometry или Ratio Histograms для извлечения данных о структуре контента.
      3. Генерация Отпечатка: Извлеченные данные обрабатываются (например, с помощью WTA Hashing) для создания Transformation Invariant Identifier.
      4. Дедупликация и Каноникализация: Отпечаток используется для идентификации дубликатов (даже измененных) и выбора канонической версии медиа.

      RANKING / RERANKING (Косвенное влияние)
      Патент не влияет на ранжирование напрямую, но обеспечивает его фундамент, позволяя корректно ассоциировать сигналы ранжирования с канонической версией медиа и оценивать уникальность контента на странице.

      Входные данные:

      • Медиаконтент или его Signal Image.

      Выходные данные:

      • Инвариантный к трансформациям идентификатор (хеш-значение).

      На что влияет

      • Типы контента: Влияет исключительно на мультимедийный контент: аудио, изображения и видео.
      • Специфические запросы: Влияет на результаты в вертикалях Google Images, Video Search и при поиске по образцу (Reverse Image Search).
      • Ниши: Критически важно для UGC-платформ (YouTube Content ID), стоковых фотографий, музыки и любого контента, подверженного копированию и модификации.

      Когда применяется

      • Триггеры активации: Применяется при индексации нового или обновленного медиаконтента, при загрузке контента пользователем или при выполнении поискового запроса по образцу.

      Пошаговый алгоритм

      Патент описывает два основных метода извлечения признаков.

      Метод А: Геометрия опорных точек (Reference Point Geometry) (Описан в Claims)

      1. Получение и Предобработка: Генерация Signal Image из медиаконтента.
      2. Выбор Опорных Точек: Идентификация Reference Points (например, пиков сигнала).
      3. Измерение Расстояний: От опорной точки измеряются расстояния до других точек пересечения с сигналом на разных уровнях.
      4. Формирование Векторов: Расстояния объединяются в векторы признаков.
      5. Применение WTA Hashing:
        1. Используется предопределенный набор случайных перестановок Θ\Theta и размер окна K.
        2. Для каждой перестановки Θi\Theta_i элементы вектора перемешиваются.
        3. Определяется индекс элемента с максимальным значением в окне K («победитель»).
        4. Этот индекс кодируется.
      6. Генерация Отпечатка: Набор полученных кодов формирует итоговый хеш.
      7. Идентификация: Поиск хеша в базе данных.

      Метод Б: Гистограммы отношений (Ratio Histograms) (Описан в Description)

      1. Получение Изображения.
      2. Обнаружение и Выбор Краев: Детектирование и отбор значимых краев (например, горизонтальных) с помощью фильтров.
      3. Определение Пересечений: Определение мест пересечения краев с линиями в другом направлении (например, вертикальными).
      4. Вычисление Отношений: Расчет отношений расстояний между последовательными краями (например, AB/BC).
      5. Квантование и Гистограмма: Построение гистограммы квантованных отношений.
      6. Генерация Отпечатка: Гистограмма используется как отпечаток (или дополнительно хешируется, например, через WTA).
      7. Идентификация.

      Какие данные и как использует

      Данные на входе

      • Мультимедиа факторы (Сигнальные данные): Интенсивность сигнала, частотные характеристики (для аудио), пиксельные данные, градиенты интенсивности (для обнаружения краев в изображениях).
      • Структурные факторы (Внутри медиа): Расположение Signal Markers (пиков, краев) относительно друг друга; расстояния и локации пересечений.

      Какие метрики используются и как они считаются

      • Расстояния (Distances): Измерения между опорными точками и другими маркерами (в методе Reference Point Geometry).
      • Отношения (Ratios): Вычисляются как деление расстояний между последовательными краями (например, AB/BCAB/BC) (в методе Ratio Histograms).
      • Ранговое сходство (Rank Similarity): Лежит в основе WTA Hashing. Система оценивает, насколько совпадает порядок признаков.
      • Pair-wise Order Measure (PO(X,Y)): Метрика для измерения рангового сходства, которая подсчитывает количество пар признаков, имеющих одинаковый порядок в векторах X и Y. Формула: PO(XY)=∑i∑j<iT((xi−xj)(yi−yj))PO(X,Y)=\sum_{i}\sum_{j<i}T((x_{i}-x_{j})(y_{i}-y_{j})), где T — пороговая функция.
      • Расстояние Хэмминга (Hamming Distance): Используется для сравнения итоговых бинарных кодов, полученных после WTA Hashing.

      Выводы

      1. Фокус на относительном порядке, а не абсолютных значениях: Ключевой вывод заключается в том, что Google использует признаки, основанные на относительном порядке (ранге) характеристик или их соотношениях, а не на абсолютных значениях. Это обеспечивает устойчивость системы к распространенным трансформациям (масштабирование, растяжение).
      2. WTA Hashing как механизм инвариантности: WTA Hashing является эффективным методом для кодирования рангового сходства. Он позволяет преобразовать сложные признаки в компактные коды, устойчивые к изменениям, которые не нарушают порядок признаков.
      3. Адаптивное извлечение признаков: Система использует адаптивные методы (Reference Point Geometry, Ratio Histograms), которые "привязываются" к структуре самого контента (пикам, краям), а не к фиксированным координатам или временным меткам.
      4. Инфраструктура мультимедийного индексирования: Патент описывает фундаментальную технологию для индексации, дедупликации и каноникализации медиаконтента в масштабах веба и платформ типа YouTube (Content ID).
      5. Неэффективность простых модификаций для уникализации: С точки зрения SEO, это подтверждает, что простые манипуляции с медиаконтентом (изменение скорости, пропорций) не позволят обойти системы обнаружения дубликатов.

      Практика

      Best practices (это мы делаем)

      • Создание подлинно уникального медиаконтента: Инвестируйте в создание оригинальных изображений и видео. Поскольку система эффективно распознает модифицированные дубликаты на структурном уровне, подлинная уникальность является ключевым фактором для видимости в Google Images и Video Search.
      • Оптимизация качества медиа: Используйте высококачественные медиафайлы с четкими признаками. Методы извлечения признаков (обнаружение краев, пиков) полагаются на четкость Signal Markers. Чрезмерно шумный или артефактный контент может затруднить точное создание отпечатков.
      • Мониторинг использования ваших активов: Используйте инструменты обратного поиска по изображению (которые используют подобные технологии), чтобы отслеживать, где используются ваши оригинальные медиа-активы, понимая, что даже измененные версии могут быть отслежены до оригинала.

      Worst practices (это делать не надо)

      • «Уникализация» путем трансформаций: Не пытайтесь обмануть поисковые системы, применяя простые трансформации (растягивание, сжатие, изменение скорости воспроизведения, зеркальное отражение) к чужому контенту. Методы WTA Hashing и Ratio Histograms специально разработаны для обнаружения таких модификаций.
      • Использование стоковых изображений без значительной переработки: Использование популярных стоковых изображений неэффективно для Image SEO, так как Google легко идентифицирует их как дубликаты. Если вы используете сток, он должен быть частью более крупной оригинальной композиции, существенно меняющей его структуру.
      • Игнорирование качества аудио в видео (VSEO): Не предполагайте, что важен только визуальный ряд. Метод Reference Point Geometry применяется для надежного создания аудио-отпечатков, что означает, что аудиодорожка также анализируется для идентификации контента.

      Стратегическое значение

      Патент подтверждает сложность систем Google по идентификации мультимедийного контента. Для SEO-стратегии это подчеркивает, что «уникальность» медиа оценивается не по метаданным или точному совпадению пикселей, а по базовым структурным отпечаткам. Эта технология позволяет Google консолидировать сигналы вокруг канонических медиа-активов, даже если они распространены в сети в модифицированных формах. Стратегический фокус должен быть направлен на создание оригинального контента, а не на технические манипуляции.

      Практические примеры

      Сценарий 1: Оптимизация изображений для E-commerce

      1. Ситуация: Магазин использует стандартные фото товара от производителя, как и конкуренты.
      2. Проблема (по патенту): Google применяет Ratio Histograms и идентифицирует эти фото как дубликаты, независимо от их размера или сжатия на сайте. Шансы ранжирования в Google Images низкие.
      3. SEO-действие: Вместо попыток уникализировать фото производителя (например, добавить рамку), необходимо создать новый контент. Сделать собственные фотографии товара с разных ракурсов или видеообзор.
      4. Результат: Новый контент имеет уникальные цифровые отпечатки, что повышает его ценность и улучшает видимость в мультимедийном поиске.

      Сценарий 2: Попытка повторного использования видео с изменением скорости

      1. Действие: Пользователь берет чужое видео и замедляет его на 10%, чтобы загрузить как «новый» контент.
      2. Обработка Google: Система анализирует аудиодорожку (или видеоряд) с помощью Reference Point Geometry. Хотя абсолютные расстояния между пиками изменились из-за замедления, их относительный порядок остался прежним.
      3. Результат: WTA Hashing генерирует отпечаток, совпадающий с оригиналом. Система идентифицирует контент как дубликат.

      Вопросы и ответы

      Что такое Winner Takes All (WTA) Hashing и почему он устойчив к изменениям медиа?

      WTA Hashing — это метод, который фокусируется на относительном порядке (ранжировании) признаков, а не на их абсолютных значениях. Он определяет, какой признак имеет наибольшее значение в подмножестве. Это устойчиво, потому что при растяжении или масштабировании контента абсолютные значения изменяются, но относительный порядок часто сохраняется (например, пик А все равно выше пика Б). Это позволяет генерировать стабильный отпечаток.

      Поможет ли изменение размера или соотношения сторон изображения сделать его уникальным для Google?

      Нет, не поможет. Патент описывает метод Ratio Histograms, специально разработанный для устойчивости к изменению пропорций. Система анализирует отношение расстояний между ключевыми элементами (краями) на изображении. При изменении размера или растяжении эти отношения сохраняются, и Google идентифицирует изображение как исходное.

      Если я ускорю или замедлю видео, сможет ли Google определить оригинал?

      Да, сможет. Метод Reference Point Geometry устойчив к временному растяжению (изменению скорости). Система измеряет расстояния между ключевыми маркерами в сигнале. При изменении скорости эти расстояния масштабируются, но их относительный порядок остается прежним. WTA hashing кодирует этот порядок, позволяя идентифицировать оригинал.

      Влияет ли этот патент на ранжирование обычных веб-страниц (10 синих ссылок)?

      Напрямую нет, но косвенно влияет. Этот механизм используется для оценки уникальности медиаконтента на странице. Если Google идентифицирует ваши изображения или видео как дубликаты, это может негативно сказаться на общей оценке качества и уникальности страницы, что, в свою очередь, повлияет на ее ранжирование.

      Как этот патент связан с Google Images и YouTube Content ID?

      Это фундаментальная технология для этих сервисов. В Google Images она используется для дедупликации, каноникализации и обратного поиска по изображению. В YouTube Content ID она позволяет автоматически идентифицировать защищенный авторским правом материал (музыку или видео), даже если пользователи пытаются обойти защиту путем модификации контента.

      Что подразумевается под "Сигнальными маркерами" (Signal Markers)?

      Signal Markers — это ключевые особенности в медиаконтенте, используемые для анализа. В аудио это могут быть пики интенсивности или частоты (опорные точки). На изображении это, как правило, края (edges) – области резкого изменения яркости или цвета. Система использует расположение этих маркеров для создания отпечатка.

      Эффективно ли добавление водяного знака или логотипа поверх изображения для его уникализации?

      Это малоэффективно для уникализации основного содержания. Хотя водяной знак добавляет новые элементы, базовая структура исходного изображения сохраняется. Системы, основанные на описанных методах, достаточно устойчивы, чтобы игнорировать такие наложения и распознать исходное изображение под ними, если оно не было существенно изменено.

      Что такое "Гистограммы отношений" (Ratio Histograms) и как они работают?

      Это метод для идентификации изображений. Система находит края (например, горизонтальные) и измеряет расстояния между ними вдоль вертикальных линий. Затем вычисляется отношение этих расстояний (например, AB/BC). Если изображение растянуть, расстояния изменятся, но их отношение останется постоянным. Гистограмма этих отношений служит устойчивым отпечатком.

      На каком этапе поиска Google применяет эту технологию?

      В основном на этапе индексирования и извлечения признаков (INDEXING & Feature Extraction). Когда Google сканирует медиафайл, система генерирует этот трансформационно-инвариантный отпечаток для идентификации контента, его дедупликации и каноникализации до того, как он будет участвовать в ранжировании.

      Какие действия предпринять SEO-специалисту, исходя из этого патента?

      Главное действие — инвестировать в создание действительно оригинального мультимедийного контента. Не полагайтесь на стоковые фото или чужие видео, пытаясь их поверхностно изменить (растянуть, обрезать, изменить цвет). Для достижения успеха в мультимедийном поиске необходим контент, который имеет уникальную внутреннюю структуру.

      Похожие патенты

      Как Google идентифицирует дубликаты и защищенный авторским правом видеоконтент с помощью 3D-отпечатков
      Google использует технологию трехмерных цифровых отпечатков для управления большими видеобиблиотеками (например, YouTube). Система анализирует пространственные (внутри кадра) и временные (между кадрами) характеристики видео, создавая уникальный идентификатор. Это позволяет эффективно обнаруживать дубликаты и защищенный контент, даже если видео было изменено (сжато, обрезано, перекодировано).
      • US8094872B1
      • 2012-01-10
      • Индексация

      • Мультимедиа

      Как Google рассчитывает «VisualRank» для изображений и медиафайлов, используя виртуальные ссылки на основе схожести и поведения пользователей
      Google использует алгоритм (концептуально называемый VisualRank) для ранжирования изображений и других медиафайлов путем создания «виртуальных ссылок» между ними. Эти ссылки основаны на визуальной схожести контента, данных о кликах пользователей и контексте размещения (URL analysis). Это позволяет оценить качество и авторитетность медиафайлов даже без явных гиперссылок, при этом система активно избегает показа слишком похожих (дублирующихся) результатов.
      • US8732187B1
      • 2014-05-20
      • Ссылки

      • Мультимедиа

      • Поведенческие сигналы

      Как Google использует трехэтапную систему фингерпринтинга (Content ID) для обнаружения дубликатов видео и аудио
      Google использует масштабируемую систему для обнаружения полных или частичных совпадений в видео и аудио контенте. Система генерирует компактные цифровые отпечатки (фингерпринты) и применяет трехэтапный процесс: быстрый поиск кандидатов с помощью Locality-Sensitive Hashing (LSH), точная классификация с использованием машинного обучения и объединение результатов. Это позволяет идентифицировать контент даже при изменении качества или скорости воспроизведения.
      • US8238669B2
      • 2012-08-07
      • Мультимедиа

      • Индексация

      Как Google использует взвешенную оценку метаданных для выявления дубликатов контента без анализа самих файлов
      Патент Google описывает метод идентификации субстантивных дубликатов (например, товаров, видео или сущностей в разных форматах) исключительно путем сравнения их метаданных. Система нормализует данные, вычисляет взвешенную оценку сходства с учетом важности разных атрибутов и помечает контент как дублирующийся, если оценка превышает порог. Этот механизм критичен для согласования сущностей (Entity Reconciliation) в системах Google.
      • US8266115B1
      • 2012-09-11
      • Индексация

      Как Google идентифицирует конкретные видео (фильмы, клипы, эпизоды) на веб-страницах, анализируя окружающий текст
      Google использует библиографические данные (название, актеры, длина) для поиска и идентификации конкретных видео на веб-страницах. Система анализирует текст, расположенный рядом с видеоплеером («associated text»), и вычисляет «оценку совпадения» (Occurrence Score), чтобы точно понять, какой именно фильм, клип или эпизод представлен на странице.
      • US8983945B1
      • 2015-03-17
      • Мультимедиа

      • Семантика и интент

      Популярные патенты

      Как Google генерирует блок "Похожие вопросы" (People Also Ask) на основе анализа кликов и поведения пользователей
      Google анализирует топовые результаты по исходному запросу и определяет "Тематические запросы" (Topic Sets) — прошлые запросы, по которым пользователи кликали на эти результаты. Затем система ищет популярные вопросы, соответствующие этим темам, фильтрует дубликаты на основе общности кликов и показывает их в блоке PAA для дальнейшего исследования темы.
      • US9213748B1
      • 2015-12-15
      • SERP

      • Семантика и интент

      • Поведенческие сигналы

      Как Google использует социальные связи для обнаружения ссылочного спама и накрутки кликов
      Google может анализировать связи между владельцами сайтов в социальных сетях, чтобы оценить независимость ссылок между их ресурсами. Если владельцы тесно связаны (например, друзья), ссылки между их сайтами могут получить меньший вес в ранжировании, а клики по рекламе могут быть классифицированы как спам (накрутка).
      • US8060405B1
      • 2011-11-15
      • Антиспам

      • Ссылки

      • SERP

      Как Google использует контекст пользователя для генерации неявных поисковых запросов и проактивного показа результатов
      Система Google отслеживает контекст пользователя в реальном времени (набираемый текст, открытые документы, письма). На основе этого контекста автоматически генерируются множественные неявные запросы. Система объединяет результаты из разных источников (локальных и глобальных) и проактивно показывает их пользователю, используя поведенческие данные (клики) для улучшения релевантности.
      • US7664734B2
      • 2010-02-16
      • Поведенческие сигналы

      • Персонализация

      • Семантика и интент

      Как Google классифицирует запросы как навигационные или исследовательские, чтобы регулировать количество показываемых результатов
      Google использует систему для динамического определения количества отображаемых результатов поиска. Система классифицирует запрос как навигационный (поиск конкретного места/ресурса) или исследовательский (поиск вариантов). Классификация основана на анализе компонентов оценки релевантности (совпадение по названию vs. категории) и энтропии исторических кликов. При навигационном интенте количество результатов сокращается.
      • US9015152B1
      • 2015-04-21
      • Семантика и интент

      • Поведенческие сигналы

      • Local SEO

      Как Google выбирает каноническую (основную) версию документа, основываясь на авторитетности источника и полноте контента
      Google использует систему для выбора канонической (основной) версии документа среди его дубликатов. Система присваивает «приоритет авторитетности» каждой версии, основываясь на источнике (например, официальный издатель) и праве публикации. Основной версией выбирается та, которая имеет высокий авторитет и является полной. При отсутствии идеального варианта выбирается версия с наибольшим объемом информации (например, самая длинная или с наибольшим PageRank).
      • US8095876B1
      • 2012-01-10
      • EEAT и качество

      • Техническое SEO

      • Ссылки

      Как Google рассчитывает авторитетность страниц на основе их близости к доверенным сайтам-источникам (Seed Sites)
      Google использует метод ранжирования страниц, основанный на измерении «расстояния» в ссылочном графе от набора доверенных исходных сайтов (Seed Sites) до целевой страницы. Чем короче путь от доверенных источников до страницы, тем выше ее рейтинг авторитетности. Длина ссылки увеличивается (а ее ценность падает), если исходная страница имеет большое количество исходящих ссылок. Этот механизм позволяет эффективно рассчитывать показатели доверия (Trust) в масштабах всего веба.
      • US9165040B1
      • 2015-10-20
      • Ссылки

      • EEAT и качество

      • Антиспам

      Как Google использует социальные связи и анализ контекста рекомендаций (Endorsements) для персонализации поисковой выдачи
      Google анализирует контент (например, посты в микроблогах и социальных сетях), созданный контактами пользователя. Система определяет, является ли ссылка в этом контенте "подтверждением" (Endorsement) на основе окружающих ключевых слов. Если да, то при поиске пользователя эти результаты могут быть аннотированы, указывая, кто из контактов и через какой сервис подтвердил результат, и потенциально повышены в ранжировании.
      • US9092529B1
      • 2015-07-28
      • Поведенческие сигналы

      • Персонализация

      • EEAT и качество

      Как Google снижает влияние ссылок с аффилированных сайтов и PBN для борьбы с манипуляциями в ранжировании
      Патент Google описывает систему ранжирования, которая идентифицирует группы сайтов под общим контролем (аффилированные узлы или PBN). Система резко снижает вес ссылок внутри такой группы и ограничивает общее влияние группы на другие сайты, учитывая только одну, самую сильную ссылку от всей группы. Также описывается механизм "Доверенных авторитетов", чьи ссылки передают максимальный вес независимо от количества исходящих ссылок.
      • US8719276B1
      • 2014-05-06
      • Антиспам

      • Ссылки

      • Техническое SEO

      Как Google запоминает прошлые уточнения поиска пользователя и автоматически перенаправляет его к конечному результату
      Google использует механизм персонализации, который отслеживает, как пользователи уточняют свои поисковые запросы. Если пользователь часто вводит общий запрос, а затем выполняет ряд действий (например, меняет запрос или взаимодействует с картой), чтобы добраться до конкретного результата, система запоминает эту последовательность. В будущем, при вводе того же общего запроса, Google может сразу показать конечный результат, минуя промежуточные шаги.
      • US9305102B2
      • 2016-04-05
      • Персонализация

      • Поведенческие сигналы

      Как Google переносит поведенческие сигналы через ссылки для повышения в ранжировании первоисточников контента
      Google использует механизм для корректного учета поведенческих сигналов (например, времени пребывания). Если пользователь кликает на результат в выдаче, а затем переходит по ссылке на другую страницу, система может перенести позитивные сигналы с исходной страницы на целевую. Это позволяет повышать в рейтинге первоисточники информации, а не страницы-посредники.
      • US8959093B1
      • 2015-02-17
      • Поведенческие сигналы

      • Ссылки

      • SERP

      seohardcore