SEO HARDCORE
  • Разборы патентов
    • Патенты Google
  • Скоро SEO инструменты
  • Скоро SEO аналитика
  • seohardcore
SEO HARDCORE
назад

Как Google связывает медиаконтент (видео) с Графом Знаний для улучшения поиска и автоматического тегирования

SEARCHING AND TAGGING MEDIA STORAGE WITH A KNOWLEDGE DATABASE (Поиск и тегирование медиа-хранилища с использованием базы знаний)
  • US9189528B1
  • Google LLC
  • 2013-03-15
  • 2015-11-17
  • Knowledge Graph
  • Семантика и интент
  • Мультимедиа
  • Описание
  • Разбор
  • Выводы
  • Практика
  • FAQ
  • Похожие

Google использует систему для связи медиаконтента (например, видео на YouTube) со структурированными данными из Базы Знаний (Knowledge Graph). Описывается, как создаются ассоциации между видео и сущностями путем анализа метаданных, что позволяет пользователям искать контент по идентификаторам сущностей и автоматически тегировать медиафайлы, улучшая их обнаруживаемость.

Описание

Какую проблему решает

Патент решает проблему ограниченности традиционного поиска по ключевым словам для медиаконтента (например, видео). Зачастую предоставленные пользователями метаданные (заголовки, описания, теги) не полностью описывают содержание контента, что снижает эффективность поиска. Кроме того, патент направлен на автоматизацию процесса тегирования, уменьшая зависимость от ручного ввода тегов, который может быть подвержен ошибкам и неточностям.

Что запатентовано

Запатентована система, которая создает и хранит ассоциации между единицами контента (Content Items) в медиа-хранилище (Media Storage) (например, видео, плейлисты, каналы) и идентификаторами (Identifications или Textual identification strings) из базы знаний (Knowledge Database). Эти идентификаторы представляют сущности или темы. Система использует эти ассоциации для улучшения поиска медиаконтента и для автоматического тегирования контента.

Как это работает

Система работает путем сопоставления метаданных (заголовков, описаний) медиаконтента со строками в Knowledge Database. Найденные связи сохраняются в Хранилище Ассоциаций (Association Store). При выполнении поиска (по ключевому слову/метаданным или идентификатору сущности) система обращается к Association Store для извлечения релевантных единиц контента, связанных идентификаторов или и того, и другого. Также система включает механизм для автоматического тегирования контента с использованием связанных с ним идентификаторов из базы знаний.

Актуальность для SEO

Высокая. Связывание любого контента со структурированными данными (Графом Знаний) является фундаментом современного семантического поиска. Этот патент крайне актуален для платформ вроде YouTube (упоминаемый как "media sharing web site"), демонстрируя базовые механизмы того, как Google использует сущности для понимания и организации нетекстового контента.

Важность для SEO

Значительное влияние (7/10). Хотя патент сфокусирован на медиа-платформах, он раскрывает ключевые механизмы того, как Google ассоциирует контент с сущностями. Понимание этого критически важно для Video SEO и максимизации видимости контента путем обеспечения его корректного сопоставления с Графом Знаний.

Детальный разбор

Термины и определения

Knowledge Database (База знаний)
Структурированная коллекция данных, часто использующая графовую модель (упоминается Freebase, аналог – Knowledge Graph). Содержит узлы (nodes), представляющие темы, подтемы или сущности.
Identification / Textual identification string (Идентификатор / Текстовая строка идентификации)
Строка, используемая для уникальной идентификации узла (сущности или темы) в Knowledge Database (например, /en/president_of_the_USA).
Media Storage (Медиа-хранилище)
База данных, содержащая медиаконтент, доступный через сайты обмена медиа (например, серверы YouTube).
Content Item (Единица контента)
Отдельный медиафайл (видео, аудио), плейлист или пользовательский канал в Media Storage.
Association Store (Хранилище ассоциаций)
База данных, которая хранит связи (cross-references) между Content Items и Identifications.
Metadata (Метаданные)
Данные, связанные с Content Item, такие как заголовок (title), описание (description) или теги. Указывается, что они могут быть созданы загрузчиком или зрителем контента. Используются для создания ассоциаций.
Tag Database (База данных тегов)
Хранилище, содержащее информацию о тегах, присвоенных контенту, в частности, теги, сгенерированные автоматически на основе Identifications.

Ключевые утверждения (Анализ Claims)

Claim 1 (Независимый пункт): Описывает основную систему поиска и её компоненты.

  1. Система включает Knowledge Database (с узлами и текстовыми строками идентификации), Media Storage (с контентом и метаданными, созданными пользователями) и Association Store.
  2. Association Store генерирует и хранит ассоциации между контентом и идентификаторами. Генерация основана на соответствии (meeting at least one matching criteria) между метаданными контента и идентификаторами.
  3. Search Retrieving Unit получает поисковый запрос.
  4. Association Retrieval Unit извлекает ассоциацию между Content Item и как минимум одной Textual identification string. Извлечение происходит, если запрос соответствует (matching) либо метаданным контента, либо идентификатору.
  5. Output Unit отображает и Content Item, и извлеченную Textual identification string в ответ на запрос.

Claim 2, 3, 4 (Зависимые): Детализируют сценарий поиска по идентификатору.

  • Если поисковый запрос содержит (или является частью) первой строки идентификации (Claim 2).
  • Система извлекает Content Item на основе этой первой строки (Claim 3).
  • Затем система извлекает *вторую* строку идентификации из базы знаний на основе уже извлеченного Content Item (Claim 4). Это механизм для поиска связанных сущностей через общий контент.

Claim 5, 6 (Зависимые): Детализируют сценарий поиска по метаданным.

  • Если поисковый запрос содержит метаданные из Content Item (Claim 5).
  • Система извлекает связанную строку идентификации на основе Content Item, который был идентифицирован по этим метаданным (Claim 6).

Где и как применяется

Изобретение охватывает процессы как на этапе индексирования, так и на этапе обработки запроса для улучшения поиска на медиа-платформах (например, YouTube).

INDEXING – Индексирование и извлечение признаков
На этом этапе происходит основной процесс создания ассоциаций. Система анализирует Content Items (видео) и их Metadata (заголовки, описания) из Media Storage. Она сравнивает эти метаданные с данными в Knowledge Database для поиска соответствующих Identifications (сущностей). Найденные ассоциации сохраняются в Association Store. Также на этом этапе работает механизм автоматического тегирования (Tag Performing Unit), который сохраняет результаты в Tag Database.

QUNDERSTANDING – Понимание Запросов
Когда пользователь выполняет поиск на медиа-платформе, система анализирует запрос. Она может определить, что запрос сам по себе является Textual identification string (идентификатором сущности из базы знаний) или содержит метаданные.

RANKING – Ранжирование (Retrieval)
На этапе поиска (retrieval) компонент Association Retrieval Unit использует Association Store для нахождения релевантного контента. Если запрос является идентификатором, система находит связанные с ним видео. Если запрос соответствует метаданным, система находит видео и связанные с ним идентификаторы.

Входные данные:

  • Медиаконтент (видео, аудио, плейлисты, каналы).
  • Метаданные контента (заголовки, описания, пользовательские теги).
  • Knowledge Database (сущности и их идентификаторы).
  • Поисковые запросы пользователей или API.

Выходные данные:

  • Извлеченные единицы контента (Content Items).
  • Извлеченные связанные идентификаторы (Identifications).
  • Автоматически сгенерированные теги для контента.

На что влияет

  • Конкретные типы контента: В первую очередь влияет на медиаконтент на сайтах обмена видео, музыкой или текстом. Включает отдельные медиафайлы, плейлисты и пользовательские каналы.
  • Специфические запросы: Улучшает обработку запросов, основанных на сущностях (люди, места, объекты, темы), когда пользователи ищут медиаконтент, связанный с этой конкретной сущностью.

Когда применяется

  • При обработке запроса: Механизм поиска активируется при получении любого поискового запроса на медиа-платформе. Система проверяет соответствие запроса метаданным или идентификаторам из Knowledge Database.
  • При индексировании (Tagging): Механизм автоматического тегирования применяется при обработке контента или на основе заранее определенных условий (predetermined condition) или эвристик, установленных имплементатором системы. В качестве примеров эвристик упоминаются контент, связанный с определенной темой, или контент с определенным количеством просмотров (view count).

Пошаговый алгоритм

Процесс А: Создание Ассоциаций (Индексирование)

  1. Извлечение данных: Система получает Content Item и его Metadata (заголовок, описание, теги) из Media Storage.
  2. Сопоставление: Система сравнивает метаданные с текстовыми строками (идентификаторами) в Knowledge Database.
  3. Сохранение ассоциации: При обнаружении соответствия, удовлетворяющего критериям (matching criteria), связь между Content Item и соответствующим Identification сохраняется в Association Store.

Процесс Б: Автоматическое Тегирование (Индексирование)

  1. Определение контента: Система (Tag Determination Unit) выбирает Content Item или группу для тегирования на основе заданных эвристик или условий.
  2. Получение ассоциаций: Для выбранного контента система извлекает связанные Identifications из Association Store.
  3. Выполнение тегирования: Система (Tag Performing Unit) присваивает эти Identifications в качестве тегов к Content Item.
  4. Сохранение тегов: Информация о тегировании сохраняется в Tag Database и может быть передана на медиа-сайт для отображения.

Процесс В: Обработка Поискового Запроса (Реальное время)

  1. Получение запроса: Система получает поисковый запрос (ключевое слово, ID или запрос конкретного контента).
  2. Определение типа извлечения: Определяется, что нужно извлечь: контент, идентификаторы или и то, и другое.
  3. Извлечение ассоциаций (Сценарий 1: Запрос по ID): Если запрос – это Identification (ID1), система ищет в Association Store связанные Content Items и извлекает их. Она также может извлечь *другие* Identifications (ID2), связанные с этим же контентом (поиск связанных сущностей).
  4. Извлечение ассоциаций (Сценарий 2: Запрос по Контенту/Метаданным): Если запрос идентифицирует Content Item (через ключевые слова/метаданные), система находит его и извлекает все связанные с ним Identifications из Association Store.
  5. Вывод результатов: Система отправляет извлеченный контент и/или идентификаторы получателю (например, веб-сайту или API) для отображения.

Какие данные и как использует

Данные на входе

  • Контентные факторы (Метаданные): Заголовки (titles), описания (descriptions) и теги (tags) медиафайлов. Они явно указаны как основные источники данных для сопоставления с Knowledge Database.
  • Структурные данные (Knowledge Database): Узлы (Nodes), представляющие темы/сущности, и текстовые строки идентификации (Textual identification strings).
  • Пользовательские/Поведенческие факторы: Метаданные, созданные загрузчиком или зрителем контента. Также упоминается возможность использования количества просмотров (view count) как эвристики для выбора контента для автоматического тегирования.

Какие метрики используются и как они считаются

  • Методы анализа текста (NLP): Используется сопоставление (matching) строк метаданных с данными в Knowledge Database для создания ассоциаций. Конкретные алгоритмы сопоставления или пороги (matching criteria) в патенте не детализированы.
  • Условия срабатывания: Для автоматического тегирования используются заранее определенные условия (predetermined conditions) или эвристики (heuristics) для выбора целевого контента.

Выводы

  1. Центральная роль Knowledge Database для медиа: Google активно использует структурированные данные (Граф Знаний) для понимания и организации нетекстового контента, такого как видео. Это позволяет системе интерпретировать контент на семантическом уровне, а не только по ключевым словам.
  2. Метаданные как ключ к ассоциации: Основным механизмом для связывания медиаконтента с сущностями является анализ и сопоставление текстовых метаданных (заголовков, описаний, тегов) с данными в Knowledge Database. Качество и полнота этих метаданных критичны.
  3. Улучшенная обнаруживаемость (Enhanced Discovery): Связывание контента с конкретными Identifications позволяет находить его по запросам, связанным с этими сущностями, даже если точные ключевые слова отсутствуют в метаданных, но семантическая связь установлена через Association Store.
  4. Автоматизация и стандартизация тегирования: Система автоматизирует процесс тегирования, используя авторитетные данные из Knowledge Database. Это повышает точность, полноту и консистентность тегов по сравнению с ручным вводом пользователями.
  5. Извлечение семантических связей: Система спроектирована не только для поиска контента, но и для выявления связей между сущностями. Поиск по одной сущности может вернуть контент и список других релевантных сущностей, также связанных с этим контентом.

Практика

Best practices (это мы делаем)

Эти рекомендации критически важны для Video SEO (например, на YouTube).

  • Оптимизация метаданных для распознавания сущностей: Создавайте четкие, описательные заголовки и подробные описания для видео. Они должны содержать недвусмысленные упоминания ключевых сущностей (имена людей, названия организаций, мест, событий, тем), о которых идет речь в контенте.
  • Согласованность с Knowledge Graph: Используйте названия сущностей в том виде, в котором они известны в Google Knowledge Graph (или Википедии). Это облегчает системе процесс сопоставления (matching) и создания точных ассоциаций в Association Store.
  • Тематическая полнота в описаниях: В описаниях видео подробно раскрывайте контекст и упоминайте связанные сущности. Это увеличивает вероятность того, что система свяжет ваше видео с большим количеством релевантных Identifications и использует их для автоматического тегирования.
  • Использование релевантных тегов: Хотя система может автоматически генерировать теги, предоставление точных пользовательских тегов также является частью метаданных, которые могут использоваться для создания ассоциаций с Knowledge Database.

Worst practices (это делать не надо)

  • Кликбейт и неясные заголовки: Использование заголовков, которые не отражают содержание видео или не упоминают основные сущности, значительно затрудняет для системы создание корректных ассоциаций с Knowledge Database.
  • Игнорирование поля описания: Оставление описания пустым или минимальным снижает объем текстовых данных, доступных для анализа и сопоставления с сущностями, что ухудшает обнаруживаемость контента.
  • Спам нерелевантными тегами или ключевыми словами: Перечисление нерелевантных ключевых слов или тегов в попытке охватить больше запросов может привести к неверным ассоциациям или быть проигнорировано системой, фокусирующейся на точном сопоставлении с сущностями.

Стратегическое значение

Патент подтверждает важность Entity-First подхода даже для медиаконтента. Успех в Video SEO зависит не только от оптимизации под ключевые слова, но и от того, насколько хорошо контент интегрирован в семантическую сеть Google. Правильная ассоциация с сущностями обеспечивает лучшую видимость в поиске по связанным темам и, вероятно, является сильным сигналом для систем рекомендаций медиа-платформы.

Практические примеры

Сценарий: Оптимизация видеообзора технологического продукта на YouTube

  1. Задача: Убедиться, что видеообзор смартфона правильно связан с сущностями продукта и бренда.
  2. Действие: В заголовке используется точное название модели (например, "Обзор Samsung Galaxy S25 Ultra: Камера и Производительность"). В описании подробно перечисляются связанные технологии и сущности (например, "Samsung", "Android", "Snapdragon 8 Gen 4", "Dynamic AMOLED 2X"). Добавляются соответствующие теги.
  3. Результат (по патенту): Система анализирует метаданные (заголовок, описание, теги), сопоставляет "Samsung Galaxy S25 Ultra", "Snapdragon 8 Gen 4" и другие термины с соответствующими Identifications в Knowledge Database. Ассоциации сохраняются в Association Store. Видео автоматически тегируется этими сущностями и становится доступным для поиска по запросам, связанным с любой из них.

Вопросы и ответы

К каким платформам применим этот патент?

Патент описывает "media sharing web site" (сайт для обмена медиафайлами), что напрямую относится к таким платформам, как YouTube, а также к другим сервисам, хранящим видео, музыку или текст. Механизмы, описанные здесь, лежат в основе того, как эти платформы организуют контент.

Как именно система связывает видео с сущностью (Identification)?

Согласно патенту, система анализирует Metadata (метаданные) видео, такие как заголовок, описание и теги. Затем она выполняет сопоставление (matching) этих метаданных с данными в Knowledge Database. Если соответствие найдено, ассоциация сохраняется.

Что такое "Knowledge Database" в контексте этого патента?

Это структурированная база данных, использующая графовую модель, где узлы представляют темы или сущности, а связи – отношения между ними. Примерами являются Freebase (упомянутый в патенте) и современный Google Knowledge Graph.

В чем преимущество автоматического тегирования, описанного в патенте?

Автоматическое тегирование использует авторитетные идентификаторы из Knowledge Database. Это делает процесс масштабируемым, более точным и менее подверженным ошибкам или спаму по сравнению с ручным вводом тегов пользователями.

Может ли одно видео быть связано с несколькими сущностями?

Да. В патенте указано, что каждая единица контента может быть связана с одним или несколькими Identifications из базы знаний. Это позволяет точно описывать контент, затрагивающий несколько тем.

Как SEO-специалист может повлиять на процесс ассоциации видео с сущностями?

Ключевой способ влияния – это оптимизация метаданных (заголовков, описаний и тегов). Необходимо использовать четкие, недвусмысленные названия сущностей, соответствующие Knowledge Graph, и предоставлять достаточный контекст в описании, чтобы облегчить системе процесс сопоставления.

Что произойдет, если метаданные видео некачественные или отсутствуют?

Если метаданные некачественные (например, кликбейт или отсутствие описания), системе будет сложно найти соответствия в Knowledge Database. В результате видео не будет ассоциировано с релевантными сущностями, что негативно скажется на его обнаруживаемости.

Как работает поиск связанных сущностей?

Патент описывает механизм (Claim 4), где при поиске по первому идентификатору система находит связанный контент, а затем находит второй идентификатор, также связанный с этим контентом. Это позволяет пользователю узнать о дополнительных релевантных темах.

Влияет ли этот механизм на рекомендации видео?

Хотя патент напрямую не описывает систему рекомендаций, установление точных ассоциаций между видео и сущностями создает богатый набор данных. Логично предположить, что эти семантические связи используются системами рекомендаций для предложения релевантного контента по схожим темам.

Использует ли система распознавание образов или речи для создания ассоциаций?

В данном патенте не упоминается использование распознавания образов или анализа аудиодорожки. Фокус сделан исключительно на сопоставлении текстовых метаданных (заголовок, описание, теги) с базой знаний.

Похожие патенты

Как Google создает видео-нарезки (Composite Videos) на лету, используя текстовый запрос и анализ аудиодорожек
Google может анализировать аудиодорожки (транскрипты) видео для идентификации конкретных сегментов, где произносятся слова из запроса пользователя. Система автоматически объединяет эти сегменты из разных видео в одно новое сводное видео (Composite Video). Для выбора сегментов используются метрики релевантности, популярности и свежести исходного контента.
  • US9672280B2
  • 2017-06-06
  • Мультимедиа

  • Индексация

  • Семантика и интент

Как Google использует машинное обучение для анализа содержания видео и динамического выбора релевантных тамбнейлов
Google использует систему машинного обучения для связывания аудиовизуальных признаков видео (цвет, текстура, звук) с ключевыми словами. Это позволяет системе понимать содержание каждого кадра и динамически выбирать для тамбнейла (миниатюры) тот кадр, который наилучшим образом соответствует запросу пользователя или общему содержанию видео.
  • US20110047163A1
  • 2011-02-24
  • Мультимедиа

  • Индексация

  • Семантика и интент

Как Google использует визуальное сходство для связывания изображений и видео, кластеризации выдачи и обогащения метаданных
Google анализирует визуальное содержимое изображений и ключевых кадров видео для выявления сходств. Это позволяет связывать разнотипный контент, даже если у него мало текстовых данных. Система использует эти связи для переноса метаданных (например, ключевых слов или геопозиции) от одного ресурса к другому, а также для кластеризации и смешивания изображений и видео в результатах поиска.
  • US9652462B2
  • 2017-05-16
  • Мультимедиа

  • SERP

  • Семантика и интент

Как Google использует теги внутри видео, социальные связи и одобрения для генерации персонализированных рекомендаций
Google использует систему рекомендаций, анализирующую элементы (людей, объекты, места), отмеченные тегами непосредственно внутри видео. Система находит связанный контент, содержащий те же элементы. Если в видео отмечен человек, система может рекомендовать контент, который этот человек одобрил (смотрел, лайкнул), учитывая силу социальной связи между ним и зрителем, при строгом соблюдении настроек конфиденциальности.
  • US9639634B1
  • 2017-05-02
  • Персонализация

  • Мультимедиа

  • Поведенческие сигналы

Как Google использует анализ видео и аудио для построения графов зависимостей между эпизодами сериализованного контента
Google анализирует медиаконтент (например, эпизоды сериалов или обучающих курсов), чтобы автоматически понять, какие эпизоды связаны между собой. Изучая фрагменты повторов, транскрипты и визуальные элементы (включая распознавание лиц), система строит «Граф Зависимостей». Это позволяет рекомендовать пользователям необходимые для понимания предыдущие эпизоды, улучшая организацию и потребление сериализованного контента.
  • US9558407B1
  • 2017-01-31
  • Мультимедиа

  • Семантика и интент

  • Персонализация

Популярные патенты

Как Google автоматически дополняет запросы пользователя терминами из его недавней истории поиска для уточнения интента
Google использует механизм для улучшения релевантности результатов путем анализа недавней истории поиска пользователя. Если текущий запрос похож на предыдущие, система определяет ключевые контекстные термины, которые часто повторялись в истории (устойчивый интент), но отсутствуют в текущем запросе. Эти термины автоматически добавляются к запросу, чтобы предоставить более точные и персонализированные результаты.
  • US9449095B1
  • 2016-09-20
  • Семантика и интент

  • Персонализация

  • Поведенческие сигналы

Как Google использует близость цитирований (ссылок) для кластеризации результатов поиска
Google может группировать результаты поиска, анализируя, как документы ссылаются друг на друга. Система оценивает силу связи между документами, проверяя контекстуальную близость общих цитирований. Ссылки, расположенные в одном предложении (co-citation) или абзаце, имеют значительно больший вес, чем ссылки, просто присутствующие в документе. Это позволяет формировать точные тематические кластеры, отсеивая группы со слабыми связями.
  • US8612411B1
  • 2013-12-17
  • Ссылки

  • SERP

Как Google предсказывает намерения пользователя и выполняет поиск до ввода запроса (Predictive Search)
Google использует механизм для прогнозирования тем, интересующих пользователя в конкретный момент времени, основываясь на его истории и контексте. При обнаружении сигнала о намерении начать поиск (например, открытие страницы поиска), система проактивно выполняет запрос по предсказанной теме и мгновенно показывает результаты или перенаправляет пользователя на релевантный ресурс.
  • US8510285B1
  • 2013-08-13
  • Семантика и интент

  • Персонализация

  • Поведенческие сигналы

Как Google собирает и структурирует данные о поведении пользователей в Поиске по картинкам (включая ховеры, клики и 2D-позицию)
Патент Google описывает инфраструктуру для детального сбора данных в Поиске по картинкам. Система фильтрует общие логи, фиксируя не только клики, но и наведение курсора (ховеры), длительность взаимодействия и точное 2D-расположение (строка/столбец) изображения на выдаче. Эти данные агрегируются в Модель Запросов Изображений для оценки релевантности.
  • US8898150B1
  • 2014-11-25
  • Поведенческие сигналы

  • SERP

  • Мультимедиа

Как Google использует анализ аномалий в показах и кликах для выявления фейковых локальных бизнес-листингов (Map Spam)
Google анализирует статистику взаимодействий (кликов) для групп связанных бизнес-листингов (Common Business). Система вычисляет статистически нормальный уровень активности и устанавливает порог (Anomaly Detection Threshold). Резкий всплеск активности выше этого порога (например, на два стандартных отклонения) сигнализирует о наличии фейковых или спамных листингов, созданных для манипуляции локальной выдачей.
  • US20150154610A1
  • 2015-06-04
  • Local SEO

  • Антиспам

  • Поведенческие сигналы

Как Google переносит поведенческие сигналы через ссылки для повышения в ранжировании первоисточников контента
Google использует механизм для корректного учета поведенческих сигналов (например, времени пребывания). Если пользователь кликает на результат в выдаче, а затем переходит по ссылке на другую страницу, система может перенести позитивные сигналы с исходной страницы на целевую. Это позволяет повышать в рейтинге первоисточники информации, а не страницы-посредники.
  • US8959093B1
  • 2015-02-17
  • Поведенческие сигналы

  • Ссылки

  • SERP

Как Google определяет основной контент страницы, анализируя визуальную структуру и характеристики разделов
Google использует систему для идентификации основного контента веб-страницы путем её разделения на логические разделы на основе визуального макета. Система оценивает характеристики каждого раздела (соотношение ссылок к тексту, количество слов, изображения, расположение) относительно характеристик всей страницы, чтобы выделить наиболее значимый контент и отделить его от навигации и шаблонов.
  • US20140372873A1
  • 2014-12-18
  • Структура сайта

  • Техническое SEO

  • Ссылки

Как Google использует данные о поведении пользователей внутри документов (время чтения разделов, закладки) для улучшения ранжирования
Google может собирать и анализировать данные о том, как пользователи взаимодействуют с электронными документами (например, PDF, DOC, HTML). Система отслеживает, какие разделы или страницы просматриваются дольше всего или добавляются в закладки. Эта агрегированная информация используется для повышения в ранжировании документов, чьи ключевые слова находятся в наиболее используемых (и, следовательно, ценных) разделах.
  • US8005811B2
  • 2011-08-23
  • Поведенческие сигналы

  • SERP

Как Google выбирает каноническую (основную) версию документа, основываясь на авторитетности источника и полноте контента
Google использует систему для выбора канонической (основной) версии документа среди его дубликатов. Система присваивает «приоритет авторитетности» каждой версии, основываясь на источнике (например, официальный издатель) и праве публикации. Основной версией выбирается та, которая имеет высокий авторитет и является полной. При отсутствии идеального варианта выбирается версия с наибольшим объемом информации (например, самая длинная или с наибольшим PageRank).
  • US8095876B1
  • 2012-01-10
  • EEAT и качество

  • Техническое SEO

  • Ссылки

Как Google использует личные интересы пользователя для понимания неопределенных запросов и персонализации рекомендаций
Google использует механизм для интерпретации неопределенных запросов или команд (например, «Я голоден» или «Мне скучно»), когда контекст неясен. Если система не может определить конкретное намерение пользователя только из текущего контента (например, экрана приложения), она обращается к профилю интересов пользователя (User Attribute Data) и его местоположению, чтобы заполнить пробелы и предоставить персонализированные рекомендации или выполнить действие.
  • US10180965B2
  • 2019-01-15
  • Персонализация

  • Семантика и интент

  • Local SEO

seohardcore