
Патент детально описывает, как Google анализирует текстовые описания, извлекает ключевые именные группы (Noun Phrases/сущности) и превращает их в поисковые запросы. Система ранжирует результаты, используя «Proximity Score» (порядок появления в тексте) и «Query Score» (контекст пользователя), что дает критическое понимание влияния структуры текста на интерпретацию контента.
Патент решает две основные задачи. Первая (инфраструктурная) — идентификация воспроизводимого медиаконтента (например, телепрограммы) без прямого API-доступа к устройству-источнику (Set-Top Box), используя OCR для чтения экранных оверлеев. Вторая (релевантная для SEO) — автоматическое определение и приоритизация наиболее важных тем в описании медиа для генерации релевантных связанных поисковых запросов в интернете.
Запатентована система для анализа текстовых описаний и генерации приоритизированных поисковых запросов. Система использует конвейер NLP для извлечения именных групп (Noun Phrases) из текста. Результаты поиска по этим фразам оцениваются и ранжируются с использованием комбинации двух ключевых метрик: Proximity Score (оценка близости), основанной на порядке появления фразы в исходном тексте, и Query Score (оценка запроса), основанной на контексте пользователя.
Хотя часть патента посвящена извлечению текста через OCR с экрана ТВ, ключевой механизм для SEO заключается в обработке этого текста:
Descriptive Phrases).Noun Phrases), часто путем сравнения с известными сущностями.Keyword Phrases) для поиска.Proximity Score (порядок появления в исходном тексте) и Query Score (персонализация/контекст). Итоговый Relevance Score является их произведением.Средняя. Инфраструктурная часть (OCR для чтения ТВ-меню) менее актуальна в 2025 году. Однако описанный NLP-конвейер для преобразования описаний в приоритизированные запросы остается высоко актуальным. Он дает критически важное представление о том, как Google может автоматически оценивать относительную важность сущностей в тексте на основе порядка их упоминания.
Патент имеет важное значение для SEO-стратегии (7/10). Он не описывает основные алгоритмы ранжирования веб-поиска, но предоставляет конкретный blueprint того, как Google анализирует описательный текст для выявления и приоритизации ключевых концепций (именных групп/сущностей). Он явно подчеркивает важность порядка появления информации (Proximity Score) и релевантности концепций для истории пользователя (Query Score), что критически важно для архитектуры текста и Entity SEO.
Program Showing Data. Содержат основную семантическую информацию о контенте.Noun Phrases, выбранных в качестве поисковых запросов.Descriptive Phrases с помощью NLP или сопоставления с известными именами (known proper names). Являются основными семантическими единицами.Keyword Phrase на основе порядка ее появления (order of appearance) в исходном тексте.location data), истории поиска (search history) и предпочтениях пользователя (user preferences).Query Score на соответствующий Proximity Score.Патент содержит много утверждений, связанных с аппаратной интеграцией (OCR). Ниже приведен анализ Claims, наиболее релевантных для NLP и SEO.
Claim 1 (Независимый пункт): Описывает общую систему идентификации и поиска контента.
Ядром является автоматизированный процесс генерации релевантных поисковых запросов на основе анализа контекстного текста.
Claim 11 (Зависимый от 1): Детализирует процесс генерации поисковых терминов.
Noun Phrases) в извлеченном тексте.Это подтверждает, что именные группы (сущности) являются основными семантическими единицами для генерации запросов.
Claim 12 и 13 (Зависимые от 11): Детализируют процесс идентификации именных групп.
Процесс включает удаление Program Showing Data для получения Descriptive Phrases. Затем Noun Phrases идентифицируются путем удаления глаголов (Claim 12) или путем сравнения сегментов текста с известными названиями шоу, фильмов, спортивных событий и именами собственными (Claim 13).
Claim 17 (Зависимый от 16): Детализирует механизм оценки (Scoring) результатов поиска. Это ключевое утверждение для SEO.
Query Score (на основе местоположения, истории поиска и предпочтений пользователя).Proximity Score каждой именной группе (поисковому термину) на основе порядка ее появления в извлеченном тексте.Query Score на соответствующий Proximity Score для получения Relevance Score.Эта формула определяет логику ранжирования связанного контента, явно используя структуру исходного текста (порядок появления) и персонализацию/контекст.
Хотя изобретение описано в контексте клиентского устройства (Smart TV), описанные принципы NLP и ранжирования имеют более широкое применение в архитектуре поиска.
INDEXING – Индексирование и извлечение признаков
Описанные NLP-техники (идентификация и приоритизация именных групп на основе порядка появления) напрямую связаны с тем, как поисковые системы анализируют контент во время индексации для понимания основных тем документа и относительной важности упомянутых сущностей.
QUNDERSTANDING – Понимание Запросов
Патент напрямую описывает методы Генерации Запросов (Query Generation). Система берет блок текста и преобразует его в набор приоритизированных поисковых запросов (Keyword Phrases), используя NLP для извлечения сущностей.
RANKING / RERANKING – Ранжирование
Патент описывает конкретный алгоритм ранжирования для найденного контента. Механизм оценки (Relevance Score = Query Score * Proximity Score) демонстрирует принципы, которые Google использует для определения релевантности: важность порядка упоминания в источнике и важность персонализации.
Входные данные:
known proper names).Search Heuristics) с сервера.Выходные данные:
Keyword Phrases).Relevance Scores.Proximity Score).Query Score) при определении финальной релевантности.В контексте патента алгоритм применяется для автоматического поиска связанного контента для медиапрограммы.
В более широком контексте SEO эти принципы NLP применяются всякий раз, когда Google необходимо понять темы и их приоритет в блоке текста, например, при индексации, для генерации связанных поисков (Related Searches) или определения основной тематики страницы.
Детальный алгоритм анализа текста и ранжирования результатов (на основе FIG. 10):
Descriptive Phrases). Для этого из текста удаляются Данные о показе программы (Program Showing Data) — время, дата, канал, шаблонные данные.Descriptive Phrases идентифицируются Именные Группы (Noun Phrases). Используется NLP и сравнение с известными сущностями.Noun Phrases выбирается в качестве Ключевых Фраз (Keyword Phrases) для поиска.Keyword Phrases уточняются (исправление ошибок, сверка с известными именами или эвристиками).Keyword Phrases.Query Score. Эта оценка учитывает контекст пользователя (местоположение, историю, предпочтения).Keyword Phrase присваивается Proximity Score на основе порядка ее появления в исходном тексте.Query Scores умножаются на Proximity Scores для получения итоговой Оценки Релевантности (Relevance Score).Relevance Scores и представляются пользователю.Proximity Score.location data), история поиска (search history) и предпочтения пользователя (user preferences) используются для расчета Query Score.known proper names, названия шоу, фильмов) используются для идентификации и уточнения Noun Phrases.Search Heuristics), предоставленные сервером.order of appearance) ключевой фразы в исходном тексте. Фразы, появившиеся раньше, получают более высокий балл.Noun Phrases являются основными семантическими единицами, которые Google извлекает из текста для понимания его сути и генерации связанных запросов. Это фундамент Entity SEO.Proximity Score. Концепции, упомянутые ранее в тексте, считаются более приоритетными.Descriptive Phrases).Query Score.Relevance Score) является произведением контекстуальной релевантности (Query Score) и текстуальной значимости (Proximity Score). Обе составляющие должны быть высокими для достижения топа.Proximity Score явно использует порядок появления как сигнал важности.Noun Phrases). Убедитесь, что система может легко идентифицировать их и сопоставить с Графом Знаний.Descriptive Phrases. Оптимизируйте описания (Descriptions/Snippets), делая их краткими и емкими, чтобы системы автоматического анализа могли эффективно их обработать.Program Showing Data) и снизить плотность полезных описательных фраз.Proximity Score для этих концепций при автоматическом анализе.Query Score показывает, что эти факторы критичны для финального ранжирования.Патент подтверждает стратегическую зависимость Google от NLP и извлечения сущностей для понимания тематики контента. Он предоставляет редкое явное упоминание того, как текстуальная структура (порядок появления) преобразуется в количественную оценку (Proximity Score), используемую при ранжировании. Это подчеркивает, что для Senior SEO-специалистов архитектура информации на странице является не просто вопросом UX, а прямым фактором, влияющим на интерпретацию контента поисковой системой.
Сценарий: Анализ описания и генерация запросов (на основе примера из патента)
Пример текста из EPG (Electronic Program Guide), упомянутый в патенте: "The Price Is Right 10:00 AM-11:00 AM TV-G Contestants bid for prizes then compete for fabulous showcases."
Процесс анализа:
Proximity Score (при прочих равных Query Score).Что такое Proximity Score и почему он важен для SEO?
Proximity Score — это метрика, основанная на порядке появления (order of appearance) ключевой фразы в исходном тексте. Согласно патенту, она используется для определения важности этой фразы. Для SEO это означает, что концепции и сущности, упомянутые раньше в тексте, считаются более приоритетными. Это подчеркивает важность использования структуры «Перевернутой пирамиды» в контенте.
Как рассчитывается итоговая оценка Relevance Score?
Relevance Score рассчитывается путем умножения двух метрик: Query Score и Proximity Score. Query Score отражает релевантность результата контексту пользователя (история, местоположение), а Proximity Score отражает важность термина в исходном тексте (порядок появления). Для высокого ранжирования необходимы высокие значения обеих метрик.
Что патент говорит об использовании Noun Phrases (Именных групп)?
Патент определяет Noun Phrases как основные семантические единицы, извлекаемые из текста. Именно они становятся кандидатами для генерации поисковых запросов (Keyword Phrases). Это подтверждает стратегию SEO, ориентированную на сущности (Entities) и четкое описание концепций, а не просто на отдельные ключевые слова.
Влияет ли этот патент на основное ранжирование в Google Поиске?
Патент описывает ранжирование связанного контента в контексте интерактивного ТВ, а не основное ранжирование веб-страниц. Однако используемые принципы (важность порядка упоминания Proximity Score, извлечение Noun Phrases) являются фундаментальными для NLP и, вероятно, применяются Google в различных системах для понимания контента и его релевантности.
Что такое Program Showing Data и Descriptive Phrases?
Program Showing Data — это метаданные, не связанные с содержанием (время, дата, канал, шаблонный текст). Система удаляет их, чтобы получить Descriptive Phrases — чистый описательный текст, который затем анализируется с помощью NLP. Для SEO это означает, что система стремится отделить основное содержание от навигационных или шаблонных элементов.
Как система определяет Noun Phrases?
Патент упоминает несколько методов. Один включает удаление глаголов из Descriptive Phrases. Другой, более важный метод (Claim 13), заключается в сравнении сегментов текста с известными именами собственными (названиями шоу, фильмов, именами людей). Это указывает на использование комбинации лингвистического анализа и данных из Графа Знаний (Knowledge Graph).
Что такое Query Score и как на него повлиять?
Query Score основан на местоположении пользователя, истории поиска и его предпочтениях. Это показатель персонализации. Напрямую повлиять на него сложно, но создание контента, который широко релевантен для целевой аудитории и соответствует ее типичным интересам и интентам, может косвенно улучшить этот показатель.
Какова роль OCR и захвата экрана в этом патенте?
OCR и захват экрана являются инфраструктурной частью патента, решающей проблему получения данных от закрытых систем (Set-Top Boxes) в контексте ТВ. Для веб-SEO эта часть не имеет прямого значения. Ценность патента для SEO заключается в том, как система обрабатывает текст *после* его получения.
Как использовать информацию о Proximity Score при написании статей?
Необходимо размещать ключевые выводы, основные сущности и ответы на главные вопросы пользователя как можно ближе к началу текста. Введение и первый абзац должны четко определять основную тему и самые важные связанные концепции, чтобы максимизировать их Proximity Score.
Каков главный вывод для SEO-стратегии из этого патента?
Главный вывод — необходимость фокуса на сущностях (именных фразах) и структуре контента. Важно не только то, какие сущности упомянуты, но и то, где они расположены в тексте. Контент, оптимизированный с учетом Proximity Score (важное в начале), будет интерпретироваться как более авторитетный по этим темам.

Мультимедиа
Семантика и интент
Персонализация

Семантика и интент
Мультимедиа
Персонализация

Антиспам
Семантика и интент
Мультимедиа

Семантика и интент
Мультимедиа
Персонализация

Семантика и интент
Knowledge Graph

Поведенческие сигналы
Персонализация
Local SEO

Персонализация
Поведенческие сигналы
Семантика и интент

Local SEO
SERP
Ссылки

Ссылки
Поведенческие сигналы
SERP

EEAT и качество
Семантика и интент

Ссылки
Структура сайта
Семантика и интент

Персонализация
Семантика и интент
Поведенческие сигналы

SERP
Семантика и интент
Поведенческие сигналы

Мультиязычность
Поведенческие сигналы
SERP

Поведенческие сигналы
Семантика и интент
Структура сайта
