SEO HARDCORE
  • Разборы патентов
    • Патенты Google
  • Скоро SEO инструменты
  • Скоро SEO аналитика
  • seohardcore
SEO HARDCORE
назад

Как Google планирует заменить статические веб-сайты страницами, генерируемыми ИИ на лету из «сырого» контента

GENERATIVE NAVIGATIONAL CORPUS (Генеративный навигационный корпус)
  • US20250094521A1
  • Google LLC
  • 2024-09-18
  • 2025-03-20
  • Семантика и интент
  • Персонализация
  • Индексация
  • Структура сайта
  • Описание
  • Разбор
  • Выводы
  • Практика
  • FAQ
  • Похожие

Патент описывает радикально новую архитектуру веба («Generative Navigational Corpus»), где контент-провайдеры предоставляют «сырые» данные (Seed Content), а Большая Фундаментальная Модель (LFM) генерирует веб-страницы, UI и ссылки в реальном времени, адаптируя формат и структуру под конкретный интент пользователя и контекст навигации.

Описание

Какую проблему решает

Патент решает проблему ограничений «статически генерируемого веб-корпуса» (statically generated web corpus), где структура, контент и презентация веб-страниц предопределены заранее. Существующие подходы не используют в полной мере возможности больших генеративных моделей (Large Foundational Models). Изобретение направлено на создание полностью динамического, кастомизированного опыта браузинга, где макет, контент и ссылки генерируются на лету (on-the-fly) в момент запроса.

Что запатентовано

Запатентована система («Generative Navigation System») для создания динамического веб-корпуса. Вместо индексирования готовых веб-страниц система индексирует «сырую» информацию (Seed Content), предоставленную создателями контента. Large Foundational Model (LFM) генерирует всю веб-страницу (UI, структуру контента, медиа, ссылки) по запросу (on-demand), основываясь на интенте пользователя, контексте навигации и извлеченном Seed Content.

Как это работает

Система функционирует как новая инфраструктура для потребления контента:

  • Получение Интента: Пользователь инициирует навигационный запрос (Navigational Request) через явный запрос или навигацию (включая переходы на несуществующие URL).
  • Извлечение Контента: Система выполняет поиск и извлечение релевантного Seed Content из корпуса сырых данных.
  • Навигационное Моделирование: Navigational Graph Model (обученная на траекториях пользователей) предсказывает вероятные следующие шаги пользователя.
  • Генерация Страницы: LFM синтезирует все компоненты: берет Seed Content, интент, навигационные предсказания и генерирует полную веб-страницу, адаптируя формат (текст, изображение, комикс) под пользователя и устройство в реальном времени.

Актуальность для SEO

Высокая (Концептуально). Патент описывает логическое развитие систем генеративного поиска (таких как SGE/AI Overviews) в полноценную генеративную среду браузинга. Это полностью соответствует стратегии Google по интеграции ИИ в основу своих продуктов. Хотя реализация такой системы в качестве полной замены традиционного веба является спекулятивной и долгосрочной перспективой, описанные концепции крайне актуальны для понимания будущего поиска и потребления контента.

Важность для SEO

Критическое влияние (10/10). Этот патент описывает смену парадигмы: отход от традиционного SEO (оптимизации страниц для сканирования и индексирования) к оптимизации сырого контента (seeds) для извлечения генеративной системой. Если эта система будет реализована, она фундаментально изменит взаимодействие контент-провайдеров с платформами поиска, смещая фокус с технического SEO и дизайна на качество, уникальность и доступность исходной информации (Seed Content).

Детальный разбор

Термины и определения

Generative Navigational Corpus (Генеративный навигационный корпус)
Новая структура веба, где контент, UI и ссылки генерируются динамически по мере навигации пользователя, а не извлекаются из статического корпуса.
Large Foundational Model (LFM) (Большая Фундаментальная Модель)
Ядро системы (включает LLM, LVM и др.), которое генерирует веб-страницы целиком или их отдельные блоки (текст, медиа, ссылки, макет) на основе интента и Seed Content.
Seed Content (Исходный/«Сырой» контент)
Необработанный контент (факты, мнения, медиафайлы), предоставляемый создателями. Не имеет законченной формы (например, статьи или веб-страницы).
Seed Content Corpus (Корпус исходного контента)
База данных, хранящая и индексирующая Seed Content.
Navigational Graph Model (Модель навигационного графа)
Модель, обученная на динамике навигации пользователей (Navigational Traces). Используется для предсказания следующих шагов пользователя и генерации релевантных ссылок.
Navigational Trace (Навигационный след)
Запись сессии пользователя; направленный граф, показывающий путь пользователя между ресурсами (узлами).
On-demand web page (Веб-страница по запросу)
Страница, сгенерированная LFM в реальном времени в ответ на Navigational Request.
Intent (Интент)
Цель пользователя. Может быть явным (Provided Query) или подразумеваемым (Inferred Query), выведенным из контекста навигации или URL.
Non-existent domain (Несуществующий домен)
URL, который не может быть разрешен службой DNS. Система использует его для вывода интента и генерации страницы вместо возврата ошибки.
Content Criteria Tags (Теги критериев контента)
Теги, используемые создателями для контроля того, *где* и *когда* может использоваться их Seed Content (например, ограничения по домену, вертикали, географии).
Content Generation Tags (Теги генерации контента)
Теги, используемые создателями для контроля того, *как* будет представлен их Seed Content (например, тон, стиль, макет, предпочтительные медиа).

Ключевые утверждения (Анализ Claims)

Примечание: US20250094521A1 — это заявка на патент (Patent Application). Claims могут измениться в процессе рассмотрения.

Claim 1 (Независимый пункт): Описывает основной процесс работы системы.

  1. Система получает навигационный запрос (navigation request), связанный с интентом (intent), от клиентского устройства.
  2. Определяется исходный контент (seed content), связанный с этим запросом.
  3. Используется Large Foundational Model для генерации веб-страницы на основе seed content, навигационной модели (navigation model) и интента.
  4. Сгенерированная веб-страница предоставляется клиентскому устройству.

Claim 3 и 4 (Зависимые): Детализируют процесс динамической навигации.

LFM генерирует не только контент страницы, но и ссылки, представленные заголовками и сниппетами (Claim 3). Когда пользователь выбирает сгенерированную ссылку, система определяет новый seed content, связанный с ней, и генерирует вторую веб-страницу, используя подразумеваемый запрос (inferred query), основанный на выбранной ссылке (Claim 4). Это создает непрерывный генеративный опыт навигации.

Claim 5 (Зависимый): Описывает механизм контроля доступа к контенту.

Seed content включает теги. Процесс определения контента включает проверку того, разрешает ли тег использование данного seed content для текущего навигационного запроса.

Claim 6 и 7 (Зависимые): Описывают персонализацию формата и структуры.

Система может генерировать разные веб-страницы (с разной структурой) из одного и того же seed content для разных пользователей, основываясь на их характеристиках (Claim 6). Генерация учитывает seed content, навигационную модель, интент и характеристики пользователя (Claim 7).

Claim 8 (Зависимый): Вводит концепцию генерации для несуществующих доменов.

Навигационный запрос может быть связан с non-existent domain (доменом, не существующим в DNS). Система все равно обработает запрос и сгенерирует страницу.

Claim 16 (Независимый пункт): Описывает процесс управления исходным контентом.

  1. Получение seed content.
  2. Ассоциирование с ним тегов (content generation tag или content criteria tag).
  3. Индексирование seed content.
  4. Использование seed content для генерации веб-страницы по запросу, основанному на навигационном запросе, связанном с non-existent domain.
  5. Предоставление веб-страницы.

Где и как применяется

Этот патент описывает не модификацию существующей архитектуры поиска Google, а предлагает новую, самодостаточную архитектуру для генеративного браузинга. Она заменяет или дополняет традиционные этапы поиска.

CRAWLING и INDEXING (Новая интерпретация)
Традиционное сканирование и индексирование готовых страниц заменяется приемом, обработкой и индексированием Seed Content. Создатели загружают сырой контент и теги в Seed Content Corpus. Индексирование, вероятно, включает создание векторных представлений (embeddings) для обеспечения быстрого поиска в латентном пространстве.

QUNDERSTANDING – Понимание Запросов
Критически важный этап. Система должна точно определять Intent пользователя на основе разнообразных сигналов: явных запросов, контекста текущей навигации (Navigational Trace) или даже попыток перехода на Non-existent domains.

RANKING (Retrieval/Извлечение)
Вместо ранжирования документов система выполняет этап «ранжирования и извлечения» (rank-and-retrieve) для идентификации наиболее релевантного Seed Content. Патент предполагает использование механизма релевантности, который отображает подразумеваемый запрос и seeds в общее латентное пространство и вычисляет расстояние (например, метод ближайших соседей — Neural Matching).

GENERATION (Новый этап, заменяющий традиционный Rendering/SERP formation)
Это основной этап работы системы. LFM принимает извлеченные seeds, интент и предсказания от Navigational Graph Model. Затем модель генерирует весь презентационный слой: макет страницы, текст, медиа и ссылки для дальнейшей навигации.

Входные данные:

  • Навигационный запрос (URL или запрос).
  • Интент (выведенный или явный).
  • Контекст устройства (тип, размер экрана).
  • Данные пользователя (предпочтения, характеристики – с разрешения).
  • Seed Content Corpus и Navigational Graph Model.

Выходные данные:

  • Полностью сгенерированная веб-страница (On-demand web page), включающая контент, UI и ссылки.

На что влияет

Патент описывает универсальную инфраструктуру, которая потенциально влияет на все типы контента, запросов и ниш. Это не специфический алгоритм ранжирования, а новый способ организации и доставки информации в вебе.

Когда применяется

  • Условия применения: Алгоритм применяется всякий раз, когда пользователь взаимодействует с этой Generative Navigation System.
  • Триггеры активации:
    • Явный запрос пользователя в этой системе.
    • Навигация на реальный домен, который поддерживается этой системой (URL маппится на Seed Content, а не на статический файл).
    • Навигация на Non-existent domain (система перехватывает запрос вместо ошибки DNS).
    • Выбор сгенерированной ссылки в рамках текущей генеративной сессии.

Пошаговый алгоритм

Процесс А: Обработка навигационного запроса

  1. Получение запроса и интента: Система получает навигационный запрос. Определяется связанный с ним интент и, опционально, домен (реальный или несуществующий).
  2. Определение исходного контента: Система ищет релевантный Seed Content в корпусе. Поиск учитывает интент, домен и проверяет Content Criteria Tags на допустимость использования контента. Также учитываются характеристики пользователя (с разрешения).
  3. Генерация веб-страницы (LFM): LFM генерирует веб-страницу. Входные данные для LFM включают:
    • Извлеченный Seed Content.
    • Интент и контекст навигации.
    • Content Generation Tags (инструкции по стилю/формату).
    • Характеристики пользователя и устройства.
  4. Определение следующих интентов и генерация ссылок: В рамках генерации страницы система использует Navigational Graph Model для предсказания следующих возможных интентов пользователя. LFM генерирует ссылки (включая заголовки и сниппеты) для этих интентов и встраивает их в веб-страницу.
  5. Предоставление страницы и ожидание взаимодействия: Сгенерированная страница отправляется пользователю.
  6. Обработка выбора ссылки: Если пользователь выбирает ссылку, система определяет, является ли она существующим статическим URL.
    • Если ДА (и система настроена на выход из генеративного режима): Происходит навигация на статический URL.
    • Если НЕТ (или ссылка является генеративной): Ссылка интерпретируется как новый интент, и процесс возвращается к Шагу 1, сохраняя контекст навигационного следа.

Процесс Б: Предоставление и индексация контента

  1. Предоставление интерфейса: Система предоставляет интерфейс для создателей контента.
  2. Получение контента: Создатель загружает Seed Content (сырой текст, медиа).
  3. Ассоциация тегов: Создатель добавляет Content Criteria Tags (где использовать) и Content Generation Tags (как использовать). Система также может добавлять теги автоматически (например, на основе профиля создателя или домена).
  4. Индексация: Система индексирует Seed Content на основе его содержимого и тегов, вероятно, создавая векторные представления для поиска в латентном пространстве.
  5. Отслеживание использования: Система отслеживает, как часто и в каком контексте Seed Content используется для генерации страниц, для атрибуции и вознаграждения.

Какие данные и как использует

Данные на входе

Система использует несколько ключевых типов данных:

  • Контентные факторы (Seed Content): Сырые данные. Текст (без форматирования, параграфов или заголовков), медиа (изображения, аудио, видео), факты, мнения, описания продуктов/услуг.
  • Структурные факторы (Tags):
    • Content Criteria Tags: Ограничения и разрешения на использование (домены, вертикали, география, чувствительность).
    • Content Generation Tags: Предпочтения по стилю, тону, макету, формату (статья vs комикс), инструкции по группировке с другим контентом.
  • Пользовательские факторы (с разрешения): Характеристики пользователя (например, обобщенный уровень образования, интересы), предпочтения по типу контента (длинный, короткий, визуальный), тип устройства, географическое положение.
  • Поведенческие факторы (Navigational Traces): Исторические данные о том, как пользователи перемещаются между контентом. Используются для обучения Navigational Graph Model.

Какие метрики используются и как они считаются

Патент не приводит конкретных формул, но описывает ключевые механизмы оценки:

  • Relevancy Mechanism (Механизм релевантности): Используется для извлечения Seed Content. Описан как процесс отображения запроса (интента) и seeds в латентное пространство и вычисления функции расстояния (distance function) с использованием системы ближайших соседей (nearest-neighbor system). Это стандартный подход Neural Matching.
  • Grounding (Проверка достоверности): Система использует наиболее релевантный Seed Content для проверки сгенерированной страницы на наличие галлюцинаций или контента, противоречащего исходным данным.
  • Navigational Prediction (Навигационное предсказание): Выходные данные Navigational Graph Model, предсказывающие вероятность перехода к следующему узлу (интенту) на основе текущего узла, пользователя и запроса.
  • Influence Weights (Веса влияния): Упоминаются в контексте вознаграждения создателей. Система, вероятно, рассчитывает веса, показывающие, насколько каждый использованный seed повлиял на финальный сгенерированный контент.

Выводы

  1. Видение полностью динамического веба, генерируемого ИИ: Патент предлагает радикальный отход от статического веба. В этой модели не существует заранее созданных веб-страниц; весь опыт (контент, дизайн, навигация) генерируется LFM в реальном времени.
  2. Сдвиг от оптимизации страниц к оптимизации «сырой» информации: Ключевой единицей контента становится Seed Content (сырые факты, данные, мнения), а не готовая страница. Успех зависит от качества этой информации и её релевантности интенту пользователя.
  3. Автоматизация и персонализация презентационного слоя: LFM берет на себя роль дизайнера, UX-специалиста и редактора, автоматически выбирая наилучший формат (статья, видео, комикс) и структуру в зависимости от контекста пользователя, устройства и интента.
  4. Критическая роль понимания интента и навигационного моделирования: Система сильно зависит от способности точно интерпретировать Intent и предсказывать поведение пользователя с помощью Navigational Graph Model для генерации релевантных следующих шагов.
  5. Встроенные механизмы контроля и монетизации для создателей: Патент предусматривает инструменты для создателей контента: Tags для контроля над распространением и стилем, а также систему вознаграждения, основанную на использовании Seed Content (Influence Weights).
  6. «Несуществующие домены» как точки входа: Интересная концепция использования ошибок DNS (Non-existent domains) как сигналов интента для генерации контента, превращая тупики в новые возможности для навигации.

Практика

Стратегическое значение

Этот патент представляет собой потенциальный финальный этап перехода к генеративному поиску. Он подтверждает, что Google видит будущее, в котором ИИ не просто отвечает на вопросы (как SGE), но и активно строит всю среду потребления контента. Для SEO-специалистов это означает необходимость эволюции от оптимизаторов веб-сайтов к стратегам по управлению информацией и знаниями (Generative Engine Optimization). Экспертиза, уникальные данные и способность предоставлять их в формате, удобном для использования ИИ-системами, станут главными факторами успеха.

Best practices (это мы делаем)

Хотя эта система является концептуальной, SEO-специалисты должны подготовиться к подобному сдвигу парадигмы:

  • Фокус на создании уникальных данных и экспертизе (E-E-A-T на уровне данных): Необходимо сосредоточиться на создании высококачественного, уникального и экспертного Seed Content. Поскольку LFM отвечает за презентацию, конкурентное преимущество будет у владельцев самой ценной исходной информации.
  • Обеспечение фактической точности (Grounding): Seed Content используется системой для проверки достоверности (grounding). Предоставление точных, проверяемых фактов критически важно для того, чтобы контент был использован и не классифицирован как галлюцинация.
  • Структурирование информации и Knowledge Graph: Представляйте информацию в чистом, структурированном виде. Активно работайте над представлением вашего бренда и контента как сущностей в Knowledge Graph. Сущности и их атрибуты являются идеальным Seed Content.
  • Стратегическое использование тегов: Если система будет реализована, понимание и использование Content Criteria Tags (для контроля дистрибуции) и Content Generation Tags (для влияния на стиль и формат) станет ключевым навыком, заменяющим традиционную оптимизацию мета-тегов.
  • Понимание векторного поиска (Neural Matching): Поскольку извлечение Seed Content основано на поиске в латентном пространстве, необходимо понимать, как создавать контент, который семантически близок к интенту пользователя, а не просто содержит ключевые слова.

Worst practices (это делать не надо)

  • Применение традиционных SEO-тактик к Seed Content: Перенасыщение ключевыми словами, создание контента низкого качества или дублирование информации будет неэффективным, так как система оценивает семантическую ценность и достоверность сырых данных.
  • Фокус на дизайне и техническом SEO сайта: В этой парадигме провайдеры контента не создают сайты. Тратить ресурсы на оптимизацию скорости загрузки, UX или crawl budget бессмысленно, так как LFM генерирует все это на лету.
  • Создание поверхностного контента и рерайтинг: Контент, не содержащий уникальной ценности или фактов, не будет иметь ценности как Seed Content.
  • Игнорирование контроля через теги: Неиспользование Tags приведет к тому, что LFM будет иметь полный контроль над тем, где и как используется контент, что может не соответствовать целям бренда.

Практические примеры

Сценарий 1: Эксперт по путешествиям предоставляет Seed Content

  1. Действие: Эксперт по походам загружает Seed Content: набор сырых данных о конкретном маршруте (координаты, сложность, ключевые точки, опасности, личные наблюдения, фотографии).
  2. Теги: Он использует Content Criteria Tags для вертикали "Путешествия" и географии "Скалистые горы". Использует Content Generation Tags, указывая предпочтение формальному тону и формату статьи.
  3. Запрос пользователя: Пользователь переходит на besthikesinrockies.com (Non-existent domain). Система перехватывает запрос и выводит интент.
  4. Генерация: LFM извлекает Seed Content эксперта. Для пользователя А (опытный походник) она генерирует детальную статью с картами и техническими данными. Для пользователя Б (семья с детьми) она генерирует визуальный гид с акцентом на безопасность и легкие участки, используя тот же Seed Content.

Сценарий 2: Новостное агентство и динамическая главная страница

  1. Действие: Журналисты новостного агентства (например, "The Herald") постоянно загружают Seed Content о текущих событиях (факты, цитаты, видеофрагменты), ассоциируя их с доменом theherald.com.
  2. Запрос пользователя: Пользователь заходит на theherald.com.
  3. Генерация: Вместо статической главной страницы LFM генерирует персонализированный набор заголовков и сниппетов на основе доступного Seed Content и интересов пользователя.
  4. Навигация: Пользователь кликает на сгенерированный заголовок. LFM генерирует полную статью на лету. По мере прокрутки LFM продолжает генерировать текст и предлагает ссылки на связанные темы, используя Navigational Graph Model.

Вопросы и ответы

Что такое «Seed Content» (Исходный контент) и чем он отличается от обычной веб-страницы?

Seed Content — это сырая, неструктурированная информация: факты, данные, мнения экспертов, медиафайлы. В отличие от веб-страницы, он не имеет законченной формы, дизайна, макета или структуры (например, заголовков и параграфов). В этой системе создатели предоставляют только Seed Content, а LFM генерирует из него готовую веб-страницу в момент запроса.

Что произойдет с техническим SEO и дизайном сайтов в этой новой модели?

В рамках Generative Navigational Corpus традиционное техническое SEO (оптимизация скорости, crawl budget, разметка) и дизайн сайтов становятся нерелевантными. Создателям контента не нужно поддерживать веб-сайт. LFM берет на себя ответственность за генерацию макета, UX и обеспечение быстрой доставки контента, адаптируя его под устройство пользователя.

Как ранжируется «Seed Content»?

Патент описывает «механизм релевантности» для извлечения Seed Content. Он работает путем отображения интента пользователя и Seed Content в общее латентное (векторное) пространство и вычисления расстояния между ними (метод ближайших соседей, Neural Matching). Это означает, что ранжирование основано на глубоком семантическом соответствии, а не на традиционных факторах вроде ссылок или ключевых слов.

Как создатели контента могут контролировать внешний вид своих материалов?

Создатели используют Content Generation Tags. Эти теги позволяют указать предпочтения относительно тона (формальный/неформальный), стиля, макета, предпочтительного формата (статья, комикс, видео) и даже инструкции по группировке контента. LFM учитывает эти теги при генерации финальной страницы.

Как создатели могут контролировать, где используется их контент?

Для этого используются Content Criteria Tags. Они позволяют установить ограничения или разрешения на использование Seed Content в определенных доменах, вертикалях (тематиках), географических регионах или для определенных типов запросов. Система проверяет эти теги перед использованием контента.

Что такое «Navigational Graph Model» и как она влияет на видимость контента?

Это модель, которая изучает, как пользователи обычно перемещаются между темами и страницами. Она предсказывает наиболее вероятные следующие шаги пользователя. LFM использует эти предсказания для генерации релевантных ссылок на текущей странице, делая навигацию интуитивной. Если ваш Seed Content часто является частью успешных навигационных путей, он с большей вероятностью будет предложен пользователям.

Что означает концепция «Non-existent domain» для SEO?

Non-existent domain — это URL, который не существует в DNS. В этой системе попытка перехода на такой URL не вызывает ошибку, а интерпретируется как интент пользователя. Система генерирует страницу на основе этого интента. Это открывает новые возможности для захвата трафика по интентам, которые ранее не были связаны с конкретными доменами.

Как обеспечивается достоверность контента, если все генерируется ИИ?

Патент подчеркивает использование механизма Grounding. Сгенерированный контент сверяется с извлеченным Seed Content для предотвращения галлюцинаций и противоречий. Это означает, что качество и фактическая точность предоставляемого вами Seed Content имеют решающее значение.

Как эта система связана с Google SGE (Search Generative Experience / AI Overviews)?

SGE — это интеграция генеративных ответов в традиционную поисковую выдачу. Generative Navigational Corpus — это гораздо более радикальный шаг: это полная замена традиционного браузинга на генеративную среду. SGE можно рассматривать как промежуточный этап, который использует похожие технологии (LFM, Grounding), но в рамках существующей инфраструктуры веба.

Предусмотрена ли монетизация для создателей контента в этой системе?

Да, патент явно упоминает атрибуцию и вознаграждение (remuneration) создателей Seed Content. Предлагается система, основанная на частоте использования контента, взаимодействии с ним или на расчете «весов влияния» (Influence Weights), которые показывают вклад каждого seed в сгенерированную страницу.

Похожие патенты

Как Google использует архитектуру «Generative Companion» для ведения диалогового поиска с сохранением контекста и выбора специализированных LLM (SGE)
Google патентует архитектуру диалогового поиска («Generative Companion»), которая поддерживает состояние пользователя (контекст, историю запросов и взаимодействий) на протяжении всей сессии. Система использует начальную LLM для генерации «синтетических запросов», классифицирует намерение пользователя на основе текущего состояния и динамически выбирает специализированные «Downstream LLM» (для суммаризации, креатива или уточнения) для формирования финального генеративного ответа.
  • US20240289407A1
  • 2024-08-29
  • Персонализация

  • Семантика и интент

Как Google использует "стену видео" с низкой частотой кадров для быстрого предпросмотра и обнаружения свежего контента
Google использует интерфейс "стена видео", отображающий множество роликов одновременно в виде версий с низкой частотой кадров (например, 1 кадр в секунду). Это позволяет пользователям быстро оценить содержание видео без когнитивной перегрузки. Система также может отображать и кластеризовать видео, которые загружаются в реальном времени, улучшая обнаружение свежего контента и событий.
  • US8935725B1
  • 2015-01-13
  • Мультимедиа

  • Свежесть контента

Как Google использует LLM для генерации поисковых сводок (SGE), основываясь на контенте веб-сайтов, и итеративно уточняет ответы
Google использует Большие Языковые Модели (LLM) для создания сводок (AI-ответов) в результатах поиска. Для повышения точности и актуальности система подает в LLM не только запрос, но и контент из топовых результатов поиска (SRDs). Патент описывает, как система выбирает источники, генерирует сводку, проверяет факты, добавляет ссылки на источники (linkifying) и аннотации уверенности. Кроме того, система может динамически переписывать сводку, если пользователь взаимодействует с одним из источников.
  • US11769017B1
  • 2023-09-26
  • EEAT и качество

  • Ссылки

  • SERP

Как Google автоматически конвертирует текстовые объявления в графические, используя изображения с целевых страниц
Google использует систему для автоматического преобразования текстовых рекламных объявлений в визуально привлекательные графические блоки. Система анализирует целевую страницу (landing page) текстового объявления, извлекает или генерирует из нее изображение и объединяет его с текстом объявления. Эти новые графические блоки затем отображаются в виде матрицы (сетки) на сайтах паблишеров.
  • US9779065B1
  • 2017-10-03
  • Мультимедиа

Как Google классифицирует веб-страницы и персонализирует выдачу, используя историю запросов и поведенческие данные
Google использует итеративный метод для тематической классификации веб-страниц, не анализируя их контент напрямую. Система анализирует исторические логи запросов и данные о кликах. Классификация известных страниц переносится на запросы, в результатах которых они появляются, а затем классификация этих запросов переносится на новые страницы. Эти данные используются для построения профилей пользователей и персонализации поисковой выдачи.
  • US8185544B2
  • 2012-05-22
  • Персонализация

  • Поведенческие сигналы

  • SERP

Популярные патенты

Как Google использует "ложные пропуски" (Fake Skips) для точной оценки качества своих правил синонимов
Google анализирует поведение пользователей для оценки качества синонимов, используемых при переписывании запросов. Патент вводит метрику "Fake Skip" (Ложный пропуск). Она фиксируется, если пользователь пропустил результат с синонимом, но кликнул на результат ниже, который также содержит этот синоним и исходный термин. Это позволяет точнее калибровать систему синонимов и не пессимизировать хорошие правила из-за неоднозначного поведения пользователей.
  • US8909627B1
  • 2014-12-09
  • Поведенческие сигналы

  • Семантика и интент

  • SERP

Как Google использует контекст внешних страниц для понимания и идентификации видео и аудио контента
Google анализирует внешние веб-страницы, которые ссылаются на медиафайлы или встраивают их (например, видео YouTube). Система извлекает метаданные из контекста этих страниц — заголовков, окружающего текста, URL. Надежность данных проверяется частотой их повторения на разных сайтах. Эта информация используется для улучшения понимания содержания медиафайла и повышения эффективности систем идентификации контента (Content ID).
  • US10318543B1
  • 2019-06-11
  • Ссылки

  • Индексация

  • Мультимедиа

Как Google использует данные о наведении курсора (Hover Data) для ранжирования изображений и борьбы с кликбейтными миниатюрами
Google использует данные о взаимодействии пользователя с миниатюрами в поиске по картинкам (наведение курсора) как сигнал интереса. Для редких запросов эти сигналы получают больший вес, дополняя недостаток данных о кликах. Система также вычисляет соотношение кликов к наведениям (Click-to-Hover Ratio), чтобы идентифицировать и понижать в выдаче «магниты кликов» — привлекательные, но нерелевантные изображения, которые собирают много наведений, но мало кликов.
  • US8819004B1
  • 2014-08-26
  • Поведенческие сигналы

  • Мультимедиа

  • SERP

Как Google использует язык интерфейса пользователя и поведенческие сигналы для определения языковой релевантности документа
Google определяет, для носителей каких языков релевантен документ, анализируя агрегированные данные о кликах. Система изучает, какой языковой интерфейс поиска (например, google.fr или google.de) использовали пользователи, кликнувшие на результат. Учитывая поведенческие факторы, такие как время пребывания на странице (Dwell Time) и позиция клика, Google рассчитывает Оценку Языковой Релевантности. Это позволяет определить целевую аудиторию страницы независимо от языка ее контента.
  • US9208231B1
  • 2015-12-08
  • Мультиязычность

  • Поведенческие сигналы

  • SERP

Как Google использует крупномасштабное машинное обучение и данные о поведении пользователей для предсказания кликов и ранжирования результатов
Google использует систему машинного обучения для создания модели ранжирования, которая предсказывает вероятность клика пользователя по документу. Модель обучается на огромных массивах данных о прошлых поисках (запросы, документы, клики). Система учитывает базовую вероятность клика (Prior Probability), основанную на позиции и предыдущей оценке документа, а затем корректирует её с помощью правил, выявляющих, какие признаки (Features) документа и запроса влияют на выбор пользователя.
  • US7231399B1
  • 2007-06-12
  • Поведенческие сигналы

Как Google использует нейросетевые эмбеддинги (Two-Tower Model) для семантического поиска изображений с учетом контекста страницы
Google использует систему поиска изображений, основанную на нейронных сетях (модель "Две Башни"). Система создает векторные представления (эмбеддинги) для поисковых запросов и для пар "изображение + посадочная страница", помещая их в общее семантическое пространство. Это позволяет находить релевантные изображения не по ключевым словам, а по близости векторов, учитывая как содержание картинки, так и контекст страницы, на которой она размещена.
  • US11782998B2
  • 2023-10-10
  • Семантика и интент

  • Индексация

  • Мультимедиа

Как Google использует контент вокруг ссылок (вне анкора) для генерации «Синтетического Описательного Текста» и ранжирования вашего сайта
Google может генерировать «Синтетический Описательный Текст» для страницы, анализируя контент и структуру сайтов, которые на нее ссылаются. Система создает структурные шаблоны для извлечения релевантного текста (например, заголовков или абзацев рядом со ссылкой), который затем используется как мощный сигнал ранжирования. Этот механизм позволяет лучше понять содержание страницы, особенно если традиционный анкорный текст низкого качества или отсутствует.
  • US9208233B1
  • 2015-12-08
  • Ссылки

  • Семантика и интент

  • Индексация

Как Google обучается на поведении пользователя для персонализации весов источников в поисковой выдаче
Google использует сигналы интереса пользователя (клики, время просмотра) для динамической корректировки весов различных источников данных (например, ключевых слов, тем, типов контента). Система определяет, какие источники наиболее полезны для конкретного пользователя, и повышает их значимость при ранжировании последующих результатов поиска, тем самым персонализируя выдачу.
  • US8631001B2
  • 2014-01-14
  • Персонализация

  • Поведенческие сигналы

  • SERP

Как Google использует данные о поведении пользователей и длительность кликов для улучшения и переписывания поисковых запросов
Google использует систему для автоматического переписывания запросов пользователей. Система анализирует миллионы прошлых поисковых сессий, чтобы определить, как пользователи уточняли свои запросы и насколько они были удовлетворены результатами (измеряя длительность кликов). На основе этого рассчитывается «Ожидаемая полезность» (Expected Utility) для предложенных вариантов запросов, что позволяет Google предлагать пользователю те формулировки, которые с наибольшей вероятностью приведут к качественному ответу.
  • US7617205B2
  • 2009-11-10
  • Поведенческие сигналы

  • Семантика и интент

  • SERP

Как Google автоматически превращает текст на странице в ссылки на результаты поиска для монетизации контента
Патент Google описывает технологию автоматического анализа контента веб-страницы для выявления ключевых тем и терминов. Система генерирует релевантные поисковые запросы и динамически встраивает гиперссылки в текст страницы. При клике пользователь перенаправляется на страницу результатов поиска (SERP). Ключевая особенность: система приоритизирует термины с высоким потенциалом дохода от рекламы.
  • US7788245B1
  • 2010-08-31
  • Ссылки

  • SERP

  • Семантика и интент

seohardcore