Как Google индексирует печатные издания (книги, журналы) и модифицирует рекламу в них для показа в поиске

METHOD FOR SEARCHING MEDIA (Метод поиска медиа)

US9684676B1
Google LLC
2008-09-08
2017-06-20

Патент описывает технологию, лежащую в основе Google Books и Google Scholar. Он раскрывает, как Google сканирует печатные материалы, делает их доступными для поиска наравне с веб-страницами и управляет авторскими правами через протокол разрешений. Ключевой аспект патента — механизмы модификации оригинальной печатной рекламы путем ее замены на обновленную цифровую рекламу или добавления интерактивных гиперссылок.

Какую проблему решает

Патент решает проблему недоступности огромного массива информации, содержащейся в традиционных печатных медиа (книги, журналы, газеты), для стандартного интернет-поиска. Он направлен на интеграцию этого контента в цифровую среду. Кроме того, патент решает сопутствующие критические задачи: управление доступом к материалам, защищенным авторским правом, и монетизацию оцифрованного контента, в частности, путем обновления или активизации устаревшей печатной рекламы.

Что запатентовано

Запатентована система и метод для интеграции оцифрованных печатных материалов (Printed Items) в результаты веб-поиска. Система включает сбор данных (сканирование, OCR), хранение их в виде наборов данных (Data Sets) и поиск по ним. Ключевыми компонентами являются Permission Protocol для управления авторскими правами и механизмы модификации рекламы. Конкретные пункты (Claims) данного патента сфокусированы на способности системы заменять оригинальную печатную рекламу на обновленную информацию (Updated Advertisement Information) или добавлять гиперссылки к рекламе, сохраняя при этом оригинальную верстку документа.

Как это работает

Система функционирует следующим образом:

Сбор и оцифровка: Печатные материалы сканируются (с использованием OCR) или загружаются от издателей, преобразуясь в Data Sets.
Индексирование и анализ: Система анализирует макет страницы, извлекает текст для индексации и идентифицирует рекламные блоки.
Управление правами: Издатели используют Permission Protocol для контроля доступа к своему контенту (например, разрешая только частичный просмотр).
Поиск и смешивание: Поисковая система ищет релевантный контент как в вебе, так и в базе оцифрованных материалов, и представляет смешанную выдачу.
Отображение и модификация рекламы: При просмотре оцифрованной страницы система может модифицировать рекламные блоки: либо заменить их на Updated Advertisement Information, либо сделать оригинальную рекламу кликабельной, сохраняя исходную верстку.

Актуальность для SEO

Высокая. Этот патент описывает фундаментальные механизмы, лежащие в основе Google Books и Google Scholar. Интеграция авторитетного контента из разнородных источников (Universal Search) и управление авторскими правами остаются центральными задачами Google. Механизмы монетизации, описанные в патенте, также активно используются.

Важность для SEO

Влияние на стандартное веб-SEO умеренное (6/10), но стратегическое значение высоко. Патент не описывает факторы ранжирования веб-сайтов. Однако он критически важен для издателей и авторов, чей контент индексируется в Google Books/Scholar. Он определяет конкурентный ландшафт, где оцифрованные печатные материалы напрямую конкурируют с веб-контентом за видимость в SERP по информационным и исследовательским запросам.

Термины и определения

Characterization (Характеристика / Сниппет): Представление результата поиска в SERP. Может включать резюме, выдержку (snippet), заголовок или другое описание источника (как веб-страницы, так и печатного материала).
Data Set (Набор данных): Электронная версия печатного материала, хранящаяся в базе данных. Может представлять собой страницу, статью или целую публикацию. Включает текст, графику и информацию о верстке.
Electronic Path (Электронный путь): Механизм (например, гиперссылка), сопровождающий Characterization и ведущий к более полному электронному представлению материала.
Layout (Верстка, макет): Расположение контента и рекламы в исходном печатном издании. Система стремится сохранить этот макет при отображении модифицированного документа.
OCR (Optical Character Recognition): Оптическое распознавание символов. Технология, используемая для извлечения текста из отсканированных изображений печатных материалов.
Permission Protocol (Протокол разрешений): Механизм, позволяющий правообладателям (издателям) контролировать отображение защищенных авторским правом материалов. Позволяет разрешать или блокировать отображение всего документа или его частей.
Printed Item (Печатный материал): Традиционные медиа (книги, журналы, газеты), которые оцифровываются для включения в базу данных.
Updated Advertisement Information (Обновленная рекламная информация): Новая цифровая реклама или ссылки, которые система вставляет в оцифрованный документ вместо оригинальной печатной рекламы при отображении пользователю.

Ключевые утверждения (Анализ Claims)

Важно отметить, что данная версия патента (US9684676B1), выданная в 2017 году, является продолжением более ранних заявок. Её Claims (Формула изобретения) узко сфокусированы на механизмах модификации рекламы внутри оцифрованного контента.

Claim 1 (Независимый пункт): Описывает метод модификации отображения оцифрованного печатного материала путем замены рекламы.

Получение изображения печатного материала.
Хранение документа, представляющего изображение. Документ разделен на данные контента (Область 1) и данные рекламы (Область 2).
Идентификация ссылок на Updated Advertisement Information на основе данных оригинальной рекламы.
Модификация документа.
При отображении в браузере показывается оригинальный контент (Область 1) и Updated Advertisement Information (Область 2). Оригинальная реклама при этом не видна.

Ядро изобретения — технология цифровой замены статической печатной рекламы на динамическую или обновленную рекламу в момент отображения.

Claim 9 (Независимый пункт): Описывает систему, реализующую замену рекламы с акцентом на сохранение верстки (layout).

Система хранит данные контента, данные рекламы и информацию о верстке (layout).
Система идентифицирует Updated Advertisement Information (которой не было в оригинале).
Система представляет (отображает) документ, включающий оригинальный контент и обновленную рекламу (скрывая оригинальную).
Форматирование контента и обновленной рекламы соответствует оригинальной верстке печатного издания.

Этот пункт защищает метод поддержания внешнего вида оригинала при динамической вставке новых рекламных объявлений.

Claim 25 (Независимый пункт): Описывает систему для создания интерактивной рекламы (добавление ссылок).

Хранение данных контента, рекламы и верстки.
Идентификация веб-страницы, связанной с продуктом/услугой из рекламы.
Модификация рекламы путем добавления ссылки на эту веб-страницу (создание modified advertisement).
Отображение документа согласно оригинальной верстке. Выбор (клик) модифицированной рекламы приводит к открытию связанной веб-страницы.

Этот пункт защищает механизм превращения статических объявлений в интерактивные элементы, ведущие на релевантные онлайн-ресурсы.

Где и как применяется

Изобретение описывает создание и функционирование специализированной поисковой системы (например, Google Books/Scholar) и ее интеграцию с основным поиском.

CRAWLING – Сканирование и Сбор данных
Происходит не веб-краулинг, а сбор данных из печатных источников: физическое сканирование (Scanning/Digitizing) и OCR, или прямая загрузка цифровых копий от издателей.

INDEXING – Индексирование и извлечение признаков
Ключевой этап обработки:

Сегментация макета: Анализ верстки (layout), идентификация областей контента и рекламных областей.
Извлечение текста: OCR для индексации.
Анализ рекламы: Извлечение информации о продукте/рекламодателе для последующей модификации.
Управление правами: Запись статуса Permission Protocol (авторизовано/заблокировано) для различных частей контента.

RANKING – Ранжирование
Поисковый движок ищет релевантные Data Sets в базе оцифрованных материалов параллельно с веб-индексом. В патенте упоминается возможность интегрального ранжирования (веб-страницы и печатные материалы ранжируются вместе).

METASEARCH – Метапоиск и Смешивание
Результаты из веб-индекса и базы печатных материалов объединяются в единую выдачу (Universal Search) или отображаются в специализированных вертикалях.

RERANKING – Переранжирование (и Презентация)
На этапе отображения контента пользователю система реализует логику Claims: происходит проверка Permission Protocol и модификация отображения для вставки Updated Advertisement Information или ссылок вместо/поверх оригинальной рекламы.

На что влияет

Конкретные типы контента: Книги, журналы, научные журналы, газеты, архивные материалы.
Специфические запросы: Информационные, исследовательские, академические запросы, поиск цитат.
Конкретные ниши или тематики: Академические исследования, история, литература, издательский бизнес.

Когда применяется

Триггеры активации (Поиск): Когда пользователь выполняет поиск, и система находит релевантный контент в базе оцифрованных печатных материалов.
Триггеры активации (Модификация Рекламы): Когда пользователь просматривает оцифрованную страницу, содержащую рекламные блоки, и система имеет возможность заменить или дополнить их.
Условия применения (Доступ): Когда Permission Protocol разрешает отображение контента или его части пользователю.

Пошаговый алгоритм

Процесс А: Сбор и Индексирование (Офлайн)

Сбор данных: Сканирование печатного материала или загрузка цифровой копии.
Обработка и Сегментация: Применение OCR для извлечения текста. Анализ верстки (layout analysis). Разделение страницы на блоки контента и блоки рекламы.
Анализ рекламы: Анализ содержания рекламных блоков для определения продукта/услуги.
Идентификация обновлений: Поиск соответствующей Updated Advertisement Information или релевантных веб-страниц для ссылок.
Хранение: Сохранение Data Set, включающего текст, изображения, информацию о верстке и метаданные рекламы/обновлений.
Управление разрешениями: Запись статуса доступа согласно Permission Protocol.

Процесс Б: Поиск и Отображение (Онлайн)

Обработка запроса и Поиск: Поиск в веб-индексе и базе оцифрованных материалов.
Формирование выдачи: Генерация Characterizations (сниппетов), смешивание и ранжирование результатов.
Запрос на отображение: Пользователь кликает по ссылке на оцифрованный материал.
Проверка разрешений: Система проверяет Permission Protocol. Неавторизованные части блокируются.
Модификация рекламы: Система применяет логику модификации к рекламным блокам (замена согласно Claims 1, 9 или добавление ссылок согласно Claim 25).
Рендеринг и Отображение: Система генерирует финальное представление страницы, сохраняя оригинальную верстку, но с модифицированной рекламой и только разрешенным контентом.

Какие данные и как использует

Данные на входе

Контентные факторы: Текст, извлеченный с помощью OCR; изображения и фотографии из отсканированных копий.
Структурные факторы: Информация о верстке (layout) оригинального печатного издания (расположение текста, изображений, рекламных блоков).
Метаданные публикации: Дата публикации, название издания, издатель, автор.
Рекламные данные: Информация о продукте, услуге или рекламодателе из оригинальной печатной рекламы. Внешние данные для Updated Advertisement Information.
Данные о разрешениях: Авторизации от правообладателей, полученные через Permission Protocol.

Какие метрики используются и как они считаются

Патент не детализирует алгоритмы ранжирования, упоминая лишь ранжирование по релевантности. Основные механизмы касаются обработки и отображения контента:

Optical Character Recognition (OCR): Используется для конвертации изображений в текст.
Анализ макета (Layout Analysis): Критически важен для сегментации страницы на контент и рекламу, а также для сохранения оригинального вида при модификации рекламы (Claims 1, 9, 25).
Статус авторизации (Permission Status): Оценка, определяющая видимость контента для пользователя на основе Permission Protocol.
Соответствие рекламы (Ad Matching): Механизм для подбора Updated Advertisement Information или ссылок на основе данных оригинальной рекламы.

Фундамент Google Books/Scholar: Патент описывает инфраструктуру, необходимую для включения оцифрованных печатных изданий в поисковую систему. Это ключевой элемент стратегии Универсального Поиска Google по организации всей мировой информации.
Центральная роль управления авторскими правами: Permission Protocol является критически важным компонентом, позволяющим Google индексировать защищенный контент, предоставляя правообладателям гранулярный контроль над его отображением.
Монетизация через модификацию рекламы: Выданные Claims сфокусированы на механизмах монетизации оцифрованного контента. Google запатентовал методы замены статической печатной рекламы на динамическую (Updated Advertisement Information) или превращения её в интерактивную (добавление гиперссылок).
Важность сохранения оригинальной верстки (Replica View): Система разработана так, чтобы максимально точно воспроизводить внешний вид (layout) оригинала, даже при модификации рекламных блоков. Это важно для сохранения контекста и удобства чтения.
Конкуренция контента: Оцифрованные печатные материалы становятся полноценными участниками поисковой выдачи, конкурируя с веб-страницами за внимание пользователя, особенно по исследовательским и информационным запросам.

Best practices (это мы делаем)

Патент имеет ограниченное применение для стандартного SEO веб-сайтов, но критически важен для издателей, авторов и исследователей.

Для издателей и авторов:

Участие в программах оцифровки: Активно участвуйте в Google Books Partner Program. Это основной способ сделать печатный контент видимым в поиске и создать дополнительный канал трафика.
Обеспечение точности метаданных: Предоставляйте полные и точные метаданные (ISBN, ISSN, авторы, даты). Это напрямую влияет на индексацию и ранжирование вашего контента в этих вертикалях.
Стратегическое использование Permission Protocol: Используйте инструменты управления доступом (реализацию Permission Protocol), чтобы определить объем предварительного просмотра. Это позволяет сбалансировать видимость в поиске и защиту контента для стимулирования продаж.

Для всех SEO-специалистов:

Учет авторитетности офлайн-источников (E-E-A-T): Ссылки и цитирования из проиндексированных книг и научных статей (Google Scholar) служат сильным сигналом авторитетности. Стремитесь к тому, чтобы ваши эксперты или бренд упоминались в авторитетных печатных источниках.
Анализ конкурентной среды: При анализе SERP учитывайте результаты из Google Books. Понимание того, какой печатный контент Google считает релевантным, может дать инсайты для контент-стратегии.

Worst practices (это делать не надо)

Игнорирование каналов оцифровки: Для издателей отказ от участия в Google Books означает потерю видимости по информационным и исследовательским запросам, где печатный контент часто доминирует.
Предоставление некачественных данных: Ошибки в метаданных или низкое качество сканирования могут привести к ошибкам OCR, плохой индексации и снижению видимости контента.
Применение стандартных SEO-тактик к Google Books: Попытки манипулировать ранжированием в Google Books с помощью стандартных веб-SEO методов неэффективны, так как сбор данных и факторы ранжирования отличаются.

Стратегическое значение

Патент подтверждает долгосрочную стратегию Google по организации всей мировой информации, а не только веб-страниц. Он демонстрирует технические и юридические подходы к интеграции защищенного авторским правом контента. Для SEO-специалистов это подчеркивает необходимость учитывать в анализе конкурентной среды результаты из специализированных индексов (Вертикалей), которые имеют уникальные конвейеры обработки данных и принципы ранжирования.

Практические примеры

Сценарий 1: Замена рекламы в оцифрованном журнале (Claim 1 и 9)

Исходный материал: Оцифрованный выпуск журнала о технологиях за 2010 год с рекламой смартфона Модель А.
Обработка: Google индексирует журнал, выделяет контент и рекламу (advertisement data). Система определяет, что Модель А устарела, и находит актуальную рекламу Модели Z того же бренда (Updated Advertisement Information).
Отображение (2025 год): Пользователь просматривает страницу в Google Books. Система отображает оригинальную статью, но в рекламном блоке вместо Модели А показывает рекламу Модели Z, сохраняя верстку журнала (layout).

Сценарий 2: Добавление интерактивности к рекламе (Claim 25)

Исходный материал: Оцифрованный кулинарный справочник с рекламой кухонного комбайна.
Обработка: Система идентифицирует рекламу и находит официальную страницу этого комбайна у ритейлера.
Модификация: Система создает modified advertisement, добавляя интерактивную ссылку к изображению.
Отображение: Пользователь видит рекламу как в оригинале, но при клике на нее перенаправляется на веб-страницу для покупки комбайна.

Сценарий 3: Управление доступом (Permission Protocol)

Действие: Издатель загружает книгу в Google Books Partner Program.
Настройка: Используя инструменты программы (реализация Permission Protocol), издатель устанавливает, что только 20% книги доступно для предварительного просмотра.
Результат: Пользователь, нашедший книгу через поиск, может прочитать только разрешенные 20%. Остальные страницы блокируются или содержат уведомление "Предварительный просмотр недоступен".

Является ли этот патент основой для Google Books и Google Scholar?

Да, этот патент и его родительские заявки описывают фундаментальную технологию для этих сервисов. Он включает методы сканирования печатных материалов, их индексации с помощью OCR, отображения в результатах поиска наравне с веб-страницами и управления авторскими правами через Permission Protocol.

Влияет ли этот патент на ранжирование моего обычного веб-сайта?

Напрямую нет. Он не описывает алгоритмы ранжирования веб-страниц. Однако он описывает механизм, который позволяет оцифрованным печатным материалам появляться в выдаче (Universal Search) и конкурировать с вашим сайтом за трафик, особенно по информационным и исследовательским запросам.

Означает ли этот патент, что Google изменяет содержание книг и журналов?

Патент описывает изменение только рекламных блоков, а не основного редакционного контента. Система модифицирует или заменяет рекламу (advertisement data) для повышения ее актуальности или интерактивности, но сохраняет основной контент (content data) и общую верстку (layout) оригинала.

Что такое 'Permission Protocol' и как он работает?

Это механизм для управления авторскими правами. Он позволяет правообладателям (издателям) контролировать, какие части их оцифрованных материалов могут быть показаны пользователям. Издатели могут разрешить полный доступ, ограничить предварительный просмотр определенным процентом страниц или полностью заблокировать отображение контента.

Что такое 'Updated Advertisement Information'?

Это новая, актуальная рекламная информация (например, современный цифровой баннер или контекстная реклама), которую система использует для динамической замены устаревшей печатной рекламы при отображении оцифрованного документа. Это позволяет монетизировать просмотры архивного контента.

В чем разница между заменой рекламы (Claim 1) и модификацией рекламы (Claim 25)?

Замена рекламы (Claim 1) подразумевает полное скрытие оригинального объявления и показ вместо него Updated Advertisement Information. Модификация рекламы (Claim 25) подразумевает добавление интерактивности к существующей рекламе, например, превращение статичного изображения в кликабельную ссылку, ведущую на сайт рекламодателя или страницу заказа.

Как система определяет, где находится контент, а где реклама на отсканированной странице?

Патент подразумевает использование анализа макета (Layout Analysis) на этапе индексации. Система сегментирует изображение на различные области (контент и реклама) и сохраняет информацию об их расположении. Это необходимо для того, чтобы впоследствии можно было модифицировать рекламу, не нарушая отображение основного контента.

Ранжируются ли результаты из печатных изданий отдельно от веб-результатов?

Патент предлагает вариант интегрального ранжирования. Веб-страницы и печатные материалы могут перечисляться вместе и ранжироваться совместно на основе релевантности. На практике Google часто смешивает эти результаты в универсальной выдаче (Metasearch) или в специализированных вертикалях.

Какова практическая польза этого патента для SEO-специалиста?

Основная польза — стратегическое понимание экосистемы поиска Google. Необходимо учитывать результаты из вертикалей Google Books и Scholar как полноценных конкурентов. Также это подчеркивает важность построения авторитета (E-E-A-T) через публикации в авторитетных печатных изданиях, которые затем индексируются Google.

Актуален ли этот патент, учитывая снижение популярности печатных медиа?

Патент остается высокоактуальным. Огромное количество авторитетной, исторической и академической информации хранится в печатном виде. Google продолжает оцифровывать эти материалы, и описанные в патенте механизмы поиска, управления доступом и монетизации активно используются в Google Books и Google Scholar.

Как Google использует статистический анализ текста для автоматического сопоставления отсканированных книг с библиотечными каталогами (Google Books)

Патент описывает инфраструктурный процесс Google для каталогизации оцифрованных документов (Google Books). Система статистически сравнивает текст книги, полученный через OCR (особенно страницу авторских прав), с базой библиотечных метаданных. Используя вероятностный анализ, который придает больший вес редким терминам, система находит наилучшее совпадение и связывает структурированные данные (автор, название, ISBN) с отсканированным контентом.

US8510312B1
2013-08-13

Индексация

Как Google проектирует интерфейс и навигацию для поиска внутри оцифрованных документов (Google Books)

Патент описывает дизайн пользовательского интерфейса для поиска по оцифрованным печатным материалам (книги, журналы). Он включает механизмы отображения результатов с выдержками (excerpts), навигацию к следующим релевантным фрагментам внутри документа (пропуская нерелевантные страницы), агрегацию связанной веб-информации и отслеживание истории просмотров.

US8364668B2
2013-01-29

SERP
Ссылки

Как Google обогащает оцифрованные документы (например, книги), автоматически находя и встраивая связанный веб-контент

Google улучшает представление оцифрованных документов (книг, статей), определяя их атрибуты (автор, название) и автоматически выполняя веб-поиск связанной информации (обзоров, биографий). Эта информация затем представляется вместе с исходным документом на «Справочной странице» (Reference Page), иногда путем прямого извлечения данных с релевантных веб-сайтов.

US8386453B2
2013-02-26

Индексация
Ссылки
Семантика и интент

Как Google автоматически распознает и связывает отсканированные книги с их библиографическими данными (ISBN, автор, название)

Патент описывает инфраструктурный процесс Google для оцифровки печатных изданий (например, Google Books). Система сканирует документ, ищет идентификаторы (ISBN, ISSN) на странице авторских прав или в штрихкоде, сверяет их с базами данных метаданных и автоматически связывает текст документа с его библиографическим описанием для последующего поиска.

US8495061B1
2013-07-23

Индексация

Как Google автоматически превращает текст на странице в ссылки на результаты поиска для монетизации контента

Патент Google описывает технологию автоматического анализа контента веб-страницы для выявления ключевых тем и терминов. Система генерирует релевантные поисковые запросы и динамически встраивает гиперссылки в текст страницы. При клике пользователь перенаправляется на страницу результатов поиска (SERP). Ключевая особенность: система приоритизирует термины с высоким потенциалом дохода от рекламы.

US7788245B1
2010-08-31

Ссылки
SERP
Семантика и интент

Как Google использует машинное зрение и исторические клики для определения визуального интента и ранжирования изображений

Google использует систему, которая определяет визуальное значение текстового запроса, анализируя объекты на картинках, которые пользователи выбирали ранее по этому или похожим запросам. Система создает набор «меток контента» (визуальный профиль) для запроса и сравнивает его с объектами, распознанными на изображениях-кандидатах с помощью нейросетей. Это позволяет ранжировать изображения на основе их визуального соответствия интенту пользователя.

US20200159765A1
2020-05-21

Семантика и интент
Мультимедиа
Персонализация

Как Google генерирует интерактивные и иерархические Sitelinks на основе структуры и популярности разделов сайта

Google анализирует навигационную иерархию сайта (DOM), популярность ссылок и глубину разделов для создания интерактивного представления ресурса (расширенных Sitelinks) в SERP. Это позволяет пользователям просматривать ключевые категории и вложенные ссылки через интерфейс вкладок, не покидая страницу результатов поиска.

US9348846B2
2016-05-24

Структура сайта
SERP
Ссылки

Как Google использует социальный граф и активность друзей для персонализации и переранжирования результатов поиска

Google использует данные из социального графа пользователя и активность его контактов (лайки, шеры, комментарии, плейлисты) для изменения ранжирования результатов поиска. Контент, одобренный социальным окружением, повышается в выдаче и сопровождается аннотациями, объясняющими причину повышения и указывающими на свежесть социального действия.

US8959083B1
2015-02-17

Персонализация
Поведенческие сигналы
SERP

Как Google выбирает модель визуальной релевантности для сложных запросов в Поиске по картинкам

Google решает проблему ранжирования изображений для сложных или редких запросов, для которых нет специализированной модели релевантности. Система тестирует существующие модели, созданные для частей запроса (подзапросов), и выбирает ту, которая лучше всего соответствует поведению пользователей (кликам) по исходному запросу. Это позволяет улучшить визуальную релевантность в Image Search.

US9152652B2
2015-10-06

Поведенческие сигналы
Мультимедиа
Семантика и интент

Как Google использует пользовательский контент (UGC) и историю поиска для сбора структурированных отзывов

Google анализирует пользовательский контент (фотографии, посты, метаданные) и историю поиска, чтобы определить, с какими объектами (места, продукты, услуги) взаимодействовал пользователь. Система проактивно предлагает оставить структурированный отзыв, используя шаблон, который может быть предварительно заполнен на основе тональности исходного UGC. Это направлено на увеличение объема и подлинности отзывов.

US20190278836A1
2019-09-12

Семантика и интент
Персонализация
EEAT и качество

Как Google использует географическое положение и историю поведения пользователей для разрешения неоднозначных запросов

Google применяет механизм для интерпретации неоднозначных поисковых запросов, которые имеют несколько географических или категориальных значений. Система определяет доминирующий интент, анализируя, как пользователи в том же регионе ранее уточняли похожие запросы и насколько они были удовлетворены результатами. На основе этих локализованных данных (гистограмм и метрик неудовлетворенности) выбирается наиболее вероятная интерпретация, и выдача фильтруется соответственно.

US8478773B1
2013-07-02

Семантика и интент
Персонализация
Поведенческие сигналы

Как Google планировал использовать цифровые подписи для расчета репутации авторов (Agent Rank) независимо от сайта публикации

Патент Google, описывающий концепцию "Agent Rank". Система предлагает авторам (агентам) использовать цифровые подписи для подтверждения авторства контента. Это позволяет рассчитывать репутационный рейтинг агента, используя алгоритмы, подобные PageRank, на основе того, кто ссылается на их подписанный контент. Этот рейтинг затем используется для влияния на ранжирование, независимо от того, где контент опубликован.

US7565358B2
2009-07-21

EEAT и качество
Ссылки

Как Google использует нормализованные сигналы удовлетворенности пользователей для переранжирования выдачи и управления краулингом/индексацией

Google анализирует вовлеченность пользователей (полезность), сравнивая фактическую удовлетворенность (Good Utilization Events) с ожидаемой вовлеченностью для данной позиции ранжирования. На основе этого рассчитывается Correction Factor для повышения документов, превосходящих ожидания, и понижения тех, которые им не соответствуют. Эта система также влияет на приоритеты сканирования и решения об индексации.

US9223897B1
2015-12-29

Поведенческие сигналы
Индексация
Техническое SEO

Как Google использует интерактивные визуальные цитаты для генерации и уточнения ответов в мультимодальном поиске (SGE/Lens)

Google использует механизм для улучшения точности ответов, генерируемых LLM в ответ на мультимодальные запросы (изображение + текст). Система находит визуально похожие изображения, извлекает текст из их источников и генерирует ответ. Этот ответ сопровождается «визуальными цитатами» (исходными изображениями). Если пользователь видит, что цитата визуально не соответствует запросу, он может её отклонить. Система удалит текст этого источника и перегенерирует ответ, повышая его точность.

US20240378237A1
2024-11-14

Мультимедиа
EEAT и качество
Семантика и интент

Как Google автоматически определяет и отображает обратные ссылки (цитирования) между независимыми веб-страницами

Патент Google, описывающий фундаментальный механизм автоматического обнаружения ссылок между веб-страницами разных авторов. Когда система обнаруживает, что Страница B ссылается на Страницу A, она может автоматически встроить представление (например, ссылку) Страницы B в Страницу A при её показе пользователю. Это технология для построения и визуализации графа цитирований в Интернете.

US8032820B1
2011-10-04

Ссылки
Индексация
Краулинг