
Патент описывает дизайн пользовательского интерфейса для поиска по оцифрованным печатным материалам (книги, журналы). Он включает механизмы отображения результатов с выдержками (excerpts), навигацию к следующим релевантным фрагментам внутри документа (пропуская нерелевантные страницы), агрегацию связанной веб-информации и отслеживание истории просмотров.
Патент решает проблему эффективного представления и навигации внутри объемных оцифрованных документов (например, книг, журналов, каталогов), которые были преобразованы в цифровой формат (упоминается OCR). Задача — предоставить пользователю удобный интерфейс для быстрого доступа к конкретным релевантным фрагментам и обзору содержания, улучшая пользовательский опыт (UX) в специализированных вертикалях поиска (например, Google Books). Патент не направлен на улучшение ранжирования в веб-поиске.
Запатентована система и графический пользовательский интерфейс (GUI) для поисковой системы по документам. Изобретение охватывает конкретные форматы отображения результатов поиска (search result), включающие выдержки (excerpts) и ссылки на другие релевантные части документа. Также запатентованы специализированные интерфейсы просмотра: Reference Page (сводная информация и связанные веб-ресурсы) и Excerpt Page (просмотр конкретной страницы с «умной» навигацией по релевантным фрагментам).
Система предоставляет многоуровневый доступ к контенту:
excerpt) с подсветкой запроса и ссылки на другие страницы документа, содержащие этот запрос.Related Information (связанные веб-документы, например, обзоры).Previously Accessed Pages для удобства навигации пользователя.Средняя. Патент (подача 2004 г.) описывает фундаментальные элементы интерфейса Google Books. Хотя дизайн эволюционировал, базовая логика представления оцифрованных документов, навигации по релевантным фрагментам (пропуск страниц) и агрегации связанной информации остается актуальной для этого типа вертикального поиска.
(1/10) Минимальное/Инфраструктура. Влияние на стандартные SEO-стратегии минимальное. Патент не описывает алгоритмы ранжирования веб-поиска. Он полностью сосредоточен на UI/UX специализированной вертикали (Google Books). Однако он имеет значение для издателей, оптимизирующих контент внутри экосистемы Google Books, поскольку описывает, как именно их контент будет представлен пользователям.
Related information.thumbnail images).Reference Page.Патент фокусируется на элементах пользовательского интерфейса и методах представления результатов.
Claim 1 (Независимый пункт): Описывает основной процесс и структуру интерфейса от SERP до Reference Page.
search result document).excerpt), связанную с запросом, и (iii) несколько ссылок на другие выдержки в этом же документе, связанные с запросом.Reference Page.Reference Page включает: (i) несколько изображений выдержек (excerpt images) и (ii) информацию о веб-документах, связанных с этим документом (Related Information).Claim 9 (Зависимый от 1): Детализирует Excerpt Page.
Система предоставляет Excerpt Page, включающую выдержку страницы (page excerpt) и как минимум одно из: (i) ссылку на следующую/предыдущую релевантную выдержку или (ii) ссылку на все релевантные выдержки в документе.
Claim 17 (Зависимый от 1): Описывает функцию отслеживания истории просмотров.
Система генерирует и предоставляет информацию, связанную с несколькими ранее посещенными страницами (previously accessed pages) этого документа.
Claim 26 (Независимый пункт - Система/GUI): Описывает систему, реализующую GUI с «умной» навигацией по релевантности.
Изобретение применяется в специализированной поисковой системе (Вертикальный поиск), такой как Google Books, и затрагивает этапы предобработки и представления результатов.
INDEXING – Индексирование и извлечение признаков
На этом этапе происходит необходимая предобработка: сканирование, OCR, сегментация на страницы, извлечение текста и структуры (оглавление, индекс). Также может происходить сбор Related Information из интернета.
RANKING – Ранжирование
Система определяет релевантные документы и, возможно, наиболее релевантные страницы внутри документа для использования в качестве excerpts (хотя алгоритмы ранжирования в патенте не описаны).
METASEARCH – Метапоиск и Смешивание / RERANKING – Переранжирование (Уровень Представления)
Основное применение патента. Система формирует пользовательский интерфейс.
Reference Page, Excerpt Page и т.д.Related Information).Previously Accessed Pages.Входные данные:
Related Information.Выходные данные:
Reference Page, Excerpt Page).Процесс А: Генерация результатов поиска (SERP)
excerpts с подсветкой термина.Процесс Б: Взаимодействие с документом (Reference Page)
Related Information (связанные веб-документы).Процесс В: Взаимодействие с документом (Excerpt Page)
Previously Accessed Pages.Патент фокусируется на использовании данных для генерации интерфейса, а не для ранжирования.
OCR). Используется для поиска совпадений и генерации excerpts.Table of Contents), индекс (Index), обложка). Используются для навигации.Excerpt Page.Related Information), такая как обзоры, биографии автора.Jacket/Flap Description).Previously Accessed Pages).В патенте не указаны метрики или формулы для ранжирования. Он оперирует логическими условиями отображения элементов:
excerpt и для работы специализированной навигации (Next/Previous relevant excerpt).Previously Accessed Pages.Reference Page служит хабом, соединяющим контент документа с метаданными и связанными веб-ресурсами (Related Information), такими как обзоры и биографии.Рекомендации применимы исключительно для авторов, издателей и специалистов, оптимизирующих контент для Google Books и аналогичных систем. Для стандартного веб-SEO эти практики не применимы.
OCR критичны для того, чтобы система могла найти и корректно отобразить релевантные excerpts.Jacket/Flap Description). Эта информация формирует Reference Page.Table of Contents) и индекса (Index) улучшает навигацию, так как система использует эти структурные элементы в интерфейсе.Related Information (Claim 1), повышая авторитетность документа в глазах пользователя.Применимо только к оптимизации в Google Books.
Reference Page.Стратегическое значение для стандартного SEO низкое. Патент демонстрирует подход Google к созданию специализированных интерфейсов для не-веб контента. Он подтверждает важность структурированных данных и качественных метаданных для корректного представления контента в вертикальных поисковых системах. Для издателей этот патент определяет «правила игры» в экосистеме Google Books.
Практических примеров для применения в работе SEO-специалиста по продвижению веб-сайтов нет, так как патент описывает интерфейс Google Books.
Пример для издателя: Оптимизация представления книги в Google Books
Reference Page. Система автоматически генерирует ссылки на TOC и Index, позволяя пользователю быстро оценить содержание.Reference Page блок Related Information автоматически заполняется ссылками на эти внешние обзоры.Влияет ли этот патент на ранжирование моего сайта в основном поиске Google?
Нет. Этот патент не описывает алгоритмы ранжирования для веб-поиска. Он полностью сосредоточен на дизайне пользовательского интерфейса и механизмах навигации для специализированной поисковой системы по оцифрованным документам (например, Google Books).
Что такое «Reference Page» и почему она важна для издателей?
Reference Page (Справочная страница) — это сводная страница о документе, агрегирующая метаданные, выдержки и связанную информацию из интернета (Related Information). Она важна для издателей, так как формирует первое впечатление пользователя и может включать ссылки на покупку или внешние обзоры, повышающие доверие.
Как Google собирает «Related Information» о книге?
Патент не детализирует алгоритм сбора, но указывает, что это информация о веб-документах, связанных с книгой или автором (обзоры, биографии, новости). Это подчеркивает важность наличия информации о книге и авторе в интернете за пределами самой системы Google Books.
Что означает функция навигации «Next/Previous Excerpt» (Claim 26)?
Это функция «умной» навигации. Она позволяет пользователю переходить к следующему или предыдущему фрагменту документа, содержащему поисковый термин. Ключевой момент: система пропускает промежуточные страницы, если на них нет этого термина, обеспечивая навигацию по релевантности.
Как оптимизировать книгу для лучшего представления в Google Books согласно этому патенту?
Необходимо сосредоточиться на качестве оцифровки (точный OCR), полноте метаданных (синопсис, библиография), наличии структуры (оглавление, индекс). Также полезно стимулировать появление внешних обзоров для заполнения блока Related Information.
Что такое «All Excerpts Page»?
Это страница, которая собирает множество релевантных выдержек из документа в одном месте. Они могут быть показаны списком текстовых фрагментов или набором миниатюр страниц (thumbnail images), на которых найдены совпадения с запросом.
Отслеживает ли Google, что я читаю, согласно этому патенту?
Да, патент описывает механизм Previously Accessed Pages (Ранее посещенные страницы). Система отслеживает, какие страницы пользователь просматривал (в рамках одного или нескольких документов), и предоставляет интерфейс для быстрого возврата к ним.
Используются ли данные из этого патента для ранжирования в веб-поиске?
Нет. В данном патенте нет информации о том, как описанные механизмы или данные влияют на ранжирование веб-поиска. Патент сфокусирован исключительно на интерфейсе системы поиска документов.
Как система обрабатывает ошибки OCR?
Патент упоминает OCR как метод получения данных, но не описывает механизмы обработки ошибок. Это означает, что низкое качество OCR напрямую ухудшит видимость документа, так как поисковые термины могут быть не распознаны корректно.
Касается ли этот патент сниппетов в обычном веб-поиске?
Нет. Патент описывает excerpts (выдержки) в контексте поиска по оцифрованным книгам, включая специфическую навигацию внутри них. Это отличается от того, как формируются стандартные сниппеты для веб-страниц в основной выдаче Google.

Индексация
Ссылки
Семантика и интент

Индексация
SERP

Семантика и интент

Индексация

Персонализация
Поведенческие сигналы
SERP

Ссылки
Индексация
Техническое SEO

Ссылки
SERP

Поведенческие сигналы
SERP

Поведенческие сигналы
EEAT и качество

Семантика и интент
Ссылки
SERP

Ссылки
Поведенческие сигналы
EEAT и качество

Поведенческие сигналы
Local SEO

Knowledge Graph
Семантика и интент
Ссылки

Персонализация
Поведенческие сигналы
SERP

Поведенческие сигналы
SERP
Семантика и интент
