SEO HARDCORE
  • Разборы патентов
    • Патенты Google
  • Скоро SEO инструменты
  • Скоро SEO аналитика
  • seohardcore
SEO HARDCORE
назад

Как Google обогащает оцифрованные документы (например, книги), автоматически находя и встраивая связанный веб-контент

PROVIDING SEARCH INFORMATION RELATING TO A DOCUMENT (Предоставление поисковой информации, относящейся к документу)
  • US8386453B2
  • Google LLC
  • 2004-09-30
  • 2013-02-26
  • Индексация
  • Ссылки
  • Семантика и интент
  • Описание
  • Разбор
  • Выводы
  • Практика
  • FAQ
  • Похожие

Google улучшает представление оцифрованных документов (книг, статей), определяя их атрибуты (автор, название) и автоматически выполняя веб-поиск связанной информации (обзоров, биографий). Эта информация затем представляется вместе с исходным документом на «Справочной странице» (Reference Page), иногда путем прямого извлечения данных с релевантных веб-сайтов.

Описание

Какую проблему решает

Патент решает проблему недостатка контекстной информации при просмотре оцифрованных версий традиционных печатных изданий (книг, журналов, каталогов), которые часто попадают в индекс через сканирование и OCR. Эти материалы статичны и изолированы от гипертекстовой среды веба. Изобретение направлено на обогащение пользовательского опыта путем автоматического связывания статического документа с динамической, релевантной информацией, доступной в интернете.

Что запатентовано

Запатентована система для автоматического или интерактивного дополнения информации о документе (например, книге) связанным веб-контентом. Система идентифицирует атрибуты документа (название, автор, тема) и использует их для выполнения вторичных поисковых запросов в интернете (например, поиск обзоров книги). Результаты этих вторичных поисков интегрируются в интерфейс просмотра документа (Reference Page), либо в виде ссылок, либо в виде извлеченной информации (extracted information).

Как это работает

Механизм работает в нескольких режимах:

  • Идентификация документа: Пользователь находит и выбирает документ (например, книгу) через поиск.
  • Отображение Справочной страницы: Система представляет Reference Page с основной информацией о документе (выдержки, библиография).
  • Реактивный поиск (Вариант 1): Reference Page содержит ссылки на связанную информацию (например, «Обзоры»). Если пользователь нажимает на ссылку, система генерирует вторичный запрос (например, Название книги + «обзор») и показывает результаты веб-поиска.
  • Проактивный поиск (Вариант 2): Система автоматически выполняет вторичные поиски по атрибутам в фоновом режиме сразу после выбора документа пользователем.
  • Интеграция результатов: Результаты вторичных поисков могут быть показаны либо как стандартные поисковые сниппеты, либо система может извлечь конкретную информацию (например, рейтинг, текст обзора) из найденных веб-документов и встроить ее прямо в Reference Page.

Актуальность для SEO

Высокая. Патент описывает фундаментальные механизмы работы специализированных вертикалей поиска, таких как Google Books и Google Scholar. Автоматическое обогащение сущностей (книг, авторов, научных работ) информацией из интернета является ключевой частью современных поисковых систем, включая формирование Панелей Знаний (Knowledge Panels).

Важность для SEO

Влияние на SEO — умеренное (4/10). Патент не описывает алгоритмы ранжирования основного веб-поиска. Однако он критически важен для понимания того, как контент попадает в специализированные вертикали. Если SEO-стратегия включает оптимизацию контента о книгах, авторах или публикациях (например, для сайтов с обзорами, биографиями), этот патент объясняет, как Google находит, ранжирует (используя стандартные сигналы) и отображает этот контент в контексте исходного документа.

Детальный разбор

Термины и определения

Document (Документ)
В контексте патента — традиционное печатное произведение (книга, журнал, каталог, статья и т.д.), часто оцифрованное (например, с помощью сканирования и OCR). Также упоминается как Scanned Document.
Web Document (Веб-документ)
Любой машиночитаемый контент, доступный через сеть (веб-сайт, файл, блог и т.д.). Источник связанной информации.
Attribute (Атрибут документа)
Характеристика документа, используемая для генерации вторичных поисковых запросов. Примеры: название, автор, категория, издатель, дата публикации, ISBN/ISSN.
Reference Page (Справочная страница)
Пользовательский интерфейс, генерируемый системой для представления детальной информации о выбранном документе. Агрегирует данные из документа и связанную информацию из интернета.
Extracted Information (Извлеченная информация)
Данные, которые система извлекает из найденных веб-документов (например, рейтинг, текст обзора, биография) для прямого отображения на Reference Page.
IR Score (Information Retrieval Score)
Стандартная оценка текстовой релевантности документа запросу.
Link-based Score (Оценка на основе ссылок)
Оценка авторитетности документа на основе ссылок. В патенте упоминается техника из U.S. Pat. No. 6,285,999 (PageRank).

Ключевые утверждения (Анализ Claims)

Патент описывает несколько ключевых режимов работы.

Claim 1 (Независимый пункт): Описывает реактивный (интерактивный) метод.

  1. Система получает запрос, выполняет первый поиск и предоставляет результаты.
  2. Пользователь выбирает результат, связанный с scanned document.
  3. Система отображает первую Reference Page. Она содержит ссылки, каждая из которых связана со вторым поиском по определенному атрибуту (например, ссылка «Обзоры»).
  4. Пользователь выбирает одну из ссылок.
  5. Система выполняет второй поиск (на основе атрибута) для идентификации веб-документов.
  6. Результат второго поиска отображается как вторая Reference Page.

Claim 17 (Независимый пункт): Описывает метод с автоматическим выполнением множества поисков.

  1. Система получает идентификацию документа.
  2. Отображается Reference Page с ссылкой, связанной с множеством поисков (plurality of searches) по атрибутам.
  3. Пользователь выбирает эту ссылку.
  4. Система автоматически выполняет это множество поисков для идентификации связанных веб-документов.
  5. Предоставляется вторая Reference Page с результатами.

Claim 20 (Независимый пункт): Описывает метод с извлечением информации.

  1. Система идентифицирует scanned document и отображает Reference Page с ссылкой на поиск по атрибуту.
  2. После выбора ссылки выполняется поиск веб-документов.
  3. Система извлекает информацию (extract information) из этих веб-документов.
  4. Отображается вторая Reference Page, включающая эту извлеченную информацию (например, текст обзора, а не ссылку на него).

Claims 3 и 4 (Зависимые): Уточняют, что результаты второго поиска ранжируются. Для этого генерируются оценки (scores), которые могут основываться на комбинации IR scores и link-based scores.

Где и как применяется

Изобретение в первую очередь относится к этапам, связанным с формированием финальной выдачи и интерфейса для специализированных вертикалей поиска (например, Google Books, Google Scholar).

INDEXING – Индексирование и извлечение признаков
На этом этапе система обрабатывает как исходные Documents (сканирует книги, извлекает текст через OCR, идентифицирует Attributes), так и Web Documents (сканирует веб-страницы с обзорами, биографиями).

QUNDERSTANDING – Понимание Запросов
Система должна генерировать вторичные поисковые запросы на основе атрибутов документа. Например, получив атрибуты «Название: 9/11 Report» и «Тип информации: Обзор», система генерирует запрос ["9/11 Report" review].

RANKING – Ранжирование
Ранжирование применяется при выполнении вторичных поисков (например, поиске обзоров). В патенте (Claims 3, 4) явно указано использование стандартных методов ранжирования, включая IR-scores и Link-based scores (ссылочные оценки), для сортировки этих вторичных результатов.

METASEARCH – Метапоиск и Смешивание
Это основной этап применения патента. Система функционирует как метапоисковый движок, который агрегирует информацию из разных источников (оцифрованный документ и результаты вторичного веб-поиска) и смешивает их для создания единой Reference Page.

Входные данные:

  • Выбранный пользователем документ и его атрибуты (название, автор, ISBN и т.д.).
  • Запрос на связанную информацию (явный клик пользователя или автоматический триггер).
  • Веб-индекс.

Выходные данные:

  • Сгенерированная Reference Page, объединяющая информацию о документе и результаты вторичного веб-поиска (в виде ссылок или извлеченных данных).

На что влияет

  • Конкретные типы контента: Наибольшее влияние на оцифрованные печатные издания (книги, научные статьи, журналы). Также влияет на веб-контент, который описывает эти издания (обзоры, биографии авторов, страницы книжных магазинов).
  • Специфические запросы: Влияет на информационные запросы, направленные на изучение конкретного документа или его автора.
  • Конкретные ниши или тематики: Издательское дело, академические исследования, электронная коммерция (продажа книг).

Когда применяется

  • Условия работы алгоритма: Алгоритм активируется, когда пользователь переходит от общих результатов поиска к просмотру деталей конкретного документа (например, открывает страницу книги в Google Books).
  • Триггеры активации:
    • Проактивно: Загрузка Reference Page для документа.
    • Реактивно: Клик пользователя по ссылке для получения связанной информации (например, «Показать обзоры»).

Пошаговый алгоритм

Процесс А: Реактивное получение связанной информации (на основе Claim 1 и FIG. 3B)

  1. Получение запроса и первичный поиск: Система получает запрос пользователя и идентифицирует релевантные документы.
  2. Выбор документа: Пользователь выбирает один документ из результатов.
  3. Представление первичной Reference Page: Система отображает страницу с информацией о документе и списком ссылок на типы связанной информации (например, «Обзор документа», «Биография автора»).
  4. Запрос связанной информации: Пользователь выбирает одну из ссылок.
  5. Генерация и выполнение вторичного поиска: Система генерирует поисковый запрос на основе атрибута документа (например, Название + «обзор») и выполняет поиск веб-документов.
  6. Ранжирование и представление результатов: Найденные веб-документы ранжируются (используя IR score и Link-based score) и отображаются пользователю.

Процесс Б: Проактивное получение и извлечение информации (на основе Claim 17, 20 и FIG. 3C/3D)

  1. Выбор документа: Пользователь идентифицирует и выбирает документ.
  2. Автоматическое выполнение множественных поисков: Система автоматически (или после одного общего клика) генерирует и выполняет несколько вторичных поисковых запросов по разным атрибутам документа (поиск обзоров, биографии и т.д.).
  3. Ранжирование результатов: Полученные веб-документы ранжируются.
  4. Извлечение информации (Опционально): Система анализирует топовые веб-документы и извлекает конкретные данные (например, рейтинги, текст обзора).
  5. Генерация и представление Reference Page: Система создает итоговую Reference Page, встраивая в нее либо ссылки на найденные веб-документы, либо непосредственно извлеченную информацию.

Какие данные и как использует

Данные на входе

Система использует следующие типы данных:

  • Контентные факторы (Документа): Текст оцифрованного документа (для показа выдержек).
  • Структурные факторы (Атрибуты Документа): Метаданные документа: Название, Автор(ы), Издатель, Дата публикации, ISBN/ISSN, Категория/Тема. Эти данные критически важны для генерации вторичных запросов.
  • Контентные факторы (Веб-документа): Содержимое веб-страниц (обзоры, биографии), которое анализируется на релевантность и из которого может извлекаться информация.
  • Ссылочные факторы (Веб-документа): Входящие ссылки на веб-документы, используемые для расчета авторитетности.
  • Поведенческие факторы: Действия пользователя (выбор документа, клик по ссылке) являются триггерами для запуска процессов.

Какие метрики используются и как они считаются

Патент не вводит новых метрик ранжирования, но явно указывает (Claims 3, 4 и описание) на использование существующих для оценки результатов вторичного веб-поиска:

  • IR Score (Оценка информационного поиска): Стандартная оценка релевантности веб-документа вторичному запросу (например, на основе частоты и расположения ключевых слов).
  • Link-based Score (Ссылочная оценка): Оценка авторитетности веб-документа на основе ссылок. В патенте цитируется U.S. Pat. No. 6,285,999 (PageRank) как пример техники расчета.
  • Overall Scores (Общие оценки): Комбинация IR scores и Link-based scores для финального ранжирования веб-документов, найденных во время вторичного поиска.
  • Извлечение информации (Information Extraction): Используются методы для идентификации и извлечения конкретных данных (рейтингов, имен, текста обзора) из веб-документов (Claim 20).

Выводы

  1. Автоматическое обогащение контента: Патент описывает механизм, позволяющий Google автоматически дополнять информацию о специфических сущностях (книгах, статьях) релевантными данными из веба. Это ключевой принцип работы вертикалей и Панелей Знаний.
  2. Генерация запросов на основе атрибутов: Система демонстрирует переход от ключевых слов к атрибутам сущностей, автоматически генерируя релевантные поисковые запросы, комбинируя атрибуты документа (Название, Автор) с типами информации (Обзор, Биография).
  3. Использование стандартного ранжирования для вторичных поисков: Для определения того, какие веб-документы (например, обзоры) будут показаны, система полагается на стандартные сигналы ранжирования, включая релевантность (IR Score) и авторитетность (Link-based Score/PageRank).
  4. Извлечение информации (Information Extraction) для UI: Система не просто ссылается на внешние ресурсы, но может активно извлекать данные (рейтинги, тексты) из веб-документов и встраивать их непосредственно в свой интерфейс (Reference Page).
  5. Фокус на UX в вертикалях: Изобретение направлено на улучшение пользовательского опыта в рамках специализированных поисковых продуктов (Google Books), а не на изменение основного алгоритма веб-поиска.

Практика

Best practices (это мы делаем)

Практическое применение этого патента актуально для сайтов, контент которых может служить источником связанной информации о книгах, статьях, авторах (сайты отзывов, книжные магазины, энциклопедии, СМИ).

  • Оптимизация под вторичные запросы: Создавайте контент, который четко отвечает на автоматически генерируемые запросы, описанные в патенте (например, [Название книги + обзор], [Автор + биография]). Убедитесь, что страницы хорошо оптимизированы под эти интенты.
  • Повышение авторитетности (Link-based Score): Поскольку результаты вторичных поисков ранжируются с использованием ссылочных оценок (PageRank), необходимо работать над авторитетностью сайта. Авторитетные источники с большей вероятностью будут выбраны Google для отображения на Reference Page.
  • Содействие извлечению информации (Information Extraction): Используйте чистую HTML-верстку и микроразметку (Schema.org для Review, Book, Person), чтобы помочь Google извлечь ключевую информацию (рейтинги, имена авторов, краткое содержание обзора). Это повышает шансы на то, что ваш контент будет встроен непосредственно в интерфейс Google (Claim 20).
  • Полнота данных об авторах и публикациях: Если вы публикуете статьи или книги, убедитесь, что информация о них (атрибуты) полна и доступна в интернете, что облегчает Google создание богатых Reference Pages для ваших работ.

Worst practices (это делать не надо)

  • Тонкий контент об известных сущностях: Создание поверхностных страниц с обзорами книг или биографиями авторов неэффективно. Google ищет авторитетные и полные источники для обогащения своих Reference Pages, используя стандартное ранжирование.
  • Блокировка или затруднение извлечения данных: Использование сложной верстки или методов, затрудняющих парсинг страницы, снизит вероятность того, что Google сможет извлечь и использовать ваш контент для обогащения информации о документе.
  • Игнорирование микроразметки для обзоров и книг: Отсутствие разметки снижает понимание структуры контента системой, уменьшая шансы на его использование в качестве источника для Extracted Information.

Стратегическое значение

Патент подтверждает стратегию Google по синтезу информации и созданию собственных ответов на базе данных из интернета. Он демонстрирует, как Google использует веб-контент для обогащения сущностей в своих вертикалях. Для SEO-специалистов это подчеркивает важность оптимизации не только для традиционного ранжирования, но и для того, чтобы стать источником данных для Панелей Знаний и специализированных сервисов Google, что требует авторитетности и хорошо структурированного контента.

Практические примеры

Сценарий: Оптимизация страницы обзора книги для Google Books

  1. Цель: Добиться того, чтобы обзор и рейтинг с вашего сайта отображались на странице книги в Google Books (Reference Page).
  2. Анализ (на основе патента): Google автоматически сгенерирует запрос типа [Название книги + обзор] и будет искать авторитетные результаты (Link-based score), из которых можно извлечь данные (Extracted Information).
  3. Действия:
    • Создать качественный, экспертный обзор книги.
    • Оптимизировать Title и H1 под интент «Обзор книги X».
    • Внедрить микроразметку Schema.org/Review, четко указав рейтинг (ratingValue), объект обзора (itemReviewed - Book) и текст обзора (reviewBody).
    • Обеспечить чистый HTML-код, где основной контент легко извлекается.
    • Получить качественные внешние ссылки на страницу обзора для повышения ее Link-based Score.
  4. Ожидаемый результат: Google идентифицирует страницу как релевантный и авторитетный результат вторичного поиска, извлекает рейтинг и сниппет обзора и отображает их на Reference Page книги.

Вопросы и ответы

Описывает ли этот патент алгоритмы ранжирования основного веб-поиска?

Нет, патент не описывает, как ранжируются сайты в основном веб-поиске. Он фокусируется на том, как Google находит и представляет связанную информацию в контексте просмотра конкретного документа (например, книги в Google Books). Однако он упоминает, что для ранжирования этой связанной информации используются стандартные метрики, такие как IR Score и Link-based Score (PageRank).

Что такое «Reference Page» (Справочная страница) в контексте патента?

Reference Page — это интерфейс, который Google генерирует для предоставления подробной информации о конкретном документе (книге, статье). Она агрегирует данные из самого документа (выдержки, оглавление) и связанную информацию, найденную в интернете (обзоры, биографию автора). Примером может служить страница конкретной книги в сервисе Google Books.

Как Google определяет, какую связанную информацию искать для документа?

Система идентифицирует атрибуты документа, такие как название, автор, тема, издатель, ISBN. Затем она использует эти атрибуты для генерации вторичных поисковых запросов. Примеры включают поиск обзоров документа, биографии автора, новостных статей, упоминающих документ, или других работ того же автора.

Что означает «Extracted Information» (Извлеченная информация) и почему это важно для SEO?

Это данные, которые Google автоматически извлекает из веб-страниц (например, рейтинг книги, текст обзора) и встраивает непосредственно в свой интерфейс (Reference Page). Для SEO это важно, так как позволяет вашему контенту быть представленным напрямую в сервисах Google. Для этого необходимо облегчить извлечение данных с помощью структурированной разметки и чистой верстки.

Патент упоминает два режима поиска: реактивный и проактивный. В чем разница?

В реактивном режиме (Claim 1) вторичный поиск выполняется только тогда, когда пользователь явно запрашивает информацию (например, нажимает кнопку «Показать обзоры»). В проактивном режиме (описанном в патенте и Claim 17) система может автоматически выполнять вторичные поиски в фоновом режиме при загрузке Reference Page и сразу отображать найденную информацию.

Как я могу повысить вероятность того, что мой сайт будет выбран в качестве источника связанной информации?

Патент указывает, что результаты вторичного поиска ранжируются с использованием стандартных сигналов, включая релевантность (IR Score) и авторитетность (Link-based Score). Поэтому необходимо создавать релевантный контент (например, качественный обзор) и работать над повышением авторитетности вашего сайта и конкретной страницы.

Применяется ли этот патент только к Google Books?

Хотя основные примеры в патенте касаются книг (scanned documents), описанные принципы применимы шире. Этот механизм автоматического обогащения сущностей информацией из веба используется также в Google Scholar (для научных статей) и может лежать в основе сбора данных для Панелей Знаний (Knowledge Panels) о любых сущностях.

Какое значение имеет упоминание «Link-based Score» (PageRank) в этом патенте?

Это подтверждает, что даже для вторичных поисков, выполняемых в рамках специализированных вертикалей, авторитетность источника остается критически важным фактором. Google предпочтет показать обзор с авторитетного сайта (например, New York Times), чем с неизвестного блога, при прочих равных условиях. В патенте прямо цитируется патент PageRank.

Как микроразметка связана с этим патентом?

Хотя патент напрямую не упоминает Schema.org (он был подан до ее широкого распространения), он описывает механизм Information Extraction (Claim 20). Микроразметка является основным инструментом, который помогает поисковым системам точно извлекать данные (рейтинги, обзоры, факты). Использование разметки значительно повышает шансы на успешное применение механизмов, описанных в патенте, к вашему контенту.

Упоминаются ли в патенте рекламные объявления?

Да. В описании патента указано, что Reference Page может также включать рекламные объявления (advertisements). Они могут быть связаны с атрибутами документа (например, реклама продажи этой книги), темой документа, исходным поисковым запросом пользователя или его поведением (историей поиска/просмотров).

Похожие патенты

Как Google проектирует интерфейс и навигацию для поиска внутри оцифрованных документов (Google Books)
Патент описывает дизайн пользовательского интерфейса для поиска по оцифрованным печатным материалам (книги, журналы). Он включает механизмы отображения результатов с выдержками (excerpts), навигацию к следующим релевантным фрагментам внутри документа (пропуская нерелевантные страницы), агрегацию связанной веб-информации и отслеживание истории просмотров.
  • US8364668B2
  • 2013-01-29
  • SERP

  • Ссылки

Как Google использует статистический анализ текста для автоматического сопоставления отсканированных книг с библиотечными каталогами (Google Books)
Патент описывает инфраструктурный процесс Google для каталогизации оцифрованных документов (Google Books). Система статистически сравнивает текст книги, полученный через OCR (особенно страницу авторских прав), с базой библиотечных метаданных. Используя вероятностный анализ, который придает больший вес редким терминам, система находит наилучшее совпадение и связывает структурированные данные (автор, название, ISBN) с отсканированным контентом.
  • US8510312B1
  • 2013-08-13
  • Индексация

Как Google индексирует печатные издания (книги, журналы) и модифицирует рекламу в них для показа в поиске
Патент описывает технологию, лежащую в основе Google Books и Google Scholar. Он раскрывает, как Google сканирует печатные материалы, делает их доступными для поиска наравне с веб-страницами и управляет авторскими правами через протокол разрешений. Ключевой аспект патента — механизмы модификации оригинальной печатной рекламы путем ее замены на обновленную цифровую рекламу или добавления интерактивных гиперссылок.
  • US9684676B1
  • 2017-06-20
  • Индексация

  • SERP

Как Google автоматически распознает и связывает отсканированные книги с их библиографическими данными (ISBN, автор, название)
Патент описывает инфраструктурный процесс Google для оцифровки печатных изданий (например, Google Books). Система сканирует документ, ищет идентификаторы (ISBN, ISSN) на странице авторских прав или в штрихкоде, сверяет их с базами данных метаданных и автоматически связывает текст документа с его библиографическим описанием для последующего поиска.
  • US8495061B1
  • 2013-07-23
  • Индексация

Как Google использует цитирования на веб-страницах для ранжирования книг в основной выдаче
Google использует механизм для определения релевантных книг по общим информационным запросам, даже если пользователь не искал книгу специально. Система анализирует, какие книги цитируются на топовых веб-страницах в выдаче. Книги получают оценку, основанную на авторитетности цитирующих страниц и контексте цитирования, и затем подмешиваются в результаты поиска.
  • US8392429B1
  • 2013-03-05
  • Ссылки

  • SERP

  • EEAT и качество

Популярные патенты

Как Google (YouTube) ранжирует видео, повышая те, которые начинают сессию просмотра и приводят внешний трафик ("Lead Video")
Google использует систему ранжирования для видеоплатформ, которая идентифицирует "ведущее видео" (Lead Video), инициирующее сессию просмотра. Система применяет повышающие коэффициенты (Scaling Factors) ко времени просмотра этого видео. Видео, привлекшие пользователя на платформу из внешних источников (например, из социальных сетей или поиска Google), получают значительно больший коэффициент, чем те, что были найдены через внутренние рекомендации.
  • US10346417B2
  • 2019-07-09
  • Мультимедиа

  • Поведенческие сигналы

  • SERP

Как Google использует личные данные пользователя (User Model) для понимания его намерений и персонализации выдачи
Google создает персональную модель пользователя (User Model) на основе его личного контента (письма, контакты, документы). Эта модель используется для определения неявного намерения пользователя (личный поиск или общий) и для аннотирования запроса контекстом из личных данных, чтобы предоставить точные персонализированные результаты.
  • US20150012558A1
  • 2015-01-08
  • Персонализация

  • Семантика и интент

  • Поведенческие сигналы

Как Google определяет скрытый интент сессии, используя универсальные уточняющие слова, и переранжирует выдачу
Google идентифицирует универсальные слова-модификаторы (например, «фото», «отзывы», «pdf»), которые пользователи часто добавляют к разным запросам. Если такое слово появляется в сессии, система определяет скрытый интент пользователя. Затем Google переранжирует выдачу, основываясь на том, какие документы исторически предпочитали пользователи с таким же интентом, адаптируя результаты под контекст сессии.
  • US8868548B2
  • 2014-10-21
  • Семантика и интент

  • Поведенческие сигналы

  • Персонализация

Как Google использует визуальные цитаты и обратную связь для генерации и уточнения ответов в мультимодальном поиске
Google генерирует ответы на мультимодальные запросы (изображение + текст), находя визуально похожие изображения в интернете и используя текст с их исходных страниц как основу для LLM. Система показывает эти изображения как «визуальные цитаты» для подтверждения ответа и позволяет пользователям исключать нерелевантные источники, чтобы мгновенно уточнить сгенерированный результат.
  • US20240378236A1
  • 2024-11-14
  • Мультимедиа

  • EEAT и качество

  • Ссылки

Как Google использует интерактивные визуальные цитаты для генерации и уточнения ответов в мультимодальном поиске (SGE/Lens)
Google использует механизм для улучшения точности ответов, генерируемых LLM в ответ на мультимодальные запросы (изображение + текст). Система находит визуально похожие изображения, извлекает текст из их источников и генерирует ответ. Этот ответ сопровождается «визуальными цитатами» (исходными изображениями). Если пользователь видит, что цитата визуально не соответствует запросу, он может её отклонить. Система удалит текст этого источника и перегенерирует ответ, повышая его точность.
  • US20240378237A1
  • 2024-11-14
  • Мультимедиа

  • EEAT и качество

  • Семантика и интент

Как Google идентифицирует и верифицирует локальные бизнесы для показа карт и адресов в органической выдаче
Google использует этот механизм для улучшения органических результатов. Система определяет, связана ли веб-страница с одним конкретным бизнесом. Затем она верифицирует ее локальную значимость, проверяя, ссылаются ли на нее другие топовые результаты по тому же запросу. Если страница верифицирована, Google дополняет стандартную «синюю ссылку» интерактивными локальными данными, такими как адреса и превью карт.
  • US9418156B2
  • 2016-08-16
  • Local SEO

  • SERP

  • Ссылки

Как Google использует данные о выделении текста пользователями (явно или неявно) для генерации сниппетов и анализа контента
Google может собирать данные о том, какие фрагменты текста пользователи выделяют на веб-страницах, используя специальные инструменты или просто выделяя текст мышью. Эти данные агрегируются для определения наиболее важных частей документа. На основе этой "популярности" Google может динамически генерировать поисковые сниппеты, включающие наиболее часто выделяемые фрагменты.
  • US8595619B1
  • 2013-11-26
  • Поведенческие сигналы

  • SERP

Как Google использует поведение пользователей в веб-поиске для динамической категоризации локальных бизнесов
Google динамически формирует категории для бизнесов, основываясь на том, как пользователи ищут их (используемые ключевые слова и клики) в веб-поиске и голосовом поиске. Эти данные формируют иерархическое понимание типов бизнеса. Эта структура затем используется для повышения точности распознавания названий компаний в голосовых запросах.
  • US8041568B2
  • 2011-10-18
  • Local SEO

  • Поведенческие сигналы

  • Семантика и интент

Как Google фильтрует персонализированные предложения запросов на основе контента просматриваемой страницы
Google использует механизм для генерации предложений следующего запроса после того, как пользователь покинул страницу выдачи. Система создает кандидатов на основе истории поиска пользователя, а затем фильтрует их, проверяя релевантность контенту страницы, которую пользователь просматривает в данный момент. Это гарантирует, что предложения соответствуют как интересам пользователя, так и текущему контексту просмотра.
  • US8392435B1
  • 2013-03-05
  • Персонализация

  • Поведенческие сигналы

  • SERP

Как Google использует цепочки запросов и время взаимодействия для определения и ранжирования результатов, которые действительно нужны пользователям
Google анализирует последовательности запросов пользователей (цепочки запросов) и время между кликами и последующими запросами (время взаимодействия), чтобы определить удовлетворенность пользователя. Если пользователи часто переформулируют Запрос А в Запрос Б, прежде чем найти удовлетворительный результат, Google использует эти данные, чтобы ранжировать этот удовлетворительный результат выше по исходному Запросу А и предлагать Запрос Б в качестве связанного поиска.
  • US9342600B1
  • 2016-05-17
  • Поведенческие сигналы

  • Семантика и интент

  • SERP

seohardcore