SEO HARDCORE
  • Разборы патентов
    • Патенты Google
  • Скоро SEO инструменты
  • Скоро SEO аналитика
  • seohardcore
SEO HARDCORE
назад

Как Google использует контекст и анализ офлайн-поведения (Read Ranking) для соединения физических документов с цифровыми копиями

APPLYING SCANNED INFORMATION TO IDENTIFY CONTENT (Применение сканированной информации для идентификации контента)
  • US20110295842A1
  • Google LLC
  • 2011-07-22
  • 2011-12-01
  • Поведенческие сигналы
  • Персонализация
  • Семантика и интент
  • Описание
  • Разбор
  • Выводы
  • Практика
  • FAQ
  • Похожие

Система идентифицирует цифровой контент по сканированному фрагменту из физического мира, используя не только текст, но и обширный контекст (время, местоположение, историю пользователя). Патент также вводит концепцию «Read Ranking» — отслеживание популярности физических документов на основе того, что люди сканируют, как потенциальный сигнал ранжирования.

Описание

Какую проблему решает

Патент решает задачу преодоления разрыва между физическим миром и цифровым контентом. Он описывает инфраструктуру, позволяющую пользователям взаимодействовать с rendered documents (печатными материалами или текстом на экране) и мгновенно находить соответствующий электронный контент или инициировать действия. Ключевая техническая проблема — надежная идентификация документа по короткому, потенциально содержащему ошибки фрагменту, что достигается за счет агрессивного использования контекстных данных.

Что запатентовано

Запатентована система, которая использует информацию, захваченную с rendered document, в сочетании с обширным контекстом (scan context) для идентификации электронного контента. Система позволяет накладывать цифровые слои (markup или modifications) поверх физического контента и отслеживает взаимодействие пользователей с документами для анализа популярности (Read Ranking). Конкретные Claims в этой публикации фокусируются на использовании контекста в запросе и хранении модификаций отдельно от оригинала.

Как это работает

Система функционирует как экосистема для визуального или физического поиска:

  • Захват: Пользователь сканирует (оптически или акустически) фрагмент текста.
  • Сбор контекста: Система собирает контекстные сигналы (время, GPS, история пользователя, окружающая среда, манера сканирования).
  • Формирование запроса: Поисковый запрос формируется на основе распознанного текста И собранного контекста (как указано в Claims).
  • Поиск и Идентификация: Система ищет электронный аналог. Контекст используется для разрешения неоднозначности.
  • Действия и Разметка: После идентификации система извлекает связанный markup (аннотации, рекламу) и предлагает действия. Модификации пользователя хранятся отдельно от контента (как указано в Claims).

Актуальность для SEO

Высокая. Патент описывает фундаментальные принципы, лежащие в основе современных систем визуального поиска, таких как Google Lens. Использование контекста для уточнения запросов и концепция соединения физического взаимодействия с цифровыми действиями являются центральными элементами современных поисковых технологий.

Важность для SEO

Патент имеет значительное стратегическое влияние на SEO (8/10). Хотя он не описывает конкретные алгоритмы веб-ранжирования, он закладывает основу для Visual Search и вводит концепцию Read Ranking (раздел 14.2 патента). Это предполагает, что Google может собирать данные о популярности контента в физическом мире и использовать их как сигнал авторитетности, аналогичный ссылочному графу в вебе. Понимание этой инфраструктуры критично для стратегии омниканального SEO.

Детальный разбор

Термины и определения

Rendered Document (Визуализированный документ)
Документ, воспринимаемый человеком, будь то в печатной форме или на экране (монитор, дисплей). Физический источник информации.
Scanning/Capturing (Сканирование/Захват)
Процесс получения информации из rendered document. Включает оптическое сканирование, фотографирование (например, Google Lens) или аудиозапись чтения текста.
Signature (Сигнатура)
Набор данных, извлеченных из захваченного фрагмента, используемый для идентификации документа. Может включать текст или смещения токенов (offsets).
Context / Scan Context (Контекст сканирования)
Факторы, внешние по отношению к захваченному тексту, которые помогают идентифицировать документ. Включает время, географическое положение, историю пользователя (Life Library), манеру сканирования и сигналы окружающей среды.
Markup (Разметка) / Modifications (Модификации)
Дополнительная функциональность или данные (аннотации, ссылки, реклама), связанные с документом. Рассматривается как «оверлей» (overlay). Согласно Claims, хранится отдельно от контента.
Read Ranking (Ранжирование по чтению)
Концепция определения популярности документов и их суб-регионов на основе анализа агрегированных данных о том, что пользователи сканируют и читают в физическом мире. Аналог PageRank для офлайн-контента.
Life Library (Библиотека жизни)
Цифровой архив всего, что пользователь захватил или прочитал. Используется для персонализации и анализа поведения.
Autocorrelation (Автокорреляция)
Метод генерации сигнатуры путем анализа смещений между повторяющимися токенами в тексте, без необходимости полного OCR.

Ключевые утверждения (Анализ Claims)

Патент US20110295842A1 является дивизионной заявкой (Divisional Application). Его Claims сосредоточены на специфических аспектах системы, хотя общее описание (Specification) охватывает гораздо более широкую экосистему физического поиска.

Claims 1, 14, 19 (Независимые пункты): Описывают метод и систему для хранения модификаций электронного документа, доступ к которому инициирован через оптический захват.

  1. Система получает запрос на контент, содержащий оптически захваченную информацию из rendered document.
  2. Идентифицируется context information, связанная с захватом (включая идентификацию самого документа).
  3. Формулируется поисковый запрос, основанный на захваченной информации И идентифицированном context information.
  4. Запрошенный контент извлекается из репозитория.
  5. Система получает модификации (modifications) этого контента (например, аннотации).
  6. Система сохраняет полученные модификации ОТДЕЛЬНО от запрошенного контента.

Ядро изобретения, защищенное этими Claims, заключается в двух аспектах: (1) Обязательное включение контекста в поисковый запрос при физическом поиске, и (2) Архитектурное решение хранить пользовательские модификации как отдельный слой, не изменяя исходный контент.

Зависимые Claims (например, 2, 11, 16, 20): Детализируют процесс динамического объединения (merging) модификаций с контентом при последующем доступе. Также описывается фильтрация (filtering) модификаций (например, по пользователю или теме) перед объединением.

Где и как применяется

Изобретение описывает полную архитектуру системы для обработки запросов, исходящих из физического мира (Visual/Physical Search).

INDEXING – Индексирование и извлечение признаков
Система предполагает, что индексы могут быть улучшены для поддержки физического поиска (Section 4.1). Это включает:

  • Индексирование информации о существовании и формате бумажной версии документа.
  • Индексирование популярности бумажных документов (Read Ranking), основанное на агрегированной статистике сканирования.

QUNDERSTANDING – Понимание Запросов
Основной этап применения. Захваченные данные интерпретируются как запрос. Критически важным является этап Query Construction и Context Analysis. Система объединяет распознанный текст с обширным контекстом (Scan Context) для формирования точного запроса, что позволяет использовать очень короткие фрагменты.

RANKING – Ранжирование
Поисковая система обрабатывает обогащенный контекстом запрос. При ранжировании могут учитываться факторы, специфичные для физического поиска:

  • Приоритет документам, существующим в бумажной форме.
  • Использование контекста для разрешения неоднозначности (например, местоположение пользователя влияет на выбор релевантного издания).
  • Использование Read Ranking как сигнала ранжирования (Section 14.2).

RERANKING – Переранжирование
Результаты могут переранжироваться на основе недавней истории пользователя. Если текущий скан соответствует документу, который пользователь сканировал недавно, этот документ получит повышение.

Входные данные:

  • Сырые данные захвата (изображение/аудио).
  • Данные с сенсоров устройства: время, GPS, скорость/направление сканирования (Scan Manner), окружающие звуки/изображения (Environment Signals).
  • Данные о пользователе: ID, история сканирования (Life Library), атрибуты, привычки.

Выходные данные:

  • Идентифицированный электронный документ и местоположение в нем.
  • Связанная Markup/Modifications (действия, аннотации, реклама).

На что влияет

  • Типы контента: Влияет на любой контент, имеющий физическое представление: книги, журналы, газеты, каталоги, визитки, меню, вывески, текст на экранах.
  • Специфические запросы: Особенно сильно влияет на локальные запросы (сканирование вывески бизнеса) и коммерческие запросы (сканирование продукта или каталога — P-Commerce).
  • Ниши: E-commerce, издательское дело, образование, локальный бизнес.

Когда применяется

Алгоритмы активируются при получении данных от устройства захвата (сканера, камеры телефона/Google Lens, микрофона). Система постоянно использует контекст для интерпретации этих данных.

Пошаговый алгоритм

Процесс обработки захвата (на основе FIG. 1 и описания):

  1. Захват данных: Получение оптических или аудио данных из rendered document.
  2. Предварительная обработка данных: Улучшение качества сигнала.
  3. Распознавание и извлечение сигнатуры: Преобразование данных в сигнатуру (текст или смещения) с помощью OCR, распознавания речи или Autocorrelation. Может быть итеративным с обратной связью от поисковой системы.
  4. Пост-обработка: Фильтрация вывода распознавания.
  5. Сбор контекста: Параллельный сбор данных Scan Context (время, местоположение, манера сканирования, история пользователя, среда).
  6. Конструирование запроса: Формирование поисковых запросов на основе сигнатуры и контекста (как указано в Claims).
  7. Поиск и контекстный анализ: Идентификация исходного документа и местоположения захвата с использованием индексов и контекста.
  8. Извлечение документа: Извлечение электронного аналога.
  9. Анализ разметки (Markup Analysis): Идентификация связанных модификаций (Modifications) или разметки (Markup).
  10. Объединение и Действия: Объединение контента с модификациями (как указано в Claims) и выполнение действий (отображение, покупка, аннотирование).

Какие данные и как использует

Данные на входе

Патент описывает чрезвычайно широкий спектр входных данных, используемых для идентификации контента и понимания намерений пользователя.

Контентные факторы:

  • Текстовые фрагменты (через OCR или распознавание речи).
  • Символы, логотипы, штрихкоды, иконки.
  • Сигнатуры, основанные на Autocorrelation (смещения токенов).

Технические факторы (Scan Manner):

  • Направление, скорость, ускорение сканирования.
  • Жесты (движения сканера для указания намерений).

Временные факторы:

  • Точное время и дата сканирования.

Географические факторы (Location):

  • Физическое местоположение (GPS, сетевые данные).

Пользовательские факторы (User Context):

  • Идентификация пользователя.
  • История сканирования (Life Library) — недавние сканы и долгосрочные привычки.
  • Недавняя цифровая активность (недавно распечатанные или открытые документы).

Мультимедиа факторы (Environment Signals):

  • Окружающие звуки, разговоры (захваченные микрофоном).
  • Изображения окружающей среды (захваченные камерой).

Какие метрики используются и как они считаются

Патент не приводит формул, но описывает ключевые метрики и концепции для оценки.

  • Read Ranking (Ранжирование по чтению): Метрика популярности физических документов и их частей. Рассчитывается путем агрегации и анализа потока данных (data-stream analysis) от всех пользователей системы: кто, что, когда и где читает (Section 14.2). Используется как сигнал авторитетности.
  • Контекстуальная релевантность: Оценка вероятности совпадения документа на основе агрегации контекстных сигналов. Вероятность повышается, если документ соответствует времени, месту и истории пользователя.
  • OCR/Recognition Confidence: Вероятностные оценки точности распознавания. Система может использовать «неопределенный OCR» (Uncertain OCR).
  • Measure of Sufficiency (Мера достаточности): Определение момента, когда захвачено достаточно информации для уникальной идентификации.

Выводы

  1. Основа Визуального Поиска и критичность Контекста: Патент описывает фундаментальную архитектуру для соединения физического мира с цифровым (например, Google Lens). Ключевым элементом является агрессивное использование Scan Context (время, место, история, среда) для разрешения неоднозначности коротких запросов. Это подтверждает стратегию Google по использованию контекста во всех типах поиска.
  2. «Read Ranking» как потенциальный сигнал ранжирования: Введение концепции Read Ranking (анализ того, что люди читают и сканируют в физическом мире) предполагает, что вовлеченность в реальном мире может рассматриваться как сигнал авторитетности для соответствующего цифрового контента.
  3. Физическое взаимодействие как триггер цифровых действий: Система спроектирована не только для поиска, но и для инициирования действий: коммерции (P-Commerce), аннотирования, перевода. Физический документ становится интерфейсом к цифровым сервисам.
  4. Глубокое отслеживание поведения (Life Library): Система предполагает детальное отслеживание читательских привычек пользователя через Life Library для персонализации, маркетинга и улучшения контекстного понимания.
  5. Архитектура хранения модификаций: Claims патента защищают механизм хранения пользовательских аннотаций (Modifications) отдельно от основного контента, что позволяет создавать динамические и персонализированные слои информации.

Практика

Best practices (это мы делаем)

  • Оптимизация под Visual Search (Google Lens): Обеспечивайте четкое визуальное представление контента. Используйте стандартную типографику и контрастный дизайн как на сайте, так и в любых печатных материалах (PDF, брошюры). Это облегчает распознавание (OCR) и идентификацию вашего контента при сканировании.
  • Обеспечение каноничности и доступности: Убедитесь, что у любого контента, который может существовать в физической форме (например, статьи, распечатанные пользователями, PDF-руководства), есть легко индексируемая и доступная цифровая каноническая версия. PDF должны содержать текстовый слой, а не только изображения.
  • Стимулирование реальной вовлеченности (для Read Ranking): Концепция Read Ranking подчеркивает важность создания контента, который настолько ценен, что пользователи захотят его сохранить, поделиться или взаимодействовать с ним физически (распечатать, цитировать). Это косвенно подтверждает ценность глубины и полезности контента для SEO.
  • Усиление локального контекста (Local SEO): Поскольку местоположение является ключевым контекстным сигналом, для локального бизнеса критично обеспечить соответствие между физическими материалами (меню, вывески, визитки) и цифровой информацией (Google Business Profile, сайт).

Worst practices (это делать не надо)

  • Использование текста в виде изображений без альтернативы: Размещение важной информации только в виде изображений затрудняет её захват и интерпретацию системами визуального поиска.
  • Сложная или нечитаемая типографика: Использование слишком мелких, неконтрастных или декоративных шрифтов может привести к ошибкам OCR и невозможности идентификации контента.
  • Несогласованность онлайн и офлайн контента: Значительные расхождения между печатной и цифровой версиями документа помешают системе установить связь.

Стратегическое значение

Патент подтверждает стратегию Google по индексированию и пониманию не только цифрового мира, но и физической реальности. Для SEO это означает важность омниканального подхода. Авторитетность и популярность бренда или контента в реальном мире (Read Ranking) потенциально могут влиять на цифровую видимость. Система подчеркивает, что любой физический объект или текст может стать точкой входа в поисковую экосистему Google.

Практические примеры

Сценарий 1: Использование Read Ranking для повышения ранжирования исследования

  1. Ситуация: Компания публикует отраслевое исследование и распространяет печатные копии на конференции.
  2. Действие пользователя: Участники конференции читают исследование и используют Google Lens (технологию на базе патента), чтобы сканировать интересные цитаты.
  3. Работа системы: Google идентифицирует источник и регистрирует эти взаимодействия как сигналы для Read Ranking. Система видит всплеск интереса к физической версии документа.
  4. Влияние на SEO: Когда другие пользователи ищут информацию по этой теме в Google, поисковая система может использовать данные Read Ranking как сигнал авторитетности, повышая цифровую версию исследования в выдаче.

Сценарий 2: Оптимизация PDF-каталога для Visual Search

  1. Задача: Обеспечить переход на сайт при сканировании продукта в печатном каталоге.
  2. Действия: Обеспечить четкую типографику в каталоге и точное соответствие текста на сайте тексту в каталоге. PDF-версия каталога должна быть индексируемой.
  3. Результат: При сканировании текста продукта в каталоге система идентифицирует электронную карточку товара и предлагает пользователю перейти на неё (инициируя P-Commerce).

Вопросы и ответы

Что такое «Read Ranking» и почему это важно для SEO?

Read Ranking — это метрика, описанная в патенте (Section 14.2), которая отражает популярность документов на основе анализа того, что пользователи сканируют из физических версий. Это аналог PageRank для офлайн-мира. Для SEO это важно, так как патент указывает, что эти данные могут использоваться для ранжирования результатов поиска. Популярность вашего контента офлайн может стать сигналом для ранжирования онлайн.

Насколько важен контекст (Scan Context) в этом патенте?

Контекст имеет решающее значение. Поскольку захваченные фрагменты часто короткие и могут содержать ошибки OCR, система полагается на Scan Context (время, местоположение, историю пользователя, окружающую среду) для точной идентификации документа. Это позволяет системе понять контекст чтения и соответствующим образом скорректировать результаты поиска.

Как этот патент связан с Google Lens?

Этот патент описывает фундаментальную технологию и инфраструктуру, которые делают возможной работу Google Lens. Он объясняет, как изображение текста преобразуется в поисковый запрос, как используется контекст для его уточнения и как система находит соответствующий цифровой контент. Google Lens — это современная реализация концепций, изложенных в этом патенте.

Как SEO-специалист может оптимизировать контент под эту систему?

Ключевые направления — это оптимизация под Visual Search и обеспечение доступности. Используйте четкую типографику, чтобы облегчить OCR. Убедитесь, что у любого контента, который может быть распечатан (например, PDF), есть индексируемая цифровая каноническая версия с текстовым слоем. Для Local SEO обеспечьте соответствие между физическими материалами и цифровыми данными.

Что такое «Rendered Document»?

Rendered Document — это любой визуализированный документ, который человек может прочитать: печатная страница, текст на экране компьютера, вывеска, этикетка продукта. Для SEO это означает, что Google рассматривает любой физический текст как потенциальную точку входа в поиск.

Патент упоминает хранение модификаций отдельно от контента. Что это значит?

Это архитектурное решение (подчеркнутое в Claims) позволяет Google накладывать дополнительную информацию (аннотации пользователей — Modifications, рекламу, переводы — Markup) поверх исходного контента, не изменяя сам оригинал. Это обеспечивает гибкость в управлении правами доступа и персонализацией.

Что такое «Life Library» и зачем она нужна Google?

Life Library — это архив всего, что пользователь когда-либо сканировал. Для пользователя это удобный архив. Для Google это источник данных о привычках, интересах и поведении пользователя в реальном мире. Эта информация используется для персонализации поиска и уточнения контекста будущих запросов.

Означает ли этот патент, что Google отслеживает все, что я читаю на бумаге?

Система отслеживает только те взаимодействия, которые происходят через активное сканирование контента с помощью совместимого устройства (например, Google Lens). Она не отслеживает чтение пассивно. Однако она собирает данные о том, *что*, *когда* и *где* было отсканировано для формирования Life Library и расчета Read Ranking.

Что такое автокорреляция (Autocorrelation) в этом патенте?

Autocorrelation — это альтернативный метод распознавания текста, который не требует полного OCR. Система анализирует расстояния (смещения) между повторяющимися символами в отсканированном фрагменте. Эта последовательность смещений формирует уникальную сигнатуру, по которой можно найти текст в индексе, что может быть эффективнее традиционного OCR.

Какое значение этот патент имеет для контента в PDF?

Для PDF-контента этот патент критически важен. Чтобы система могла найти PDF по сканированному фрагменту, PDF-файл должен быть проиндексирован Google и содержать текстовый слой, а не только изображения страниц. PDF, состоящие только из сканов, будут недоступны для этой технологии.

Похожие патенты

Как Google использует real-time анализ текста, аудио и изображений для автоматической генерации запросов и проактивного поиска
Система Google для анализа информации, захваченной из различных источников (вводимый текст, изображения документов, аудиопотоки) в реальном времени. Система автоматически распознает контент, выделяет ключевые фрагменты, формирует поисковые запросы и мгновенно предоставляет пользователю релевантный цифровой контент или связанные действия без явных запросов. Это механизм, лежащий в основе технологий визуального (Lens) и голосового поиска.
  • US8990235B2
  • 2015-03-24
  • Семантика и интент

  • Персонализация

  • Мультимедиа

Как Google использует данные о поведении пользователей внутри документов (время чтения разделов, закладки) для улучшения ранжирования
Google может собирать и анализировать данные о том, как пользователи взаимодействуют с электронными документами (например, PDF, DOC, HTML). Система отслеживает, какие разделы или страницы просматриваются дольше всего или добавляются в закладки. Эта агрегированная информация используется для повышения в ранжировании документов, чьи ключевые слова находятся в наиболее используемых (и, следовательно, ценных) разделах.
  • US8005811B2
  • 2011-08-23
  • Поведенческие сигналы

  • SERP

Как Google связывает документы на основе поведения пользователей, времени взаимодействия и контентной близости для персонализации поиска
Google использует систему для определения "меры ассоциации" между различными документами (статьями, веб-страницами, письмами). Ассоциация рассчитывается на основе того, насколько близко по времени пользователь взаимодействовал с этими документами, насколько похож их контент и совпадают ли метаданные (например, автор). Эти связи используются для понимания пути пользователя и персонализации последующих результатов поиска.
  • US8131754B1
  • 2012-03-06
  • Поведенческие сигналы

  • Персонализация

  • Семантика и интент

Как Google анализирует видимый контент на экране пользователя для предоставления контекстной информации без ввода запроса (Contextual Search)
Google использует механизм для анализа контента, активно отображаемого на экране устройства (веб-страницы, приложения, чаты). По общему триггеру (например, долгое нажатие или жест) система идентифицирует ключевые сущности только в видимой области. Она определяет их важность на основе визуального представления (размер, цвет, позиция) и типа контента, причем логика определения важности адаптируется (например, в чате приоритет у недавних сообщений внизу экрана).
  • US11003667B1
  • 2021-05-11
  • Семантика и интент

  • Knowledge Graph

Как Google использует распознавание сущностей в тексте (например, в email) для отображения персонализированного медиаконтента и социальных действий
Google анализирует текст (например, электронные письма) для идентификации медиа-сущностей (фильмов, книг, музыки). Система автоматически отображает связанный контент, ссылки для покупки и персонализированную информацию, включая активность социальных связей пользователя. Это демонстрирует возможности Google в извлечении сущностей из неструктурированного текста и их связи с действиями и социальным графом.
  • US9430447B1
  • 2016-08-30
  • Персонализация

  • Семантика и интент

  • Мультимедиа

Популярные патенты

Как Google использует клики пользователей в Поиске по Картинкам для определения реального содержания изображений
Google использует данные о поведении пользователей для автоматической идентификации содержания изображений. Если пользователи вводят определенный запрос (Идею) и массово кликают на конкретное изображение в результатах поиска, система ассоциирует это изображение с Концептом, производным от запроса. Это позволяет Google понимать, что изображено на картинке, не полагаясь исключительно на метаданные или сложный визуальный анализ, и улучшает релевантность ранжирования в Image Search.
  • US8065611B1
  • 2011-11-22
  • Поведенческие сигналы

  • Семантика и интент

  • Мультимедиа

Как Google использует данные сессий и разнообразие результатов для генерации блока "Связанные запросы"
Google анализирует поисковые сессии пользователей, чтобы найти запросы, которые часто следуют за одним и тем же предшествующим запросом (родственные запросы). Затем система фильтрует эти потенциальные "Связанные запросы", чтобы убедиться, что они предлагают разнообразные результаты по сравнению с исходным запросом и другими предложениями, помогая пользователям исследовать смежные, но отличные темы.
  • US8244749B1
  • 2012-08-14
  • Семантика и интент

  • Персонализация

  • Поведенческие сигналы

Как Google консолидирует сигналы ранжирования между мобильными и десктопными версиями страниц, используя десктопный авторитет для мобильного поиска
Патент Google описывает механизм для решения проблемы недостатка сигналов ранжирования в мобильном вебе. Система идентифицирует корреляцию между мобильной страницей и её десктопным аналогом. Если мобильная версия недостаточно популярна сама по себе, она наследует сигналы ранжирования (например, обратные ссылки и PageRank) от авторитетной десктопной версии, улучшая её позиции в мобильном поиске.
  • US8996514B1
  • 2015-03-31
  • Техническое SEO

  • Ссылки

Как Google использует погоду, время и местоположение для понимания истинного намерения пользователя и адаптации поисковой выдачи
Google анализирует, как физическое окружение (погода, время, местоположение) влияет на то, что ищут пользователи. Система выявляет корреляции между средой и поведением пользователей в прошлом (включая длительность кликов), чтобы лучше понять текущий интент многозначных запросов. Затем она переранжирует выдачу или переписывает запрос для предоставления наиболее релевантных результатов и рекламы.
  • US8898148B1
  • 2014-11-25
  • Семантика и интент

  • Поведенческие сигналы

  • Персонализация

Как Google использует данные о кликах и пропусках для валидации и удаления неэффективных синонимов в поиске
Google постоянно тестирует правила подстановки (синонимы) для расширения запросов. Этот патент описывает механизм оценки эффективности этих правил с помощью анализа поведения пользователей (клики и пропуски результатов). Если пользователи часто пропускают результаты, содержащие подставленный термин, система автоматически удаляет это правило, очищая понимание запросов от нерелевантных синонимов.
  • US8965875B1
  • 2015-02-24
  • Поведенческие сигналы

  • Семантика и интент

  • EEAT и качество

Как Google использует модифицированный PageRank (Personalized PageRank) для персонализации выдачи на основе истории и предпочтений пользователя
Патент Google, описывающий механизм персонализации поиска путем модификации алгоритма PageRank. Система определяет "точку зрения" пользователя (Point-of-View Data) на основе его истории посещений, закладок или указанных категорий. Затем стандартный расчет PageRank изменяется так, чтобы авторитет (Reset Probability) концентрировался только на этих персональных источниках, повышая в выдаче сайты, которые близки к интересам пользователя.
  • US7296016B1
  • 2007-11-13
  • Персонализация

  • Поведенческие сигналы

  • SERP

Как Google использует внутренние ссылки и структуру DOM для генерации шаблонов сайта и извлечения структурированных сниппетов
Google анализирует повторяющиеся блоки внутренних ссылок (например, списки товаров). Если текст возле ссылки на исходной странице совпадает с текстом на целевой странице, Google определяет DOM-структуру этого текста и создает шаблон домена. Этот шаблон позволяет автоматически извлекать ключевую информацию (например, цену и характеристики) для сниппетов со всех однотипных страниц сайта, даже без микроразметки.
  • US9971746B2
  • 2018-05-15
  • Структура сайта

  • SERP

  • Ссылки

Как Google рассчитывает репутационную значимость организаций и людей, используя данные из внешних источников для ранжирования
Google использует систему для оценки репутации и престижа сущностей (например, организаций или людей). Система не полагается только на предоставленные данные, а активно ищет «Дополнительные Аспекты» из внешних источников (например, профессиональные сети, СМИ). На основе этих данных рассчитываются две метрики: «Репутационная Значимость» (престиж относительно аналогов) и «Двустороннее Соответствие» (взаимная привлекательность), которые используются для ранжирования результатов поиска и рекомендаций.
  • US10878048B2
  • 2020-12-29
  • EEAT и качество

  • SERP

  • Knowledge Graph

Как Google фильтрует поведенческие сигналы, используя совместимость языков и стран пользователей
Google уточняет ранжирование, анализируя, откуда (страна) и на каком языке (язык пользователя) поступали исторические клики по документу. Если эти характеристики считаются «несовместимыми» с текущим пользователем, поведенческие сигналы (клики) от этих групп могут быть исключены или понижены в весе. Это предотвращает искажение релевантности данными от кардинально отличающихся аудиторий.
  • US8498974B1
  • 2013-07-30
  • Поведенческие сигналы

  • Мультиязычность

  • Персонализация

Как Google переносит авторитетность бренда и описательные термины между страницами одного сайта для улучшения ранжирования
Google использует механизмы для улучшения релевантности страниц путем переноса сигналов внутри сайта. Система распространяет "авторитетные" термины (например, бренд) с главной страницы на внутренние разделы и, наоборот, поднимает "высокоописательные" термины (например, адреса, категории, уникальные слова) с внутренних страниц на главную. Это позволяет ранжировать наиболее подходящую страницу сайта, даже если нужные ключевые слова на ней отсутствуют.
  • US7933890B2
  • 2011-04-26
  • Структура сайта

  • Техническое SEO

  • Индексация

seohardcore