SEO HARDCORE
  • Разборы патентов
    • Патенты Google
  • Скоро SEO инструменты
  • Скоро SEO аналитика
  • seohardcore
SEO HARDCORE
назад

Как Google агрегирует и отображает исторические тренды для продуктов со сложными атрибутами (например, цены или ставки)

PROVIDING TREND DATA FOR PRODUCT CONTENT (Предоставление данных о трендах для продуктового контента)
  • US20150073871A1
  • Google LLC
  • 2012-03-13
  • 2015-03-12
  • Google Shopping
  • Описание
  • Разбор
  • Выводы
  • Практика
  • FAQ
  • Похожие

Google использует систему для отслеживания изменений характеристик продуктов (цены, ставки по ипотеке) во времени. Система заранее определяет типичные сценарии поиска, периодически собирает данные по ним, агрегирует результаты в статистику (например, средняя цена за день) и сохраняет эту историю. Это позволяет быстро отображать графики трендов, когда пользователь выполняет похожий поиск.

Описание

Какую проблему решает

Патент решает проблему эффективного отслеживания, хранения и быстрого отображения исторических трендов для многозначных наборов данных (multi-valued data sets). Это актуально для результатов поиска по товарам, где атрибуты (например, цены или процентные ставки) предлагаются множеством поставщиков и постоянно меняются. Сложность заключается в том, чтобы сгенерировать однозначный временной тренд из большого объема флуктуирующих данных без необходимости выполнять сложные вычисления в реальном времени при запросе пользователя.

Что запатентовано

Запатентована система для генерации и предоставления данных о трендах (Trend Data) путем предварительного вычисления (pre-computation). Система периодически выполняет набор предопределенных запросов, называемых сценариями (Scenarios), которые репрезентативно охватывают продуктовое пространство. Полученные сырые результаты агрегируются за определенные периоды времени (например, ежедневно вычисляется средняя или лучшая цена). Эти агрегированные значения сохраняются в базе данных для быстрого извлечения.

Как это работает

Система функционирует в два основных этапа: офлайн-обработка и онлайн-обслуживание.

  • Офлайн (Сбор и Агрегация): Система периодически запускает предопределенные Scenarios для сбора сырых данных из источников (Product data sources). Затем эти данные обрабатываются: для каждого сценария и временного периода (например, дня) функция Aggregator вычисляет статистическое значение (среднее, лучшее). Результаты сохраняются как временные ряды (Data Time Series).
  • Онлайн (Обслуживание): Когда пользователь вводит запрос, система сопоставляет его с ближайшим предопределенным Scenario. Она извлекает уже рассчитанные агрегированные данные для этого сценария и отображает их в виде графика тренда.

Актуальность для SEO

Средняя. Базовая концепция предварительного вычисления и агрегации данных для отображения трендов остается крайне актуальной и используется в Google Shopping, Google Flights, Hotel Ads и финансовых вертикалях. Однако это инфраструктурный патент, и конкретная техническая реализация могла эволюционировать с момента подачи заявки.

Важность для SEO

Низкое влияние (2/10). Патент описывает внутреннюю инфраструктуру для обработки и отображения исторических данных в специализированных продуктовых вертикалях, а не алгоритмы ранжирования органической выдачи. Он имеет значение для SEO-специалистов, работающих с E-commerce или агрегаторами, подчеркивая важность точности и структурированности передаваемых продуктовых данных (фиды, микроразметка) для видимости в этих вертикалях.

Детальный разбор

Термины и определения

Aggregator / Accumulator (Агрегатор / Аккумулятор)
Функция или логический блок, который принимает набор значений за определенный период времени и вычисляет одно итоговое агрегированное значение (например, среднее, лучшее). Работает инкрементально.
Attributes (Атрибуты)
Характеристики товара. Примеры в патенте: процентная ставка (Interest Rate), годовая процентная ставка (APR), цена, минимальный депозит.
Data Time Series (Временной ряд данных)
Последовательность агрегированных значений для одного сценария за разные периоды времени (например, средний APR за каждый день).
Multi-valued data sets (Многозначные наборы данных)
Наборы данных, где для одного запроса в один момент времени существует множество результатов с разными значениями атрибутов.
Product Content (Продуктовый контент)
Информация о товарах, включающая их атрибуты. Примеры в патенте: ипотека, кредитные карты, депозитные сертификаты (CDs), автомобили.
Product Data Source (Источник продуктовых данных)
Внешние источники информации о товарах (веб-сайты поставщиков, фиды, API).
Scenario (Сценарий)
Предопределенный набор значений атрибутов запроса (pre-defined set of values for query attributes), используемый для периодического сбора данных. Представляет собой конкретную конфигурацию поиска (например, ипотека на 30 лет, сумма $500k, хороший кредитный рейтинг).
Vertical (Вертикаль)
Конкретный тип продукта или рыночная ниша (например, ипотечные кредиты, E-commerce).

Ключевые утверждения (Анализ Claims)

Claim 1 (Независимый пункт): Описывает компьютерный метод генерации и предоставления данных о трендах.

  1. Периодическое выполнение на сервере набора запросов (set of queries/Scenarios) для продуктового контента. Этот набор запросов включает предопределенные значения атрибутов и обеспечивает репрезентативное представление продуктового пространства.
  2. Получение запроса на сортировку результатов по атрибуту и временным периодам (внутренний этап обработки).
  3. Генерация множества наборов результатов на основе запросов и периодов времени.
  4. Агрегация (Aggregating) набора значений из результатов для каждого запроса в каждый период времени.
  5. Периодическое сохранение каждого агрегированного набора значений в базу данных.
  6. Получение на сервере критериев запроса пользователя (query criteria) и временного диапазона.
  7. Сопоставление (Matching) критериев пользователя с одним из предопределенных запросов (сценариев).
  8. Извлечение из базы данных сохраненного набора значений, соответствующего сопоставленному запросу.
  9. Предоставление данных для отображения (display data) тренда.

Ядро изобретения — это процесс предварительного вычисления (pre-computation) трендов. Система периодически выполняет предопределенные сценарии, агрегирует многозначные результаты в единичные статистические значения за период (например, среднее за день) и сохраняет их. Запрос пользователя затем сопоставляется с этими предварительно вычисленными данными для быстрого отображения тренда.

Где и как применяется

Этот патент описывает инфраструктурный процесс для специализированных продуктовых вертикалей, который затрагивает сбор, обработку и отображение структурированных данных.

CRAWLING – Сканирование и Сбор данных (Data Acquisition)
Система выполняет активный сбор данных путем периодического выполнения предопределенных запросов (Scenarios) к источникам данных (Product data sources). Это не стандартный краулинг веба, а целенаправленный сбор структурированной продуктовой информации (из фидов, API или веб-страниц).

INDEXING – Индексирование и извлечение признаков (Aggregation)
Основная обработка (пре-компьютинг). Система обрабатывает сырые данные, извлекает Attributes и применяет Aggregator для вычисления статистик (среднее, лучшее значение) за определенные периоды времени. Результаты сохраняются в виде временных рядов (Data Time Series) в специализированной базе данных.

QUNDERSTANDING – Понимание Запросов (Scenario Matching)
На этом этапе запрос пользователя интерпретируется и сопоставляется с ближайшим предопределенным Scenario, для которого уже рассчитаны тренды.

METASEARCH – Метапоиск и Смешивание (Serving/Display)
Извлеченные агрегированные данные используются для генерации специализированных блоков на SERP (например, график истории цен в Google Shopping) или в интерфейсе вертикали. Система смешивает эти блоки с другими результатами.

Входные данные:

  • Предопределенные сценарии (Scenarios).
  • Сырые данные из Product data sources (атрибуты продуктов с временными метками).
  • Запрос пользователя.

Выходные данные:

  • Агрегированные временные ряды данных о трендах (Trend Data).
  • График или таблица тренда для пользователя.

На что влияет

  • Конкретные типы контента и Ниши: Влияет исключительно на структурированный продуктовый контент. В патенте детально проиллюстрированы финансовые продукты (ипотека, кредитные карты, депозиты). Также упоминаются автомобили. Актуально для E-commerce, Финансов, Путешествий.
  • Специфические запросы: Информационные и коммерческие запросы, где пользователи заинтересованы в историческом контексте (например, "график цен на товар X", "изменение ставок по ипотеке").
  • Форматы контента: Влияет на генерацию графиков трендов и таблиц сравнения в SERP features.

Когда применяется

  • Офлайн-процесс: Сбор и агрегация данных происходят периодически (например, ежедневно или ежечасно) для обновления базы данных трендов.
  • Онлайн-процесс (Триггеры активации): Активируется, когда пользователь запрашивает отображение тренда или когда поисковая система отображает продуктовый блок, который может быть сопоставлен с предопределенным сценарием.

Пошаговый алгоритм

Процесс А: Офлайн Пре-компьютинг (Сбор и Агрегация)

  1. Определение Сценариев: Формируется набор предопределенных запросов (Scenarios), которые репрезентативно охватывают продуктовое пространство.
  2. Периодический Сбор Данных: Система выполняет эти сценарии, обращаясь к источникам продуктовых данных. Результаты логируются с временными метками.
  3. Сортировка и Извлечение: Собранные сырые данные сортируются по сценарию и хронологически. Извлекаются интересующие числовые атрибуты (например, цена, APR).
  4. Группировка по Времени: Данные группируются по заданным периодам (например, по дням).
  5. Агрегация (Вычисление Статистики): Для каждой группы (Сценарий + Период) применяется Aggregator. Вычисляются статистические показатели (среднее значение, лучшее значение).
  6. Хранение Временных Рядов: Агрегированные значения сохраняются в базе данных, индексируемой по ключу сценария (Row Key), с разной степенью детализации (ежедневно, еженедельно).

Процесс Б: Онлайн Обслуживание (Отображение Трендов)

  1. Получение Запроса Пользователя: Пользователь указывает критерии поиска и временной диапазон.
  2. Сопоставление Сценария: Система находит в базе данных предопределенный сценарий, который наиболее точно соответствует критериям пользователя.
  3. Извлечение Данных: Извлекается соответствующий временной ряд агрегированных данных (Data Time Series).
  4. Визуализация Тренда: Данные используются для построения графика или таблицы тренда.

Какие данные и как использует

Данные на входе

Система использует структурированные продуктовые данные, собранные из внешних источников.

  • Контентные/Структурные факторы (Атрибуты Продукта): Критически важные данные. Система использует количественные атрибуты для расчета трендов (цена, APR, процентная ставка Interest Rate, APY, комиссии Fees) и качественные атрибуты для определения сценариев (местоположение, тип продукта, срок кредита, кредитный рейтинг Credit rating).
  • Временные факторы: Временные метки (timestamps) результатов запросов используются для сортировки данных и определения периодов агрегации.

Другие типичные SEO-факторы (ссылочные, поведенческие) в данном патенте не упоминаются.

Какие метрики используются и как они считаются

  • Метрики: Система вычисляет агрегированные статистики на основе сырых данных за определенные периоды.
    • Mean (Average) (Среднее значение).
    • Best Value (Лучшее значение). Критерий "лучшего" зависит от вертикали: минимум (например, для цены или APR) или максимум (например, для ставки по депозиту).
  • Временные Периоды: Агрегация может выполняться за разные интервалы (Daily, Weekly, Monthly) для оптимизации отображения разных временных диапазонов (Scoping).
  • Методы вычислений: Используется фреймворк агрегации (Aggregator/Accumulator). Он позволяет инкрементально обрабатывать данные. Например, для вычисления среднего Aggregator суммирует значения и ведет их подсчет, а в конце периода делит сумму на количество.

Выводы

  1. Инфраструктурное решение, не алгоритм ранжирования: Патент описывает техническую инфраструктуру для отслеживания исторических трендов в специализированных продуктовых вертикалях (Shopping, Finance, Travel). Он не связан с алгоритмами ранжирования органического веб-поиска.
  2. Зависимость от предварительных вычислений (Pre-computation): Система полагается на офлайн-обработку и агрегацию. Тренды не вычисляются на лету при запросе пользователя; вместо этого Google периодически обрабатывает и сохраняет данные для предопределенных Scenarios.
  3. Обработка многозначных данных (Multi-valued data): Ключевая задача — преобразование множества предложений по одному запросу (например, цены от разных магазинов) в одно статистическое значение (среднее, лучшее) за период времени для построения тренда.
  4. Сопоставление сценариев (Scenario Matching): Для быстрого ответа система сопоставляет запрос пользователя с ближайшим предопределенным сценарием, для которого тренды уже рассчитаны.
  5. Фокус на структурированных данных: Система предназначена для работы с четко структурированными продуктовыми данными и атрибутами (цены, ставки). Это подчеркивает важность фидов данных и микроразметки для видимости в этих вертикалях.

Практика

ВАЖНО: Патент является инфраструктурным и не дает прямых рекомендаций для SEO в органическом поиске. Однако он критически важен для оптимизации в продуктовых вертикалях.

Best practices (это мы делаем)

Для SEO-специалистов, работающих с E-commerce, агрегаторами или поставщиками услуг:

  • Обеспечение точности и полноты структурированных данных: Это критично. Система полагается на сбор структурированных данных (Product Data Acquisition). Убедитесь, что продуктовые фиды (например, Google Merchant Center) и микроразметка Schema.org (Product, Offer) точны, актуальны и полны. Это гарантирует корректное извлечение атрибутов для анализа трендов.
  • Поддержание консистентности идентификаторов: Используйте стабильные идентификаторы продуктов (SKU, GTIN). Если идентификаторы часто меняются, системе будет сложно связать исторические данные с текущим продуктом и корректно отследить тренд.
  • Обеспечение доступности данных: Гарантируйте высокую доступность страниц продуктов и стабильность фидов/API, так как система полагается на периодический сбор данных.

Worst practices (это делать не надо)

  • Предоставление нестабильных или неточных данных: Передача некорректных цен или атрибутов может привести к неправильному расчету трендов и потенциальному исключению из специализированных функций или продуктовых блоков.
  • Использование неструктурированных форматов: Размещение ключевой информации (цены, ставки) в изображениях или сложных скриптах, которые затрудняют извлечение данных.
  • Игнорирование требований к фидам данных: Несоблюдение спецификаций фидов (Shopping, Travel) приведет к тому, что данные не будут собраны и обработаны этой системой.

Стратегическое значение

Патент подтверждает стратегическую важность структурированных данных для продуктово-ориентированного поиска. Google инвестирует в создание собственных баз данных и сервисов сравнения (Shopping, Travel, Finance). Для бизнеса в этих вертикалях фокус на качестве данных, фидах и микроразметке становится не менее важным, чем традиционное SEO, для обеспечения видимости в функциях сравнения и анализа трендов.

Практические примеры

Сценарий: Отслеживание цен в Google Shopping

  1. Определение сценария (Google): Google определяет сценарий для популярного товара (например, "iPhone 15 Pro, 256GB, Черный").
  2. Сбор данных (Google): Система ежедневно собирает цены на этот товар из фидов Merchant Center разных магазинов.
  3. Агрегация (Google): Aggregator обрабатывает все предложения за день и вычисляет статистику: "Средняя цена" и "Лучшая (минимальная) цена".
  4. Хранение (Google): Эти значения сохраняются в базе данных временных рядов для этого сценария.
  5. Отображение (Пользователь): Когда пользователь ищет этот товар, Google извлекает сохраненные данные и отображает график "Динамика цен" (Price insights), показывая историю изменения минимальной цены.
  6. Действие (Оптимизатор): Магазин должен убедиться, что его фид в Merchant Center корректен, актуален и содержит конкурентоспособные цены, чтобы участвовать в этом функционале и фигурировать в статистике.

Вопросы и ответы

Влияет ли этот патент на ранжирование моего сайта в органическом поиске?

Нет. Патент описывает инфраструктуру для сбора, агрегации и отображения исторических трендов в специализированных сервисах (например, Google Shopping или графики цен). Он не затрагивает алгоритмы, определяющие позиции сайтов в стандартной веб-выдаче.

Что такое "Сценарий" (Scenario) в контексте этого патента?

Scenario — это предопределенный поисковый запрос с фиксированным набором атрибутов. Например, "Ипотека на 30 лет, сумма $400k, кредитный рейтинг 720". Система периодически запускает эти сценарии для сбора данных и расчета трендов, вместо того чтобы пытаться рассчитать тренды для любого произвольного запроса пользователя.

Как система обрабатывает ситуацию, когда по одному запросу есть много разных предложений (цен)?

Это ключевая часть патента. Система собирает все предложения (например, цены от 50 разных магазинов) за определенный период (например, за день). Затем используется Aggregator, который вычисляет одно статистическое значение из этого набора — например, среднюю цену или лучшую (минимальную) цену за этот день.

Происходит ли вычисление трендов в реальном времени?

Нет. Патент подчеркивает, что сбор данных и агрегация происходят офлайн (пре-компьютинг) периодически. В реальном времени происходит только сопоставление запроса пользователя с уже вычисленными и сохраненными данными трендов. Это обеспечивает высокую скорость ответа.

Для каких типов сайтов этот патент наиболее актуален?

Он актуален для поставщиков структурированных продуктовых данных (E-commerce, банки, автодилеры, сайты путешествий) и агрегаторов. Для них важно предоставлять качественные данные (фиды, микроразметка), чтобы Google мог корректно отслеживать историю их продуктов и включать их в сервисы сравнения.

Что означает "Лучшее значение" (Best Value) при агрегации?

Это наиболее выгодное для пользователя значение атрибута за период. "Лучшее" зависит от контекста: для цены товара или ставки по ипотеке это минимальное значение, а для ставки по депозиту — максимальное. Система настраивается для каждой вертикали.

Может ли система показать тренд для любого произвольного запроса пользователя?

Система старается найти ближайший предопределенный Scenario, для которого данные уже рассчитаны. Если пользователь вводит очень специфический или редкий запрос, система сопоставит его с наиболее похожим стандартным сценарием, или данные о трендах могут быть не показаны.

Какие данные собирает эта система?

Система собирает числовые атрибуты продуктов. В патенте приведены примеры финансовых данных: APR, Interest Rate, APY, комиссии. Также это применимо к ценам на товары, авиабилеты, отели.

Как этот патент связан с Google Shopping или Google Flights?

Эта технология является основой для функций отслеживания цен в этих сервисах. Графики истории цен на товары в Google Shopping или анализ стоимости авиабилетов в Google Flights строятся с использованием описанного механизма сбора, агрегации и хранения исторических данных по предопределенным сценариям.

Есть ли польза от этого патента для контентных сайтов (блогов, новостей)?

Для стандартных контентных сайтов этот патент не имеет практической ценности, так как он сфокусирован исключительно на обработке структурированных продуктовых данных и их числовых атрибутов.

Похожие патенты

Как Google автоматически определяет и проверяет атрибуты, бренды и категории товаров, анализируя веб-контент и поведение пользователей
Google использует систему для автоматического извлечения и проверки «Структурных параметров» (бренды, атрибуты, категории, линейки продуктов) из неструктурированного веб-контента и логов запросов. Система валидирует классификацию с помощью анализа контекстуального сходства, целевого краулинга (поиск фраз типа «X является Y») и анализа распределения кликов. Это позволяет стандартизировать данные о товарах от разных продавцов и формировать структурированную E-commerce выдачу.
  • US9171088B2
  • 2015-10-27
  • Индексация

  • Краулинг

  • Семантика и интент

Как Google использует агрегированные поведенческие данные для маркировки результатов поиска и подсказок индикаторами ожидаемых действий
Google анализирует агрегированные данные о том, что пользователи делают после клика по результату поиска или подсказке (например, покупка, сохранение, бронирование). Если определенное действие статистически значимо для конкретного результата, Google добавляет к нему визуальный индикатор (значок или бейдж), чтобы помочь другим пользователям понять вероятный исход клика.
  • US11132406B2
  • 2021-09-28
  • Поведенческие сигналы

  • SERP

Как Google использует анализ затрат и выгод, чтобы решить, когда показывать графики временных рядов в результатах поиска
Google не всегда генерирует графики и таблицы данных (временные ряды) в ответ на запрос. Система сначала оценивает затраты на сбор и обработку этих данных (нагрузка на сервер, задержка) и сравнивает их с ожидаемой выгодой для пользователя (вероятность клика, качество данных). Визуализация генерируется, только если выгода превышает затраты.
  • US8326836B1
  • 2012-12-04
  • SERP

  • Семантика и интент

  • Поведенческие сигналы

Как Google агрегирует поведенческие данные из похожих запросов для ранжирования редких и длиннохвостых запросов
Google использует механизм обобщения запросов для улучшения ранжирования, особенно когда исторических данных по исходному запросу недостаточно. Система создает варианты запроса (удаляя стоп-слова, используя синонимы, стемминг или частичное совпадение) и агрегирует данные о поведении пользователей (клики, dwell time) из этих вариантов. Это позволяет оценить качество документа для исходного запроса, используя статистику из семантически близких запросов.
  • US9110975B1
  • 2015-08-18
  • Поведенческие сигналы

  • Семантика и интент

  • SERP

Как Google комбинирует временные тренды и контекстуальный анализ для определения схожести поисковых запросов
Google использует систему машинного обучения для определения схожести между запросами путем объединения разнородных сигналов. Система анализирует как временные паттерны использования терминов в разных источниках (Temporal Correlation), так и контекст, в котором термины появляются в интернете (Distributional Similarity). Комбинация этих данных позволяет генерировать более точные поисковые подсказки и связанные запросы.
  • US8478699B1
  • 2013-07-02
  • Семантика и интент

Популярные патенты

Как Google создает и использует базу «идеальных» ответов (Canonical Content Items) для ответов на вопросы пользователей
Google использует систему для идентификации и создания «канонических элементов контента» — образцовых объяснений тем, часто в формате вопрос-ответ. Система анализирует огромные массивы существующего контента, кластеризует похожие вопросы и ответы и выбирает или синтезирует идеальную версию. Когда пользователь задает вопрос, система сопоставляет его с этой базой данных, чтобы мгновенно предоставить высококачественный, модельный ответ.
  • US9396263B1
  • 2016-07-19
  • Семантика и интент

  • EEAT и качество

Как Google использует анкорный текст входящих ссылок для определения синонимов и псевдонимов сущностей в Knowledge Graph
Google автоматически определяет синонимы и псевдонимы для сущностей (например, людей, компаний) в своем хранилище фактов (Knowledge Graph). Система анализирует анкорный текст ссылок, ведущих на исходные документы, из которых были извлечены факты о сущности. Это позволяет системе понять, что, например, "Биг Блю" и "IBM" относятся к одной и той же компании.
  • US8738643B1
  • 2014-05-27
  • Knowledge Graph

  • Семантика и интент

  • Ссылки

Как Google использует историю запросов в текущей сессии и статистические паттерны для переранжирования результатов
Google анализирует миллионы прошлых поисковых сессий, выявляя статистически значимые последовательности запросов («Пути Запросов»), которые заканчиваются кликом на определенный URL («Конечная Точка Контента»). Когда текущая сессия пользователя совпадает с историческим путем, Google переранжирует результаты, повышая те URL, которые исторически удовлетворяли пользователей в аналогичном контексте, пропорционально вероятности их выбора.
  • US7610282B1
  • 2009-10-27
  • Поведенческие сигналы

  • SERP

  • Семантика и интент

Как Google использует пользовательский контент (UGC) и историю поиска для сбора структурированных отзывов
Google анализирует пользовательский контент (фотографии, посты, метаданные) и историю поиска, чтобы определить, с какими объектами (места, продукты, услуги) взаимодействовал пользователь. Система проактивно предлагает оставить структурированный отзыв, используя шаблон, который может быть предварительно заполнен на основе тональности исходного UGC. Это направлено на увеличение объема и подлинности отзывов.
  • US20190278836A1
  • 2019-09-12
  • Семантика и интент

  • Персонализация

  • EEAT и качество

Как Google использует исторические данные о документах, ссылках и поведении пользователей для определения свежести, качества и борьбы со спамом
Фундаментальный патент Google, описывающий использование временных рядов данных для ранжирования. Система анализирует историю документа (дату создания, частоту и объем обновлений), историю ссылок (скорость появления, возраст, изменения анкоров), тренды запросов и поведение пользователей. Эти данные используются для определения свежести контента, выявления неестественной активности (спама) и оценки легитимности домена.
  • US7346839B2
  • 2008-03-18
  • Свежесть контента

  • Антиспам

  • Ссылки

Как Google определяет свежесть документа, анализируя возраст ссылающихся страниц и динамику появления ссылок (Link Velocity)
Google использует методы для оценки свежести документа, когда дата его обновления неизвестна или ненадежна. Система анализирует даты обновления страниц, которые ссылаются на документ, а также историю появления и удаления этих ссылок (Link Velocity). Если на документ ссылаются недавно обновленные страницы или количество ссылок растет, он считается свежим.
  • US7797316B2
  • 2010-09-14
  • Свежесть контента

  • Ссылки

  • Техническое SEO

Как Google масштабирует расчет кратчайших путей в графе ссылок от авторитетных сайтов («Seed Nodes»)
Патент описывает инфраструктуру Google для распределенного вычисления кратчайших путей в огромных графах, таких как веб-граф. Система позволяет эффективно и отказоустойчиво рассчитывать расстояние от любого узла до ближайших авторитетных «Seed Nodes». Это foundational технология, которая делает возможным применение алгоритмов ранжирования, основанных на анализе ссылочного графа и распространении авторитетности (например, типа TrustRank) в масштабах всего интернета.
  • US8825646B1
  • 2014-09-02
  • Ссылки

Как Google автоматически превращает текст на странице в ссылки на результаты поиска для монетизации контента
Патент Google описывает технологию автоматического анализа контента веб-страницы для выявления ключевых тем и терминов. Система генерирует релевантные поисковые запросы и динамически встраивает гиперссылки в текст страницы. При клике пользователь перенаправляется на страницу результатов поиска (SERP). Ключевая особенность: система приоритизирует термины с высоким потенциалом дохода от рекламы.
  • US7788245B1
  • 2010-08-31
  • Ссылки

  • SERP

  • Семантика и интент

Как Google использует социальные связи для обнаружения ссылочного спама и накрутки кликов
Google может анализировать связи между владельцами сайтов в социальных сетях, чтобы оценить независимость ссылок между их ресурсами. Если владельцы тесно связаны (например, друзья), ссылки между их сайтами могут получить меньший вес в ранжировании, а клики по рекламе могут быть классифицированы как спам (накрутка).
  • US8060405B1
  • 2011-11-15
  • Антиспам

  • Ссылки

  • SERP

Как Google запоминает прошлые уточнения поиска пользователя и автоматически перенаправляет его к конечному результату
Google использует механизм персонализации, который отслеживает, как пользователи уточняют свои поисковые запросы. Если пользователь часто вводит общий запрос, а затем выполняет ряд действий (например, меняет запрос или взаимодействует с картой), чтобы добраться до конкретного результата, система запоминает эту последовательность. В будущем, при вводе того же общего запроса, Google может сразу показать конечный результат, минуя промежуточные шаги.
  • US9305102B2
  • 2016-04-05
  • Персонализация

  • Поведенческие сигналы

seohardcore