Патент Google описывает архитектуру для создания и ранжирования пользовательских индексов (Custom Search Index) отдельно от основного веб-поиска. Владельцы контента могут напрямую влиять на ранжирование в своем индексе, используя аннотации (указание относительной важности), а также активируя учет обратной связи пользователей и паттернов использования.
Описание
Какую задачу решает
Патент решает задачу обеспечения релевантного ранжирования для специализированных корпусов контента (Custom Content), где стандартные алгоритмы веб-поиска могут быть неэффективны. Он позволяет адаптировать логику ранжирования к специфике конкретного набора данных (например, корпоративного поиска или тематической вертикали) и предоставляет владельцу этого контента инструменты для влияния на порядок выдачи.
Что запатентовано
Запатентована система, которая разделяет индексирование и ранжирование общего веб-контента и пользовательского контента. Ключевым элементом является Custom Content Ranking System, которая работает независимо от стандартной Web Ranking System. Создатель пользовательского индекса может определять специфические параметры ранжирования (Selected Ranking Parameters), включая использование аннотаций (Annotations), обратной связи (User Feedback) и паттернов использования (Usage Patterns).
Как это работает
Система функционирует следующим образом:
- Сбор и Индексирование: Пользователь загружает или указывает контент, который индексируется в отдельный Custom Search Index.
- Настройка ранжирования: Владелец контента может аннотировать его, указывая относительную важность (indication of relative importance), и выбирать, какие сигналы использовать для ранжирования.
- Обработка запроса: При поиске система использует Custom Content Ranking System, которая применяет выбранные владельцем параметры для сортировки результатов. Например, контент, помеченный как важный или получивший высокие оценки пользователей, будет ранжироваться выше в этом конкретном индексе.
Актуальность для SEO
Средняя. Технология, описанная в патенте (который является продолжением заявок, начиная с 2006 года), лежит в основе продуктов типа Google Custom Search Engine (CSE) / Programmable Search Engine (PSE). Эти продукты актуальны для создания сайт-поиска или вертикальных поисковых решений. Однако описанные механизмы (особенно прямое влияние владельца через аннотации) не применяются в основном поиске Google.com.
Важность для SEO
(3/10). Влияние на общие SEO-стратегии для ранжирования в основном поиске Google минимальное. Патент четко разграничивает системы ранжирования. Он имеет высокое значение только для специалистов, которые занимаются оптимизацией поиска внутри специализированных поисковых систем, созданных на базе технологий Google (CSE/PSE). Не следует экстраполировать описанные механизмы на основной алгоритм Google.
Детальный разбор
Термины и определения
- Annotations (Аннотации)
- Пометки, добавленные создателем индекса к частям Custom Content. Они служат как indication of relative importance (индикатор относительной важности) или ценности контента.
- Custom Content (Пользовательский контент)
- Контент, который был загружен пользователем (например, через API) или указан (designated) пользователем для индексации в отдельном корпусе.
- Custom Content Ranking System (Система ранжирования пользовательского контента)
- Алгоритм, используемый для упорядочивания результатов из Custom Search Index. Использует параметры, которые могут отличаться от Web Ranking System.
- Custom Search Index (Пользовательский поисковый индекс)
- Поисковый индекс, созданный на основе Custom Content. Он отделен от Web Search Index.
- Indication of relative importance (Индикатор относительной важности)
- Сигнал, указывающий на важность ресурса по отношению к другим ресурсам в коллекции. Присваивается пользователем, предоставившим этот контент (создателем индекса).
- Selected Ranking Parameters (Выбранные параметры ранжирования)
- Параметры, которые создатель индекса выбирает для использования при ранжировании. Включают Annotations, Usage Patterns и User Feedback.
- Usage Patterns (Паттерны использования)
- Данные о том, как конечные пользователи взаимодействуют с Custom Content (например, частота доступа, клики на результаты).
- User Feedback (Обратная связь пользователя)
- Явные оценки или рейтинги (например, от «Poor» до «Excellent»), предоставленные конечными пользователями относительно качества контента.
Ключевые утверждения (Анализ Claims)
Claim 1 (Независимый пункт): Описывает основной метод ранжирования в пользовательском поиске.
- Система получает запрос для поиска в коллекции custom content resources. Эти ресурсы предоставлены (exposed) поисковой системе пользователем (создателем индекса).
- Система получает результат поиска из custom search index.
- Система получает indication of relative importance для найденного ресурса.
- Критически важно: этот индикатор важности назначается тем же пользователем, который предоставил контент.
- Система определяет оценку (score) для результата на основе этого индикатора важности.
- Система ранжирует результат, используя эту оценку.
Ядро изобретения — использование субъективной оценки важности контента, предоставленной самим создателем индекса, в качестве прямого сигнала ранжирования внутри этого специализированного индекса.
Claim 3 (Зависимый): Уточняет, что indication of relative importance является аннотацией (annotation) к ресурсу.
Claim 5 (Зависимый): Уточняет, что оценка определяется с использованием user-specified ranking parameters (параметров ранжирования, указанных пользователем), которые включают indication of relative importance.
Claim 8 (Зависимый): Описывает процесс получения от пользователя указания (designation) набора ресурсов, которые должны быть проиндексированы отдельно. Это подтверждает контроль пользователя над границами индексируемого корпуса.
Где и как применяется
Изобретение описывает инфраструктуру для поддержки параллельных поисковых систем (например, Google CSE/PSE).
CRAWLING – Сканирование и Сбор данных
Система собирает Custom Content через Custom Content Upload API или Custom Content Crawler, который обходит ресурсы, указанные создателем индекса.
INDEXING – Индексирование и извлечение признаков
Custom Content Indexer обрабатывает контент и создает Custom Search Index, отдельный от Web Search Index. На этом этапе сохраняются Annotations (индикаторы важности), предоставленные создателем.
RANKING – Ранжирование
Основное применение патента. Custom Content Ranking System используется для сортировки результатов из пользовательского индекса. Она работает независимо от Web Ranking System и использует Selected Ranking Parameters (аннотации, фидбек, данные об использовании) для расчета оценок.
METASEARCH – Метапоиск и Смешивание
Результаты из Custom Search Index могут быть объединены с результатами из Web Search Index для представления пользователю. Патент предполагает, что пользовательские результаты могут быть выделены (displayed prominently).
Входные данные:
- Поисковый запрос.
- Custom Search Index.
- Selected Ranking Parameters (конфигурация от создателя индекса).
- Данные для параметров: Annotations, User Feedback, Usage Patterns.
Выходные данные:
- Ranked Custom Search Results (Отранжированные результаты пользовательского поиска).
На что влияет
- Типы контента и Ниши: Влияет исключительно на ранжирование внутри пользовательских поисковых систем (Google CSE/PSE). Патент не описывает влияния на основной поиск Google. Влияет на любые типы контента, включенные в Custom Search Index (документы, видео, изображения, как указано в Claim 9).
Когда применяется
- Условия работы: Алгоритм применяется, когда пользователь выполняет поиск в системе, которая использует Custom Search Index.
- Триггеры активации: Специфические механизмы ранжирования (например, на основе аннотаций) активируются, если создатель индекса выбрал их в качестве Selected Ranking Parameters и предоставил соответствующие данные.
Пошаговый алгоритм
Процесс А: Подготовка и настройка (Офлайн/Предварительный этап)
- Получение контента: Система получает Custom Content от создателя (загрузка или сканирование).
- Получение настроек: Создатель выбирает Selected Ranking Parameters (использовать аннотации, фидбек и/или паттерны использования).
- Получение аннотаций: Создатель предоставляет Annotations (индикаторы относительной важности) для контента.
- Индексирование: Система создает Custom Search Index, сохраняя контент и аннотации.
- Сбор данных (Продолжающийся): Система собирает User Feedback и отслеживает Usage Patterns.
Процесс Б: Обработка запроса (Онлайн)
- Получение запроса: Система получает запрос от конечного пользователя.
- Поиск в индексе: Выполняется поиск в соответствующем Custom Search Index.
- Получение параметров ранжирования: Система извлекает Selected Ranking Parameters для этого индекса.
- Ранжирование: Custom Content Ranking System ранжирует результаты, используя выбранные параметры:
- Если используются Annotations: результаты с более высокой важностью повышаются.
- Если используется User Feedback: результаты с лучшими оценками повышаются.
- Если используются Usage Patterns: более часто используемые результаты повышаются.
- Предоставление результатов: Отранжированные результаты предоставляются пользователю.
Какие данные и как использует
Данные на входе
Патент фокусируется на факторах, специфичных для пользовательского поиска.
- Факторы, определяемые создателем индекса:
- Annotations (indication of relative importance): Прямое указание важности контента создателем.
- Selected Ranking Parameters: Конфигурация, определяющая, какие факторы использовать.
- Поведенческие факторы (в рамках Custom Index):
- User Feedback: Явные оценки качества контента (например, шкала от «Poor» до «Excellent»).
- Usage Patterns: Данные отслеживания использования (Usage Tracking), например, частота выбора определенных результатов.
Какие метрики используются и как они считаются
Патент не предоставляет формул, но описывает используемые метрики:
- Indication of relative importance: Метрика важности, основанная на Annotations. Используется для определения оценки (score) результата. Ресурсы с более высокой важностью получают более высокую оценку.
- Метрики на основе User Feedback: Агрегированные оценки пользователей. Результаты с более позитивной обратной связью ранжируются выше. Патент также упоминает Feedback Rating — возможность взвешивания обратной связи от разных пользователей по-разному (например, фидбек от пользователя, который постоянно занижает оценки, может иметь меньший вес).
- Метрики на основе Usage Patterns: Статистика использования контента. Более часто используемый контент ранжируется выше.
Выводы
- Разделение инфраструктуры поиска: Патент четко описывает инфраструктуру для разделения процессов ранжирования между основным веб-индексом (Web Search Index) и пользовательскими индексами (Custom Search Index), такими как Google CSE/PSE.
- Контроль над ранжированием для создателей CSE: Ключевым аспектом является возможность создателя индекса напрямую влиять на ранжирование внутри своего поиска. Это достигается через назначение Annotations (относительной важности) и выбор параметров ранжирования.
- Специфические сигналы ранжирования для CSE: Для ранжирования в CSE используются сигналы, которые могут отличаться от основного поиска: явные аннотации создателя, явная обратная связь пользователей (рейтинги) и локальные паттерны использования.
- Отсутствие выводов для общего SEO: Этот патент не содержит практических выводов или инсайтов для оптимизации сайтов под основной поиск Google. Он релевантен исключительно для понимания и управления Google CSE / Programmable Search Engine.
Практика
ВАЖНОЕ ЗАМЕЧАНИЕ: Патент является инфраструктурным и описывает работу пользовательских поисковых систем (Google CSE/PSE). Он не дает практических рекомендаций для SEO в основном поиске Google. Следующие пункты применимы ТОЛЬКО для специалистов, создающих или управляющих Google CSE/PSE.
Best practices (это мы делаем для CSE/PSE)
- Использование Annotations для продвижения ключевого контента: Активно используйте функционал Annotations (через XML-фиды или панель управления PSE) для разметки наиболее важных документов. Это позволит системе использовать эти данные как indication of relative importance и повышать их в выдаче вашего поиска.
- Настройка Selected Ranking Parameters: Определите цели вашего поиска и сконфигурируйте параметры ранжирования соответственно. Решите, что важнее: ваши собственные аннотации или популярность контента среди пользователей (Usage Patterns).
- Тщательный отбор источников (Custom Content): Качество вашего поиска напрямую зависит от корпуса контента. Тщательно отбирайте сайты или разделы, которые вы включаете в Custom Search Index.
Worst practices (это делать не надо)
- Экстраполяция механизмов на основной поиск Google: Ошибочно предполагать, что механизмы, описанные в патенте (например, прямые аннотации важности от владельца сайта), работают в основном веб-поиске Google. Это приведет к неверным стратегическим решениям.
- Игнорирование настроек ранжирования в CSE/PSE: Использование CSE/PSE без применения Annotations или настройки параметров ранжирования приведет к стандартному ранжированию, которое может не соответствовать задачам специализированного поиска.
Стратегическое значение
Патент подтверждает, что Google использует различные механизмы ранжирования для основного поиска и для специализированных поисковых решений. Не следует переносить принципы работы и наблюдения за ранжированием в CSE/PSE на основной поиск Google. Стратегическое значение для общего SEO минимально, но патент фундаментален для понимания работы сайт-поиска на базе технологий Google.
Практические примеры
Сценарий: Оптимизация Google CSE для сайта электронной коммерции
- Задача: Улучшить ранжирование новых и высокомаржинальных товаров в поиске по сайту, реализованном через CSE.
- Применение патента (Использование Annotations): Владелец сайта использует функционал CSE для аннотирования контента. К страницам новых товаров добавляются аннотации (метки/labels) с высоким весом (indication of relative importance).
- Настройка параметров: В настройках CSE активируется и приоритизируется учет этих аннотаций при ранжировании.
- Результат: Когда пользователь ищет товар на сайте, Custom Content Ranking System учитывает аннотации. Новые и высокомаржинальные товары появляются выше в результатах поиска по сайту, реализуя бизнес-логику владельца.
Вопросы и ответы
Описывает ли этот патент, как Google ранжирует сайты в основном поиске (Google.com)?
Нет. Патент описывает исключительно механизмы ранжирования для пользовательских поисковых индексов (Custom Search Index), которые отделены от основного веб-индекса (Web Search Index). Это инфраструктура для продуктов типа Google Custom Search Engine (CSE) или Programmable Search Engine (PSE).
Что такое «Annotations» и кто их создает?
Annotations (Аннотации) — это метки, которые указывают на относительную важность (indication of relative importance) определенной части контента. Их создает тот же пользователь, который предоставил этот контент для индексации (т.е. создатель или администратор CSE).
Могу ли я использовать «Annotations», чтобы сообщить Google, какие страницы моего сайта наиболее важны для основного поиска?
Нет. Механизм Annotations, описанный в патенте, предназначен исключительно для управления ранжированием внутри Custom Search Index. В основном веб-поиске Google не существует механизма, позволяющего владельцу сайта напрямую задавать относительную важность страниц таким способом.
Как создатель CSE может повлиять на ранжирование внутри своего поиска?
Он может повлиять двумя способами. Во-первых, путем предоставления данных через Annotations для повышения или понижения важности контента. Во-вторых, путем выбора параметров ранжирования (Selected Ranking Parameters) — например, указав, что нужно учитывать эти аннотации, обратную связь пользователей или паттерны использования.
Использует ли Google поведенческие факторы (User Feedback, Usage Patterns) согласно этому патенту?
Да, но только в рамках Custom Content Ranking System. Патент описывает, как система собирает явные оценки пользователей (User Feedback) и отслеживает взаимодействие с контентом (Usage Patterns), и использует эти данные для ранжирования в пользовательских индексах, если создатель индекса активировал эти параметры.
Какова практическая польза этого патента для SEO-специалиста?
Практическая польза ограничена оптимизацией поиска на базе Google CSE/PSE. Если вы используете эти технологии для поиска по сайту, патент объясняет, как использовать доступные инструменты (например, аннотации/boosting) для прямого управления и повышения релевантности результатов поиска по вашему контенту.
Что такое «Custom Content» в контексте этого патента?
Custom Content — это контент, который создатель индекса явно предоставил системе для отдельной индексации. Это может быть контент, загруженный напрямую через API, или указание на существующие веб-ресурсы (сайты, домены), которые должны сформировать корпус для специализированного поиска.
Отличается ли алгоритм ранжирования для Custom Search от основного Web Search?
Да, кардинально. Патент описывает, что для пользовательского контента используется Custom Content Ranking System, которая применяет параметры (такие как Annotations от владельца), отличные от тех, что использует Web Ranking System для основного поиска.
Могут ли результаты из Custom Search Index появляться в основной выдаче Google?
Да, патент упоминает возможность смешивания результатов. Результаты пользовательского поиска могут быть смешаны с результатами основного веб-поиска и потенциально отображаться более заметно (displayed prominently). Это может происходить, например, если пользователь подписан на определенный Custom Search Index.
Как работает взвешивание обратной связи (User Feedback)?
Патент упоминает возможность взвешивания обратной связи от разных пользователей (Feedback Rating). Например, если система определяет, что пользователь постоянно предоставляет отзывы, которые значительно более негативны, чем у других, его обратная связь может получить меньший вес при расчете ранжирования.