Google позволяет пользователям явно указывать предпочитаемые сайты (вручную или принимая рекомендации системы). Система использует эти данные для корректировки выдачи: результаты с предпочитаемых сайтов могут повышаться в ранжировании или визуально выделяться. Это механизм явной персонализации, обеспечивающий пользователю контроль над отображением результатов.
Описание
Какую задачу решает
Патент решает проблему ограничений систем неявного (inferred) определения предпочтений пользователя. Системы, основанные на анализе истории и кликов, часто требуют высокой степени уверенности (high confidence measure) для определения предпочтений из-за зашумленности данных. Это может приводить к тому, что некоторые интересующие пользователя сайты никогда не будут определены как предпочитаемые. Изобретение позволяет пользователям напрямую контролировать персонализацию, явно указывая предпочитаемые сайты (Preferred Sites), и улучшает пользовательский опыт, чаще показывая контент с этих ресурсов.
Что запатентовано
Запатентована система для сбора и использования явных (explicit) предпочтений пользователей относительно сайтов. Пользователь может указать предпочитаемый сайт вручную или принять рекомендацию системы, сгенерированную на основе его истории (User Site Data). Эти данные (Site Preference Data) затем используются для корректировки представления результатов поиска, например, путем повышения в ранжировании (promotion) или визуального выделения (highlighting) результатов с этих сайтов.
Как это работает
Система работает в трех основных направлениях:
- Сбор предпочтений: Пользователь указывает предпочитаемые сайты через интерфейс настроек поиска или принимает рекомендации, отображаемые на странице настроек или непосредственно в SERP.
- Генерация рекомендаций: Site Recommendation Engine анализирует User Site Data (историю поиска, клики, закладки, навигацию), рассчитывает Recommendation Score для сайтов-кандидатов и предлагает пользователю добавить их в предпочтения.
- Корректировка выдачи: Во время поиска Search Results Adjusting Engine проверяет, ссылаются ли результаты на сайты из Site Preference Data пользователя. Если да, система может применить Presentation Adjustment — изменить ранжирование результата или его визуальное отображение.
Актуальность для SEO
Средняя. Персонализация остается ключевым направлением развития поиска, однако основной фокус Google сместился в сторону сложных неявных моделей машинного обучения, а не ручного управления настройками. Тем не менее, механизмы явного контроля пользователя над источниками контента (например, подписки в Google Discover или предпочтения новостных изданий) основаны на принципах, описанных в этом патенте.
Важность для SEO
(4/10). Влияние на SEO опосредованное. Патент описывает механизм персонализации, который активируется на финальных этапах ранжирования и зависит от индивидуальных действий и настроек пользователя. SEO-специалист не может напрямую заставить пользователя добавить сайт в Preferred Sites. Однако патент подчеркивает стратегическую важность формирования лояльной аудитории, узнаваемости бренда и стимулирования повторных визитов, что увеличивает вероятность того, что система порекомендует сайт пользователю, а пользователь примет эту рекомендацию.
Детальный разбор
Термины и определения
- Explicitly Identified Site (Явно идентифицированный сайт)
- Сайт, который пользователь либо ввел вручную как предпочитаемый, либо явно принял (explicitly accepts) в ответ на рекомендацию системы.
- Locally Relevant Host (Локально релевантный хост)
- Хост внутри домена, который соответствует географическому положению или языковым предпочтениям пользователя (например, ru.example.com для пользователя из России, предпочитающего example.com).
- Per-site population metrics (Метрики сайта для популяции)
- Агрегированные статистики использования сайта всеми пользователями (например, общий CTR, Long CTR, количество уникальных запросов, ведущих на сайт).
- Per-site user metrics (Метрики сайта для пользователя)
- Статистики использования сайта конкретным пользователем (например, CTR пользователя, Long CTR, частота посещений, время последнего визита).
- Preferred Site (Предпочитаемый сайт)
- Сайт, явно указанный пользователем, результаты с которого имеют право на Presentation Adjustment. Может быть определен как домен, хост, конкретный URL или даже подстрока.
- Presentation Adjustment (Корректировка представления)
- Изменение отображения результата поиска. Включает повышение в ранжировании (promotion), понижение (demotion) или визуальное выделение (highlighting).
- Recommendation Score (Оценка рекомендации)
- Метрика, рассчитываемая для сайтов-кандидатов на основе Per-site user metrics и Per-site population metrics. Определяет вероятность того, что сайт интересен пользователю.
- Search Results Adjusting Engine (Система корректировки результатов поиска)
- Компонент, который сравнивает результаты поиска с Site Preference Data и применяет Presentation Adjustment.
- Site Preference Data (Данные о предпочтениях сайтов)
- Хранилище, содержащее список Preferred Sites для конкретного User Identifier.
- Site Recommendation Engine (Система рекомендаций сайтов)
- Компонент, анализирующий User Site Data для генерации Recommendation Score и предложения сайтов. Также обрабатывает ручной ввод пользователя, включая валидацию и исправление ошибок в URL.
- User Site Data (Данные пользователя о сайтах)
- Все доступные данные, связанные с пользователем и содержащие resource locators (история поиска, клики, история навигации, закладки, подписки). Используются для генерации рекомендаций.
Ключевые утверждения (Анализ Claims)
Claim 1 (Независимый пункт): Описывает механизм отображения предпочитаемых сайтов с визуальным индикатором и условиями локализации.
- Система получает доступ к Site Preference Data пользователя, где сайты были добавлены через явное принятие рекомендации (explicit acceptance) в предыдущей сессии.
- Ключевое условие: Предпочитаемые сайты указаны только по доменному имени (only a domain name).
- Условие корректировки: Presentation Adjustment применяется ТОЛЬКО к тем результатам, которые ссылаются на этот домен И одновременно включают resource locator, ссылающийся на локально релевантный хост (locally relevant host) внутри этого домена (релевантный местоположению пользователя).
- Действие: Предоставление страницы результатов в текущей (второй) сессии.
- Визуальный индикатор: Включение визуального индикатора для результата, ссылающегося на предпочитаемый сайт. Индикатор заключается в отображении текста адреса ресурса в формате, отличном от формата адресов других ресурсов.
Claim 5 (Зависимый от 1): Уточняет, что отличающийся формат текста для отображения адреса — это курсив (italicized text format).
Claim 6 и 7 (Зависимые от 1): Уточняют, как определяется locally relevant host. Он определяется на основе географического местоположения пользователя (Claim 6) или предпочитаемого языка пользователя (Claim 7).
Claim 4 (Зависимый от 1): Описывает процесс, который приводит к созданию Site Preference Data, используемых в Claim 1 (т.е. процесс генерации и принятия рекомендаций).
- Доступ к User Site Data (включая resource locators ресурсов, которые были выбраны хотя бы один раз в предыдущих сессиях).
- Идентификация сайтов-кандидатов путем группировки resource locators по доменным именам и выбора доменного имени как кандидата.
- Идентификация рекомендованного сайта из кандидатов.
- Предоставление рекомендации на странице результатов (которая включает результат, ссылающийся на рекомендованный сайт).
- Генерация Site Preference Data (идентификация рекомендованного сайта как предпочитаемого) в ответ на явное принятие рекомендации пользователем.
Где и как применяется
Изобретение затрагивает несколько этапов поиска, используя данные пользовательской активности для влияния на финальное представление результатов.
QUNDERSTANDING – Понимание Запросов (Офлайн-процессы)
Система периодически анализирует User Site Data (историю поиска, клики, навигацию) в офлайн-режиме. На этом этапе происходит расчет Per-site user metrics, Per-site population metrics, генерация Recommendation Scores и формирование списка рекомендованных сайтов для каждого пользователя.
RANKING – Ранжирование
На этом этапе генерируется стандартный набор результатов поиска без учета явных предпочтений пользователя.
RERANKING – Переранжирование / METASEARCH – Метапоиск и Смешивание
Основное применение патента. Search Results Adjusting Engine получает результаты этапа RANKING, идентифицирует пользователя (User Identifier) и получает доступ к его Site Preference Data. Система сравнивает результаты поиска с предпочитаемыми сайтами и применяет Presentation Adjustment (повышение в ранжировании и/или визуальное выделение) к соответствующим результатам.
Входные данные:
- Исходный набор результатов поиска с Relevance Scores.
- User Identifier.
- Site Preference Data пользователя.
- Данные о локации и языке пользователя (для определения locally relevant hosts).
Выходные данные:
- Скорректированный набор результатов поиска (Adjusted Search Results) с измененным порядком и/или визуальными индикаторами.
На что влияет
- Типы контента и запросы: Влияет на все типы контента и запросов, при условии, что у пользователя есть явные предпочтения для сайтов, релевантных этим запросам. Наиболее заметно влияние на информационные, навигационные и транзакционные запросы, где у пользователя есть устоявшаяся лояльность к определенным брендам, магазинам или источникам информации.
Когда применяется
Алгоритм применяется при выполнении следующих условий:
- Условия активации: Пользователь должен быть идентифицирован системой (например, выполнен вход в аккаунт); у пользователя должны быть сохраненные Site Preference Data; в сгенерированном наборе результатов поиска присутствуют ресурсы, ссылающиеся на эти предпочитаемые сайты.
- Триггеры и Пороги: Применяются правила корректировки. Например, повышение (promotion) может быть применено, только если Relevance Score результата превышает минимальный порог; если не превышен максимальный лимит повышений на одной странице SERP; или если результат не находится слишком высоко в исходном ранжировании.
- Локализация (Claims 1, 6, 7): Если предпочтение указано на уровне домена, корректировка применяется только к результатам с locally relevant hosts (определяемым по языку или географии пользователя).
Пошаговый алгоритм
Процесс А: Генерация Рекомендаций (Офлайн/Периодически)
- Сбор данных: Идентификация User Site Data, связанных с User Identifier (история поиска, клики, закладки, навигация).
- Идентификация кандидатов: Извлечение уникальных сайтов (доменов, хостов) из User Site Data.
- Расчет метрик: Генерация Per-site user metrics и Per-site population metrics для каждого кандидата.
- Скоринг: Генерация Recommendation Score для каждого кандидата на основе рассчитанных метрик (например, с помощью эвристической функции или ML-модели).
- Фильтрация: Фильтрация кандидатов на основе порогового значения Recommendation Score и ограничений по Per-site user metrics (например, сайт должен быть посещен хотя бы раз).
- Выбор рекомендаций: Идентификация оставшихся кандидатов как рекомендованных сайтов.
Процесс Б: Обработка Предпочтений (В реальном времени)
- Получение ввода: Получение явного указания сайта от пользователя (ручной ввод или принятие рекомендации).
- Валидация и разрешение: Проверка корректности ввода. Если ввод некорректен или неоднозначен, система пытается его разрешить (например, исправляет опечатки в URL или определяет навигационный хост для введенного названия бренда).
- Локализация: Если указан только домен, система идентифицирует locally relevant hosts на основе данных пользователя (язык, география).
- Сохранение: Обновление Site Preference Data пользователя.
Процесс В: Корректировка Выдачи (В реальном времени)
- Получение данных: Получение результатов поиска от поисковой системы и идентификация пользователя.
- Доступ к предпочтениям: Загрузка Site Preference Data, связанных с User Identifier.
- Итерация и сравнение: Итерация по результатам поиска. Для каждого результата его resource locator сравнивается с Site Preference Data.
- Проверка совпадения: Проверяется наличие совпадения на разных уровнях: точное совпадение URL, совпадение хоста, совпадение домена, совпадение подстроки.
- Применение правил корректировки: Если найдено совпадение, выполняется соответствующий процесс корректировки. Например, для домена проверяется, является ли хост локально релевантным (Claim 1). Проверяются условия для повышения (порог Relevance Score, лимиты).
- Корректировка (Presentation Adjustment): Применение повышения в ранжировании и/или визуального выделения (например, отображение URL курсивом, добавление пометки «Your Preferred Site»).
- Выдача результатов: Предоставление скорректированного набора результатов пользователю.
Какие данные и как использует
Данные на входе
- Поведенческие факторы (User Site Data): Критически важны для генерации рекомендаций. Включают:
- Историю поиска и кликов (click-through rate, long click-through rate).
- Историю навигации (browser history).
- Закладки (bookmarks) и подписки (subscribed feeds).
- Географические и Пользовательские факторы: Местоположение (geographic location) и предпочитаемый язык (preferred language) пользователя. Используются для определения locally relevant hosts, когда предпочтение задано на уровне домена (Claims 1, 6, 7).
- Контентные/Технические факторы: Структура URL (домен, хост, путь). Используется для валидации ввода и сопоставления результатов с предпочтениями.
- Системные данные: Базовые Relevance Scores результатов поиска. Используются как условие для применения повышения в ранжировании.
Какие метрики используются и как они считаются
- Recommendation Score: Агрегированная оценка для предложения сайтов. Может рассчитываться с помощью эвристической функции, учитывающей метрики интереса, трафика и разнообразия запросов, или с помощью предиктивной модели (например, логистической регрессии), предсказывающей вероятность клика пользователя на сайт.
- Per-site user metrics: Метрики, измеряющие интерес конкретного пользователя к сайту (CTR, Long CTR, частота визитов, время последнего визита).
- Per-site population metrics: Метрики, измеряющие интерес популяции пользователей к сайту (общий CTR, Long CTR, количество уникальных запросов, ведущих на сайт).
- Пороги и условия:
- Recommendation threshold: Минимальный Recommendation Score для включения сайта в список рекомендаций.
- Second recommendation threshold: Порог для определения, где показывать рекомендацию (только в настройках или также в SERP).
- Relevance score threshold: Минимальный Relevance Score, необходимый для того, чтобы результат мог быть повышен в ранжировании.
Выводы
- Явная персонализация как дополнение к неявной: Патент описывает инфраструктуру для явного (explicit) контроля пользователя над персонализацией выдачи. Это дополняет стандартные системы неявного (inferred) определения предпочтений и позволяет системе быть уверенной в интересах пользователя.
- Агрессивность корректировки: Поскольку предпочтения указаны самим пользователем, система может применять более агрессивные корректировки ранжирования (Presentation Adjustment) для этих сайтов по сравнению с сайтами, предпочтения к которым были выведены алгоритмически.
- Критичность локализации предпочтений (International SEO): Система уделяет особое внимание локализации. Согласно Claim 1, если пользователь предпочитает домен (например, «google.com»), система будет отдавать приоритет не всему домену, а только locally relevant hosts (например, «google.ru» или «google.co.uk») в зависимости от языка и географии пользователя.
- Рекомендации на основе комплексного анализа поведения: Система активно предлагает пользователю сайты для добавления в предпочтения. Для этого анализируется не только история поиска, но и вся доступная User Site Data (навигация, закладки), причем метрики пользователя сравниваются с метриками популяции для расчета Recommendation Score.
- Многоуровневость предпочтений: Предпочтения могут быть заданы на разных уровнях (URL, хост, домен, подстрока), и для каждого уровня могут применяться различные правила и строгость корректировки ранжирования.
Практика
Best practices (это мы делаем)
- Формирование лояльности и развитие бренда: Это ключевая стратегия в контексте данного патента. Чем выше лояльность аудитории и узнаваемость бренда, тем больше вероятность, что пользователи добавят сайт в предпочтения (вручную или приняв рекомендацию). Это обеспечивает преимущество в виде повышения позиций в персонализированной выдаче конкретного пользователя.
- Стимулирование повторных визитов и вовлеченности: Необходимо работать над тем, чтобы пользователи возвращались на сайт и активно взаимодействовали с контентом (качественный контент, email-маркетинг, подписки). Высокие показатели per-site user metrics (особенно Long click-through rate) увеличивают Recommendation Score и вероятность того, что система порекомендует ваш сайт пользователю.
- Корректная международная и языковая настройка: Убедитесь, что Google корректно идентифицирует и индексирует локальные версии сайта (будь то разные хосты, поддиректории или домены). Патент явно указывает (Claim 1), что при предпочтении на уровне домена приоритет отдается locally relevant hosts. Правильное использование hreflang и локальных сигналов критично для работы этого механизма.
Worst practices (это делать не надо)
- Игнорирование брендового трафика и лояльности: Фокусировка исключительно на привлечении нового трафика по небрендовым запросам упускает возможность капитализации через механизмы персонализации для лояльной аудитории.
- Попытки манипуляции поведенческими метриками для рекомендаций: Искусственное завышение per-site user metrics (накрутка визитов, CTR) для попадания в рекомендации рискованно. Система рассчитывает Recommendation Score, сравнивая метрики пользователя с метриками популяции и учитывая множество факторов (например, разнообразие запросов), что затрудняет прямую манипуляцию.
Стратегическое значение
Патент подтверждает важность построения долгосрочных отношений с аудиторией и развития бренда как актива. В условиях высокой конкуренции и информационной перегрузки лояльность пользователя становится значимым фактором ранжирования в его персонализированной экосистеме. Это смещает акцент в SEO с разовой технической или контентной оптимизации на комплексное развитие авторитетного и узнаваемого ресурса, на который пользователи хотят возвращаться.
Практические примеры
Сценарий 1: Локализация предпочтений для международного бренда
- Ситуация: Пользователь из Германии часто посещает сайт международного магазина «example.com» и принимает рекомендацию добавить его в Preferred Sites.
- Механизм (Claim 1): Система сохраняет предпочтение на уровне домена «example.com».
- Действие: При следующем поиске система определяет, что пользователь находится в Германии. Она ищет locally relevant host, например, «de.example.com».
- Результат: Результаты с «de.example.com» получат Presentation Adjustment (повышение и/или выделение курсивом), в то время как результаты с «us.example.com» могут быть обработаны стандартно, даже если они присутствуют в выдаче.
Сценарий 2: Повышение лояльности к контентному проекту
- Действие: Контентный сайт активно работает над качеством материалов, UX и стимулирует пользователей подписываться на рассылки и часто возвращаться за обновлениями.
- Механизм: Система фиксирует высокие per-site user metrics (повторные визиты, высокий Long CTR). Recommendation Score для этого сайта у данного пользователя растет.
- Активация: Когда Recommendation Score превышает порог, система предлагает пользователю добавить сайт в Preferred Sites (например, прямо на SERP под сниппетом сайта). Пользователь соглашается.
- Результат: В последующих поисковых сессиях статьи с этого сайта получают повышение в ранжировании для данного пользователя, обеспечивая сайту стабильный приток лояльного трафика.
Вопросы и ответы
Как SEO-специалист может повлиять на добавление сайта в «Preferred Sites» пользователя?
Напрямую повлиять нельзя, так как это требует явного действия пользователя (ввод или принятие рекомендации). Однако можно косвенно увеличить вероятность этого события. Необходимо фокусироваться на повышении узнаваемости бренда и формировании лояльной аудитории. Чем чаще пользователь посещает сайт и чем выше его вовлеченность (высокий Long CTR), тем выше Recommendation Score, и тем вероятнее система предложит пользователю добавить сайт в предпочтения.
Что такое «locally relevant host» и почему это важно для международных сайтов?
Это хост внутри предпочитаемого домена, который соответствует языку или географии пользователя (например, de.brand.com для пользователя из Германии). Это критически важно, потому что патент (Claim 1) указывает: если предпочтение задано на уровне домена, корректировка ранжирования применяется ТОЛЬКО к результатам с локально релевантных хостов. Это подчеркивает необходимость правильной технической настройки мультиязычности и таргетинга (например, через hreflang).
Насколько агрессивно повышаются результаты с предпочитаемых сайтов?
Патент предполагает, что повышение может быть более агрессивным, чем при неявной персонализации, поскольку уверенность в предпочтении максимальна (пользователь указал его сам). Система может повышать результат на фиксированное количество позиций (например, не выше 4-й позиции) или корректировать его Relevance Score, чтобы он занял определенное место. Однако применяются ограничения: результат должен превышать минимальный порог релевантности и может существовать лимит на количество повышенных результатов на странице.
Чем отличаются «явные» (explicit) предпочтения от «неявных» (inferred)?
Явные предпочтения (описанные в патенте) требуют прямого действия пользователя — ввода сайта или нажатия кнопки «Принять рекомендацию». Они дают системе сигнал максимальной уверенности. Неявные предпочтения выводятся алгоритмически на основе анализа поведения (истории поиска, кликов) без прямого подтверждения со стороны пользователя и требуют более высокой степени статистической достоверности для применения.
Какие поведенческие факторы используются для генерации рекомендаций?
Система использует User Site Data, включающие историю поиска, историю навигации, закладки и подписки. Ключевые метрики (per-site user metrics) включают Click-Through Rate (CTR), Long Click-Through Rate (длинные клики, сигнализирующие о вовлеченности), частоту посещений сайта и время с момента последнего посещения. Эти метрики сравниваются с аналогичными метриками популяции пользователей.
Если пользователь указал домен как предпочитаемый, будут ли повышаться все результаты с этого домена?
Не обязательно. Согласно Claim 1, если предпочтение указано только на уровне домена, система применяет корректировку только к результатам, ссылающимся на locally relevant hosts внутри этого домена (определяемые по языку или географии пользователя). Другие результаты с этого домена могут быть визуально выделены (например, курсивом), но не обязательно повышены в ранжировании.
Может ли результат с предпочитаемого сайта быть повышен, если его базовый Relevance Score низкий?
Патент упоминает использование Relevance Score Threshold. Если базовый скор результата ниже этого порога, он, вероятно, не будет повышен, даже если сайт находится в списке предпочтений. Это сделано для предотвращения появления нерелевантных результатов в топе выдачи. Однако такой результат все еще может получить визуальное выделение.
Как система обрабатывает ошибки при ручном вводе предпочитаемого сайта?
Site Recommendation Engine имеет механизмы валидации и разрешения ввода. Система проверяет формат URL/домена/хоста. При ошибках она может использовать сравнение по edit distance для поиска похожих известных сайтов или обработать ввод как навигационный запрос для поиска наиболее вероятного целевого сайта. При высокой уверенности исправление применяется автоматически, при низкой — пользователю предлагается подтвердить вариант.
Влияет ли этот патент на ранжирование для пользователей, которые не вошли в аккаунт?
Нет. Описанный механизм является формой глубокой персонализации и требует наличия User Identifier и связанных с ним Site Preference Data. Для анонимных пользователей или пользователей без сохраненных предпочтений этот механизм корректировки ранжирования не активируется. Ранжирование для них строится на стандартных алгоритмах и, возможно, неявной персонализации на основе сессии.
Как этот механизм связан с Google Discover или функцией «Подписки» (Follow)?
Механизм имеет прямое концептуальное сходство. Функция «Подписки» на сайты или темы в Google (например, в Chrome или Discover) является современной реализацией сбора явных предпочтений пользователя (Explicitly Identified Sites/Topics). Данные, собранные через эти подписки, служат для персонализации контента в Discover и потенциально могут использоваться для корректировки результатов в основном поиске, как описано в патенте.