Патент Google, описывающий механизм создания Sitelinks (быстрых ссылок). Система анализирует поведение пользователей (клики, время на странице) и другие сигналы качества (входящие ссылки, вероятность конверсии), чтобы определить наиболее полезные внутренние страницы сайта. Эти страницы затем показываются под основным результатом поиска, ускоряя навигацию пользователя.
Описание
Какую задачу решает
Патент решает проблему навигационной неэффективности. Часто, переходя по ссылке из результатов поиска (например, на главную страницу), пользователь вынужден совершать дополнительные клики, чтобы найти нужную информацию внутри сайта. Это отнимает время, особенно если навигация на сайте запутана. Изобретение направлено на сокращение этого пути путем предоставления прямых ссылок на ключевые внутренние разделы сайта непосредственно в поисковой выдаче.
Что запатентовано
Запатентована система для автоматического дополнения результатов поиска дополнительными ссылками (известными в SEO как Sitelinks), которые ведут на внутренние страницы того же веб-сайта. Ключевым элементом является механизм выбора этих ссылок на основе Quality Factor (Фактора качества), который рассчитывается с использованием логов поведения пользователей, анализа ссылок и других метрик полезности страниц.
Как это работает
Система работает в два этапа. На первом этапе (офлайн) Log Processing System собирает и анализирует данные о посещениях веб-страниц (клики, время на странице, скроллинг) и другие сигналы (например, количество входящих ссылок). На основе этих данных рассчитывается Quality Factor для внутренних страниц. Для сайтов формируется ранжированный список наиболее качественных или популярных страниц, который сохраняется в Web Site Mapping Storage. На втором этапе (онлайн), при обработке запроса, система генерирует стандартные результаты, а затем Mapping Component проверяет наличие данных в Web Site Mapping Storage и дополняет основной результат топовыми внутренними ссылками.
Актуальность для SEO
Высокая. Хотя оригинальное изобретение датируется 2005 годом (эта публикация является продолжением более ранних заявок), Sitelinks являются фундаментальной частью современной поисковой выдачи Google. Базовая архитектура, описанная в патенте (сбор сигналов, офлайн-расчет, онлайн-дополнение результатов), остается актуальной, хотя методы расчета Quality Factor, вероятно, значительно эволюционировали.
Важность для SEO
Высокое влияние (8/10). Sitelinks критически важны для SEO, особенно для брендовых и навигационных запросов. Они значительно увеличивают занимаемое место в SERP, повышают авторитетность бренда и существенно увеличивают CTR. Понимание того, что их генерация основана на поведенческих факторах и качестве страниц, напрямую влияет на стратегию оптимизации информационной архитектуры, UX и внутренней перелинковки.
Детальный разбор
Термины и определения
- Log Processing System (Система обработки логов)
- Компонент, который собирает, обрабатывает и анализирует данные о поведении пользователей (например, HTTP-запросы, клики) для генерации Web Site Mapping Storage.
- Log Data Storage (Хранилище логов)
- База данных, хранящая информацию о доступе клиентов к веб-страницам, включая количество обращений, время, проведенное на странице, поведение скроллинга, количество входящих ссылок и т.д.
- Quality Factor (Фактор качества)
- Ключевая метрика для ранжирования внутренних страниц в пределах одного веб-сайта. Может основываться на популярности (частоте доступа), времени на странице, количестве входящих ссылок, Information Retrieval Score, вероятности покупки и других показателях полезности страницы.
- Web Site Mapping Storage (Хранилище структуры веб-сайта)
- Хранилище данных, содержащее ранжированные списки внутренних веб-страниц для различных сайтов, отсортированные по Quality Factor. Используется для генерации Sitelinks.
- Mapping Component (Компонент сопоставления)
- Часть поисковой системы, которая получает первичные результаты поиска и дополняет их данными из Web Site Mapping Storage.
- Information Retrieval Score (Оценка информационного поиска)
- Метрика релевантности, показывающая, насколько точно конкретный поисковый запрос соответствует информации на веб-странице. Может использоваться как один из сигналов для Quality Factor.
Ключевые утверждения (Анализ Claims)
Claim 1 (Независимый пункт): Описывает основной метод предоставления расширенных результатов поиска.
- Система получает поисковый запрос от пользователя.
- Генерируются результаты поиска на основе этого запроса.
- Система идентифицирует множество веб-страниц, связанных по крайней мере с одним из этих результатов поиска. Выбор этих страниц основан на Quality Factor.
- Ключевое условие: эти идентифицированные веб-страницы и веб-страница основного результата поиска находятся на одном и том же веб-сайте (same web site).
- Система предоставляет пользователю результаты поиска и множество ссылок (Sitelinks), связанных с идентифицированными веб-страницами.
Ядром изобретения является процесс дополнения стандартного результата поиска дополнительными ссылками, ведущими на другие страницы того же самого веб-сайта. Принципиальным моментом является то, что эти дополнительные ссылки выбираются не случайно, а на основе рассчитанного Quality Factor (фактора качества или полезности) этих страниц.
Где и как применяется
Изобретение затрагивает несколько этапов поиска, используя данные о поведении пользователей и статические сигналы для влияния на финальное отображение SERP.
INDEXING – Индексирование и извлечение признаков (Офлайн-обработка)
Log Processing System работает независимо от обработки конкретного запроса. Он анализирует логи поведения пользователей (Log Data Storage) – частоту кликов, время пребывания, скроллинг – для расчета Quality Factors страниц. Результатом этой офлайн-обработки является генерация и обновление Web Site Mapping Storage. Также на этапе индексирования могут рассчитываться статические сигналы, такие как количество входящих ссылок или Information Retrieval Scores.
RANKING – Ранжирование
Search Component генерирует стандартный набор начальных результатов поиска (initial search results) на основе запроса.
METASEARCH / RERANKING – Метапоиск, Смешивание и Переранжирование
Это основной этап применения патента. Mapping Component получает начальные результаты и обращается к Web Site Mapping Storage. Если для сайта, представленного в результатах, существует предварительно рассчитанный список качественных страниц, компонент дополняет этот результат соответствующими ссылками (Sitelinks). Это процесс формирования SERP Feature.
Входные данные:
- Начальные результаты поиска (Initial search results).
- Web Site Mapping Storage (предварительно рассчитанные ранжированные списки внутренних страниц).
- (Офлайн): Логи пользовательской активности.
Выходные данные:
- Дополненные результаты поиска (Search results with web site mapping information), т.е. SERP, включающая Sitelinks.
На что влияет
- Специфические запросы: Наибольшее влияние оказывается на навигационные и брендовые запросы, где конкретный сайт является доминирующим ответом и намерение пользователя часто заключается в поиске определенного раздела этого сайта (например, запрос [hp] в примере патента).
- Типы сайтов: Влияет на любые сайты (e-commerce, корпоративные, информационные), которые имеют достаточный объем трафика и четкую структуру, позволяющую системе идентифицировать популярные внутренние страницы.
Когда применяется
- Условия применения: Алгоритм применяется, когда результат поиска соответствует веб-сайту, для которого система предварительно сгенерировала и сохранила информацию в Web Site Mapping Storage.
- Триггеры активации: Наличие достаточных данных для расчета надежного Quality Factor для внутренних страниц сайта.
- Ограничения: Система отображает только предопределенное количество ссылок (например, пять или меньше) для каждого результата и может применять Sitelinks только к ограниченному числу топовых результатов.
Пошаговый алгоритм
Процесс А: Офлайн-генерация Web Site Mapping Storage
- Сбор данных о доступе к страницам: Log Processing System непрерывно получает данные о посещенных веб-страницах (например, через HTTP-запросы от тулбара пользователя или клики в SERP).
- Хранение данных: Информация о посещении (URL/гиперссылка) сохраняется в Log Data Storage. Также сохраняется связанный текст (анкорный текст ссылки или заголовок самой страницы).
- Агрегация данных: Система агрегирует данные для каждой страницы. Например, увеличивается счетчик посещений (index value). Также собираются другие метрики (время на странице, скроллинг и т.д.).
- Расчет Quality Factor и Ранжирование: Processing Component анализирует агрегированные данные для всех страниц в пределах одного веб-сайта и генерирует сортированный список страниц на основе Quality Factor (например, по популярности).
- Сохранение структуры: Сортированный список сохраняется в Web Site Mapping Storage, привязанный к соответствующему веб-сайту.
Процесс Б: Обработка запроса и дополнение результатов (Онлайн)
- Получение запроса: Search Engine System получает поисковый запрос.
- Генерация начальных результатов: Search Component генерирует стандартный список релевантных результатов.
- Доступ к хранилищу структуры: Mapping Component получает начальные результаты и обращается к Web Site Mapping Storage.
- Идентификация структурной информации: Система определяет, есть ли для сайтов в начальных результатах сохраненные ранжированные списки внутренних страниц.
- Дополнение результатов: Для найденных соответствий система извлекает предопределенное количество топовых ссылок из списка и добавляет их к основному результату поиска.
- Отправка результатов клиенту: Финальный набор результатов, включающий Sitelinks, отправляется пользователю.
Какие данные и как использует
Данные на входе
Патент перечисляет множество потенциальных источников данных для расчета Quality Factor:
- Поведенческие факторы (Ключевые данные):
- Частота доступа (Clicks): Общее количество раз, когда веб-страница была посещена пользователями (total number of times).
- Время на странице: Количество времени (например, среднее), которое пользователи провели на странице.
- Поведение скроллинга: Информация о том, прокручивал ли пользователь страницу или ушел с нее без прокрутки.
- Вероятность покупки: Вероятность того, что пользователь совершит покупку на странице (на основе логов или данных от владельца сайта).
- Ссылочные факторы:
- Количество входящих ссылок: Количество ссылок (с других веб-страниц), которые указывают на данную страницу.
- Анкорный текст (Anchor text): Текст ссылки, используемый для доступа к веб-странице с другой страницы того же сайта (например, в меню).
- Контентные и Структурные факторы:
- Текст на веб-странице: Текст, расположенный на самой странице (например, заголовок вверху страницы).
- Системные данные:
- Information Retrieval Scores: Оценки релевантности страницы различным запросам.
- Внешние данные (Альтернативная реализация):
- Список предпочтительных страниц: Владельцы сайтов могут предоставить свой собственный список предпочтительных веб-страниц (list of favored web pages).
- Пользовательские факторы (Альтернативная реализация):
- История доступа конкретного пользователя (для персонализации Sitelinks).
Какие метрики используются и как они считаются
- Quality Factor (Фактор качества): Центральная метрика для ранжирования страниц внутри сайта. Патент не предоставляет единой формулы, но указывает, что это может быть любая из перечисленных выше метрик или их комбинация. Quality Factor представляет собой оценку популярности, вероятности использования или полезности страницы.
- Index Value (Счетчик доступа): В одном из описанных вариантов Quality Factor основан непосредственно на количестве посещений страницы. Страницы сортируются по убыванию этого счетчика.
- Предопределенное количество ссылок (Predetermined number): Пороговое значение, определяющее, сколько Sitelinks будет показано в выдаче (например, четыре или пять).
Выводы
- Прогнозирование навигации пользователя: Основная цель системы — предугадать, какие разделы сайта пользователь захочет посетить, и предоставить ему быстрый доступ к ним, минуя промежуточные страницы.
- Sitelinks основаны на «Quality Factor»: Выбор ссылок базируется на Quality Factor. Это не просто анализ структуры меню или XML-карты сайта, а оценка реальной полезности или популярности страниц.
- Ключевая роль данных о поведении пользователей: Патент явно подчеркивает использование логов пользовательской активности (частота кликов, время пребывания, скроллинг, конверсии) как основного источника данных для определения Quality Factor.
- Использование традиционных сигналов: Помимо поведенческих факторов, система может учитывать количество входящих ссылок и Information Retrieval Scores для определения качества страницы.
- Определение текста Sitelinks: Текст, отображаемый в Sitelink, может браться из анкорного текста внутренних ссылок, ведущих на эту страницу, или из заголовка самой страницы.
- Эффективность за счет прекалькуляции: Система использует офлайн-обработку логов для создания Web Site Mapping Storage. Это позволяет быстро дополнять результаты поиска в реальном времени.
- Гибкость и персонализация: Патент предусматривает возможность персонализации Sitelinks на основе истории пользователя и возможность влияния владельцев сайтов (предоставление предпочтительного списка).
Практика
Best practices (это мы делаем)
- Оптимизация информационной архитектуры (IA) и навигации: Структура сайта должна быть четкой и логичной. Это помогает пользователям находить важные страницы, что генерирует поведенческие сигналы (Quality Factors), необходимые для формирования Sitelinks.
- Оптимизация внутренних анкоров: Используйте четкие, краткие и описательные анкоры для ссылок на важные страницы (особенно в основном меню). Патент указывает, что этот текст может быть использован для Sitelink.
- Улучшение вовлеченности на ключевых страницах: Поскольку Quality Factor базируется на частоте доступа, времени на странице и скроллинге, необходимо стимулировать трафик и взаимодействие с ключевыми внутренними страницами. Страницы с высоким вовлечением являются основными кандидатами на попадание в Sitelinks.
- Усиление внутренних ссылок: Увеличение количества внутренних ссылок на ключевые страницы может служить сигналом их важности, так как количество ссылок упомянуто как возможный компонент Quality Factor.
- Обеспечение высокого IR Score: Убедитесь, что важные страницы хорошо оптимизированы под соответствующие запросы (имеют высокий Information Retrieval Score), так как это также может учитываться при расчете Quality Factor.
Worst practices (это делать не надо)
- Запутанная или сложная навигация: Если пользователям трудно найти важные страницы, они не будут генерировать необходимые поведенческие сигналы. Это затрудняет для системы выделение качественных страниц.
- Использование неинформативных анкоров: Использование внутренних анкоров типа «подробнее», «здесь» или изображений без alt-текста для навигации может привести к формированию некачественных текстов в Sitelinks.
- Игнорирование страниц с низким качеством/вовлеченностью: Если страницы имеют низкую вовлеченность (например, быстрый уход без скроллинга), их Quality Factor будет низким, и они не попадут в Sitelinks.
- Скрытие важных страниц глубоко в структуре: Страницы, на которые сложно попасть и которые имеют мало входящих ссылок и низкий трафик, не смогут накопить достаточный Quality Factor.
Стратегическое значение
Этот патент подчеркивает стратегическую важность того, как пользователи реально взаимодействуют с сайтом. Для Google важно обеспечить пользователю быстрый доступ к наиболее полезному контенту на сайте. Это подтверждает, что Информационная Архитектура (IA) и Пользовательский Опыт (UX) являются критически важными компонентами SEO. Сайт, удобный для навигации, с большей вероятностью получит качественные и релевантные Sitelinks.
Практические примеры
Сценарий: Оптимизация Sitelinks для интернет-магазина
Задача: Добиться того, чтобы при поиске по брендовому запросу [Название Магазина] в Sitelinks отображались ключевые категории товаров, а также страницы «Акции» и «Доставка».
- Анализ поведения (На основе патента): Изучить в системах аналитики, какие страницы получают наибольший трафик, имеют лучшее время вовлечения и конверсии (Quality Factor).
- Оптимизация внутренних ссылок и анкоров: Убедиться, что ссылки на эти страницы размещены на видном месте (в главном меню) и имеют четкие анкорные тексты (например, «Акции», а не «Специальные предложения»).
- Стимулирование трафика: Направить внутренний трафик на эти страницы с главной страницы (например, через баннеры или блоки популярных категорий). Это увеличит частоту доступа, которую фиксирует Log Processing System.
- Мониторинг: Отслеживать изменения в Sitelinks в SERP.
- Ожидаемый результат: Система Google пересчитает Web Site Mapping Storage, повысит Quality Factor для целевых страниц, и они начнут отображаться в Sitelinks по брендовому запросу.
Вопросы и ответы
Что такое «Quality Factor» (Фактор качества), упомянутый в патенте, и как он рассчитывается?
Quality Factor — это метрика для оценки и ранжирования внутренних страниц сайта. Патент не дает единой формулы, но перечисляет возможные компоненты: частота посещения страницы пользователями (популярность), время, проведенное на странице, поведение скроллинга, количество входящих ссылок на страницу, Information Retrieval Score и вероятность совершения покупки. Система может использовать один из этих факторов или их комбинацию.
Могу ли я вручную выбрать, какие ссылки будут отображаться как Sitelinks?
Патент описывает автоматизированный процесс. Однако в одном из альтернативных вариантов реализации упоминается, что владельцы веб-сайтов могут предоставить поисковой системе свой список предпочтительных веб-страниц. На практике Google заявляет, что Sitelinks автоматизированы, но оптимизация структуры и внутренних ссылок позволяет косвенно влиять на их выбор.
Что важнее для генерации Sitelinks: данные о поведении пользователей или ссылки?
Патент уделяет значительное внимание Log Processing System и анализу данных о доступе пользователей (популярности) как основному методу определения Quality Factor. Количество входящих ссылок также упоминается как возможный фактор. Исходя из описания, данные о реальном поведении пользователей играют критически важную роль в определении того, какие страницы наиболее полезны.
Что определяет текст, используемый для Sitelink?
Патент предлагает несколько источников. Это может быть анкорный текст (Anchor text) ссылки, используемый на самом сайте для перехода на эту страницу (например, текст пункта меню). Также это может быть текст, расположенный на самой целевой странице, например, ее заголовок. Для SEO это подчеркивает важность использования кратких и точных внутренних анкоров и заголовков.
Анализирует ли эта система структуру сайта, например, файл sitemap.xml?
Патент не упоминает анализ XML-карт сайта. Он фокусируется на анализе того, как пользователи реально перемещаются по сайту (через логи доступа) и какие страницы имеют более высокий Quality Factor. Хотя хорошая структура сайта помогает пользователям (и, следовательно, влияет на логи), система основана на результатах взаимодействия, а не на заявленной структуре.
Что такое «Web Site Mapping Storage»?
Это база данных, которая хранит предварительно рассчитанные результаты анализа качества страниц. Для множества веб-сайтов она содержит ранжированный список их внутренних страниц, отсортированный по Quality Factor. Это позволяет поисковой системе быстро извлекать лучшие Sitelinks во время обработки запроса пользователя.
Если навигация на моем сайте запутана, помешает ли это получению Sitelinks?
Да, это может помешать. Если пользователи не могут легко найти важные страницы, эти страницы не получат достаточного трафика и вовлеченности, чтобы их Quality Factor стал высоким. Четкая навигация является ключевым фактором для генерации качественных Sitelinks.
Являются ли Sitelinks персонализированными?
Да, патент упоминает такую возможность. Система может отслеживать историю посещений конкретного пользователя и ранжировать Sitelinks на основе его предыдущих взаимодействий с сайтом. Это означает, что два разных пользователя могут увидеть разный набор Sitelinks для одного и того же сайта.
Влияют ли внешние ссылки на то, попадет ли страница в Sitelinks?
Да, патент явно упоминает «количество ссылок с других веб-страниц», указывающих на конкретную страницу, как один из возможных факторов для расчета Quality Factor. Авторитетные страницы с сильным внешним (и внутренним) ссылочным профилем имеют больше шансов быть выделенными.
Актуален ли этот патент, учитывая, что оригинальная идея датируется 2005 годом?
Да, патент остается высоко актуальным. Он описывает базовую архитектуру системы генерации Sitelinks. Хотя конкретные методы расчета Quality Factor наверняка стали сложнее и используют машинное обучение, фундаментальные принципы — использование поведенческих сигналов, ссылок и оценок контента для определения лучших внутренних страниц — остаются неизменными.