SEO HARDCORE
  • Разборы патентов
    • Патенты Google
  • Скоро SEO инструменты
  • Скоро SEO аналитика
  • seohardcore
SEO HARDCORE
назад

Как Google синтезирует сниппеты, объединяя заголовки высококачественных внутренних страниц сайта (Sitelinks)

SYNTHESIS OF WEBPAGE SNIPPETS USING SUB-PAGES OF THE WEBPAGE (Синтез сниппетов веб-страниц с использованием подстраниц этой веб-страницы)
  • US9158849B2
  • Google LLC
  • 2013-02-19
  • 2015-10-13
  • SERP
  • Структура сайта
  • Техническое SEO
  • Описание
  • Разбор
  • Выводы
  • Практика
  • FAQ
  • Похожие

Google может заменить стандартный сниппет веб-страницы на «синтезированный сниппет», созданный путем объединения заголовков её наиболее важных подстраниц (например, тех, что попадают в Sitelinks). Это происходит, когда стандартный сниппет неинформативен, позволяя пользователю лучше понять структуру и содержание сайта прямо в выдаче.

Описание

Какую проблему решает

Патент решает проблему неинформативных или слишком общих стандартных сниппетов (Normal Snippet), особенно для главных страниц сайтов или крупных разделов (хабов). Часто текст на таких страницах не дает четкого представления о содержании или структуре сайта. Изобретение предлагает механизм для автоматического создания более полезного сниппета, который описывает ключевые разделы ресурса, улучшая пользовательский опыт в SERP.

Что запатентовано

Запатентована система генерации «синтезированных сниппетов» (Synthesized Snippet) для веб-страницы. Суть изобретения заключается в идентификации ключевых «подстраниц» (Sub-pages) основной страницы, извлечении их заголовков (Titles) и последующем объединении (конкатенации) этих заголовков для формирования нового сниппета. Этот механизм часто использует данные, подготовленные для быстрых ссылок (Shortcut Links или Sitelinks).

Как это работает

Система работает в несколько этапов:

  • Идентификация подстраниц: Определяются Sub-pages для основной страницы на основе анализа структуры ссылок, иерархии сайта или URL.
  • Фильтрация и отбор: Не все подстраницы используются. Система отбирает кандидатов на основе строгих критериев: мера качества (Measure of Quality) подстраницы, длина её заголовка (предпочтение отдается коротким), отсутствие определенных символов (например, запятых, тире) в заголовке и наличие прямой ссылки с основной страницы.
  • Генерация сниппета: Заголовки отобранных подстраниц объединяются в единую строку (Synthesized Snippet), часто в порядке их важности или качества.
  • Выбор лучшего сниппета: Система сравнивает Synthesized Snippet со стандартным Normal Snippet (или Meta Description) и выбирает тот, который имеет более высокую оценку качества и информативности для отображения в SERP.

Актуальность для SEO

Высокая. Описанный механизм активно используется в Google Search. Мы регулярно наблюдаем сниппеты, состоящие из списка основных категорий сайта, особенно по навигационным запросам. Также этот механизм используется для генерации описаний под самими Sitelinks (как показано на FIG. 8 патента).

Важность для SEO

Патент имеет высокое значение (8/10) для SEO. Он напрямую влияет на представление сайта в SERP и, следовательно, на CTR. Патент подчеркивает критическую важность продуманной информационной архитектуры (IA), качества внутренних страниц и технической гигиены заголовков (Titles) разделов сайта. Понимание этих механизмов позволяет оптимизировать структуру и контент для получения максимально информативных и привлекательных сниппетов.

Детальный разбор

Термины и определения

Measure of Quality (Мера качества)
Метрика, используемая для оценки подстраницы. Может включать независимую от запроса оценку качества (query-independent quality score) или данные о пользовательском трафике (user traffic).
Normal Snippet (Обычный сниппет)
Стандартный сниппет, сгенерированный на основе текста самой веб-страницы, часто включающий термины из поискового запроса, или текст из Meta Description.
Shortcut Link (Быстрая ссылка / Sitelink)
Ссылки на внутренние страницы сайта, отображаемые под основным результатом поиска. Часто являются источником данных (Sub-pages) для синтеза сниппетов.
Sub-page (Подстраница)
Страница, которая находится ниже в иерархии сайта относительно основной страницы или напрямую связана с ней. Определяется через анализ ссылок, URL или хлебных крошек (breadcrumbs).
Synthesized Snippet (Синтезированный сниппет)
Сниппет, сгенерированный путем объединения (синтеза) текста, взятого из подстраниц основной веб-страницы, в частности, из их заголовков (Titles).
Website Hierarchy (Иерархия сайта)
Структура организации страниц на сайте, используемая для определения отношений родитель-потомок.

Ключевые утверждения (Анализ Claims)

Claim 1 (Независимый пункт): Описывает базовый метод генерации сниппета.

  1. Система идентифицирует подстраницы (Sub-pages) для основной веб-страницы (на том же сайте).
  2. Определяются заголовки (Titles) этих подстраниц.
  3. Происходит отбор набора подстраниц для генерации сниппета. Каждая отобранная страница должна удовлетворять определенным критериям.
  4. Ключевой критерий отбора: заголовок подстраницы НЕ должен содержать один или несколько определенных символов (lacking one or more particular characters).
  5. Сниппет генерируется с использованием заголовков отобранного набора подстраниц.
  6. Сгенерированный сниппет сохраняется и используется в результатах поиска.

Claim 2 (Зависимый от 1): Добавляет критерий отбора.

Подстраница отбирается, если на неё есть ссылка с основной веб-страницы.

Claim 3 (Зависимый от 1): Добавляет критерий качества.

Определяется Measure of Quality подстраницы. Подстраница отбирается, если эта мера качества превышает порог.

Claim 4 (Зависимый от 1): Добавляет критерий длины заголовка.

Определяется длина заголовка подстраницы. Подстраница отбирается, если длина заголовка удовлетворяет пороговому значению (т.е. достаточно короткая).

Claim 5 (Зависимый от 1): Уточняет критерий символов (из Claim 1).

Определенные символы, которых не должно быть в заголовке, включают запятую, тире или точку.

Claim 6 (Зависимый от 1): Добавляет критерий общей длины.

При отборе проверяется, что общая длина заголовка текущей подстраницы в сумме с длиной уже отобранных заголовков не превышает общий порог для сниппета.

Claim 7 (Зависимый от 1): Уточняет метод генерации.

Генерация сниппета происходит путем конкатенации (объединения) заголовков отобранных подстраниц.

Где и как применяется

Изобретение применяется на нескольких этапах поисковой архитектуры.

INDEXING – Индексирование и извлечение признаков
На этом этапе система анализирует структуру сайта (Website Hierarchy), структуру ссылок и URL для идентификации потенциальных Sub-pages и Shortcut Links. Также на этом этапе рассчитываются Measure of Quality для этих подстраниц и извлекаются их заголовки (Titles).

RANKING / RERANKING – Ранжирование и Переранжирование
После того как набор результатов сформирован, система генерирует сниппеты для отображения. Это основной этап применения патента:

  1. Генерация кандидатов: Для страницы генерируется Normal Snippet (из контента или Meta Description) и предпринимается попытка сгенерировать Synthesized Snippet по описанному алгоритму (фильтрация подстраниц по качеству, длине заголовков и т.д.).
  2. Оценка и Выбор: Система оценивает качество всех доступных вариантов сниппетов.
  3. Отображение: Выбирается сниппет с наивысшей оценкой качества для включения в финальную выдачу (SERP).

Входные данные:

  • Структура ссылок и иерархия сайта.
  • Список потенциальных Sub-pages (например, Sitelinks).
  • Заголовки (Titles) для каждой Sub-page.
  • Оценки качества (Measure of Quality) для каждой Sub-page.
  • Контент или Meta Description основной страницы (для Normal Snippet).

Выходные данные:

  • Выбранный сниппет (Синтезированный или Обычный) для отображения в SERP.

На что влияет

  • Конкретные типы контента: Наибольшее влияние оказывается на страницы с четкой структурой подчиненных элементов — главные страницы сайтов, страницы категорий, крупные хабовые страницы.
  • Специфические запросы: Особенно сильно влияет на навигационные и брендовые запросы, где цель пользователя — понять общую структуру сайта.
  • Форматы контента: Может применяться к лонгридам, если они имеют четкую внутреннюю структуру (например, оглавление с анкорными ссылками), которая может быть интерпретирована как Sub-pages.

Когда применяется

Алгоритм генерации синтезированного сниппета активируется при наличии следующих условий:

  • Наличие подстраниц: Для основной страницы идентифицировано достаточное количество Sub-pages (например, определены Sitelinks).
  • Качество подстраниц: Существует набор подстраниц, удовлетворяющих строгим критериям отбора (высокое качество, подходящие заголовки).
  • Сравнение сниппетов: Алгоритм применяется в выдаче (т.е. отображается пользователю), только если итоговый Synthesized Snippet оценивается выше, чем Normal Snippet или Meta Description. Если Meta Description качественный, он может иметь приоритет.

Пошаговый алгоритм

Процесс А: Генерация Синтезированного Сниппета (Офлайн или Онлайн)

  1. Определение подстраниц: Идентифицировать список кандидатов в Sub-pages для основной страницы (например, на основе структуры ссылок, URL, Sitelinks).
  2. Получение данных: Для каждого кандидата получить его Заголовок (Title) и Меру Качества (Measure of Quality).
  3. Ранжирование кандидатов: Отсортировать список кандидатов, например, по убыванию Measure of Quality.
  4. Итеративный отбор и фильтрация: Обработать кандидатов последовательно, проверяя соответствие критериям:
    • Есть ли прямая ссылка с основной страницы на подстраницу? (Критерий 1)
    • Превышает ли Measure of Quality подстраницы порог? (Критерий 2)
    • Меньше ли длина заголовка порога (например, 20-30 символов)? (Критерий 3)
    • Отсутствуют ли в заголовке запрещенные символы (запятые, тире, точки)? (Критерий 4)
    • Не превысит ли добавление этого заголовка общую максимальную длину сниппета? (Критерий 5)
  5. Конкатенация: Если кандидат удовлетворяет всем критериям, его заголовок добавляется к Synthesized Snippet.
  6. Завершение: Процесс продолжается до достижения максимальной длины сниппета или окончания списка кандидатов.

Процесс Б: Использование в Поиске (Онлайн)

  1. Получение запроса и результатов: Система идентифицирует релевантные страницы.
  2. Получение вариантов сниппетов: Для каждой страницы извлекается/генерируется Normal Snippet (из контента/Meta Description) и Synthesized Snippet (из Процесса А).
  3. Оценка качества сниппетов: Рассчитывается оценка качества для каждого варианта. Оценка Synthesized Snippet может зависеть от количества использованных подстраниц и их качества.
  4. Выбор лучшего варианта: Выбирается сниппет с наивысшей оценкой. В патенте отмечается, что сниппеты типа «meta» (Meta Description) могут получать преимущество.
  5. Генерация SERP: Выбранный сниппет включается в результат поиска. Это может быть как сниппет основного результата, так и сниппеты под Sitelinks.

Какие данные и как использует

Данные на входе

  • Структурные факторы: Критически важные данные. Используется структура ссылок сайта, иерархия сайта, анализ URL (директории, хлебные крошки) для определения отношений «основная страница — подстраница». Наличие прямой ссылки с основной страницы на подстраницу является одним из критериев отбора.
  • Контентные факторы: Заголовки (Titles) подстраниц являются основным «сырьем» для синтезированного сниппета. Также используется контент или Meta Description основной страницы для генерации Normal Snippet.
  • Факторы качества/Поведенческие факторы: Используются оценки качества подстраниц (Measure of Quality). Патент упоминает, что это могут быть независимые от запроса оценки качества (query-independent quality score) или данные о пользовательском трафике (user traffic) на подстраницу.

Какие метрики используются и как они считаются

  • Measure of Quality (Подстраницы): Метрика качества подстраницы. Используется для фильтрации и ранжирования кандидатов.
  • Порог длины заголовка: Жесткое ограничение на длину заголовка подстраницы (например, 20 или 30 символов). Используется для обеспечения читаемости сниппета.
  • Фильтр символов: Бинарная проверка на наличие нежелательных символов (запятая, тире, точка) в заголовке.
  • Порог общей длины сниппета: Максимальная длина итогового синтезированного сниппета.
  • Snippet Quality Score (Оценка качества сниппета): Итоговая метрика, используемая для сравнения Normal Snippet и Synthesized Snippet. Для синтезированного сниппета она может агрегировать Measure of Quality использованных подстраниц, их количество и общую длину сниппета.

Выводы

  1. Информационная архитектура (IA) напрямую влияет на сниппеты: Патент демонстрирует, как Google использует понимание структуры сайта (иерархия, ссылки) для генерации сниппетов. Четкая и логичная IA помогает системе идентифицировать ключевые Sub-pages.
  2. Критические требования к заголовкам внутренних страниц: Заголовки (Titles) категорий и ключевых разделов должны быть не просто оптимизированы под запросы, но и соответствовать строгим техническим критериям, чтобы попасть в синтезированный сниппет: быть короткими (до 20-30 символов) и «чистыми» (без запятых, тире, точек).
  3. Качество оценивается на уровне подстраниц: Для генерации сниппета используются только те подстраницы, которые имеют достаточно высокую Measure of Quality (или трафик). Некачественные или технические разделы будут проигнорированы.
  4. Прямые ссылки важны: Наличие прямой ссылки с основной страницы на подстраницу является одним из фильтров (Claim 2). Это подчеркивает важность продуманного блока навигации или перелинковки на главных страницах и хабах.
  5. Google активно сравнивает источники сниппетов: Система не использует синтезированный сниппет по умолчанию. Она сравнивает его качество с качеством Normal Snippet и Meta Description. Хорошо проработанный Meta Description по-прежнему имеет высокую ценность.

Практика

Best practices (это мы делаем)

  • Оптимизация Информационной Архитектуры (IA) и Навигации: Убедитесь, что сайт имеет четкую иерархию, отраженную в URL и хлебных крошках. Основные разделы должны быть доступны по прямым ссылкам с главной страницы или соответствующих хабов.
  • Фокус на краткости и чистоте Заголовков (Titles) разделов: Оптимизируйте заголовки ключевых внутренних страниц (категорий, услуг). Они должны быть краткими, информативными и, по возможности, не содержать символов, которые могут привести к фильтрации (запятые, точки, тире). Например, вместо «Телефоны, Смартфоны и Аксессуары» лучше использовать «Телефоны Смартфоны Аксессуары».
  • Повышение качества ключевых внутренних страниц: Работайте над улучшением Measure of Quality и привлечением трафика на страницы разделов, так как только качественные страницы могут стать частью синтезированного сниппета.
  • Проработка Meta Description: Продолжайте создавать качественные и информативные Meta Descriptions. Они являются альтернативой синтезированным сниппетам и могут быть выбраны системой, если их качество выше.

Worst practices (это делать не надо)

  • Длинные и сложные заголовки категорий: Использование длинных, переспамленных ключевыми словами заголовков для внутренних страниц снижает вероятность их использования в синтезированном сниппете из-за порогов по длине.
  • Злоупотребление разделителями в Titles: Использование тире, вертикальных линий или запятых в заголовках ключевых разделов может привести к их исключению из сниппета согласно Claim 5.
  • Слабая внутренняя перелинковка: Если на ключевые разделы нет прямых ссылок с главной страницы или хаба, система может не включить их в сниппет (Claim 2).
  • Игнорирование качества внутренних страниц: Создание множества низкокачественных или дублирующихся страниц категорий не поможет генерации сниппета, так как они будут отфильтрованы по качеству.

Стратегическое значение

Этот патент подтверждает, что для Google важна не только релевантность отдельной страницы, но и её место в общей структуре сайта. Информационная архитектура является не просто удобством для пользователя, а источником данных для алгоритмов представления результатов. Стратегически, необходимо уделять значительное внимание технической оптимизации структуры, иерархии и форматированию элементов навигации (включая заголовки), чтобы обеспечить наилучшее представление сайта в SERP.

Практические примеры

Сценарий: Оптимизация сниппета главной страницы интернет-магазина

  1. Ситуация ДО: Главная страница магазина «ExampleStore» имеет неинформативный сниппет в выдаче: «ExampleStore – лучший магазин. Мы предлагаем товары с доставкой...». Заголовки категорий длинные, например: «Ноутбуки и Компьютеры (Гарантия)», «Смартфоны, Телефоны – Распродажа».
  2. Анализ: SEO-специалист понимает, что текущий сниппет не привлекает трафик. Система не может сгенерировать Synthesized Snippet, так как заголовки категорий слишком длинные и содержат нежелательные символы (скобки, запятые, тире).
  3. Действия по оптимизации:
    • Заголовки категорий сокращаются и очищаются: «Ноутбуки и Компьютеры», «Смартфоны и Телефоны».
    • Проверяется, что на все ключевые категории есть прямые ссылки с главной страницы.
    • Проводится работа по улучшению контента и поведенческих факторов на страницах категорий для повышения их Measure of Quality.
  4. Ситуация ПОСЛЕ: После переиндексации система идентифицирует обновленные заголовки как подходящие кандидаты. Качество категорий достаточное.
  5. Ожидаемый результат: Сниппет главной страницы в SERP заменяется на синтезированный: «Ноутбуки и Компьютеры – Смартфоны и Телефоны – Бытовая Техника – Одежда». Это повышает информативность и CTR.

Вопросы и ответы

Что такое «подстраница» (Sub-page) в контексте этого патента?

Подстраница — это страница, связанная с основной страницей и находящаяся, как правило, ниже в иерархии сайта. В патенте прямо указано, что источником данных о подстраницах часто служат Shortcut Links (Sitelinks). Также они могут определяться через анализ структуры ссылок, URL, хлебных крошек или даже внутренних разделов одной длинной страницы (например, через оглавление).

Как Google решает, какие именно подстраницы включить в синтезированный сниппет?

Используется строгий набор критериев. Подстраница должна иметь высокую Measure of Quality (или трафик), быть доступна по прямой ссылке с основной страницы, иметь короткий заголовок (до 20-30 символов) и не содержать в заголовке определенных символов (запятые, тире, точки). Отбор происходит итеративно, пока не будет достигнута максимальная длина сниппета.

Может ли синтезированный сниппет заменить текст из Meta Description?

Да. Система генерирует несколько вариантов сниппетов: обычный (из контента), из Meta Description (тип «meta») и синтезированный. Затем она сравнивает их оценки качества и выбирает лучший. Если синтезированный сниппет будет признан более информативным и качественным, чем Meta Description, он будет показан в выдаче.

Какие символы нежелательны в заголовках страниц, если я хочу получить синтезированный сниппет?

В патенте (Claim 5) явно указаны символы, которые могут привести к исключению страницы из сниппета: запятая (,), тире (-) и точка (.). Хотя на практике мы иногда видим эти символы в сниппетах, для повышения вероятности включения рекомендуется использовать чистые заголовки без них, особенно для ключевых категорий.

Как я могу повлиять на генерацию синтезированного сниппета для моего сайта?

Ключевые действия: оптимизируйте информационную архитектуру, обеспечьте наличие прямых ссылок на важные разделы с главной страницы, работайте над качеством этих разделов и, самое главное, сделайте их заголовки (Titles) максимально краткими, чистыми и информативными.

Применяется ли этот механизм только для сниппета основного результата поиска?

Нет. Патент описывает два применения. Первое — для основного сниппета результата поиска (как на FIG. 10). Второе — для генерации описаний под самими быстрыми ссылками (Sitelinks) (как на FIG. 8). В обоих случаях логика одинакова: сниппет страницы (будь то главная страница или страница Sitelink) синтезируется из заголовков её собственных подстраниц.

Что такое Measure of Quality подстраницы и как его повысить?

Патент не детализирует расчет Measure of Quality, но упоминает, что это может быть независимая от запроса оценка качества или данные о пользовательском трафике. Для повышения этой оценки необходимо работать над авторитетностью страницы, качеством её контента, улучшением поведенческих факторов и привлечением естественного трафика.

Почему важна длина заголовка подстраницы?

Длина важна, потому что система стремится включить в сниппет как можно больше разделов, сохраняя при этом читаемость. Если заголовки слишком длинные, они занимают много места и могут быть исключены при фильтрации (упоминаются пороги в 20-30 символов), чтобы освободить место для других качественных разделов.

Если у меня настроены Sitelinks через Search Console, будут ли они использоваться для сниппета?

Google упразднил ручное управление Sitelinks. Сейчас они генерируются алгоритмически. Эти алгоритмически определенные Sitelinks (Shortcut Links) и являются основным источником данных для генерации синтезированных сниппетов, как описано в патенте.

Что важнее для этого алгоритма: структура URL или структура ссылок?

Патент упоминает оба механизма для определения иерархии сайта. Однако наличие прямой ссылки с основной страницы на подстраницу указано как конкретный критерий отбора (Claim 2). Поэтому надежная структура ссылок (навигация, блоки перелинковки) имеет критическое значение, но чистая структура URL и хлебные крошки также помогают системе понять иерархию.

Похожие патенты

Как Google генерирует сниппеты для Sitelinks, используя контент целевых страниц, а не исходный запрос
Google использует специальный метод для генерации сниппетов в расширенных результатах поиска (Sitelinks). Сниппет для главной страницы часто основан на запросе пользователя, но сниппеты для внутренних ссылок (sub-documents) генерируются на основе "репрезентативных ключевых слов" (например, Title) самой внутренней страницы, а не исходного навигационного запроса. Это позволяет сделать описание Sitelinks более точным и релевантным теме целевой страницы.
  • US9081831B2
  • 2015-07-14
  • SERP

  • Семантика и интент

  • Структура сайта

Как Google извлекает и может отображать оригинальный дизайн (стили) контента в сниппетах поисковой выдачи
Google разработал систему для отображения текстовых сниппетов в поисковой выдаче с сохранением их оригинального стиля (шрифт, размер, форматирование) из исходного документа. Для этого система создает отдельные индексы для текста и стилей. Это позволяет пользователям оценить визуальный контекст, важность контента и эстетику сайта непосредственно в SERP, влияя на выбор результата.
  • US10311114B2
  • 2019-06-04
  • SERP

  • Индексация

  • Техническое SEO

Как Google оценивает и выбирает контент для Featured Snippets (Блоков с ответами) на основе консенсуса выдачи
Google использует систему для выбора и оценки Featured Snippets. Система анализирует топовые результаты поиска, чтобы предсказать, какие термины должны быть в ответе (Answer Terms). Затем она оценивает отрывки текста, учитывая совпадение с запросом, наличие предсказанных терминов ответа (консенсус топа), качество исходного сайта, форматирование и языковую модель контента.
  • US9940367B1
  • 2018-04-10
  • SERP

  • Семантика и интент

  • EEAT и качество

Как Google использует околоссылочный текст и заголовки (Web Quotes) для индексирования страниц и генерации сниппетов
Google анализирует текст на страницах, ссылающихся на целевой документ, извлекая «Web Quotes». Это не только текст абзаца, окружающего ссылку, но и текст из ближайших заголовков. Эти цитаты ранжируются по качеству ссылающегося источника (например, PageRank) и используются для индексирования целевой страницы (даже если этих слов на ней нет) и для формирования сниппета в результатах поиска.
  • US8495483B1
  • 2013-07-23
  • Индексация

  • Ссылки

  • SERP

Как Google выбирает, сортирует и форматирует динамические Sitelinks на основе типа контента и свежести страниц
Патент Google описывает систему генерации Sitelinks (саб-ссылок), которые ведут непосредственно на конечный контент (статьи, видео, товары), а не на разделы сайта. Система определяет категорию контента и применяет специфические правила сортировки (например, по свежести для новостей), которые отличаются от стандартного ранжирования. Также используется специальное форматирование для улучшения навигации в SERP.
  • US9081832B2
  • 2015-07-14
  • Ссылки

  • SERP

  • Свежесть контента

Популярные патенты

Как Google выбирает Sitelinks, анализируя визуальное расположение и структуру DOM навигационных меню
Google использует механизм для генерации Sitelinks путем рендеринга страницы и анализа DOM-структуры. Система определяет визуальное расположение (координаты X, Y) гиперссылок и группирует их на основе визуальной близости и общих родительских элементов. Sitelinks выбираются исключительно из доминирующей группы (например, главного меню), а ссылки из других групп игнорируются.
  • US9053177B1
  • 2015-06-09
  • SERP

  • Ссылки

  • Структура сайта

Как Google ранжирует контент на других языках, основываясь на поведении пользователей с одинаковыми языковыми настройками
Google использует статистику кликов (CTR), сегментированную по языковым предпочтениям пользователей, для корректировки ранжирования. Если пользователи, предпочитающие язык X, часто кликают на результат на языке Y, этот результат будет повышен в выдаче для других пользователей с предпочтением языка X. Это позволяет ранжировать контент, популярный у определенной языковой группы, независимо от языка самого контента.
  • US8375025B1
  • 2013-02-12
  • Мультиязычность

  • Поведенческие сигналы

  • Персонализация

Как Google динамически формирует Панели Знаний, выбирая блоки информации на основе истории поисковых запросов пользователей
Google использует гибридный подход для создания структурированных страниц о сущностях (например, Панелей Знаний). Система анализирует исторические данные о том, что пользователи чаще всего ищут об этой сущности или её классе. На основе этого анализа динамически выбираются блоки информации (например, «Награды», «Саундтрек»), которые дополняют стандартный набор данных, позволяя автоматически адаптировать выдачу под актуальные интересы аудитории.
  • US10110701B2
  • 2018-10-23
  • Knowledge Graph

  • Поведенческие сигналы

  • Персонализация

Как Google масштабирует расчет кратчайших путей в графе ссылок от авторитетных сайтов («Seed Nodes»)
Патент описывает инфраструктуру Google для распределенного вычисления кратчайших путей в огромных графах, таких как веб-граф. Система позволяет эффективно и отказоустойчиво рассчитывать расстояние от любого узла до ближайших авторитетных «Seed Nodes». Это foundational технология, которая делает возможным применение алгоритмов ранжирования, основанных на анализе ссылочного графа и распространении авторитетности (например, типа TrustRank) в масштабах всего интернета.
  • US8825646B1
  • 2014-09-02
  • Ссылки

Как Google использует историю поиска и браузинга для персонализации выдачи и определения предпочтений пользователя
Google записывает и анализирует историю действий пользователя: запросы, клики по результатам и рекламе, посещенные страницы. Система группирует связанные действия в сессии, определяет "Предпочитаемые локации" на основе частоты и времени визитов (stay-time), и использует эту историю для изменения порядка ранжирования, повышая позиции ранее посещенных сайтов в персональной выдаче.
  • US20060224583A1
  • 2006-10-05
  • Персонализация

  • Поведенческие сигналы

Как Google использует историю физических перемещений пользователя для фильтрации и персонализации результатов поиска
Google может собирать и хранить историю физических перемещений пользователя (Location History). Патент описывает интерфейс, позволяющий пользователю осознанно включать свои прошлые местоположения (например, «места, где я был на прошлой неделе») в качестве фильтра для нового поискового запроса, чтобы сделать результаты более релевантными личному опыту.
  • US8874594B2
  • 2014-10-28
  • Персонализация

  • Поведенческие сигналы

  • Local SEO

Как Google итеративно распознает сущности на страницах и рассчитывает их важность с помощью PageRank
Google использует итеративный процесс для распознавания и устранения неоднозначности сущностей (людей, мест, понятий) в документах. Система начинает с известных фактов, находит упоминающие сущность документы, анализирует сопутствующие термины для уточнения модели распознавания и автоматически обнаруживает новые признаки. Патент также описывает расчет важности сущности путем суммирования PageRank ссылающихся документов, взвешенного на вероятность ссылки.
  • US8122026B1
  • 2012-02-21
  • Семантика и интент

  • Ссылки

  • Knowledge Graph

Как Google определяет скрытый интент сессии, используя универсальные уточняющие слова, и переранжирует выдачу
Google идентифицирует универсальные слова-модификаторы (например, «фото», «отзывы», «pdf»), которые пользователи часто добавляют к разным запросам. Если такое слово появляется в сессии, система определяет скрытый интент пользователя. Затем Google переранжирует выдачу, основываясь на том, какие документы исторически предпочитали пользователи с таким же интентом, адаптируя результаты под контекст сессии.
  • US8868548B2
  • 2014-10-21
  • Семантика и интент

  • Поведенческие сигналы

  • Персонализация

Как Google использует машинное обучение и данные о длительности сессий для выявления битых Deep Links в мобильных приложениях
Google использует систему машинного обучения для анализа того, как долго пользователи взаимодействуют с контентом в приложении после перехода по Deep Link (Presentation Duration). Анализируя распределение этих временных интервалов, система классифицирует ссылку как рабочую или битую без необходимости прямого сканирования контента. Это позволяет Google удалять неработающие ссылки из индекса.
  • US10628511B2
  • 2020-04-21
  • Ссылки

  • Индексация

  • Поведенческие сигналы

Как Google определяет авторитетные сайты для конкретных тем, анализируя «гибридные запросы» пользователей
Google анализирует «гибридные запросы» (например, «back pain WebMD»), чтобы понять, какие сайты пользователи считают лучшими источниками информации по конкретным темам. Система создает карты соответствия между темами и авторитетными ресурсами. Эти данные используются для повышения релевантности авторитетных сайтов в выдаче по информационным запросам и для улучшения поисковых подсказок.
  • US9244972B1
  • 2016-01-26
  • EEAT и качество

  • Семантика и интент

  • SERP

seohardcore