SEO HARDCORE
  • Разборы патентов
    • Патенты Google
  • Скоро SEO инструменты
  • Скоро SEO аналитика
  • seohardcore
SEO HARDCORE
назад

Как Google генерирует сниппеты для Sitelinks, используя контент целевых страниц, а не исходный запрос

METHODS AND SYSTEMS FOR PRESENTING DOCUMENT-SPECIFIC SNIPPETS (Методы и системы для представления сниппетов, специфичных для документа)
  • US9081831B2
  • Google LLC
  • 2013-03-14
  • 2015-07-14
  • SERP
  • Семантика и интент
  • Структура сайта
  • Описание
  • Разбор
  • Выводы
  • Практика
  • FAQ
  • Похожие

Google использует специальный метод для генерации сниппетов в расширенных результатах поиска (Sitelinks). Сниппет для главной страницы часто основан на запросе пользователя, но сниппеты для внутренних ссылок (sub-documents) генерируются на основе "репрезентативных ключевых слов" (например, Title) самой внутренней страницы, а не исходного навигационного запроса. Это позволяет сделать описание Sitelinks более точным и релевантным теме целевой страницы.

Описание

Какую проблему решает

Патент решает проблему неинформативных сниппетов при отображении расширенных результатов поиска (Sitelinks) в ответ на навигационные запросы (site-navigational query). Стандартный подход генерирует сниппеты на основе терминов запроса. Например, по запросу "XYZ" сниппеты для внутренних разделов (Новости, Погода) часто содержали бы просто "XYZ", что не помогает пользователю понять содержание раздела. Изобретение улучшает пользовательский опыт, предоставляя описание, релевантное содержанию конкретной целевой страницы.

Что запатентовано

Запатентована система генерации "сниппетов, специфичных для документа" (document-specific snippets) в рамках комбинированного результата поиска (combined search result). Суть в том, что для дополнительных ссылок (Sitelinks или sub-documents) сниппет генерируется не на основе исходного запроса, а на основе "репрезентативных ключевых слов" (representative keywords), извлеченных из самого этого документа (например, его Title или мета-тегов).

Как это работает

Система работает следующим образом:

  • Получение запроса: Система получает навигационный запрос (например, название бренда).
  • Идентификация документов: Определяется главный документ (main document, главная страница) и суб-документы (sub-documents, Sitelinks).
  • Генерация главного сниппета: Для главного документа может генерироваться сниппет, основанный на терминах запроса.
  • Идентификация ключевых слов суб-документа: Для каждого суб-документа система определяет representative keywords (например, из Title, мета-тегов или альтернативного заголовка).
  • Генерация сниппета суб-документа: Система ищет вхождения этих ключевых слов в контенте суб-документа (например, в Meta Description или основном тексте) и извлекает сниппет вокруг них.
  • Отображение: Все документы и их специфические сниппеты объединяются в единый расширенный результат поиска.

Актуальность для SEO

Высокая. Отображение Sitelinks и качество их сниппетов остаются фундаментальной частью современного SERP для навигационных и брендовых запросов. Понимание механизма их генерации критически важно для контроля внешнего вида бренда в поиске и управления CTR.

Важность для SEO

Патент имеет высокое значение для SEO-стратегий, связанных с брендовым трафиком. Он не влияет напрямую на ранжирование, но критически важен для CTR и представления бренда по навигационным запросам. Патент подтверждает, что сниппеты для Sitelinks контролируются через оптимизацию контента (в частности, Title и Meta Description) целевых страниц, а не через анкоры на главной странице или иные внешние факторы.

Детальный разбор

Термины и определения

Combined search result / Site-specific search result (Комбинированный / Сайт-специфичный результат поиска)
Единый, связный блок результатов поиска, который включает ссылки и сниппеты как для основного документа, так и для связанных с ним суб-документов (Sitelinks).
Document-specific snippet (Сниппет, специфичный для документа)
Сниппет, сгенерированный на основе содержания и representative keywords конкретного документа, который он описывает, а не обязательно на основе терминов исходного поискового запроса.
Main document / First document (Главный документ / Первый документ)
Основной документ, возвращаемый в ответ на навигационный запрос, обычно главная страница сайта (home page).
Representative keywords / Representative Element (Репрезентативные ключевые слова / Элемент)
Текст или элемент, связанный с суб-документом, который представляет его тему. Примеры включают текст из Title, Meta Description, мета-тегов или идентифицированную сущность/тему.
Site-navigational query (Сайт-навигационный запрос)
Запрос, указывающий на намерение пользователя перейти на определенный сайт (например, запрос названия бренда или домена).
Snippet Generator (Генератор сниппетов)
Компонент поисковой системы, который принимает идентификатор документа и набор слов для поиска, и создает сниппет, содержащий эти слова.
Sub-document / Second document (Суб-документ / Второй документ)
Документ, на который прямо или косвенно ссылается главный документ. Отображается в том же комбинированном результате поиска (например, Sitelink).

Ключевые утверждения (Анализ Claims)

Claim 1 (Независимый пункт): Описывает основной метод генерации сниппетов для расширенного результата.

  1. Система получает поисковый запрос (содержащий термины запроса).
  2. Система получает набор релевантных документов, включающий (i) Первый документ (главную страницу сайта) и (ii) Второй документ (внутреннюю страницу сайта, на которую ссылается Первый документ).
  3. Идентифицируются representative keywords, которые связаны со Вторым документом и не включены в термины запроса.
  4. Получаются два сниппета: (i) Сниппет для Первого документа (включает термины запроса) и (ii) Сниппет для Второго документа (включает representative keywords).
  5. Генерируется combined search result для обоих документов, включающий оба сниппета.
  6. Предоставляется страница результатов поиска (SERP) с этим комбинированным результатом.

Этот пункт защищает метод генерации сниппетов для Sitelinks (Второй документ) с использованием ключевых слов, специфичных для этой страницы (Representative keywords), одновременно с генерацией основного сниппета (Первый документ) с использованием фактического запроса пользователя, и представление их вместе. Ключевым моментом является явное исключение терминов запроса из репрезентативных ключевых слов (шаг 3) – это фокусирует сниппет на теме страницы, а не на навигационном запросе.

Claim 3 (Зависимый от 1): Уточняет источник representative keywords.

Representative keywords представляют собой текст из Title Второго документа.

Claim 4 (Зависимый от 1): Уточняет альтернативный источник.

Система может сгенерировать "альтернативный заголовок" (alternate title) для Второго документа, и representative keywords берутся из этого альтернативного заголовка.

Claim 5 (Зависимый от 1): Определяет контекст применения.

Метод применяется, когда набор документов представляет собой результаты site-navigational search, включающие главный документ и один или несколько суб-документов.

Где и как применяется

Изобретение применяется на финальных этапах формирования поисковой выдачи, после того как документы для отображения уже выбраны.

INDEXING – Индексирование и извлечение признаков
На этом этапе система анализирует документы для извлечения потенциальных representative keywords (Title, мета-теги, ведущий текст). Может происходить предварительная генерация alternate titles.

QUNDERSTANDING – Понимание Запросов
Система должна распознать запрос как site-navigational query. Это является триггером для потенциального отображения расширенного результата поиска (Sitelinks).

RANKING – Ранжирование
На этом этапе основная система ранжирования определяет main document (главную страницу) и релевантные sub-documents (Sitelinks), которые должны быть отображены вместе.

METASEARCH – Метапоиск и Смешивание / RERANKING – Переранжирование (Генерация сниппетов)
Это основная фаза применения патента. После того как набор документов выбран, активируется Snippet Generator. Он обрабатывает главный документ (используя термины запроса) и каждый суб-документ (используя его собственные representative keywords). Затем он форматирует combined search result.

Входные данные:

  • Поисковый запрос пользователя.
  • Набор выбранных документов (Главный и Суб-документы).
  • Контент этих документов (включая Titles, мета-теги, основной текст).

Выходные данные:

  • Отформатированный combined search result (блок Sitelinks) с документ-специфичными сниппетами для каждой ссылки.

На что влияет

  • Специфические запросы: В первую очередь влияет на отображение результатов по site-navigational queries (брендовые запросы, названия компаний, доменные имена).
  • Конкретные типы контента: Влияет на любые страницы, которые система выбирает для отображения в качестве Sitelinks (ключевые внутренние страницы, категории, популярные статьи, страницы контактов).

Когда применяется

  • Триггеры активации: Алгоритм активируется, когда поисковая система определяет, что запрос является сайт-навигационным, и принимает решение отобразить combined search result (расширенный блок Sitelinks) для соответствующего домена.
  • Исключения и особые случаи: Если система не может идентифицировать representative keywords или не может найти их в контенте суб-документа, она может использовать заранее определенную часть документа, например, начальный текст (leading text). Также патент упоминает сценарии, когда сниппет для главного документа может быть опущен (например, на основе анализа контента или директив на странице, таких как "nosnippet").

Пошаговый алгоритм

  1. Получение запроса и извлечение документов: Система получает запрос и определяет набор релевантных документов: идентифицируется main document и sub-documents (Sitelinks).
  2. Генерация сниппета главного документа (Опционально): Идентифицируется сниппет для главного документа, обычно включающий один или несколько терминов из поискового запроса.
  3. Цикл обработки суб-документов: Для каждого суб-документа выполняется:
    1. Идентификация репрезентативных ключевых слов: Определяется набор representative keywords для суб-документа. Источником может быть фактический Title страницы, альтернативный заголовок, сгенерированный системой, мета-теги или идентифицированные темы/сущности.
    2. Подготовка контента (Опционально): Суб-документ может быть проанализирован для удаления шаблонного текста (boilerplate), ссылок и другой неспецифичной информации перед поиском сниппета.
    3. Поиск сниппета: Система ищет вхождения этих representative keywords в контенте суб-документа (начальный текст, Meta Description, основной текст).
    4. Извлечение сниппета: Извлекается сниппет, который включает одно или несколько репрезентативных ключевых слов. Если сниппет не найден, может использоваться предопределенный фрагмент (leading text).
  4. Форматирование результата: Генерируется combined search result, объединяющий каждый документ с его соответствующим сниппетом.
  5. Предоставление SERP: Страница результатов поиска предоставляется пользователю.

Какие данные и как использует

Данные на входе

Патент фокусируется на данных, необходимых для генерации сниппетов после того, как документы уже выбраны.

  • Контентные и Структурные факторы:
    • Titles (тег <title>): Явно указаны как основной источник для representative keywords суб-документов.
    • Мета-теги (Meta Description): Упомянуты как источники для representative keywords и как потенциальный контент для сниппетов.
    • Leading text (Ведущий текст): Начало основного контента. Используется для поиска сниппета или как резервный вариант.
    • Основной текст документа: Текстовое содержание, критически важное для извлечения финального текста сниппета.
  • Системные данные:
    • Alternate title (Альтернативный заголовок): Система может генерировать собственный заголовок и использовать его как representative keywords.
  • Пользовательские факторы: Термины исходного поискового запроса используются для генерации сниппета главного документа.

Какие метрики используются и как они считаются

  • Патент не описывает сложных метрик или формул. Основной механизм — это идентификация и сопоставление representative keywords с контентом документа.
  • Упоминается, что Snippet Generator идентифицирует "наиболее релевантное вхождение" (most relevant occurrence) ключевых слов, что подразумевает наличие внутренней оценки релевантности для выбора наилучшего сниппета из нескольких кандидатов, хотя детали этой оценки не раскрываются.
  • Методы анализа текста: Используется парсинг документов. Упоминается процесс удаления шаблонного текста (boilerplate) для более точного определения сниппетов.

Выводы

  1. Сниппеты Sitelinks зависят от контента целевой страницы, а не от запроса: Ключевой вывод – патент подтверждает, что Google генерирует сниппеты для Sitelinks на основе содержания самой целевой страницы, явно игнорируя исходный навигационный запрос (как указано в Claim 1).
  2. Критическая роль "Репрезентативных ключевых слов": Система полагается на идентификацию ключевых слов, которые резюмируют суб-документ. Патент явно выделяет тег <title> как основной источник, но также упоминает мета-теги и сгенерированные системой "альтернативные заголовки" (alternate titles).
  3. Контроль над сниппетами через On-Page SEO: SEO-специалисты имеют значительный контроль над сниппетами Sitelinks. Это достигается путем оптимизации элементов, из которых извлекаются representative keywords (Title), и обеспечения того, чтобы эти ключевые слова появлялись в привлекательном контексте в Meta Description или основном контенте (leading text).
  4. Разделение процессов генерации: Процессы генерации сниппета для основного результата (на основе запроса) и сниппетов для Sitelinks (на основе документа) являются различными и объединяются только на этапе форматирования выдачи.

Практика

Best practices (это мы делаем)

  • Оптимизация Title ключевых страниц: Убедитесь, что теги <title> страниц, которые потенциально могут попасть в Sitelinks (категории, услуги, о нас, контакты), являются краткими, описательными и содержат ключевые слова, точно представляющие эту страницу. Это главные кандидаты на роль representative keywords.
  • Создание качественных Meta Description: Поскольку система ищет вхождения representative keywords (часто из Title) для формирования сниппета, Meta Description является идеальным местом для этого. Пишите описания, которые включают эти ключевые термины в естественном, привлекательном предложении, стимулирующем клик.
  • Оптимизация начального текста страницы (Leading Text): Если Meta Description отсутствует или игнорируется, система может использовать видимый начальный текст документа. Убедитесь, что первый абзац или видимый контент четко резюмирует страницу и включает representative keywords.
  • Мониторинг текущих сниппетов Sitelinks: Регулярно проверяйте сниппеты, которые Google генерирует для Sitelinks вашего бренда по навигационным запросам. Если сниппет некачественный, проанализируйте Title и Meta Description целевой страницы, чтобы понять причину, и оптимизируйте их.

Worst practices (это делать не надо)

  • Использование нечетких или неописательных Title: Использование общих заголовков (например, "Страница 1" или "Добро пожаловать") на ключевых внутренних страницах снижает качество representative keywords, что приводит к плохим сниппетам Sitelinks.
  • Перенасыщение брендовыми терминами в мета-тегах: Включение названия бренда в начало Title или Meta Description всех внутренних страниц. Патент явно указывает, что система стремится найти ключевые слова, не связанные с навигационным запросом (брендом), для генерации этих сниппетов.
  • Игнорирование оптимизации сниппетов внутренних страниц: Нельзя предполагать, что сниппеты Sitelinks формируются автоматически без возможности влияния. Этот патент показывает, что они активно генерируются на основе конкретных элементов страницы.
  • Отсутствие текстового контента: Если на странице нет достаточного количества текста, релевантного заголовку, Snippet Generator не сможет сформировать качественное описание.

Стратегическое значение

Этот патент подчеркивает важность фундаментальных основ On-Page SEO (Title и Meta Description) даже в эпоху сложных алгоритмов. Для брендовых/навигационных запросов, которые часто имеют самый высокий объем и конверсию, контроль над внешним видом расширенного результата поиска имеет решающее значение для CTR и восприятия бренда. Это подтверждает, что Google стремится сделать Sitelinks полезными навигационными инструментами, точно описывая место назначения, а не просто повторяя запрос пользователя.

Практические примеры

Сценарий: Оптимизация сниппета для Sitelink "Карьера"

  1. Проблема: По брендовому запросу отображается Sitelink для страницы "Карьера". Сниппет плохой: "Добро пожаловать на портал. Войдите здесь..."
  2. Анализ (на основе патента): Вероятно, Title страницы – "Портал Карьеры". Система использует "Портал Карьеры" как representative keywords. Meta Description отсутствует, поэтому система нашла эти ключевые слова в инструкциях по входу на страницу (leading text).
  3. Действие:
    1. Изменить Title на: "Карьера в компании XYZ".
    2. Написать новый Meta Description: "Карьера в компании XYZ: Присоединяйтесь к нашей команде и ищите вакансии в отделах разработки, маркетинга и продаж."
  4. Ожидаемый результат: Система использует "Карьера в компании XYZ" как representative keywords, находит их в новом Meta Description и обновляет сниппет Sitelink на оптимизированный текст, улучшая CTR.

Вопросы и ответы

Как я могу повлиять на текст описаний (сниппетов) в Sitelinks моего сайта?

Согласно патенту, описания для Sitelinks генерируются на основе representative keywords целевой страницы, а не на основе брендового запроса. Чтобы повлиять на них, необходимо оптимизировать элементы, из которых система извлекает эти ключевые слова и текст сниппета: Title, Meta Description и ведущий текст (leading text) страницы. Они должны быть максимально информативными и точно отражать содержание раздела.

Что такое "Репрезентативные ключевые слова" (Representative keywords) и откуда они берутся?

Это слова или фразы, которые лучше всего описывают тему суб-документа (Sitelink). Патент явно указывает (Claim 1), что они НЕ являются терминами из исходного запроса пользователя. Основными источниками являются тег <title> целевой страницы, её мета-теги (включая Meta Description), или "альтернативный заголовок", сгенерированный самой системой.

Почему сниппет моего Sitelink отличается от Meta Description, хотя я его оптимизировал?

Система ищет вхождения representative keywords (например, из Title) в контенте страницы. Если она находит более релевантное вхождение в тексте страницы (например, в leading text), чем в Meta Description, или если Meta Description не содержит этих ключевых слов, она может использовать текст со страницы. Убедитесь, что ваш Title и Meta Description согласованы по ключевым словам.

Что такое "альтернативный заголовок" (alternate title), упомянутый в патенте?

Патент предполагает, что Google может самостоятельно генерировать заголовок для страницы, если посчитает существующий Title неоптимальным (например, слишком общим или переспамленным), и использовать этот альтернативный заголовок в качестве representative keywords. Это согласуется с наблюдаемой практикой Google по переписыванию заголовков в SERP.

Влияет ли анкорный текст ссылки на главной странице на сниппет Sitelink?

Согласно этому патенту, нет. Механизм генерации сниппета для Sitelink (sub-document) основан на representative keywords и контенте самой целевой страницы, а не на том, как на нее ссылается главная страница (main document).

Что делать, если у страницы нет текста (например, страница входа)?

Патент упоминает, что если система не может найти сниппет, включающий representative keywords, она может использовать предопределенную часть суб-документа, например, начальный текст (leading text). В сложных случаях рекомендуется предоставить хотя бы минимальный описательный контент или качественный Meta Description.

Влияет ли этот патент на ранжирование сайта?

Нет, этот патент не описывает факторы ранжирования. Он посвящен исключительно процессу генерации сниппетов и представлению результатов поиска (SERP Presentation), конкретно — блоку Sitelinks. Однако качественные и информативные Sitelinks могут значительно улучшить CTR по брендовым запросам, что косвенно влияет на поведенческие метрики.

Нужно ли включать название бренда в Title внутренних страниц для улучшения Sitelinks?

Нет, это может быть контрпродуктивно. Патент явно указывает, что система стремится найти representative keywords, которые не включены в исходный навигационный запрос (который обычно и есть название бренда). Title внутренних страниц должны фокусироваться на теме раздела, а не дублировать название бренда.

Как система определяет, какой фрагмент текста использовать в качестве сниппета?

Система ищет вхождения идентифицированных representative keywords в контенте страницы. Патент не детализирует алгоритм выбора лучшего фрагмента, но упоминает, что анализируются разные части документа, включая мета-описание и ведущий текст. Выбирается наиболее релевантный фрагмент, содержащий эти ключевые слова.

Отличается ли этот механизм от генерации обычных сниппетов в поиске?

Да, принципиально отличается. Обычные сниппеты генерируются так, чтобы показать, как страница релевантна запросу пользователя, и обычно содержат термины из запроса. Механизм из этого патента специально игнорирует запрос пользователя (при генерации сниппета для суб-документа) и фокусируется на описании содержания самой страницы, используя её собственные representative keywords.

Похожие патенты

Как Google синтезирует сниппеты, объединяя заголовки высококачественных внутренних страниц сайта (Sitelinks)
Google может заменить стандартный сниппет веб-страницы на «синтезированный сниппет», созданный путем объединения заголовков её наиболее важных подстраниц (например, тех, что попадают в Sitelinks). Это происходит, когда стандартный сниппет неинформативен, позволяя пользователю лучше понять структуру и содержание сайта прямо в выдаче.
  • US9158849B2
  • 2015-10-13
  • SERP

  • Структура сайта

  • Техническое SEO

Как Google автоматически генерирует, ранжирует и отображает навигационные фильтры (структурированные сниппеты и Sitelinks) для результатов поиска и рекламы
Google использует систему для автоматического извлечения структурированных данных (заголовков и связанных элементов) с целевой страницы. Эти данные организуются в "Навигационные фильтры" — концептуально параллельные списки (например, "Бренды: Canon, Nikon, Sony"). Система ранжирует эти фильтры на основе запроса пользователя, его интересов и доступного пространства, а затем интегрирует их в сниппет результата поиска или рекламное объявление для улучшения навигации.
  • US9276855B1
  • 2016-03-01
  • SERP

  • Семантика и интент

Как Google использует связанные фразы и расширения запросов для генерации сниппетов в поисковой выдаче
Google использует запатентованный метод для автоматической генерации описаний документов (сниппетов) в результатах поиска. Система анализирует предложения в документе и ранжирует их на основе наличия трех элементов: самой фразы из запроса, семантически связанных фраз (определенных через Information Gain) и расширений фразы запроса. Наиболее релевантные предложения выбираются для формирования сниппета.
  • US7584175B2
  • 2009-09-01
  • Семантика и интент

  • SERP

  • Персонализация

Как Google использует внутренние ссылки и структуру DOM для генерации шаблонов сайта и извлечения структурированных сниппетов
Google анализирует повторяющиеся блоки внутренних ссылок (например, списки товаров). Если текст возле ссылки на исходной странице совпадает с текстом на целевой странице, Google определяет DOM-структуру этого текста и создает шаблон домена. Этот шаблон позволяет автоматически извлекать ключевую информацию (например, цену и характеристики) для сниппетов со всех однотипных страниц сайта, даже без микроразметки.
  • US9971746B2
  • 2018-05-15
  • Структура сайта

  • SERP

  • Ссылки

Как Google персонализирует сниппеты и заголовки в выдаче на основе истории поиска и интересов пользователя
Google может динамически изменять сниппеты и заголовки (Title) результатов поиска, чтобы выделить ту часть контента на странице, которая соответствует известным интересам пользователя (история поиска, демография, недавний контекст). Это позволяет сделать представление выдачи более персонализированным, не обязательно изменяя ранжирование документов.
  • US9235626B2
  • 2016-01-12
  • Персонализация

  • SERP

  • Семантика и интент

Популярные патенты

Как Google генерирует блок "Похожие вопросы" (People Also Ask) на основе анализа кликов и поведения пользователей
Google анализирует топовые результаты по исходному запросу и определяет "Тематические запросы" (Topic Sets) — прошлые запросы, по которым пользователи кликали на эти результаты. Затем система ищет популярные вопросы, соответствующие этим темам, фильтрует дубликаты на основе общности кликов и показывает их в блоке PAA для дальнейшего исследования темы.
  • US9213748B1
  • 2015-12-15
  • SERP

  • Семантика и интент

  • Поведенческие сигналы

Как Google алгоритмически определяет и верифицирует языковые версии страниц, анализируя ссылки, контент и частоту обновлений
Google использует систему для автоматической идентификации связанных версий контента (например, переводов). Система анализирует ссылки между страницами и ищет «индикаторы связи» (названия языков в анкорах или флаги). Обнаруженная связь затем верифицируется с помощью машинного перевода и сравнения контента, а также анализа частоты обновлений. Это позволяет Google показывать пользователю наиболее подходящую языковую или региональную версию в поиске.
  • US8892596B1
  • 2014-11-18
  • Мультиязычность

  • Ссылки

  • SERP

Как Google анализирует распределение качества входящих ссылок для классификации и понижения сайтов в выдаче
Google использует систему для оценки качества ссылочного профиля сайта. Система фильтрует входящие ссылки (удаляя шаблонные и дублирующиеся с одного домена), группирует оставшиеся по качеству источника (например, Vital, Good, Bad) и вычисляет взвешенный «Link Quality Score». Если доля низкокачественных ссылок слишком велика, сайт классифицируется как низкокачественный и понижается в результатах поиска.
  • US9002832B1
  • 2015-04-07
  • Ссылки

  • Антиспам

  • SERP

Как Google использует модифицированный PageRank (Personalized PageRank) для персонализации выдачи на основе истории и предпочтений пользователя
Патент Google, описывающий механизм персонализации поиска путем модификации алгоритма PageRank. Система определяет "точку зрения" пользователя (Point-of-View Data) на основе его истории посещений, закладок или указанных категорий. Затем стандартный расчет PageRank изменяется так, чтобы авторитет (Reset Probability) концентрировался только на этих персональных источниках, повышая в выдаче сайты, которые близки к интересам пользователя.
  • US7296016B1
  • 2007-11-13
  • Персонализация

  • Поведенческие сигналы

  • SERP

Как Google использует визуальный анализ кликов по картинкам для понимания интента запроса и переранжирования выдачи
Google анализирует визуальное содержимое изображений, которые пользователи чаще всего выбирают в ответ на определенный запрос. На основе этого анализа (наличие лиц, текста, графиков, доминирующих цветов) система определяет категорию запроса (например, «запрос о конкретном человеке» или «запрос на определенный цвет»). Эти категории затем используются для переранжирования будущих результатов поиска, повышая изображения, которые визуально соответствуют выявленному интенту.
  • US9836482B2
  • 2017-12-05
  • Семантика и интент

  • Поведенческие сигналы

  • SERP

Как Google автоматически дополняет запросы пользователя терминами из его недавней истории поиска для уточнения интента
Google использует механизм для улучшения релевантности результатов путем анализа недавней истории поиска пользователя. Если текущий запрос похож на предыдущие, система определяет ключевые контекстные термины, которые часто повторялись в истории (устойчивый интент), но отсутствуют в текущем запросе. Эти термины автоматически добавляются к запросу, чтобы предоставить более точные и персонализированные результаты.
  • US9449095B1
  • 2016-09-20
  • Семантика и интент

  • Персонализация

  • Поведенческие сигналы

Как Google решает, показывать ли промежуточную страницу (превью) или направлять пользователя сразу на сайт при клике в Поиске по картинкам
Google анализирует, насколько хорошо веб-страница представляет выбранное изображение («image-centricity»). Если изображение на странице качественное, заметное и удовлетворяет интент пользователя (на основе статических и поведенческих данных), Google направляет трафик из Поиска по картинкам напрямую на сайт. В противном случае, Google показывает промежуточный экран (Image Overlay).
  • US9135317B2
  • 2015-09-15
  • Поведенческие сигналы

  • Мультимедиа

  • Семантика и интент

Как Google масштабирует расчет кратчайших путей в графе ссылок от авторитетных сайтов («Seed Nodes»)
Патент описывает инфраструктуру Google для распределенного вычисления кратчайших путей в огромных графах, таких как веб-граф. Система позволяет эффективно и отказоустойчиво рассчитывать расстояние от любого узла до ближайших авторитетных «Seed Nodes». Это foundational технология, которая делает возможным применение алгоритмов ранжирования, основанных на анализе ссылочного графа и распространении авторитетности (например, типа TrustRank) в масштабах всего интернета.
  • US8825646B1
  • 2014-09-02
  • Ссылки

Как Google использует историю поиска и браузинга пользователя для персонализации и изменения результатов выдачи
Google записывает историю поиска и просмотров пользователя для последующей персонализации выдачи. Система может повышать в ранжировании ранее посещенные сайты, добавлять в текущую выдачу релевантные результаты из прошлых похожих запросов, а также понижать сайты, которые пользователь ранее видел, но проигнорировал. Патент также описывает создание "предпочитаемых локаций" на основе частоты посещений и времени пребывания на сайте.
  • US9256685B2
  • 2016-02-09
  • Персонализация

  • Поведенческие сигналы

  • SERP

Как Google генерирует «синтетический анкорный текст», анализируя структуру и контекст ссылающихся страниц
Google анализирует структурно похожие страницы, ссылающиеся на различные ресурсы. Определяя, где известные поисковые запросы (Seed Queries) появляются в структуре этих ссылающихся страниц (например, в заголовках или Title), Google создает шаблоны. Эти шаблоны затем используются для извлечения текста из аналогичных мест на других страницах, создавая «синтетический описательный текст» (аналог анкорного текста) для целевых ресурсов. Это улучшает ранжирование, даже если фактический анкорный текст низкого качества.
  • US9208232B1
  • 2015-12-08
  • Ссылки

  • Структура сайта

  • Семантика и интент

seohardcore