Как Google извлекает и может отображать оригинальный дизайн (стили) контента в сниппетах поисковой выдачи

DISPLAYING STYLIZED TEXT SNIPPETS WITH SEARCH ENGINE RESULTS (Отображение стилизованных текстовых сниппетов в результатах поисковой системы)

US10311114B2
Google LLC
2014-11-03
2019-06-04

Google разработал систему для отображения текстовых сниппетов в поисковой выдаче с сохранением их оригинального стиля (шрифт, размер, форматирование) из исходного документа. Для этого система создает отдельные индексы для текста и стилей. Это позволяет пользователям оценить визуальный контекст, важность контента и эстетику сайта непосредственно в SERP, влияя на выбор результата.

Какую проблему решает

Патент решает проблему отображения текстовых сниппетов в унифицированном (generic) стиле поисковой системы. Стандартные сниппеты лишают пользователя важного визуального контекста, не показывая, как именно текст выглядит на исходной странице. Изобретение позволяет пользователям увидеть сниппет в его native context (исходном контексте). Это помогает быстрее оценить важность информации (например, является ли текст заголовком или сноской) и общее качество дизайна/эстетику источника до перехода на сайт.

Что запатентовано

Запатентована система и метод для представления стилизованных текстовых сниппетов (stylized text snippets) в результатах поиска. Система извлекает и отдельно индексирует текстовое содержимое и связанную с ним информацию о стиле (style information) из веб-документов. При ответе на запрос система комбинирует релевантный текст с его оригинальным стилем, извлеченным из отдельного индекса, гарантируя, что сниппет будет выглядеть так же, как в исходном документе.

Как это работает

Система работает в два основных этапа:

Индексирование: Во время обхода (data mining) система извлекает текст и связанную информацию о стиле (HTML, CSS). Текст сохраняется в Text Index, а стили — в отдельном Style Index. Они связываются с помощью идентификатора (Style Identifier).
Обработка запроса и отображение: При генерации SERP система определяет текстовый сниппет, извлекает соответствующий стиль из Style Index и применяет его. Патент также предусматривает гибкость: стили могут применяться немедленно, с задержкой (для скорости) или только по запросу пользователя (например, при наведении мыши).

Актуальность для SEO

Средняя. В стандартной органической выдаче Google мы редко наблюдаем точное копирование нативных стилей в сниппетах, вероятно, из-за приоритета скорости и унификации дизайна SERP. Однако инфраструктура, описанная в патенте (извлечение и понимание стилей и визуальной иерархии), критически важна для современных систем оценки качества страницы (Page Experience), анализа структуры контента и формирования обогащенных результатов (Rich Snippets).

Важность для SEO

Влияние на SEO умеренное (6/10). Патент не описывает алгоритмы ранжирования. Однако он напрямую влияет на представление сайта в SERP и, как следствие, на CTR и поведенческие сигналы. Понимание того, что Google индексирует визуальное представление контента (а не только текст), подчеркивает стратегическую важность качества дизайна, визуальной иерархии и семантической разметки.

Термины и определения

Native Context (Исходный/Нативный контекст): Отображение текста так, как он выглядит в исходном документе, с сохранением оригинального форматирования и стиля.
Style Identifier (Идентификатор стиля): Уникальный идентификатор, используемый для связи фрагмента текста в Text Index с соответствующей информацией о стиле в Style Index.
Style Index (Индекс стилей): Отдельный индекс, хранящий информацию о стиле (Style Information), извлеченную из документов. Содержит данные о форматировании (разметка, CSS).
Style Information (Информация о стиле): Данные, определяющие внешний вид текста в исходном документе (например, HTML-разметка, CSS, форматирование).
Stylized Text Snippet (Стилизованный текстовый сниппет): Фрагмент текста, отображаемый в результатах поиска, к которому применена Style Information из исходного документа.
Text Index (Текстовый индекс): Индекс, хранящий текстовое содержимое проанализированных документов. Используется для выбора сниппетов. Может также хранить Style Identifier.
Web-addressable document (Веб-адресуемый документ): Любой ресурс, доступный по URL, включая веб-страницы (HTML), PDF, документы Word, таблицы и т.д.

Ключевые утверждения (Анализ Claims)

Claim 1 (Независимый пункт): Описывает основной метод отображения стилизованных сниппетов.

Система получает поисковый запрос от клиента.
Идентифицируются релевантные документы.
Для документа система обращается к Text Index, извлекает релевантный фрагмент текста (сниппет) и его Style Identifier.
Система обращается к Style Index и сопоставляет Style Identifier с записью в индексе.
Из Style Index извлекается Style Information. Эта информация определяет форматирование текста в исходном документе.
Система определяет, нужно ли применять стиль к тексту.
Если да, система стилизует текст, применяя извлеченную Style Information.
Система предоставляет клиенту стилизованный список результатов (SERP). Сниппет отображается так, что он имеет тот же внешний вид (same appearance), что и в оригинале.

Claim 4 и 5 (Зависимые): Уточняют шаг 6 из Claim 1.

Решение о применении стиля может основываться на типе клиентского устройства (Claim 4) или типе веб-браузера (Claim 5). Это позволяет отключать стилизацию для определенных клиентов.

Claim 7 (Зависимый): Детализирует процесс отображения для ускорения загрузки.

До предоставления стилизованного списка система сначала предоставляет нестилизованный список результатов (SERP с обычными сниппетами).

Claim 8 и 9 (Зависимые от 7): Уточняют условия обновления.

Стилизованный список предоставляется либо после завершения операции применения стиля (Claim 8), либо после получения информации о действии пользователя на клиенте (Claim 9).

Claim 11 (Зависимый от 9): Уточняет действие пользователя.

Действием пользователя может быть наведение курсора мыши (mouse-over) на результат в нестилизованном списке.

Claim 12 (Зависимый): Описывает офлайн-процесс индексации.

Система извлекает текст и сохраняет его в Text Index; извлекает информацию о стиле и сохраняет её в Style Index с привязкой к тексту.

Claim 14 (Зависимый): Описывает обработку несовместимых стилей.

Если извлеченная информация о стиле несовместима с браузерами, система определяет альтернативную совместимую информацию о стиле (alternate style information) и сохраняет её в Style Index.

Где и как применяется

Изобретение затрагивает несколько этапов поисковой архитектуры, от сбора данных до финального отображения результатов.

CRAWLING – Сканирование и Сбор данных
На этом этапе система должна загрузить не только контент, но и все связанные ресурсы, определяющие стиль (например, CSS-файлы).

INDEXING – Индексирование и извлечение признаков
Основная часть работы по подготовке данных.

Рендеринг и анализ: Система должна проанализировать документ (возможно, выполнить рендеринг), чтобы понять, какие стили применяются к каким фрагментам текста. Это включает анализ исходного кода, CSS. В патенте также упоминается возможность использования OCR на скриншотах.
Извлечение и хранение: Текст сохраняется в Text Index. Информация о стиле сохраняется в отдельном Style Index. Создаются связи (Style Identifiers).
Нормализация стилей: Система может генерировать альтернативные стили для обеспечения совместимости (Claim 14).

RANKING – Ранжирование
На этом этапе определяются релевантные документы и выбираются фрагменты текста для сниппетов. Патент не влияет на логику ранжирования.

METASEARCH / RERANKING (Формирование SERP / Презентационный слой)
Это этап фактического применения изобретения.

Извлечение данных: Система извлекает текст сниппета и его стиль из соответствующих индексов.
Принятие решения: Система решает, применять ли стиль (на основе устройства, браузера, скорости).
Применение стиля: Система комбинирует текст и стиль. Это может включать добавление markup-тегов (Claim 6) или генерацию динамического CSS для страницы результатов.
Формирование ответа: Генерируется финальный HTML страницы выдачи со стилизованными сниппетами.

На что влияет

Типы документов: Применимо ко всем Web-addressable documents, включая HTML, PDF, документы Word, таблицы.
Пользовательский опыт (UX) и CTR: Основное влияние оказывается на восприятие результатов. Стилизация помогает выделить важные элементы (заголовки, списки) и оценить эстетику сайта, что напрямую влияет на вероятность клика.

Когда применяется

Алгоритм отображения стилей применяется при генерации SERP, но его активация гибка и условна:

Ограничения: Может быть отключен для определенных устройств или браузеров (Claims 4, 5).
Оптимизация скорости (Двухэтапная загрузка): Система может использовать прогрессивное улучшение (Claim 7): сначала показать нестилизованные сниппеты, а затем обновить их до стилизованных после завершения обработки (Claim 8).
По требованию: Стилизация может активироваться по действию пользователя, например, при наведении курсора мыши (Claims 9, 11).

Пошаговый алгоритм

Процесс А: Индексация (Офлайн)

Идентификация документа: Определение документа для индексации.
Извлечение текста: Получение текстового содержимого (анализ кода, OCR).
Извлечение стилей: Получение информации о стиле (анализ разметки, CSS).
Обработка совместимости (Опционально): Проверка совместимости стилей. При необходимости генерация альтернативного стиля (Claim 14).
Сохранение текста: Запись текста в Text Index.
Сохранение стилей: Запись информации о стиле в Style Index.
Ассоциирование: Связывание текста и стиля через Style Identifier.

Процесс Б: Обработка запроса и отображение (Онлайн)

Получение запроса и Ранжирование: Идентификация релевантных документов.
Извлечение сниппетов и идентификаторов: Обращение к Text Index для получения текста и Style Identifiers.
Извлечение стилей: Обращение к Style Index для получения Style Information.
Принятие решения о стилизации: Определение, следует ли применять стили (на основе типа устройства, браузера, настроек).
Вариант 1 (Прямая стилизация):
1. Применение стилей: Комбинирование текста и стиля.
2. Отображение: Отправка SERP со стилизованными сниппетами.
Вариант 2 (Отложенная стилизация):
1. Начальное отображение: Отправка SERP с нестилизованными сниппетами (Claim 7).
2. Определение триггера обновления: Ожидание завершения обработки (Claim 8) или действия пользователя (Claim 9).
3. Обновление отображения: Динамическое обновление SERP стилизованными сниппетами.

Какие данные и как использует

Данные на входе

Контентные факторы: Текст документа.
Технические факторы: Исходный код документа (HTML).
Структурные и Стилистические факторы (Ключевые данные):
- Markup information: HTML-теги, определяющие форматирование (<strong>, <h1>).
- Style sheets: CSS (Cascading Style Sheets), определяющие шрифты, размеры, цвета, отступы.
- Formatting information: Специфичное форматирование в не-HTML документах (PDF, Word).
Пользовательские факторы: Тип устройства и тип браузера используются для принятия решения о применении стилизации и проверки совместимости.

Какие метрики используются и как они считаются

Патент не описывает метрик для ранжирования. Он описывает методы хранения и извлечения данных:

Методы анализа: Используются анализ исходного кода, screen-scraping и OCR (Optical Character Recognition) для извлечения информации о стиле.
Ассоциация данных: Используются Style Identifiers (например, foreign keys или unique addressing) для связи между Text Index и Style Index.
Генерация SERP: Применение markup-тегов или генерация динамического CSS для страницы результатов для воспроизведения исходных стилей.

Google индексирует не только текст, но и визуальное представление: Система разработана для извлечения, индексации (в отдельном Style Index) и воспроизведения оригинального стиля контента. Это подтверждает, что Google анализирует CSS и HTML-разметку для понимания структуры и визуальной иерархии.
Визуальный контекст важен для оценки релевантности: Цель патента — предоставить пользователю native context. Внешний вид текста (заголовок или сноска) помогает пользователю оценить важность результата до клика.
Качество дизайна и эстетика могут влиять на выбор в SERP: Патент прямо заявляет, что стилизованные сниппеты предоставляют информацию о качестве дизайна или эстетике исходной страницы. Непривлекательный дизайн может оттолкнуть пользователя.
Инфраструктура для понимания Page Experience: Механизм анализа и индексации стилей, даже если он не используется для точного копирования стиля в стандартных сниппетах, является важной частью инфраструктуры для оценки пользовательского опыта (Page Experience) и анализа структуры страницы.
Гибкость и оптимизация производительности: Система учитывает ограничения производительности и совместимости, предлагая решения: двухэтапное отображение (сначала текст, потом стиль), генерацию альтернативных стилей и отключение функции для определенных устройств/браузеров.

Best practices (это мы делаем)

Инвестируйте в качественный и чистый дизайн (UX/UI): Поскольку Google индексирует и потенциально может отображать ваш оригинальный стиль в SERP, важно, чтобы дизайн был эстетически привлекательным и профессиональным. Это влияет на восприятие бренда и CTR.
Соблюдайте четкую визуальную иерархию контента: Используйте CSS и семантическую HTML-разметку (H1-H6, strong, списки) для выделения ключевой информации. Если основной ответ на запрос оформлен как важный визуальный элемент, это повысит привлекательность сниппета, если он будет стилизован.
Обеспечьте доступность и совместимость стилей: Убедитесь, что ваши CSS доступны для краулеров и корректно обрабатываются Googlebot. Используйте стандартные методы стилизации. Патент упоминает генерацию альтернативных стилей для несовместимых реализаций, но лучше полагаться на чистый код.
Размещайте ключевую информацию в значимых блоках: Патент подчеркивает, что пользователь может отказаться от клика, если увидит в сниппете, что искомый термин является лишь сноской или неважной частью страницы.

Worst practices (это делать не надо)

Использование запутанного или "грязного" кода: Сложный CSS и невалидный HTML могут затруднить извлечение и корректное отображение стилей в Style Index.
Манипуляции с визуальным представлением (Cloaking стилей): Попытки показать Googlebot один стиль, а пользователям другой, рискованны, так как система стремится индексировать и отображать именно то, что видит пользователь (native context).
Игнорирование визуальной иерархии: Размещение важного контента в неструктурированных блоках с невыразительным стилем. Стилизованный сниппет такого контента будет выглядеть непривлекательно.
Использование нечитаемых или чрезмерно "кричащих" стилей: Перегруженный дизайн, плохое сочетание цветов или слишком мелкий шрифт могут быть воспроизведены в SERP и оттолкнуть пользователей. Патент упоминает, что это помогает пользователям избегать "overly flashy" сайтов.

Стратегическое значение

Этот патент подтверждает важность комплексного подхода к SEO, включающего UX/UI и качество фронтенда. Хотя мы не видим массового применения точного копирования стилей в стандартных сниппетах, инфраструктура, описанная в патенте (Text Index + Style Index), критически важна для понимания Google визуальной иерархии и качества пользовательского опыта. Стратегически, это усиливает значение сигналов Page Experience и подчеркивает, что оптимизация включает то, как контент представлен визуально.

Практические примеры

Сценарий: Оптимизация статьи для повышения CTR через стилизованный сниппет

Задача: Повысить кликабельность статьи по запросу "как выбрать треккинговые ботинки".

Действия (основанные на патенте):

Структурирование контента: Ключевые критерии выбора оформляются в виде маркированного списка (<ul>/<li>).
Визуальное выделение: Для списка применяется специфический CSS-стиль (например, увеличенный интервал, кастомные маркеры, жирный шрифт для ключевых слов).
Семантическая разметка: Убедиться, что список предваряется релевантным подзаголовком (H2/H3).

Ожидаемый результат (при условии активации механизма):

Сниппет в SERP может отобразить этот маркированный список с сохранением оригинального стиля. Пользователь увидит не сплошной текст, а структурированный и визуально выделенный список критериев. Это обеспечивает лучший native context, демонстрирует важность информации и повышает вероятность клика.

Означает ли этот патент, что Google точно копирует дизайн моего сайта в SERP?

Патент описывает механизм, который позволяет это делать, чтобы сниппет имел тот же внешний вид, что и в исходном документе. Система индексирует ваши стили в Style Index. Однако на практике Google применяет эту технологию выборочно, балансируя между сохранением оригинального контекста и обеспечением скорости загрузки и унификации дизайна самой страницы выдачи.

Как именно Google извлекает информацию о стиле?

Патент упоминает несколько методов. Основные – это анализ исходного кода страницы, включая HTML-разметку и таблицы стилей (CSS). Также упоминаются альтернативные методы, такие как screen-scraping (анализ отображаемой страницы) и OCR (оптическое распознавание символов) на скриншотах страницы, если другие методы затруднены.

Влияет ли качество моего дизайна на ранжирование согласно этому патенту?

Патент не описывает использование стиля как прямого фактора ранжирования. Однако он прямо заявляет, что отображение стиля помогает пользователям оценить "качество дизайна или эстетику" сайта. Если ваш дизайн отталкивает пользователей и они не кликают на результат (низкий CTR), это косвенно повлияет на поведенческие сигналы, что может повлиять на ранжирование.

Что такое Text Index и Style Index?

Это два отдельных хранилища данных. Text Index хранит само текстовое содержимое веб-страниц. Style Index хранит информацию о форматировании и внешнем виде этого текста (CSS, разметка). Система связывает их с помощью уникальных идентификаторов (Style Identifiers), чтобы при генерации сниппета быстро найти нужный текст и соответствующий ему стиль.

Что делать, если мои стили сложные или нестандартные? Будут ли они отображаться?

Патент предусматривает обработку таких случаев (Claim 14). Если система определяет, что стиль несовместим с определенными браузерами, она может сгенерировать и сохранить альтернативный, совместимый стиль (alternate style information). Для SEO-специалистов это подчеркивает важность использования чистых и стандартных методов реализации CSS.

Как этот патент связан с Rich Snippets (Обогащенными результатами)?

Хотя патент фокусируется на копировании оригинального стиля, описанная инфраструктура (извлечение и индексация стилей и структуры) имеет отношение к формированию Rich Snippets. Понимание визуальной иерархии и структуры контента, которое достигается при анализе стилей, помогает Google более точно извлекать данные для обогащенных результатов.

Почему система может показывать стилизованные сниппеты с задержкой?

Это описано в патенте как механизм оптимизации скорости (Claims 7, 8). Сначала отображается страница выдачи с нестилизованными (универсальными) сниппетами, что происходит быстро. Затем, после завершения более ресурсоемкой обработки стилей, сниппеты динамически обновляются до стилизованной версии.

Как я могу использовать этот патент для улучшения CTR?

Ключевая стратегия – обеспечить четкую визуальную иерархию и привлекательный дизайн для наиболее важного контента. Если фрагмент текста, который Google выбирает для сниппета, оформлен как заголовок, выделенный список или акцентированный блок, это будет отражено в стилизованном сниппете, привлекая внимание пользователя.

Применяется ли это к PDF или документам Word?

Да, патент явно указывает, что механизм применим к различным веб-адресуемым документам (web-addressable documents), включая PDF, документы Word и таблицы. Система способна извлекать информацию о форматировании из этих файлов и воспроизводить её в сниппетах.

Стоит ли блокировать доступ Googlebot к CSS-файлам?

Категорически нет. Этот патент подтверждает, что Googlebot должен иметь доступ к CSS для анализа стилей и структуры контента. Блокировка CSS помешает системе корректно проиндексировать информацию в Style Index, что ухудшит понимание контекста страницы и может негативно сказаться на её представлении и оценке (например, в контексте Page Experience).

Как Google может генерировать альтернативные запросы из контента страниц и встраивать их в сниппеты

Google использует механизм для помощи пользователям в уточнении их поискового намерения. Система анализирует текст веб-страниц в результатах поиска и находит фразы, похожие на исходный запрос или характеризующие документ. Эти фразы затем встраиваются непосредственно в сниппеты как кликабельные предложения для нового поиска, облегчая навигацию и уточнение запроса.

US9183323B1
2015-11-10

Семантика и интент
SERP

Как Google использует данные о выделении текста пользователями (явно или неявно) для генерации сниппетов и анализа контента

Google может собирать данные о том, какие фрагменты текста пользователи выделяют на веб-страницах, используя специальные инструменты или просто выделяя текст мышью. Эти данные агрегируются для определения наиболее важных частей документа. На основе этой "популярности" Google может динамически генерировать поисковые сниппеты, включающие наиболее часто выделяемые фрагменты.

US8595619B1
2013-11-26

Поведенческие сигналы
SERP

Как Google генерирует визуальные превью страниц в выдаче, используя "разрывы страницы" и масштабирование релевантного контента

Google использует систему для создания визуальных превью страниц (Page Previews) в результатах поиска. Система оценивает релевантность контента, учитывая близость ключевых слов и тип контента (например, пессимизируя сноски). Для показа наиболее важных, но разрозненных участков используются "разрывы страницы" (Page Tears). Ключевой контент также может отображаться в увеличенном масштабе для читаемости, помогая пользователю оценить формат страницы до клика.

US8954427B2
2015-02-10

SERP
Семантика и интент

Как Google динамически выбирает текст для сниппета, основываясь на типе запроса и структуре документа

Google использует адаптивную систему для генерации сниппетов в результатах поиска. Система анализирует тип запроса (например, поиск по автору или по содержанию) и местоположение ключевых слов в документе. На основе этого выбирается алгоритм генерации. Параграфы оцениваются по их длине, позиции в документе, качеству текста и форматированию, чтобы выбрать наиболее информативный фрагмент, часто отдавая предпочтение введению или резюме.

US8145617B1
2012-03-27

SERP
Семантика и интент

Как Google использует сравнение DOM и Render Tree для обнаружения и девальвации скрытого текста при генерации сниппетов и ранжировании

Google использует механизм для точного определения, какой текст на веб-странице виден пользователю при загрузке, а какой скрыт. Система сравнивает весь код страницы (DOM Tree) с тем, что фактически отображается (Render Tree). Обнаруженный скрытый текст (например, в меню, скрытый через CSS или цветом фона) получает понижающий коэффициент (Weighting Factor), что снижает вероятность его попадания в сниппет и может влиять на оценку страницы.

US8639680B1
2014-01-28

Техническое SEO
Индексация
SERP

Как Google использует историю поиска и браузинга для персонализации выдачи и определения предпочтений пользователя

Google записывает и анализирует историю действий пользователя: запросы, клики по результатам и рекламе, посещенные страницы. Система группирует связанные действия в сессии, определяет "Предпочитаемые локации" на основе частоты и времени визитов (stay-time), и использует эту историю для изменения порядка ранжирования, повышая позиции ранее посещенных сайтов в персональной выдаче.

US20060224583A1
2006-10-05

Персонализация
Поведенческие сигналы

Как Google использует историю поиска и браузинга пользователя для персонализации и изменения результатов выдачи

Google записывает историю поиска и просмотров пользователя для последующей персонализации выдачи. Система может повышать в ранжировании ранее посещенные сайты, добавлять в текущую выдачу релевантные результаты из прошлых похожих запросов, а также понижать сайты, которые пользователь ранее видел, но проигнорировал. Патент также описывает создание "предпочитаемых локаций" на основе частоты посещений и времени пребывания на сайте.

US9256685B2
2016-02-09

Персонализация
Поведенческие сигналы
SERP

Как Google использует всплески поискового интереса и анализ новостей для обновления Графа Знаний в реальном времени

Google отслеживает аномальный рост запросов о сущностях (людях, компаниях) как индикатор реального события. Система анализирует свежие документы, опубликованные в этот период, извлекая факты в формате Субъект-Глагол-Объект (SVO). Эти факты используются для оперативного обновления Графа Знаний или добавления блока «Недавно» в поисковую выдачу.

US9235653B2
2016-01-12

Knowledge Graph
Свежесть контента
Семантика и интент

Как Google использует тематические списки предпочтительных и нежелательных сайтов (Editorial Opinion) для корректировки ранжирования

Google может заранее определять "Темы запросов" (Query Themes) и назначать для них списки "Предпочтительных" (Favored) и "Нежелательных" (Non-Favored) источников. Если запрос пользователя соответствует теме, система корректирует ранжирование: повышает предпочтительные источники и понижает нежелательные, используя "Параметр редакторского мнения" (Editorial Opinion Parameter).

US7096214B1
2006-08-22

EEAT и качество
Антиспам
SERP

Как Google использует контекст и анализ офлайн-поведения (Read Ranking) для соединения физических документов с цифровыми копиями

Система идентифицирует цифровой контент по сканированному фрагменту из физического мира, используя не только текст, но и обширный контекст (время, местоположение, историю пользователя). Патент также вводит концепцию «Read Ranking» — отслеживание популярности физических документов на основе того, что люди сканируют, как потенциальный сигнал ранжирования.

US20110295842A1
2011-12-01

Поведенческие сигналы
Персонализация
Семантика и интент

Как Google использует контекст пользователя для предложения запросов до начала ввода текста (Zero-Input Queries)

Google анализирует историю поисковых запросов, группируя их в «контекстные кластеры» на основе схожести темы и обстоятельств ввода (время, местоположение, интересы). Когда пользователь открывает строку поиска, система оценивает его текущий контекст и мгновенно предлагает релевантные категории запросов (например, «Кино» или «Рестораны»), предсказывая намерение еще до ввода символов.

US10146829B2
2018-12-04

Семантика и интент
Персонализация
Поведенческие сигналы

Как Google агрегирует, оценивает и ранжирует комментарии, отзывы и упоминания о веб-странице из разных источников

Google собирает комментарии, отзывы и посты в блогах, относящиеся к определенной веб-странице. Система использует сложные алгоритмы для определения основной темы упоминаний (особенно если в них несколько ссылок) и ранжирует эти комментарии на основе авторитетности автора, свежести, качества языка и обратной связи пользователей, чтобы представить наиболее полезные мнения.

US8745067B2
2014-06-03

EEAT и качество
Свежесть контента
Семантика и интент

Как Google использует контент вокруг ссылок (вне анкора) для генерации «Синтетического Описательного Текста» и ранжирования вашего сайта

Google может генерировать «Синтетический Описательный Текст» для страницы, анализируя контент и структуру сайтов, которые на нее ссылаются. Система создает структурные шаблоны для извлечения релевантного текста (например, заголовков или абзацев рядом со ссылкой), который затем используется как мощный сигнал ранжирования. Этот механизм позволяет лучше понять содержание страницы, особенно если традиционный анкорный текст низкого качества или отсутствует.

US9208233B1
2015-12-08

Ссылки
Семантика и интент
Индексация

Как Google использует клики пользователей в Поиске по Картинкам для определения реального содержания изображений

Google использует данные о поведении пользователей для автоматической идентификации содержания изображений. Если пользователи вводят определенный запрос (Идею) и массово кликают на конкретное изображение в результатах поиска, система ассоциирует это изображение с Концептом, производным от запроса. Это позволяет Google понимать, что изображено на картинке, не полагаясь исключительно на метаданные или сложный визуальный анализ, и улучшает релевантность ранжирования в Image Search.

US8065611B1
2011-11-22

Поведенческие сигналы
Семантика и интент
Мультимедиа

Как Google использует распределение кликов по разным типам запросов для оценки общего качества сайта (Website Quality Score)

Google оценивает качество сайта не по общему CTR, а по тому, в ответ на какие запросы он получает клики. Система сегментирует пользовательский фидбек (клики, CTR) по различным параметрам запроса (например, конкурентность, длина, популярность). Сайт считается качественным, если он получает много кликов в ответ на высококонкурентные и популярные запросы, а не только на низкочастотные или нечеткие.

US8615514B1
2013-12-24

Поведенческие сигналы