SEO HARDCORE
  • Разборы патентов
    • Патенты Google
  • Скоро SEO инструменты
  • Скоро SEO аналитика
  • seohardcore
SEO HARDCORE
назад

Как Google планирует использовать «Snippet Packets» для сохранения, курирования и публикации фрагментов веб-страниц как нового формата контента

GENERATING A SNIPPET PACKET BASED ON A SELECTION OF A PORTION OF A WEB PAGE (Генерация пакета сниппета на основе выбора части веб-страницы)
  • US12038997B2
  • Google LLC
  • 2022-12-15
  • 2024-07-16
  • Семантика и интент
  • Описание
  • Разбор
  • Выводы
  • Практика
  • FAQ
  • Похожие

Google разработал механизм «Snippet Packet», позволяющий пользователям сохранять определенный контент (текст, изображения) с веб-страницы. Пакет включает сам контент, URL и точные данные о местоположении (например, Text Fragments). Система генерирует интерактивные графические карточки для обмена и потенциальной публикации в вебе, позволяя пользователям возвращаться точно к исходному месту на странице.

Описание

Какую проблему решает

Патент решает проблему сохранения контекста при кураторстве веб-контента. Традиционные методы (закладки, копирование текста) часто не позволяют быстро вернуться к точному местоположению сохраненного фрагмента на исходной странице. Изобретение направлено на создание структурированного и интерактивного способа сохранения веб-фрагментов с возможностью мгновенного восстановления контекста.

Что запатентовано

Запатентована система и метод создания Snippet Packet. Это структура данных, которая инкапсулирует выбранный пользователем элемент контента (Content Item), адрес источника (Address Data, например, URL) и точные данные о местоположении контента на странице (Location Data, например, Text Fragments). Система также описывает генерацию визуальных Graphical Cards для этих пакетов и механизмы взаимодействия для автоматической навигации к источнику.

Как это работает

Механизм работает в несколько этапов:

  • Выбор контента: Пользователь выбирает часть веб-страницы, используя стандартное выделение или жесты (например, обводка).
  • Идентификация и Локализация: Система определяет границы контента, фиксирует URL и генерирует точные Location Data (например, директивы Text Fragment).
  • Обработка (ML): Контент может быть обработан ML-моделями для извлечения сущностей (Entity Tags), определения тем или создания резюме (Summarization).
  • Генерация Карточки: Система создает Graphical Card, часто накладывая текст (или резюме) на релевантное изображение или фон.
  • Создание и Хранение Пакета: Все данные объединяются в Snippet Packet и сохраняются (например, в Google Collections).
  • Взаимодействие и Обмен: При последующем выборе Snippet Packet система загружает веб-страницу и использует Location Data для автоматической прокрутки и выделения исходного контента. Пакетами можно делиться или публиковать их.

Актуальность для SEO

Высокая. Патент выдан в 2024 году и отражает актуальные тенденции в области курирования контента и технологий точного связывания. Он напрямую связан со стандартом Scroll-to-Text Fragment, который Google уже активно использует. Упоминание публикации сниппетов «в открытом вебе как новый формат контента» указывает на стратегическое направление развития экосистемы Google.

Важность для SEO

Влияние на SEO оценивается как среднее-высокое (6.5/10). Патент не описывает алгоритм ранжирования, но имеет важное стратегическое значение. Во-первых, он описывает новый формат контента (Snippet Packets), который может публиковаться в вебе и потенциально появляться в поиске или Discover. Во-вторых, система предоставляет Google детальные данные о том, какие именно фрагменты контента пользователи считают ценными («clipping data»), что может стать косвенным сигналом качества или релевантности контента на гранулярном уровне.

Детальный разбор

Термины и определения

Address Data (Адресные данные)
Данные, описывающие адрес источника контента. Обычно это URL или URI веб-страницы, но может быть и адрес локального файла.
Content Item (Элемент контента)
Конкретный фрагмент веб-страницы, выбранный пользователем для сохранения (текст, изображения, видео, аудио или мультимодальные данные).
Entity Tag (Тег сущности)
Метаданные, сгенерированные путем обработки Content Item (часто с помощью ML) для идентификации связанных сущностей. Используется для категоризации и организации Snippet Packets.
Gesture Data (Данные жеста)
Входные данные, описывающие жест пользователя (например, обводка кругом на сенсорном экране) для выбора контента.
Graphical Card (Графическая карточка)
Визуальное представление Snippet Packet. Часто генерируется автоматически и включает текст (исходный или резюмированный), наложенный на изображение или фон, а также атрибуцию источника. Является интерактивным элементом.
Location Data (Данные о местоположении)
Данные, точно определяющие местоположение Content Item внутри исходной веб-страницы. Могут включать позицию прокрутки, узлы DOM или, что предпочтительнее, Text Fragments.
Snippet Packet (Пакет сниппета)
Основное изобретение. Структура данных, которая инкапсулирует Content Item, Address Data и Location Data.
Text Fragment (Текстовый фрагмент)
Спецификация (упоминается стандарт WICG Scroll-to-Text Fragment), позволяющая добавлять в URL указания на конкретный фрагмент текста. Включает текстовые директивы с указанием начала и конца текста для точной навигации и выделения.

Ключевые утверждения (Анализ Claims)

Claim 1 (Независимый пункт): Описывает полный цикл генерации, хранения и обмена Snippet Packet.

  1. Система предоставляет GUI для отображения веб-страницы и получает запрос на сохранение Content Items.
  2. Генерируется Snippet Packet, включающий: контент, Address Data (URL) и Location Data.
  3. Процесс генерации включает создание Graphical Card: определяется связанное изображение и текст, текст накладывается поверх изображения.
  4. Пакет сохраняется и ассоциируется с пользователем.
  5. Система получает выбор опции обмена (sharing) и передает пакет другим системам.
  6. Переданная Graphical Card является кликабельной и автоматически направляет пользователя точно к местоположению контента на исходной странице, используя Address Data и Location Data.

Claim 8 (Независимый пункт): Описывает процесс взаимодействия с уже созданным Snippet Packet (повторный доступ).

  1. Система получает ввод, указывающий на выбор Graphical Card (которая содержит суммированный текст, наложенный на изображение).
  2. Извлекаются Address Data и Location Data из связанного пакета.
  3. Загружаются данные веб-страницы по Address Data.
  4. Определяется точное местоположение контента с помощью Location Data.
  5. Предоставляется часть веб-страницы. Этот процесс включает: отображение страницы в окне, автоматическую навигацию (прокрутку) к местоположению и предоставление индикаторов (например, подсветки) исходного контента.

Claim 13 (Независимый пункт): Описывает генерацию Snippet Packet на основе жеста пользователя и автоматическое создание тематической карточки.

  1. Система получает Gesture Data (например, обводка), связанные с частью страницы.
  2. Gesture Data обрабатываются для определения выбранного Content Item.
  3. Генерируется Snippet Packet, включающий контент и Graphical Card, которая кликабельна для навигации к источнику.
  4. Генерация карточки включает специфический метод: контент обрабатывается для определения темы (topic); на основе темы определяется изображение; создается карточка с этим изображением в качестве фона и наложенным текстом.

Где и как применяется

Этот патент в первую очередь относится к пользовательскому интерфейсу (UI/UX) и системам управления контентом (браузеры, Google Collections), но он взаимодействует с результатами поиска и потенциально может влиять на архитектуру поиска.

INDEXING – Индексирование и извлечение признаков
Функционирование Snippet Packets полагается на глубокое понимание структуры страницы (DOM) и контента. Возможность генерировать точные Location Data (например, Text Fragments) требует, чтобы контент был корректно проиндексирован и отрендерен.

QUNDERSTANDING (Понимание Контента)
Патент активно использует ML для анализа сохраняемого контента. Упоминается обработка Content Item для извлечения сущностей (Claim 6), генерации Entity Tags, определения тем (Claim 13) и создания резюме (Claim 8). Это применение NLP и ML для понимания контента на лету.

METASEARCH – Метапоиск и Смешивание
В патенте и на иллюстрациях упоминается возможность публикации Snippet Packets в открытый веб как «новый формат контента» и их отображение в интерфейсе «Search Engine». Это может означать появление сохраненных или популярных пакетов в результатах поиска, ленте Discover или других рекомендательных системах как нового типа вертикального контента.

Входные данные:

  • Данные веб-страницы (HTML, DOM, медиаресурсы).
  • Пользовательский ввод (Gesture Data, выделение текста/изображений).
  • Address Data (URL текущей страницы).
  • Контекстные данные пользователя (опционально, например, местоположение, время).

Выходные данные:

  • Snippet Packet (структура данных).
  • Graphical Card (визуальное представление).
  • Entity Tags (метаданные о сущностях).

На что влияет

  • Конкретные типы контента: Влияет на все типы контента, которые можно выделить: текст, изображения, видео, аудио.
  • Специфические запросы и тематики: Наибольшее влияние в информационных и коммерческих нишах (исследования, обучение, YMYL, e-commerce), где важно сохранение точных цитат, данных или товаров с контекстом.
  • Форматы контента: Повышает ценность лонгридов и детальных гайдов, позволяя пользователям легко извлекать и сохранять ключевые «наггетсы» информации.

Когда применяется

Алгоритм активируется исключительно по инициативе пользователя.

  • Триггеры активации (Создание): Выполнение пользователем действия для сохранения контента: нажатие кнопки «Clip», «Save», «Summarize» или выполнение определенного жеста (обведение).
  • Триггеры активации (Взаимодействие): Когда пользователь выбирает ранее сохраненный Snippet Packet.

Пошаговый алгоритм

Процесс А: Генерация Snippet Packet

  1. Отображение и Ввод: Система отображает веб-страницу и получает ввод от пользователя (например, Gesture Data).
  2. Идентификация Контента: Ввод обрабатывается для определения границ Content Item. Может использоваться ML для интерпретации жестов и определения семантически целостного блока на основе структуры DOM и синтаксиса.
  3. Извлечение Данных: Извлекается Content Item. Фиксируются Address Data (URL). Генерируются точные Location Data (например, Text Directives/Text Fragments).
  4. Обработка Контента (Опционально): Content Item обрабатывается ML-моделями для извлечения Entity Tags, определения темы или создания резюме.
  5. Генерация Графической Карточки: Определяется фон (цвет, связанное изображение со страницы или изображение на основе темы). Текст (исходный или резюме) накладывается на фон. Добавляется атрибуция.
  6. Сборка и Хранение Пакета: Все компоненты собираются в Snippet Packet и сохраняются (локально или в облаке).

Процесс Б: Взаимодействие с Snippet Packet

  1. Выбор Пакета: Пользователь выбирает сохраненный Snippet Packet (кликает на Graphical Card).
  2. Извлечение Данных Навигации: Система извлекает Address Data и Location Data.
  3. Загрузка Страницы: Система загружает веб-страницу, используя Address Data.
  4. Навигация и Индикация: После загрузки система использует Location Data (например, Text Fragment в URL) для автоматической прокрутки к точному местоположению исходного контента и его визуального выделения (highlighting).

Какие данные и как использует

Данные на входе

  • Контентные факторы: Текст, изображения, видео, аудио, выбранные пользователем. Анализируются для суммаризации и извлечения сущностей.
  • Структурные факторы: Структура HTML/DOM используется для определения границ контента (content boundary) и генерации Location Data.
  • Технические факторы: URL страницы (Address Data).
  • Пользовательские факторы: Gesture Data, явное выделение контента. Контекст пользователя (местоположение, время) может сохраняться как метаданные пакета.

Какие метрики используются и как они считаются

Патент не приводит формул ранжирования, но описывает следующие методы вычислений:

  • Location Data (Text Fragments): Рассчитывается путем определения начала (start data) и конца (end data) выделенного контента.
  • Определение границ контента (при жестах):
    • Вычисление площади пересечения прямоугольника жеста (gesture rectangle) с элементами контента. Элемент с наибольшим пересечением выбирается.
    • Использование ML-моделей для определения границ на основе синтаксиса, структуры и семантической связности (semantic cohesion).
  • NLP и ML Модели:
    • Извлечение Сущностей: Используется для генерации Entity Tags.
    • Определение Темы: Используется для выбора релевантных изображений для фона Graphical Card.
    • Резюмирование (Summarization): Используется для генерации краткого описания контента.

Выводы

  1. Гранулярность контента и Deep Linking: Патент подчеркивает смещение фокуса к конкретным фрагментам информации внутри страницы. Ключевой технологией является использование Location Data (особенно Text Fragments) для точного глубокого связывания (Deep Linking), что обеспечивает бесшовный возврат к контексту.
  2. Новый формат обмена и потенциальная публикация: Изобретение вводит Graphical Cards как стандартизированный формат обмена контентом. Критически важное упоминание о возможности публикации Snippet Packets в открытом вебе указывает на потенциальное появление нового типа курируемого пользователями контента в экосистеме Google (SERP, Discover).
  3. Автоматизация с помощью ML: Система активно использует ML для улучшения качества пакетов: интерпретация жестов, суммаризация текста, извлечение сущностей (Entity Tags) и автоматический дизайн карточек (подбор изображений на основе темы).
  4. Потенциальный новый сигнал релевантности («Clipping Data»): Система создает массив данных о том, какие именно части веб-страниц пользователи сохраняют и чем делятся. Эти данные («clipping data») могут стать мощным сигналом для оценки качества и релевантности контента на гранулярном уровне, хотя патент этого прямо не утверждает.

Практика

Best practices (это мы делаем)

  • Обеспечение технической совместимости с Deep Linking: Убедитесь, что сайт корректно работает с технологией Scroll-to-Text Fragments. Избегайте сложных JavaScript-манипуляций или нестабильных макетов (CLS), которые могут нарушить возможность браузера точно определить местоположение фрагмента. Тестируйте генерацию ссылок на фрагменты.
  • Создание «Clippable» контента: Разрабатывайте контент с четкими, ценными и лаконичными сегментами (ключевые выводы, статистика, определения), которые пользователи захотят сохранить. Это увеличит вероятность распространения вашего контента через этот механизм.
  • Четкая структура и семантическая разметка: Используйте логичную структуру документа и семантические теги. Это помогает системе корректно определить границы Content Item при выделении (особенно жестами) и способствует корректному извлечению сущностей.
  • Оптимизация визуального контента (Image SEO): Используйте качественные и релевантные изображения рядом с важным текстом. Система может использовать эти изображения для фона Graphical Card, делая сохраненный сниппет более привлекательным для обмена.
  • Фокус на Сущностях (Entities): Насыщайте контент четкими ссылками на сущности, так как система генерирует Entity Tags для организации пакетов. Это поможет Google правильно категоризировать фрагменты вашего контента.

Worst practices (это делать не надо)

  • Обфускация или блокировка выделения контента: Техники, предотвращающие копирование или выделение контента (например, блокировка выделения текста с помощью JavaScript), помешают пользователям генерировать Snippet Packets, ухудшая UX и блокируя потенциальный канал дистрибуции.
  • Сложный и нестабильный Rendering: Использование сложных JavaScript-механизмов для отображения контента или частые изменения в DOM структуре могут нарушить работу Location Data, делая сохраненные ссылки нерабочими.
  • Низкая информационная плотность («Вода»): Создание длинных текстов без четких ключевых моментов снижает вероятность того, что пользователи захотят сохранить какой-либо фрагмент.

Стратегическое значение

Патент подтверждает стратегию Google на переход к более гранулярному пониманию и организации информации (уровень фрагментов). Для SEO это означает необходимость оптимизации не только страниц, но и отдельных «наггетсов» информации. Потенциальное использование данных о клиппинге как сигнала релевантности может изменить подходы к созданию контента. Если Snippet Packets станут новым форматом контента в выдаче или Discover (как указано в патенте), это потребует разработки стратегий по оптимизации под этот формат UGC (User Generated Content).

Практические примеры

Сценарий: Оптимизация статьи-руководства для Snippet Packets

  1. Анализ контента: В длинной статье «Как выбрать палатку» определяются ключевые советы (например, «Водонепроницаемость должна быть не менее 3000 мм»).
  2. Структурирование: Ключевые советы оформляются в виде отдельных абзацев или маркированных списков. Это облегчает пользователю выделение, а системе — определение границ контента.
  3. Визуальное сопровождение: Рядом с советом размещается качественная инфографика или изображение, иллюстрирующее концепцию.
  4. Ожидаемый результат (Система): Когда пользователь выделяет совет, система генерирует Snippet Packet. Для Graphical Card она использует текст совета и автоматически подтягивает инфографику в качестве фона.
  5. Ожидаемый результат (SEO): Увеличение распространения контента через обмен привлекательными карточками. Потенциальное получение положительных сигналов релевантности за счет частого сохранения этого конкретного фрагмента.

Вопросы и ответы

Является ли этот патент описанием алгоритма ранжирования?

Нет, напрямую этот патент не описывает алгоритм ранжирования в поиске. Он фокусируется на пользовательском интерфейсе и создании структуры данных (Snippet Packet) для сохранения и обмена фрагментами веб-страниц с точными глубокими ссылками.

Каковы потенциальные SEO-последствия этого патента, если он не о ранжировании?

Есть два основных последствия. Первое: в патенте упоминается возможность публикации Snippet Packets как «нового формата контента» в открытом вебе, что может создать новые точки видимости в SERP или Discover. Второе: сбор данных о том, какие фрагменты пользователи сохраняют чаще всего («clipping data»), может использоваться Google как косвенный сигнал качества и релевантности контента.

Что такое Location Data и почему это важно?

Location Data — это ключевой компонент, который точно определяет местоположение сохраненного контента на исходной странице, часто используя технологию Text Fragments (Scroll-to-Text). Это критически важно, так как позволяет пользователю при клике на сохраненный пакет автоматически перейти и увидеть выделенный исходный контент в его оригинальном контексте.

Как SEO-специалист может оптимизировать сайт под эту технологию?

Необходимо сосредоточиться на техническом и контентном аспектах. Технически, сайт должен быть стабильным и не ломать работу Scroll-to-Text Fragments. Контентно, следует создавать четко структурированный материал с лаконичными и ценными фрагментами (цитаты, факты), которые пользователи захотят сохранить, и сопровождать их качественными изображениями.

Что такое Graphical Card и как она генерируется?

Graphical Card — это визуальное представление сохраненного фрагмента. Она генерируется автоматически. Система может использовать исходный текст или его резюме и наложить его на фон. Фон может быть изображением со страницы или изображением, подобранным на основе темы контента с помощью ML-моделей.

Патент упоминает извлечение сущностей (Entity Extraction). Как это используется?

Система анализирует сохраненный контент для идентификации сущностей и генерирует Entity Tags. Эти теги используются для автоматической организации Snippet Packets в пользовательских коллекциях (например, группировка всех сохраненных фрагментов о конкретном продукте) и для установления связей между разными пакетами.

Может ли сложная верстка или JavaScript помешать работе Snippet Packets?

Да, может. Если контент загружается динамически сложным образом, структура DOM нестабильна или используются скрипты, блокирующие выделение, система может не справиться с генерацией корректных Location Data. Это приведет к тому, что сохраненные ссылки не смогут автоматически прокрутить страницу к нужному фрагменту.

Описывает ли патент сохранение только текста?

Нет. Патент явно указывает, что Content Item может включать текст, изображения, видео, аудио и мультимодальные данные. Механизм предназначен для сохранения любого выбранного элемента контента на веб-странице или даже в локальных файлах и приложениях.

Где пользователь может столкнуться с этой технологией?

Скорее всего, эта технология интегрирована или будет интегрирована в продукты Google, такие как браузер Chrome, мобильное приложение Google App и сервис Google Collections. Она может проявляться в виде опций «Сохранить», «Clip» или через специальные жесты при просмотре веб-контента.

Чем это отличается от Google Collections или закладок?

Основное отличие — наличие Location Data. Закладки сохраняют только URL и ведут на начало страницы. Snippet Packet сохраняет конкретный фрагмент внутри страницы и позволяет автоматически перейти к этому точному месту при повторном открытии, что критически важно для длинных документов.

Похожие патенты

Как Google использует курируемые пользователями коллекции контента (Web Notebooks) для ранжирования и генерации сниппетов
Google может использовать контент, собранный пользователями в коллекциях ("Web Notebooks"), как сигнал для ранжирования и генерации сниппетов. Если страница была сохранена в тематическую коллекцию, контекст которой (заголовки, аннотации) соответствует запросу, ее позиция может быть повышена. Кроме того, сохраненный пользователем фрагмент может использоваться в качестве сниппета в поисковой выдаче.
  • US9256676B2
  • 2016-02-09
  • SERP

  • Поведенческие сигналы

  • Персонализация

Как Google использует данные о выделении текста пользователями (явно или неявно) для генерации сниппетов и анализа контента
Google может собирать данные о том, какие фрагменты текста пользователи выделяют на веб-страницах, используя специальные инструменты или просто выделяя текст мышью. Эти данные агрегируются для определения наиболее важных частей документа. На основе этой "популярности" Google может динамически генерировать поисковые сниппеты, включающие наиболее часто выделяемые фрагменты.
  • US8595619B1
  • 2013-11-26
  • Поведенческие сигналы

  • SERP

Как Google извлекает и может отображать оригинальный дизайн (стили) контента в сниппетах поисковой выдачи
Google разработал систему для отображения текстовых сниппетов в поисковой выдаче с сохранением их оригинального стиля (шрифт, размер, форматирование) из исходного документа. Для этого система создает отдельные индексы для текста и стилей. Это позволяет пользователям оценить визуальный контекст, важность контента и эстетику сайта непосредственно в SERP, влияя на выбор результата.
  • US10311114B2
  • 2019-06-04
  • SERP

  • Индексация

  • Техническое SEO

Как Google использует контекст и анализ офлайн-поведения (Read Ranking) для соединения физических документов с цифровыми копиями
Система идентифицирует цифровой контент по сканированному фрагменту из физического мира, используя не только текст, но и обширный контекст (время, местоположение, историю пользователя). Патент также вводит концепцию «Read Ranking» — отслеживание популярности физических документов на основе того, что люди сканируют, как потенциальный сигнал ранжирования.
  • US20110295842A1
  • 2011-12-01
  • Поведенческие сигналы

  • Персонализация

  • Семантика и интент

Как Google создает тематические анимированные превью для SERP, анализируя и кластеризируя изображения на странице
Google использует систему для генерации анимированных сниппетов (например, GIF) в результатах поиска. Система анализирует страницу, идентифицирует постоянные изображения (исключая рекламу и иконки), оценивает их расположение и качество, и группирует их по темам. Для одной страницы создается несколько анимированных превью. При получении запроса Google выбирает то превью, которое наиболее релевантно теме запроса, улучшая визуальное представление выдачи.
  • US10503803B2
  • 2019-12-10
  • SERP

  • Мультимедиа

  • Семантика и интент

Популярные патенты

Как Google создает и наполняет Панели Знаний (Knowledge Panels), используя шаблоны сущностей и популярность фактов
Google использует систему для отображения Панелей Знаний (Knowledge Panels) рядом с результатами поиска. Когда запрос относится к конкретной сущности (человеку, месту, компании), система выбирает соответствующий шаблон и наполняет его контентом из разных источников. Выбор фактов для отображения основан на том, как часто пользователи искали эту информацию в прошлом.
  • US9268820B2
  • 2016-02-23
  • Knowledge Graph

  • SERP

  • Семантика и интент

Как Google выбирает, сортирует и форматирует динамические Sitelinks на основе типа контента и свежести страниц
Патент Google описывает систему генерации Sitelinks (саб-ссылок), которые ведут непосредственно на конечный контент (статьи, видео, товары), а не на разделы сайта. Система определяет категорию контента и применяет специфические правила сортировки (например, по свежести для новостей), которые отличаются от стандартного ранжирования. Также используется специальное форматирование для улучшения навигации в SERP.
  • US9081832B2
  • 2015-07-14
  • Ссылки

  • SERP

  • Свежесть контента

Как Google использует распределение кликов в выдаче для определения брендовых (навигационных) и общих (тематических) запросов
Google анализирует поведение пользователей в поисковой выдаче для классификации интента запроса. Если клики сконцентрированы на одном результате (низкое разнообразие, высокая частота), запрос классифицируется как навигационный или брендовый (Data-Creator Targeting). Если клики распределены по разным сайтам, запрос считается общим (Content Targeting). Эта классификация используется для адаптации поисковой выдачи.
  • US20170068720A1
  • 2017-03-09
  • Семантика и интент

  • Поведенческие сигналы

  • SERP

Как Google интегрирует поиск в инструменты создания контента и использует распространение ссылок для расчета репутации автора
Google разработал систему (UDS), интегрирующую поиск в инструменты создания контента (Email, блоги, форумы). Система автоматически уточняет запросы на основе контекста и профилей пользователей. Если автор вставляет ссылку, а читатель кликает по ней, Google использует это взаимодействие для расчета «оценки репутации» автора и как поведенческий сигнал качества контента.
  • US7844603B2
  • 2010-11-30
  • Ссылки

  • Поведенческие сигналы

  • EEAT и качество

Как Google использует всплески поискового интереса и анализ новостей для обновления Графа Знаний в реальном времени
Google отслеживает аномальный рост запросов о сущностях (людях, компаниях) как индикатор реального события. Система анализирует свежие документы, опубликованные в этот период, извлекая факты в формате Субъект-Глагол-Объект (SVO). Эти факты используются для оперативного обновления Графа Знаний или добавления блока «Недавно» в поисковую выдачу.
  • US9235653B2
  • 2016-01-12
  • Knowledge Graph

  • Свежесть контента

  • Семантика и интент

Как Google использует клики пользователей в поиске по картинкам для понимания содержания изображений и улучшения таргетинга
Google анализирует поведение пользователей в поиске по картинкам для идентификации содержания изображений. Если пользователи ищут определенный запрос (идею) и массово кликают на конкретное изображение в результатах, система связывает это изображение с данным запросом (концепцией). Эти данные используются для улучшения ранжирования в поиске картинок и для предложения релевантных ключевых слов рекламодателям, загружающим схожие изображения.
  • US11409812B1
  • 2022-08-09
  • Поведенческие сигналы

  • Семантика и интент

  • SERP

Как Google вычисляет тематический авторитет автора (Author Rank) на основе его вклада в контент
Google патентует систему для количественной оценки экспертности авторов по конкретным темам. Система анализирует документы, определяет их тематику (Topic) и вес этой тематики (Weight), а затем учитывает долю вклада (Authorship Percentage) каждого автора в раскрытие этой темы. На основе этих данных формируется кумулятивный «Сигнал Авторитета» (Authority Signature) автора, позволяющий идентифицировать экспертов в различных областях.
  • US8458196B1
  • 2013-06-04
  • EEAT и качество

  • Семантика и интент

Как Google использует историю поиска и ссылки с предпочитаемых пользователем сайтов для персонализации выдачи
Google может персонализировать результаты поиска, используя историю запросов или просмотров пользователя для создания набора предпочтений (Document Bias Set). Если документы из этого набора, особенно те, которые также признаны глобально качественными, ссылаются на результаты поиска, эти результаты переранжируются (повышаются или понижаются) в соответствии с весами предпочтений пользователя.
  • US8538970B1
  • 2013-09-17
  • Персонализация

  • Поведенческие сигналы

  • SERP

Как Google использует организационные структуры (папки, ярлыки) как ссылки для расчета PageRank и ранжирования документов
Google может анализировать, как документы организованы пользователями (например, в папках, через ярлыки или закладки), и использовать эти организационные структуры для расчета рейтинга документа. Документы, концептуально сгруппированные вместе, передают друг другу ранжирующий вес (аналогично PageRank), причем более тесные связи (например, в одной папке) передают больше веса, чем более слабые связи (например, в соседних папках).
  • US8090736B1
  • 2012-01-03
  • Ссылки

  • SERP

  • Структура сайта

Как Google определяет язык и языковую релевантность страницы, анализируя контекст входящих и исходящих ссылок
Google использует контекст входящих и исходящих ссылок для определения языковой релевантности ресурса. Система анализирует язык анкоров, URL, контент ссылающихся и целевых страниц, а также качество ссылок и тип страницы (например, «языковой шлюз»). Это позволяет точно идентифицировать релевантные языки, даже если на самой странице мало текста.
  • US9098582B1
  • 2015-08-04
  • Ссылки

  • Мультиязычность

  • Семантика и интент

seohardcore