SEO HARDCORE
  • Разборы патентов
    • Патенты Google
  • Скоро SEO инструменты
  • Скоро SEO аналитика
  • seohardcore
SEO HARDCORE
назад

Как Google автоматически обновляет устаревшие факты (время, цены, должности) внутри документов и электронных писем

UPDATING TEXT WITHIN A DOCUMENT (Обновление текста внутри документа)
  • US9607032B2
  • Google LLC
  • 2014-05-12
  • 2017-03-28
  • Свежесть контента
  • Семантика и интент
  • EEAT и качество
  • Описание
  • Разбор
  • Выводы
  • Практика
  • FAQ
  • Похожие

Google использует систему для поддержания актуальности информации в документах (например, в Google Docs или Gmail). Система распознает сущности и их чувствительные ко времени атрибуты (например, время рейса или цену акции). Затем она проверяет актуальное значение через поисковую систему и предлагает пользователю обновить устаревшие данные в тексте.

Описание

Какую проблему решает

Патент решает проблему устаревания фактической информации в документах (электронные письма, текстовые файлы, посты в блогах). Данные, актуальные на момент написания (например, цены, расписания, погода, должности людей), со временем меняются. Изобретение автоматизирует процесс выявления таких time-sensitive attributes (чувствительных ко времени атрибутов) и их обновления до актуального состояния, улучшая точность информации, доступной пользователю.

Что запатентовано

Запатентована система (Suggestion System), которая анализирует текст документа для идентификации сущностей (entities) и их атрибутов, которые могут меняться со временем. Система генерирует запрос к поисковой системе (Search System) для получения актуального значения (result value) и предоставляет его пользователю в качестве замены устаревшего значения (first value) в документе. Ключевым элементом является взаимодействие с пользователем для маркировки (tagging) данных как обновляемых.

Как это работает

Механизм работает в контексте системы просмотра или редактирования документов (Document System):

  • Идентификация: Когда пользователь открывает документ, Suggestion System анализирует текст. Она распознает сущности (например, «Рейс 406») и атрибуты, классифицируемые как чувствительные ко времени (например, «время вылета»).
  • Взаимодействие и Тегирование: Система запрашивает у пользователя разрешение пометить (tag) этот фрагмент как чувствительный ко времени для отслеживания обновлений (ключевой аспект Claim 1).
  • Проверка фактов: Если пользователь согласен (тег сгенерирован), система создает запрос (query) и отправляет его в Search System.
  • Обновление: Получив актуальное значение от Search System, система предоставляет его устройству пользователя для замены устаревшего текста.

Актуальность для SEO

Высокая для экосистемы Google Workspace. Технология активно используется в продуктах Google (Gmail, Google Docs) для повышения удобства пользователей и обеспечения точности данных (например, обновление статуса авиарейсов в письмах или функции Smart Chips). Это актуальное направление развития приложений.

Важность для SEO

Влияние на традиционное SEO (ранжирование сайтов) низкое (2/10). Патент не описывает алгоритмы ранжирования веб-поиска, а фокусируется на функциональности внутри приложений для работы с документами. Однако он предоставляет критически важные стратегические инсайты о возможностях Google в области NLU: как система распознает сущности, идентифицирует чувствительные ко времени данные и использует свою поисковую инфраструктуру (Knowledge Graph) как источник истины для проверки фактов. Это подтверждает важность точности и актуальности данных (E-E-A-T).

Детальный разбор

Термины и определения

Document (Документ)
Компьютерный файл, содержащий текст. Включает текстовые документы, электронные письма, посты в блогах, SMS/MMS сообщения, веб-страницы или поля ввода текста в приложениях.
Document System (Система документов)
Система, предоставляющая пользователям доступ к документам (например, почтовый сервер, облачный текстовый редактор).
Entity (Сущность)
Тема дискурса; концепция или объект, отличимый от других (например, конкретный авиарейс, компания, человек).
First Value (Первое значение)
Исходное значение атрибута в документе (потенциально устаревшее).
Result Value (Результирующее значение)
Актуальное значение атрибута, полученное от Search System.
Search System (Поисковая система)
Система, предоставляющая актуальные значения атрибутов по запросу (например, интернет-поисковик, база данных или Knowledge Graph). Выступает источником истины.
Suggestion System (Система предложений)
Система, которая анализирует документ, генерирует запросы к Search System и предоставляет предложения по обновлению текста.
Tag (Тег)
Метка, генерируемая для значения атрибута после подтверждения пользователем. Указывает, что значение является чувствительным ко времени и инициирует его обновление при определенных условиях (predetermined actions).
Time-sensitive attribute (Чувствительный ко времени атрибут)
Атрибут сущности, значение которого может меняться со временем (например, цена, возраст, погода, должность, время).

Ключевые утверждения (Анализ Claims)

Claim 1 (Независимый пункт): Описывает метод обновления текста, который включает обязательное взаимодействие с пользователем для маркировки данных и активируется после предоставления документа.

  1. Система предоставляет (serving) пользователю документ, содержащий First Value, который еще НЕ помечен (not tagged) как чувствительный ко времени.
  2. Автоматическая идентификация: Система автоматически идентифицирует сущность и time-sensitive attribute на основе текста *после* предоставления документа пользователю. Уточняется, что эти атрибуты ранее не были определены как чувствительные ко времени для этого документа.
  3. Идентифицируется First Value этого атрибута.
  4. Запрос на тегирование (Prompting): Пользователю предоставляется запрос (prompt) в документе. Выбор элемента управления в запросе помечает значение как time-sensitive attribute value.
  5. Генерация тега (Tagging): В ответ на выбор пользователя генерируется тег (tag). Этот тег инициирует обновление текста при наступлении предопределенных действий (predetermined actions).
  6. Обновление (в ответ на тегирование):
    • Генерируется запрос (query), специфицирующий сущность.
    • Запрос предоставляется Search System, которая возвращает Result Value.
    • Пользователю предоставляются данные, которые вызывают отображение Result Value в качестве замены First Value, как указано тегом.

Claim 3 (Зависимый от 1): Определяет условия (predetermined actions) для будущего обновления помеченного значения.

Условиями могут быть: доступ к документу, явный запрос пользователя на обновление или запрос от Document System (например, пакетное обновление).

Claim 4 и 5 (Зависимые): Детализируют идентификацию чувствительных ко времени атрибутов.

Идентификация происходит путем проверки наличия атрибута в предопределенном списке (list of predetermined time-sensitive attributes). Примеры из патента: цена, возраст, погодные условия (environmental condition), человек, занимающий должность (a person holding a title), или время.

Где и как применяется

Этот патент не применяется к стандартным этапам ранжирования веб-поиска. Он описывает функциональность на уровне приложений (например, Google Docs, Gmail), которая, однако, тесно взаимодействует с поисковой инфраструктурой Google.

INDEXING – Индексирование и извлечение признаков (Косвенно)
Search System, используемая для проверки фактов, полагается на данные, проиндексированные Google (включая Knowledge Graph). Эта инфраструктура должна поддерживать актуальность значений атрибутов сущностей. Также на этом этапе разрабатываются NLP-модели для распознавания сущностей, используемые Suggestion System.

QUNDERSTANDING – Понимание Запросов
Suggestion System использует сложные возможности NLU (Natural Language Understanding) для анализа текста документа, идентификации триплета (Сущность, Атрибут, Значение) и генерации структурированного запроса к Search System на основе неструктурированного контекста.

Применение в Приложениях (Document/Suggestion System)
Основное применение происходит в реальном времени при взаимодействии пользователя с документом.

  • Входные данные:
    • Текст документа (Document text).
    • Предопределенный список чувствительных ко времени атрибутов.
    • Пользовательский ввод (подтверждение тегирования).
  • Выходные данные:
    • Запросы (queries) к Search System.
    • Предложения (prompts) пользователю.
    • Обновленный текст документа (result data с result value).
    • Метаданные документа (теги).

На что влияет

  • Конкретные типы контента: Влияет на документы, содержащие фактическую информацию, которая может устареть: электронные письма с бронированиями, финансовые отчеты, биографические справки, прогнозы.
  • Специфические атрибуты: Система активируется для контента, содержащего сущности с атрибутами из предопределенного списка (цена, возраст, должность, время, погода и т.д.).

Когда применяется

  • Триггеры активации (Начальная идентификация): Когда пользователь открывает или редактирует документ, содержащий текст, который *еще не был* идентифицирован как чувствительный ко времени (Claim 1).
  • Условия для предложения тегирования: Когда система идентифицирует сущность и атрибут, соответствующий предопределенному списку time-sensitive attributes.
  • Триггеры активации (Обновление):
    • Немедленно: В ответ на действие пользователя по тегированию атрибута (Claim 1).
    • В будущем (если атрибут помечен тегом): При наступлении предопределенных условий (Claim 3), таких как повторное открытие документа или явный запрос пользователя.

Пошаговый алгоритм

Этап 1: Идентификация и Тегирование

  1. Доступ к тексту: Suggestion System получает доступ к тексту документа, который ранее не был помечен как чувствительный ко времени.
  2. Идентификация триплета: Идентифицируется Сущность, Атрибут и Значение (First Value).
  3. Проверка чувствительности: Система определяет, является ли атрибут time-sensitive, используя предопределенный список (Claim 4).
  4. Запрос пользователя (Prompting): Система отображает пользователю запрос (prompt), предлагая пометить это значение как чувствительное ко времени (Claim 1).
  5. Тегирование: Если пользователь соглашается, система генерирует Tag.

Этап 2: Обновление

  1. Активация: Процесс запускается сразу после тегирования (Claim 1) или при наступлении предопределенного действия (Claim 3).
  2. Генерация запроса: Система генерирует query, специфицирующий сущность.
  3. Запрос к Search System: Запрос отправляется в Search System.
  4. Получение результата: Search System возвращает актуальное значение (Result Value). В описании патента упоминается, что результат может иметь Confidence Score.
  5. Предоставление обновления: Система предоставляет Result Data пользовательскому устройству, что вызывает замену First Value на Result Value.

Какие данные и как использует

Данные на входе

Патент фокусируется на обработке текста документа и взаимодействии с пользователем.

  • Контентные факторы: Текст документа является основным источником данных. Анализируется для извлечения Entity text, Attribute text и Value text.
  • Пользовательские факторы: Пользовательский ввод критичен для подтверждения тегирования атрибута как чувствительного ко времени (Claim 1) и может использоваться для инициации обновления (Claim 3).
  • Системные данные: Предопределенный список (list of predetermined time-sensitive attributes) используется для классификации атрибутов (Claim 4). Актуальные факты, предоставляемые Search System.

Какие метрики используются и как они считаются

Патент не указывает конкретных формул, но упоминает следующие механизмы:

  • Методы анализа текста (NLP/NLU): Используются для идентификации сущностей и атрибутов. Патент предполагает наличие обученной модели идентификации сущностей (entity identification model).
  • Классификация: Используется для определения чувствительности атрибута ко времени путем сравнения с предопределенным списком.
  • Confidence Score (Оценка уверенности): В описании патента (не в Claims) упоминается возможность использования confidence score для Result Value. Система может сравнивать эту оценку с порогом (например, 0.75), чтобы определить, следует ли предлагать обновление пользователю.

Выводы

  1. Фокус на приложениях, а не на ранжировании: Патент описывает технологию для улучшения пользовательского опыта в приложениях (Google Workspace), а не алгоритм ранжирования веб-поиска. Прямое влияние на SEO минимально.
  2. Глубокое понимание сущностей и атрибутов: Патент демонстрирует способность Google выполнять гранулярное извлечение фактов. Система может идентифицировать конкретные сущности и различать их временные атрибуты (цена, дата, статус) от статических.
  3. Идентификация чувствительности ко времени: Google активно классифицирует информацию по ее потенциалу устаревания, используя предопределенные списки типов атрибутов.
  4. Валидация фактов через поиск (Knowledge Graph): Система полагается на основную поисковую инфраструктуру (Search System) как на источник истины для проверки и обновления фактов. Это подчеркивает важность того, чтобы поисковая система имела доступ к точной и актуальной информации.
  5. Критичность взаимодействия с пользователем: В отличие от многих поисковых алгоритмов, этот механизм (согласно Claim 1) требует явного согласия пользователя на маркировку (tagging) данных перед активацией отслеживания и обновления.
  6. Инсайт для E-E-A-T и Freshness: Хотя это не алгоритм ранжирования, он показывает технические возможности Google по проверке точности и актуальности контента. Это подтверждает важность фактической точности и свежести для поддержания авторитетности и доверия к сайту как источнику данных.

Практика

Best practices (это мы делаем)

Хотя патент не дает прямых рекомендаций по ранжированию, он подтверждает важность стратегий, связанных с сущностями и достоверностью информации, чтобы ваш сайт мог служить источником истины для Search System.

  • Обеспечение актуальности данных (Freshness): Критически важно поддерживать актуальность информации, которая относится к time-sensitive attributes (цены, расписания, статистика, должности сотрудников). Это повышает вероятность того, что ваш сайт будет источником Result Value.
  • Фактическая точность (E-E-A-T): Обеспечивайте максимальную точность данных. Патент подтверждает, что Google обладает сложными инструментами для проверки фактов, связанных с сущностями.
  • Структурирование данных и Schema.org: Используйте микроразметку (Schema.org) для однозначного определения сущностей и их атрибутов (например, Price в Offer, даты в Event, jobTitle в Person). Это облегчает Search System извлечение и верификацию фактов.
  • Последовательность данных (Consistency): Обеспечьте согласованность фактов на всех платформах (сайт, Google Business Profile, социальные сети). Расхождения могут снизить confidence score системы в точности факта.

Worst practices (это делать не надо)

  • Публикация устаревшей информации: Предоставление неактуальных цен, дат или другой фактологической информации. Это снижает доверие к сайту как к источнику достоверных фактов для Knowledge Graph.
  • Нечеткое представление фактов: Представление информации о сущностях и их атрибутах в виде, сложном для машинного анализа (например, в изображениях или запутанном тексте). Это затрудняет извлечение Entity Text, Attribute Text и Value Text.
  • Манипуляция датами публикаций: Простая смена даты публикации без реального обновления содержания может быть неэффективной, так как система способна анализировать фактические данные (Value Text) внутри контента, а не только метаданные статьи.

Стратегическое значение

Стратегическое значение патента заключается в демонстрации того, насколько продвинуты технологии Google в области извлечения, понимания и обновления фактов в реальном времени. Для SEO это подтверждает тренд на переход от ключевых слов к сущностям (Entities) и важность управления достоверностью данных. Поисковая система (Search System) стремится быть источником истины; задача SEO-специалиista — помочь системе понять, что именно ваш сайт является авторитетным источником для конкретных фактов.

Практические примеры

Сценарий: Оптимизация страницы мероприятия для обеспечения точности данных

Цель: Убедиться, что Google корректно распознает и верифицирует временные атрибуты мероприятия, чтобы использовать ваш сайт как источник истины для Search System.

  1. Действие: При публикации информации о конференции четко укажите название мероприятия (Сущность), дату, время начала, место проведения и стоимость (Временные атрибуты и их Значения).
  2. Реализация (Контент): Используйте явные заголовки и списки: "Дата: 15 ноября 2025", "Время: 9:00 UTC", "Стоимость: $500".
  3. Реализация (Техническое SEO): Внедрите разметку Event Schema.org, заполнив поля name, startDate, endDate, location и offers. Убедитесь, что даты указаны в формате ISO 8601.
  4. Ожидаемый результат: Системы Google (Search System) смогут легко извлечь эти атрибуты, сверить их с другими источниками и использовать их для валидации фактов (например, для обновления информации в Gmail пользователя, если он сохранит это событие). Это повышает достоверность страницы и авторитетность сайта в контексте данной сущности.

Вопросы и ответы

Описывает ли этот патент, как Google ранжирует сайты в веб-поиске?

Нет. Патент описывает технологию для обновления текста внутри пользовательских документов (например, электронные письма в Gmail или файлы в Google Docs). Он не касается алгоритмов ранжирования публичной поисковой выдачи Google Search.

Какое значение этот патент имеет для SEO, если он не о ранжировании?

Он имеет важное стратегическое значение. Патент демонстрирует, насколько хорошо Google умеет распознавать сущности и их атрибуты в тексте, а также как система использует свою базу знаний (Search System/Knowledge Graph) для проверки фактов в реальном времени. Это подтверждает необходимость фокусироваться на Entity SEO и обеспечении максимальной точности и актуальности данных на вашем сайте (E-E-A-T), чтобы быть источником истины.

Что такое «time-sensitive attribute» (чувствительный ко времени атрибут) согласно патенту?

Это атрибут сущности, значение которого может меняться со временем. В патенте (Claim 5) приводятся примеры: цена, возраст, погодные условия (environmental condition), человек, занимающий определенную должность (a person holding a title), или время. Система определяет такие атрибуты, сверяясь с предопределенным списком (Claim 4).

Должен ли пользователь подтверждать обновление фактов в документе?

Да, согласно Claim 1, это критически важный шаг. Система сначала предлагает пользователю пометить (tag) значение как чувствительное ко времени. Генерация запроса на обновление происходит только после того, как пользователь согласился и тег был создан. В дальнейшем обновления могут происходить при наступлении определенных условий (например, при открытии документа).

Откуда система берет актуальные факты для обновления (Result Value)?

Система генерирует запрос и отправляет его в Search System. Это может быть интернет-поисковик или база данных. На практике это, скорее всего, Граф Знаний Google и основной поисковый индекс, которые агрегируют факты из интернета.

Как SEO-специалист может использовать информацию из этого патента на практике?

Необходимо сосредоточиться на том, чтобы ваш сайт стал источником истины для Search System. Это достигается путем предоставления точной, актуальной и последовательной информации о ваших сущностях. Использование микроразметки Schema.org критически важно для облегчения извлечения этих фактов системой.

Что означает, что система идентифицирует текст, который «ранее не был идентифицирован как чувствительный ко времени»?

Это означает, что система способна анализировать любой документ на лету и распознавать потенциально устаревшие данные без предварительной разметки или тегирования этого конкретного документа. Это демонстрирует продвинутые возможности Google в области NLU.

Может ли система ошибаться при обновлении фактов?

Да, это возможно. В описании патента упоминается возможность использования оценок уверенности (confidence scores) для результирующих значений. Если уверенность низкая (например, ниже порога 0.75), система может не предложить обновление или запросить дополнительную верификацию у пользователя.

Как этот патент связан с Knowledge Graph?

Патент тесно связан с Knowledge Graph. Suggestion System идентифицирует сущности, а Search System предоставляет актуальные значения их атрибутов. Knowledge Graph является основным хранилищем Google для структурированных фактов о сущностях и, вероятно, служит основным источником этих актуальных значений (Result Value).

Влияет ли этот патент на то, как Google обрабатывает свежий контент (Freshness/QDF)?

Прямого влияния на алгоритмы QDF (Query Deserves Freshness) нет. Однако патент подчеркивает инфраструктурные возможности Google по поддержанию актуальности конкретных фактов (атрибутов сущностей) в своей базе знаний. Это разные аспекты «свежести»: QDF оценивает потребность в новом контенте по запросу, а этот патент описывает поддержание точности известных фактов.

Похожие патенты

Как Google использует историю запросов в текущей сессии для понимания контекста и переписывания неоднозначных запросов
Google анализирует предыдущие запросы пользователя в рамках текущей сессии, чтобы понять контекст нового запроса. Если новый запрос неоднозначен или содержит отсылки (например, местоимения типа «он», «это»), система пытается объединить его с сущностями из предыдущих запросов. Это позволяет переписать запрос более точно (например, заменить «он» на имя человека), чтобы предоставить результаты, соответствующие истинному намерению пользователя.
  • US9547690B2
  • 2017-01-17
  • Семантика и интент

Как Google строит и динамически обновляет индекс на основе тем и векторных представлений для семантического поиска
Google индексирует документы, присваивая им семантическую "сигнатуру" — вектор, состоящий из абстрактных тем (Topics) и весов (Weights), определяющих их значимость. Патент описывает инфраструктуру для эффективного обновления этого тематического индекса при изменении контента или обновлении моделей NLP Google. Система использует эти векторы для быстрого определения схожести контента через Cosine Similarity.
  • US8756236B1
  • 2014-06-17
  • Индексация

  • Семантика и интент

Как Google определяет свежесть документа, анализируя возраст ссылающихся страниц и динамику появления ссылок (Link Velocity)
Google использует методы для оценки свежести документа, когда дата его обновления неизвестна или ненадежна. Система анализирует даты обновления страниц, которые ссылаются на документ, а также историю появления и удаления этих ссылок (Link Velocity). Если на документ ссылаются недавно обновленные страницы или количество ссылок растет, он считается свежим.
  • US7797316B2
  • 2010-09-14
  • Свежесть контента

  • Ссылки

  • Техническое SEO

Как Google использует свой индекс для автоматического обновления устаревших ссылок в закладках, истории поиска и на веб-страницах
Система Google поддерживает актуальность различных коллекций URL (закладки пользователей, история поиска, электронные письма), используя основной поисковый индекс как эталон канонических адресов. Если сохраненный URL устарел, система автоматически заменяет его на актуальную версию. Также описан механизм уведомления владельцев сайтов о неработающих исходящих ссылках.
  • US20130144836A1
  • 2013-06-06
  • Ссылки

  • Индексация

  • Техническое SEO

Как Google использует real-time анализ текста, аудио и изображений для автоматической генерации запросов и проактивного поиска
Система Google для анализа информации, захваченной из различных источников (вводимый текст, изображения документов, аудиопотоки) в реальном времени. Система автоматически распознает контент, выделяет ключевые фрагменты, формирует поисковые запросы и мгновенно предоставляет пользователю релевантный цифровой контент или связанные действия без явных запросов. Это механизм, лежащий в основе технологий визуального (Lens) и голосового поиска.
  • US8990235B2
  • 2015-03-24
  • Семантика и интент

  • Персонализация

  • Мультимедиа

Популярные патенты

Как Google использует исторические паттерны CTR для предсказания сезонных и циклических изменений интента пользователя
Google анализирует исторические данные о кликах (CTR) для выявления предсказуемых изменений в интересах пользователей по неоднозначным запросам. Если интент меняется в зависимости от сезона, дня недели или времени суток, система корректирует ранжирование, чтобы соответствовать доминирующему в данный момент интенту. Например, по запросу "turkey" в ноябре приоритет получат рецепты, а не информация о стране.
  • US8909655B1
  • 2014-12-09
  • Семантика и интент

  • Поведенческие сигналы

  • SERP

Как Google использует внешние сигналы (соцсети, новости, блоги) для верификации реальной популярности контента и фильтрации накруток
Google верифицирует популярность контента (например, видео) проверяя, упоминается ли он на внешних источниках: блогах, новостных сайтах и в социальных сетях. Это позволяет формировать списки "популярного", отражающие подлинный широкий интерес, отфильтровывая контент с искусственно завышенными просмотрами или узконишевой популярностью. Система также учитывает географическую релевантность внешних упоминаний.
  • US9465871B1
  • 2016-10-11
  • Антиспам

  • SERP

  • Ссылки

Как Google использует CTR и E-E-A-T сигналы для определения контекста ссылок и оценки качества внешних упоминаний
Google использует двухэтапный механизм для анализа внешних комментариев (например, блог-постов). Сначала система определяет истинный объект обсуждения, если в комментарии несколько ссылок, анализируя CTR, длину URL и тематику. Затем она оценивает качество комментария, используя рейтинг автора, авторитетность источника, свежесть и обратную связь пользователей, чтобы отобрать наиболее релевантный контент.
  • US8656266B2
  • 2014-02-18
  • Ссылки

  • EEAT и качество

  • Свежесть контента

Как Google обучает ИИ-модели для автоматической оценки качества сайтов на основе данных асессоров и предвзятой выборки
Патент Google, описывающий фундаментальную методологию создания систем оценки качества сайтов. Google использует машинное обучение (например, SVM), чтобы найти корреляции между оценками асессоров и измеримыми сигналами сайта (PageRank, клики). Для повышения точности применяется метод «предвзятой выборки» (Biased Sampling): система намеренно собирает больше оценок для сайтов среднего качества («сложных случаев»), чем для очевидно плохих или хороших.
  • US8442984B1
  • 2013-05-14
  • SERP

  • EEAT и качество

  • Поведенческие сигналы

Как Google использует данные о поведении пользователей внутри документов (время чтения разделов, закладки) для улучшения ранжирования
Google может собирать и анализировать данные о том, как пользователи взаимодействуют с электронными документами (например, PDF, DOC, HTML). Система отслеживает, какие разделы или страницы просматриваются дольше всего или добавляются в закладки. Эта агрегированная информация используется для повышения в ранжировании документов, чьи ключевые слова находятся в наиболее используемых (и, следовательно, ценных) разделах.
  • US8005811B2
  • 2011-08-23
  • Поведенческие сигналы

  • SERP

Как Google использует машинное обучение и данные о длительности сессий для выявления битых Deep Links в мобильных приложениях
Google использует систему машинного обучения для анализа того, как долго пользователи взаимодействуют с контентом в приложении после перехода по Deep Link (Presentation Duration). Анализируя распределение этих временных интервалов, система классифицирует ссылку как рабочую или битую без необходимости прямого сканирования контента. Это позволяет Google удалять неработающие ссылки из индекса.
  • US10628511B2
  • 2020-04-21
  • Ссылки

  • Индексация

  • Поведенческие сигналы

Как Google использует время взаимодействия пользователя с сайтом (Dwell Time) для расчета оценки качества всего сайта
Google использует агрегированные данные о продолжительности визитов пользователей на сайт для расчета метрики качества этого сайта (Site Quality Score). Система измеряет время взаимодействия (включая Dwell Time — время от клика в выдаче до возврата обратно), фильтрует аномальные визиты и нормализует данные по типам контента. Итоговая оценка используется как независимый от запроса сигнал для ранжирования и принятия решений об индексировании.
  • US9195944B1
  • 2015-11-24
  • Поведенческие сигналы

  • Индексация

  • SERP

Как Google использует поведение пользователей в веб-поиске для динамической категоризации локальных бизнесов
Google динамически формирует категории для бизнесов, основываясь на том, как пользователи ищут их (используемые ключевые слова и клики) в веб-поиске и голосовом поиске. Эти данные формируют иерархическое понимание типов бизнеса. Эта структура затем используется для повышения точности распознавания названий компаний в голосовых запросах.
  • US8041568B2
  • 2011-10-18
  • Local SEO

  • Поведенческие сигналы

  • Семантика и интент

Как Google A/B тестирует и оптимизирует сниппеты (заголовки, описания, изображения) для повышения CTR
Google использует механизм для оптимизации отображения контента (сниппетов). Система показывает разные варианты заголовков, описаний или изображений для одной и той же ссылки разным пользователям или на разных платформах. Затем она измеряет кликабельность (CTR) каждого варианта и выбирает наиболее эффективный для дальнейшего использования, учитывая также тип устройства пользователя.
  • US9569432B1
  • 2017-02-14
  • SERP

  • Поведенческие сигналы

  • Персонализация

Как Google использует данные о кликах и пропусках для валидации и удаления неэффективных синонимов в поиске
Google постоянно тестирует правила подстановки (синонимы) для расширения запросов. Этот патент описывает механизм оценки эффективности этих правил с помощью анализа поведения пользователей (клики и пропуски результатов). Если пользователи часто пропускают результаты, содержащие подставленный термин, система автоматически удаляет это правило, очищая понимание запросов от нерелевантных синонимов.
  • US8965875B1
  • 2015-02-24
  • Поведенческие сигналы

  • Семантика и интент

  • EEAT и качество

seohardcore