SEO HARDCORE
  • Разборы патентов
    • Патенты Google
  • Скоро SEO инструменты
  • Скоро SEO аналитика
  • seohardcore
SEO HARDCORE
назад

Как Google использует пользовательский контент (UGC) и историю поиска для сбора структурированных отзывов

ASSISTED REVIEW CREATION (Вспомогательное создание отзывов)
  • US20190278836A1
  • Google LLC
  • 2019-05-24
  • 2019-09-12
  • Семантика и интент
  • Персонализация
  • EEAT и качество
  • Поведенческие сигналы
  • Описание
  • Разбор
  • Выводы
  • Практика
  • FAQ
  • Похожие

Google анализирует пользовательский контент (фотографии, посты, метаданные) и историю поиска, чтобы определить, с какими объектами (места, продукты, услуги) взаимодействовал пользователь. Система проактивно предлагает оставить структурированный отзыв, используя шаблон, который может быть предварительно заполнен на основе тональности исходного UGC. Это направлено на увеличение объема и подлинности отзывов.

Описание

Какую проблему решает

Патент решает проблему недостаточного объема и охвата онлайн-отзывов. Пользователи часто не мотивированы создавать отзывы из-за трудоемкости процесса («транзакционных издержек»). Это приводит к поляризации данных: доминируют крайне положительные или отрицательные мнения, а средний сегмент остается неохваченным. Изобретение направлено на упрощение создания отзывов для увеличения их количества, качества и репрезентативности.

Что запатентовано

Запатентована система для вспомогательного создания отзывов. Она анализирует пользовательский контент (User-Generated Content, UGC) – посты, фото, метаданные – для автоматической идентификации «объектов, подлежащих отзыву» (Reviewable Objects, RO). Ключевым аспектом является использование личных данных, включая историю поиска пользователя, для точной идентификации RO. Система проактивно предлагает пользователю оставить структурированный отзыв через шаблон (Review Template), который может быть предварительно заполнен на основе анализа тональности исходного UGC.

Как это работает

Система функционирует в несколько этапов:

  • Анализ UGC и Контекста: Анализируются текст, изображения и метаданные (GPS, время) с использованием NLP и распознавания образов.
  • Идентификация RO: Система определяет Reviewable Objects, сопоставляя данные UGC с таксономиями и, что критически важно, с историей поиска пользователя.
  • Анализ Тональности и Приоритизация: Определяется отношение пользователя к объекту (sentiment). Объекты могут приоритизироваться, например, если о них мало отзывов.
  • Запрос и Шаблон: Пользователю предлагается оставить отзыв. Предоставляется Review Template, предварительно заполненный на основе извлеченного sentiment.
  • Сохранение: Ввод сохраняется как структурированный отзыв.

Актуальность для SEO

Высокая. Отзывы критически важны для Local SEO, E-commerce и оценки E-E-A-T. Описанные механизмы активно используются в Google Maps и Google Photos, которые предлагают оставить отзыв на основе истории местоположений или загруженных фотографий. Учитывая, что одним из изобретателей является Prabhakar Raghavan (глава Google Search), это отражает стратегию Google по сбору структурированных данных о реальном опыте пользователей.

Важность для SEO

Влияние на SEO высокое (8/10). Патент не описывает алгоритм ранжирования, но описывает инфраструктуру для масштабного сбора критически важных данных – отзывов. Отзывы являются фундаментальным фактором в локальном поиске и ключевым источником сигналов «Experience» и «Trust» для оценки E-E-A-T. Понимание того, как Google стимулирует и верифицирует создание отзывов через UGC и историю поиска, критически важно для ORM и Local SEO стратегий.

Детальный разбор

Термины и определения

User-Generated Content (UGC) (Пользовательский контент)
Контент, созданный пользователями (посты, фото, видео, комментарии) и связанные с ним метаданные. Является триггером для процесса.
Reviewable Object (RO) (Объект, подлежащий отзыву)
Любая сущность (продукт, услуга, место, компания, исполнитель), о которой пользователь может оставить отзыв.
Review Template (Шаблон отзыва)
Структурированный интерфейс для ввода отзыва. Включает поля для текста и рейтинги по различным измерениям (например, «удобство использования»).
Natural Language Processing (NLP) (Обработка естественного языка)
Технологии для анализа UGC. В патенте упоминаются: Named Entity Recognition (распознавание именованных сущностей), Co-reference Resolution, Relationship Extraction и Sentiment Analysis.
Sentiment Analysis (Анализ тональности)
Определение эмоциональной окраски UGC по отношению к RO. Используется для предварительного заполнения шаблона.
Metadata (Метаданные)
Данные, сопровождающие UGC. Упоминаются форматы Exif и XMP, содержащие GPS-координаты, время, идентифицированные лица и т.д.
RO Taxonomy (Таксономия RO)
Структурированный каталог известных объектов, используемый для сопоставления упоминаний в UGC с конкретными сущностями.
External Reference Systems (Внешние справочные системы)
Внешние базы данных или поисковые системы, используемые для уточнения идентифицированных RO.

Ключевые утверждения (Анализ Claims)

Анализ основан на действующих пунктах (Claims 19-38), так как этот патент является публикацией продолжения (Continuation).

Claim 19 (Независимый пункт, Система): Описывает базовый процесс.

  1. Получение UGC (включая текст) от пользователя.
  2. Идентификация терминов в тексте.
  3. Идентификация одного или нескольких RO на основе этих терминов.
  4. Отправка запроса пользователю на выбор RO для отзыва.
  5. Получение выбора конкретного RO.
  6. Отправка запроса на ввод данных (предоставление шаблона).
  7. Получение данных (отзыва).

Claim 27 (Независимый пункт, Метод) и Claim 20 (Зависимый): Вводят критически важное уточнение в процесс идентификации RO.

Идентификация RO (шаг 3) основывается, по крайней мере частично, на истории поиска (search history), связанной с пользователем.

Это ключевой элемент, позволяющий системе связать намерение пользователя (выраженное в поиске) с его последующим опытом (зафиксированным в UGC) для точной идентификации объекта.

Claim 21 и 28 (Зависимые): Детализируют методы идентификации RO.

Методы включают одно или несколько из: парсинг UGC на предмет ссылок на RO Taxonomy; применение NLP; запрос к External Reference System с частью UGC; идентификация RO из Metadata.

Claim 24 и 31 (Зависимые): Описывают использование анализа тональности для повышения эффективности.

  1. В процессе анализа UGC идентифицируется тональность (sentiment), связанная с RO.
  2. При запросе ввода данных пользователю предоставляется Review Template, который уже содержит эту идентифицированную тональность (предзаполнение шаблона).

Claim 23 и 30 (Зависимые): Описывают приоритизацию.

Перед запросом выбора RO система приоритизирует идентифицированные объекты. Запрос пользователю представляется в порядке этой приоритизации.

Где и как применяется

Изобретение затрагивает несколько этапов поиска, интегрируя данные из разных слоев.

CRAWLING – Сканирование и Сбор данных (Data Acquisition)
Основное применение патента. Система функционирует как механизм активного сбора структурированных данных (отзывов), используя неструктурированный UGC как источник и триггер.

INDEXING – Индексирование и извлечение признаков
Технологии этого слоя используются для анализа UGC. Применяются NLP (NER, Sentiment Analysis), анализ метаданных (GPS, время), распознавание изображений. Происходит сопоставление с RO Taxonomy (Knowledge Graph). Полученные отзывы также индексируются и связываются с сущностями.

QUNDERSTANDING – Понимание Запросов (и Контекста Пользователя)
Система использует данные о пользователе для интерпретации UGC и идентификации RO. Claims прямо указывают на использование истории поиска пользователя (Search History) и предпочтений.

Входные данные:

  • UGC (текст, изображения, видео).
  • Метаданные UGC (Exif, XMP - геолокация, время, теги).
  • Данные пользователя (История поиска, предпочтения).
  • RO Taxonomy и данные из External Reference Systems.

Выходные данные:

  • Структурированные отзывы, привязанные к конкретным сущностям (RO).

На что влияет

  • Конкретные ниши: Наибольшее влияние на сферы, где отзывы критичны:
    • Local SEO: Рестораны, отели, магазины, услуги. Использование GPS и фото делает этот механизм идеальным для локального поиска.
    • E-commerce: Отзывы о продуктах.
    • Развлечения и События: Концерты, мероприятия, исполнители.
  • E-E-A-T: Увеличение количества подлинных отзывов, основанных на верифицируемой активности (UGC, локация, поиск), повышает сигналы Доверия (Trust) и Опыта (Experience).

Когда применяется

  • Триггеры активации: Алгоритм активируется при обработке нового UGC, в котором система идентифицирует потенциальный Reviewable Object с достаточной степенью уверенности.
  • Условия применения: Комбинация сигналов. Например, пользователь искал ресторан (история поиска), а затем загрузил фотографию еды с соответствующей геолокацией (UGC + метаданные).

Пошаговый алгоритм

Процесс вспомогательного создания отзывов:

Этап 1: Сбор и первичный анализ UGC

  1. Получение UGC: Система получает контент (текст, фото, видео) и сопровождающие метаданные.
  2. Извлечение данных и анализ медиа:
    • Извлечение метаданных (Exif/XMP: GPS, время).
    • Применение распознавания образов (Image Recognition) к медиафайлам.
    • Применение распознавания речи (Speech Recognition) к аудиодорожкам.

Этап 2: Идентификация и контекстуализация RO

  1. Текстовый анализ (NLP): Применение Named Entity Recognition для выявления сущностей.
  2. Сопоставление с таксономиями: Использование RO Taxonomy для матчинга сущностей.
  3. Контекстуализация через историю поиска (Ключевой шаг): Анализ недавней истории поиска пользователя для уточнения и валидации идентифицированных RO (Claims 20, 27).
  4. Запрос к внешним системам: Отправка запросов к External Reference Systems для подтверждения RO.
  5. Формирование списка кандидатов RO.

Этап 3: Приоритизация и взаимодействие с пользователем

  1. Анализ Тональности (Sentiment Analysis): Определение мнения пользователя об идентифицированных RO на основе текста UGC.
  2. Приоритизация кандидатов (Опционально): Ранжирование RO на основе потребности в отзывах, предпочтений пользователя или силы выявленного Sentiment.
  3. Запрос выбора: Представление пользователю списка кандидатов RO (в порядке приоритета) для выбора объекта отзыва.
  4. Презентация шаблона: Показ Review Template. Шаблон предварительно заполняется текстом из UGC и/или предложенным рейтингом на основе Sentiment Analysis (Claims 24, 31).
  5. Сбор и сохранение: Получение ввода от пользователя и сохранение структурированного отзыва.

Какие данные и как использует

Данные на входе

Система использует комплексные данные из UGC и профиля пользователя.

  • Контентные факторы: Текст UGC (посты, подписи). Используется для NLP анализа (сущности, тональность).
  • Мультимедиа факторы: Изображения и видео. Используется распознавание изображений (Image Recognition) и распознавание речи (Speech Recognition).
  • Географические и Временные факторы (Метаданные): Данные Exif/XMP: GPS координаты, дата и время. Критически важны для идентификации локаций и контекста.
  • Технические факторы: Ссылки в UGC. Анализируется цель ссылки для идентификации RO.
  • Пользовательские факторы:
    • История поиска (Search History): Явно указана в Claims как ключевой фактор для идентификации RO.
    • Предпочтения пользователя: Заявленные предпочтения (например, типы кухни) используются для приоритизации.
    • Социальный граф: В описании упоминается возможность использования информации о друзьях пользователя (с их разрешения).

Какие метрики используются и как они считаются

Патент не приводит формул, но описывает методы и метрики:

  • Методы анализа текста (NLP):
    • Named Entity Recognition (NER): Для идентификации упоминаний людей, мест, брендов.
    • Sentiment Analysis: Вычисление тональности (позитивная/негативная) и силы настроения, выраженного в UGC.
  • Prioritization Score (Оценка приоритета): Метрика для упорядочивания запросов на отзыв. Учитывает:
    • Review Scarcity (Нехватка отзывов): Объекты с меньшим количеством отзывов (или ниже среднего для категории) получают более высокий приоритет.
    • Sentiment Strength (Сила настроения): Сильнее выраженное мнение в UGC повышает приоритет.
    • Соответствие предпочтениям пользователя и истории поиска.

Выводы

  1. Трансформация UGC в Структурированные Данные: Google стратегически использует неструктурированный пользовательский контент (посты, фото) как источник для генерации ценных структурированных данных (отзывов).
  2. Кросс-платформенная Интеграция Данных: Патент явно демонстрирует связь между различными сервисами Google. История поиска пользователя (Search History) используется для интерпретации его UGC и верификации опыта взаимодействия с объектом. Это связывает намерение (поиск) и результат (UGC).
  3. Мультимодальный Анализ и Важность Метаданных: Для идентификации объектов используется комплексный подход: NLP, распознавание изображений и анализ контекстуальных метаданных (GPS, время из Exif/XMP). Это критически важно для Local SEO.
  4. Автоматизация через Sentiment Analysis: Использование анализа тональности для предварительного заполнения шаблонов отзывов значительно снижает барьер для пользователя и ускоряет сбор данных.
  5. Стратегический Сбор Данных (Приоритизация): Система управляет сбором данных, приоритизируя объекты, по которым наблюдается дефицит отзывов, для обеспечения полноты покрытия.
  6. Повышение Подлинности Отзывов: Отзывы, собранные таким образом, вероятно, имеют высокий вес, так как они основаны на комплексе подтвержденных сигналов активности пользователя (поиск, фото, местоположение), что затрудняет манипуляции.

Практика

Best practices (это мы делаем)

  • Стимулирование создания качественного UGC о бренде: Мотивируйте клиентов создавать и публиковать контент (особенно фотографии и посты с геометками), связанный с вашим продуктом или локацией. Чем больше UGC генерируется, тем выше вероятность, что Google активирует механизм запроса отзыва у этих пользователей.
  • Оптимизация под распознавание сущностей (Entity Optimization): Убедитесь, что ваш бизнес легко идентифицируется. Это включает точное заполнение Google Business Profile (GBP), использование микроразметки Schema.org и четкий брендинг (для распознавания через NLP и Image Recognition).
  • Работа над общей тональностью (ORM и Customer Experience): Поскольку система использует Sentiment Analysis для предварительного заполнения отзывов, важно поддерживать положительный опыт клиентов. Положительный UGC может привести к упрощенной генерации положительного структурированного отзыва.
  • Акцент на геолокации для Local SEO: Для локального бизнеса критически важно, чтобы клиенты создавали контент с включенной геолокацией (GPS в метаданных фото). Это позволяет Google точно верифицировать посещение и идентифицировать заведение как Reviewable Object.
  • Оптимизация для визуального распознавания: Убедитесь, что ваш продукт или локация легко идентифицируются визуально (четкие логотипы, вывески). Это поможет системам распознавания изображений корректно идентифицировать ваш объект на фотографиях пользователей.

Worst practices (это делать не надо)

  • Игнорирование UGC как источника отзывов: Рассматривать активность пользователей в социальных сетях и на платформах Google как не связанную с SEO. Патент доказывает, что этот контент является прямым источником данных для генерации отзывов.
  • Попытки манипуляции через фейковый UGC: Создание фейковых постов или загрузка фотографий с поддельными метаданными рискованно. Поскольку система валидирует контекст через комплексные сигналы (реальную историю поиска, паттерны перемещения, данные с устройства), такие манипуляции могут быть неэффективны и пессимизированы.
  • Удаление метаданных с фотографий: Удаление Exif/XMP данных из фотографий на сайте или в профиле компании. Эти данные помогают Google лучше понимать контекст и локацию.

Стратегическое значение

Патент подтверждает стратегическую важность отзывов и демонстрирует глубокую интеграцию различных источников данных (Поиск, UGC, Карты, Фото) для понимания реального опыта пользователей. Это подчеркивает важность E-E-A-T, где отзывы, основанные на верифицируемой активности, являются прямым источником сигналов «Experience» и «Trust». Для SEO это означает, что управление репутацией (ORM) и стимулирование UGC становятся неотъемлемой частью продвижения, особенно в локальном поиске и E-commerce.

Практические примеры

Сценарий 1: Сбор отзывов для локального бизнеса (Ресторан) через интеграцию данных

  1. Намерение (Search History): Пользователь ищет в Google «лучший стейк хаус рядом». Google фиксирует историю поиска.
  2. Взаимодействие и UGC: Пользователь посещает ресторан «SteakHouse XYZ», делает фото стейка с включенным GPS (Метаданные Exif) и публикует его с подписью «Отличный рибай!» (Текст UGC).
  3. Работа системы Google:
    • Система анализирует UGC. GPS-данные указывают на «SteakHouse XYZ».
    • Система учитывает недавнюю историю поиска («стейк хаус рядом») для контекстуализации.
    • Sentiment Analysis определяет положительную тональность («Отличный рибай!»).
    • «SteakHouse XYZ» уверенно идентифицируется как Reviewable Object.
  4. Запрос отзыва и Шаблон: Google отправляет пользователю уведомление (например, через Google Maps): «Оцените SteakHouse XYZ». Пользователю предоставляется шаблон, где текстовое поле уже предзаполнено фразой «Отличный рибай!», и предлагается выставить рейтинг.
  5. Результат: Пользователю требуется минимум усилий, чтобы оставить подлинный положительный структурированный отзыв.

Сценарий 2: Сбор отзывов о товаре (E-commerce)

  1. Действие пользователя: Пользователь ищет "обзор камеры Sony A7 IV" (история поиска). Позже он покупает ее и публикует фото, сделанное этой камерой. Метаданные Exif содержат модель камеры.
  2. Работа системы Google: Система анализирует метаданные фото (идентифицирует модель камеры как RO). История поиска подтверждает интерес пользователя к этому продукту.
  3. Результат: Система предлагает пользователю оставить структурированный отзыв о Sony A7 IV, обогащая базу данных Google Shopping.

Вопросы и ответы

Как именно история поиска помогает идентифицировать объект для отзыва?

История поиска обеспечивает критически важный контекст для интерпретации UGC (Claim 27). Если пользователь недавно искал конкретный ресторан, а затем опубликовал фото еды из этого района, система использует историю поиска, чтобы с большей вероятностью идентифицировать именно этот ресторан и предложить оставить о нем отзыв, устраняя неоднозначность.

Какие типы пользовательского контента (UGC) анализируются?

Система анализирует широкий спектр UGC, включая текст (посты, комментарии, подписи), изображения и видео. Также критически важными являются метаданные, сопровождающие этот контент, такие как геолокация (GPS координаты из Exif), дата и время создания контента.

Как система определяет тональность (Sentiment) и использует ее?

Система использует Sentiment Analysis (раздел NLP) для анализа текста UGC. Например, фразы вроде "было великолепно!" указывают на позитивный Sentiment. Согласно патенту (Claim 24, 31), это мнение может быть использовано для предварительного заполнения шаблона отзыва — например, система может предложить высокую звездную оценку или вставить текст из UGC в поле отзыва.

Какое значение этот патент имеет для Local SEO?

Критическое. Отзывы являются одним из главных факторов ранжирования в локальном поиске. Этот патент описывает механизм, позволяющий Google значительно увеличить объем собираемых структурированных отзывов о локальных бизнесах. Бизнесы, которые стимулируют создание аутентичного UGC (фото клиентов, упоминания с геометками), могут получить больше отзывов благодаря работе этого механизма.

Может ли система запросить отзыв, если объект не упоминается в тексте UGC?

Да. Система может идентифицировать объект с помощью распознавания изображений (например, продукт на фото) или через метаданные (например, ресторан по GPS координатам фотографии из Exif данных), даже если название объекта не было упомянуто в текстовой части UGC.

Как система определяет, для каких объектов нужно больше отзывов?

Патент описывает механизм приоритизации RO. Одним из факторов является текущее количество доступных отзывов. Объекты с меньшим количеством отзывов (или меньшим количеством по сравнению со средним для данной категории) могут получить более высокий приоритет при запросе отзыва у пользователя.

Может ли негативный пост (UGC) автоматически превратиться в негативный отзыв?

Нет, автоматически не может. Система использует UGC как триггер, чтобы предложить пользователю оставить отзыв. Хотя система может предварительно заполнить шаблон текстом, отражающим негативную тональность исходного поста, пользователь должен вручную подтвердить, отредактировать и отправить структурированный отзыв.

Влияет ли этот патент на E-E-A-T?

Да, значительно. Отзывы являются важным сигналом доверия (Trust) и опыта (Experience). Механизм, описанный в патенте, направлен на увеличение объема подлинных отзывов, основанных на верифицируемых сигналах (поиск, локация, фото). Это позволяет Google точнее оценивать авторитетность и надежность бизнеса.

Насколько сложно обмануть эту систему фейковыми отзывами?

Обмануть эту конкретную систему сбора данных сложно. Поскольку она основана на анализе комплексных сигналов подлинной активности пользователя (комбинация истории поиска, геолокации, времени, фотографий из личной библиотеки), имитация всех этих сигналов для создания фейкового отзыва требует значительных усилий и выглядит неестественно для алгоритмов.

Использует ли Google данные из сторонних социальных сетей для этого механизма?

В патенте упоминается анализ UGC в целом, и в качестве примера приводятся социальные сети. Если Google имеет доступ к этому контенту (например, через публичное сканирование или API) и данным пользователя (история поиска), он технически может быть использован. Однако основное применение, вероятно, сосредоточено внутри экосистемы Google (Maps, Photos, Поиск).

Похожие патенты

Как Google использует отзывы для сравнения, фильтрации и ранжирования сущностей в поиске
Патент Google описывает систему, которая позволяет пользователям искать внутри отзывов (UGR) сразу по нескольким сущностям (например, отелям или товарам) и сравнивать их в едином интерфейсе. Система индексирует отзывы как отдельные документы и использует их содержание для обнаружения сущностей, фильтрации результатов основного поиска и в качестве сигналов ранжирования веб-страниц.
  • US11568004B2
  • 2023-01-31
  • Индексация

  • SERP

  • Семантика и интент

Как Google использует поиск для сопоставления отзывов о товарах, у которых нет уникальных идентификаторов (GTIN, UPC)
Google использует механизм для агрегации отзывов о товарах в свой продуктовый каталог (например, Google Shopping). Если в отзыве отсутствует уникальный идентификатор товара (GTIN, UPC), система извлекает ключевую информацию (например, название товара), выполняет поиск в интернете и анализирует результаты выдачи. Найдя наиболее вероятный идентификатор в результатах поиска, Google связывает отзыв с соответствующим товаром в каталоге.
  • US20120254158A1
  • 2012-10-04
  • Google Shopping

  • SERP

  • Семантика и интент

Как Google ранжирует комментарии и UGC, используя объективное качество и субъективную персонализацию
Google использует двухфакторную модель для ранжирования пользовательского контента (комментариев, отзывов). Система вычисляет объективную оценку качества (репутация автора, грамотность, длина, рейтинги) и субъективную оценку персонализации (является ли автор другом или предпочтительным автором, соответствует ли контент интересам и истории поиска пользователя). Итоговый рейтинг объединяет обе оценки для показа наиболее релевантного и качественного UGC.
  • US8321463B2
  • 2012-11-27
  • Персонализация

  • EEAT и качество

  • Поведенческие сигналы

Как Google находит, извлекает и объединяет отзывы о товарах из интернета для создания агрегированных рейтингов и выявления частых фраз
Патент описывает систему Google для сбора отзывов о товарах из интернета. Система использует селективное сканирование сайтов, извлекает текст отзывов, рейтинги и авторов. Затем она автоматически определяет, к какому именно продукту относится отзыв (даже при разных названиях), и создает сводную информацию: общий рейтинг, распределение оценок и список часто упоминаемых фраз. Эта система позволяет пользователям искать информацию внутри отзывов о конкретном товаре.
  • US7962461B2
  • 2011-06-14
  • Краулинг

Как Google динамически обогащает сниппеты, ранжируя отзывы, атрибуты и упоминания для обоснования результатов поиска
Google использует фреймворк для обогащения результатов поиска вспомогательной информацией (аннотациями), такой как редакционные упоминания, списки Топ-X, атрибуты товаров и контекстные отзывы. Система использует машинное обучение для оценки и ранжирования этих разнородных данных, чтобы динамически выбрать наиболее полезный дополнительный сниппет. Это позволяет обосновать позицию результата и повысить доверие пользователя.
  • US12164527B2
  • 2024-12-10
  • SERP

Популярные патенты

Как Google определяет синонимы и варианты слов, анализируя категории выбранных пользователями результатов
Google использует метод стемминга, основанный на поведении пользователей и категориях сущностей. Если пользователи ищут разные слова (например, «пицца» и «пиццерия») и выбирают результаты одной категории («ресторан»), система идентифицирует эти слова как варианты одной основы (Stem Variants). Это происходит, если слова похожи по написанию ИЛИ если объем кликов статистически значим.
  • US9104759B1
  • 2015-08-11
  • Семантика и интент

  • Поведенческие сигналы

  • Персонализация

Как Google персонализирует мобильную выдачу, повышая в ранжировании приложения, которые пользователь часто использует (Affinity Score)
Google рассчитывает «Affinity Score» для мобильных приложений на основе того, как часто и долго пользователь их использует (относительное вовлечение). При поиске с мобильного устройства система повышает в ранжировании результаты (deep links), ведущие в приложения с высоким Affinity Score, делая выдачу более персонализированной.
  • US10248698B2
  • 2019-04-02
  • Персонализация

  • Поведенческие сигналы

  • SERP

Как Google агрегирует поведенческие данные из похожих запросов для ранжирования редких и длиннохвостых запросов
Google использует механизм обобщения запросов для улучшения ранжирования, особенно когда исторических данных по исходному запросу недостаточно. Система создает варианты запроса (удаляя стоп-слова, используя синонимы, стемминг или частичное совпадение) и агрегирует данные о поведении пользователей (клики, dwell time) из этих вариантов. Это позволяет оценить качество документа для исходного запроса, используя статистику из семантически близких запросов.
  • US9110975B1
  • 2015-08-18
  • Поведенческие сигналы

  • Семантика и интент

  • SERP

Как Google рассчитывает авторитетность и ранжирует сайты, вычисляя кратчайшие пути до доверенных источников (Seeds) в Веб-графе
Google использует масштабируемую распределенную систему для анализа огромных графов, таких как Веб-граф (триллионы связей). Система вычисляет кратчайшие пути от каждого узла (сайта) до набора предопределенных авторитетных источников («Seeds»). Эти расстояния используются для расчета метрик авторитетности и ранжирования сайтов: чем ближе сайт к доверенным источникам, тем выше его предполагаемое качество.
  • US8631094B1
  • 2014-01-14
  • EEAT и качество

  • Ссылки

Как Google (YouTube) ранжирует видео, повышая те, которые начинают сессию просмотра и приводят внешний трафик ("Lead Video")
Google использует систему ранжирования для видеоплатформ, которая идентифицирует "ведущее видео" (Lead Video), инициирующее сессию просмотра. Система применяет повышающие коэффициенты (Scaling Factors) ко времени просмотра этого видео. Видео, привлекшие пользователя на платформу из внешних источников (например, из социальных сетей или поиска Google), получают значительно больший коэффициент, чем те, что были найдены через внутренние рекомендации.
  • US10346417B2
  • 2019-07-09
  • Мультимедиа

  • Поведенческие сигналы

  • SERP

Как Google использует социальные связи для выявления предвзятых ссылок и борьбы со ссылочными схемами и кликфродом
Google анализирует взаимоотношения между администраторами веб-сайтов (используя данные социальных сетей), чтобы определить независимость ссылок или кликов по рекламе. Если обнаружена тесная связь, это интерпретируется как предвзятость (Bias). В результате вес ссылки для ранжирования может быть снижен (борьба с Search Spamming), или клик по рекламе может быть дисконтирован (борьба с Ad Spamming).
  • US10402457B1
  • 2019-09-03
  • Ссылки

  • Антиспам

  • Краулинг

Как Google использует данные о посещаемости, уникальных пользователях и длине URL для ранжирования документов
Фундаментальный патент Google, описывающий использование поведенческих факторов в ранжировании. Система рассчитывает Usage Score на основе частоты посещений и количества уникальных пользователей, фильтруя ботов и взвешивая данные по географии. Этот балл комбинируется с текстовой релевантностью (IR Score) и длиной URL (Path Length Score) для определения итоговой позиции документа.
  • US8001118B2
  • 2011-08-16
  • Поведенческие сигналы

  • SERP

Как Google использует контекст пользователя и интерактивное уточнение для обучения моделей поиска
Google может инициировать поиск пассивно, основываясь на контексте действий пользователя (например, чтении статьи или телефонном звонке). Система позволяет пользователю уточнить этот поиск, выбрав один из использованных критериев (например, тапнув на сущность в тексте), чтобы повысить его значимость. Реакция пользователя на уточненные результаты используется для машинного обучения и улучшения взвешивания критериев в будущих поисковых запросах.
  • US11568003B2
  • 2023-01-31
  • Семантика и интент

  • Персонализация

  • Поведенческие сигналы

Как Google выявляет ссылочный спам (Link Farms и Web Rings), анализируя чувствительность PageRank к изменениям в структуре ссылок
Google использует математический метод для обнаружения искусственного завышения PageRank. Система анализирует, насколько резко меняется ранг страницы при изменении «коэффициента связи» (coupling factor/damping factor). Если ранг страницы слишком чувствителен к этим изменениям (имеет высокую производную), это сигнализирует о наличии манипулятивных структур, таких как ссылочные фермы или веб-кольца.
  • US7509344B1
  • 2009-03-24
  • Антиспам

  • Ссылки

  • Техническое SEO

Как Google использует ссылки, которыми делятся в почте, блогах и мессенджерах, как сигнал для корректировки ранжирования
Google запатентовал механизм (User Distributed Search), который учитывает, как пользователи делятся ссылками в коммуникациях (почта, блоги, мессенджеры). Если автор включает ссылку в сообщение, это дает ей первоначальную модификацию в ранжировании. Если получатели переходят по этой ссылке, её Ranking Score увеличивается ещё больше. Оба сигнала используются для влияния на позиции документа в будущей выдаче.
  • US8862572B2
  • 2014-10-14
  • Поведенческие сигналы

  • Ссылки

seohardcore