SEO HARDCORE
  • Разборы патентов
    • Патенты Google
  • Скоро SEO инструменты
  • Скоро SEO аналитика
  • seohardcore
SEO HARDCORE
назад

Как Google автоматически генерирует критерии таргетинга для рекламы, сравнивая сущности на лендинге и в тематических коллекциях

GENERATING AND USING ENTITY SELECTION CRITERIA (Генерация и использование критериев выбора на основе сущностей)
  • US20150100413A1
  • Google LLC
  • 2013-10-09
  • 2015-04-09
  • Семантика и интент
  • Персонализация
  • Описание
  • Разбор
  • Выводы
  • Практика
  • FAQ
  • Похожие

Анализ патента Google, описывающего автоматическую генерацию критериев таргетинга для рекламных кампаний. Система анализирует целевую страницу рекламодателя и сравнивает сущности, найденные на ней, с сущностями из тематических коллекций, соответствующих заявленному типу бизнеса. Пересечение этих данных формирует точные критерии выбора, улучшая релевантность рекламы.

Описание

Какую проблему решает

Патент решает задачу автоматизации и повышения точности генерации критериев выбора (Selection Criteria), то есть параметров таргетинга, для рекламных кампаний (Content Items). Он направлен на устранение неоднозначности ключевых слов (например, отличить «Jaguar» автомобиль от животного) и снижение ручного труда рекламодателей путем автоматической идентификации ключевых сущностей (Entities), связанных с их бизнесом и целевой страницей.

Что запатентовано

Запатентована система автоматической генерации Selection Criteria для рекламной кампании. Механизм основан на сравнении двух наборов сущностей. Первый набор извлекается непосредственно из целевой страницы (Landing Page) рекламодателя. Второй набор берется из тематических коллекций (Collections), которые система ассоциирует с типом бизнеса (Business Type), указанным рекламодателем. Пересечение этих двух наборов формирует критерии таргетинга.

Как это работает

Система работает следующим образом:

  • Ввод данных: Рекламодатель предоставляет URL лендинга и указывает свой Business Type.
  • Анализ Бизнеса (Группа 1): Система идентифицирует релевантные Collections сущностей, основываясь на Business Type, и формирует первую группу сущностей.
  • Анализ Лендинга (Группа 2): Компонент Annotator извлекает сущности из контента лендинга, рассчитывая метрики уверенности (Confidence Score) и тематичности (Topicality Score). Формируется вторая группа сущностей.
  • Сравнение: Система сравнивает Группу 1 и Группу 2.
  • Генерация Критериев: Совпадающие сущности (пересечение) используются для автоматической генерации Selection Criteria для кампании.

Актуальность для SEO

Высокая (для контекстной рекламы). Автоматизация настройки рекламных кампаний (например, Performance Max) активно развивается и полагается на автоматическое понимание бизнеса рекламодателя. Понимание сущностей является центральным элементом технологического стека Google, что делает описанные методы высокоактуальными для рекламной платформы.

Важность для SEO

Патент имеет косвенное значение для SEO (4/10). Он описывает механизмы внутри Content Management System (рекламной платформы), а не органического поиска (Search System). Однако он детально раскрывает, как Google технологически извлекает сущности со страниц и оценивает их с помощью Confidence Score и Topicality Score. Понимание этих базовых технологий анализа контента критически важно для Senior SEO-специалистов, разрабатывающих стратегии семантической оптимизации.

Детальный разбор

Термины и определения

Annotator (Аннотатор)
Компонент системы, который анализирует контент Landing Page, распознает термины, относящиеся к сущностям, и извлекает их. Использует парсинг и методы NLP.
Business Type (Тип бизнеса)
Категория, которую рекламодатель самостоятельно указывает для описания своего бизнеса (например, «мебельный магазин» или «автодилер»).
Collection (Коллекция)
Группа сущностей, объединенных общим признаком (например, коллекция «Лучшие фильмы 2000 года» или «Бренды автомобилей»). Используется как эталонный набор сущностей для Business Type.
Confidence Score (Оценка уверенности)
Метрика, определяющая вероятность того, что термин на лендинге действительно относится к идентифицированной сущности. Используется для разрешения неоднозначностей (например, «Ягуар» как автомобиль или животное).
Content Management System (Система управления контентом)
В контексте патента — рекламная платформа (например, Google Ads), управляющая кампаниями и показом рекламы.
Entity (Сущность)
Идентифицируемый объект: человек, место, продукт, услуга, организация, концепция или абстрактная идея.
Landing Page (Целевая страница/Лендинг)
Веб-страница, предоставленная рекламодателем, на которую ведет рекламное объявление.
Quality Score (Оценка качества коллекции)
Метрика, указывающая, насколько конкретная Collection релевантна определенному Business Type. Может быть предопределена в системе соответствий (mapping).
Selection Criteria (Критерии выбора/Таргетинга)
Параметры (ключевые слова, сущности), используемые для определения того, когда показывать элемент контента (рекламу) в ответ на запрос.
Topicality Score (Оценка тематичности/Актуальности)
Метрика, определяющая важность сущности для основной темы страницы. Зависит от расположения контента (например, сущность в заголовке важнее, чем в дисклеймере).

Ключевые утверждения (Анализ Claims)

Claim 1 (Независимый пункт): Описывает основной процесс генерации критериев выбора.

  1. Система получает данные о Landing Page и данные об одном или нескольких Business Type.
  2. Идентифицируются одна или несколько Collections из множества коллекций, основываясь на Business Type.
  3. Из идентифицированных коллекций выбирается первая группа сущностей.
  4. Из Landing Page идентифицируется вторая группа сущностей.
  5. Первая группа сущностей сравнивается со второй группой.
  6. На основе сравнения генерируются Selection Criteria для элементов контента (рекламы).

Ядро изобретения — это валидация релевантности путем сравнения ожидаемых сущностей (из коллекций по типу бизнеса) и фактических сущностей (с лендинга).

Claim 3 и 4 (Зависимые): Детализируют процесс идентификации коллекций.

Система определяет Quality Score для коллекций на основе Business Type и выбирает коллекции с более высоким баллом. Этот Quality Score может быть взят из заранее определенного соответствия (predetermined mapping) между типами бизнеса и коллекциями.

Claim 5 (Зависимый): Детализирует выбор первой группы сущностей.

Если идентифицировано несколько коллекций, процесс может включать выполнение операций объединения (union) или пересечения (intersection) над ними для формирования первой группы.

Claim 6 (Зависимый): Детализирует идентификацию второй группы сущностей (с лендинга).

Сущности на лендинге идентифицируются Annotator вместе с Confidence Score и Topicality Score. Выбор сущностей для второй группы основывается на этих оценках (например, путем фильтрации по порогам).

Claim 7 и 8 (Зависимые): Детализируют сравнение и генерацию критериев.

Сравнение включает операцию пересечения (intersection) для определения сущностей, присутствующих в обеих группах. Selection Criteria генерируются на основе этого пересечения. Это может включать автоматическое создание кампании, использующей эти критерии.

Где и как применяется

Важно отметить, что этот патент НЕ применяется к стандартным фазам органического поиска (Ранжирование). Он относится исключительно к Content Management System (рекламной платформе).

Контекст применения: Система используется во время настройки или автоматического создания рекламной кампании рекламодателем.

INDEXING – Индексирование и извлечение признаков (Косвенно)
Описанная технология полагается на базовые системы Google, работающие на этапе индексирования. Для работы системы необходимы предварительно рассчитанные данные о сущностях (упоминается knowledge graph) и предопределенные Collections. Компонент Annotator использует технологии индексирования (NLP, Entity Extraction) для анализа контента Landing Page и расчета Confidence и Topicality Scores.

Входные данные:

  • URL целевой страницы (Landing Page).
  • Тип(ы) бизнеса (Business Type).
  • Название бизнеса (Business Name) (опционально).

Выходные данные:

  • Сгенерированные или предложенные критерии выбора (Selection Criteria), основанные на сущностях.
  • Автоматически сгенерированная рекламная кампания.

На что влияет

  • Рекламные кампании: Основное влияние — повышение точности таргетинга рекламных кампаний и автоматизация их настройки.
  • Коммерческие ниши (E-commerce, Услуги): Наиболее применимо к бизнесам, где продукты и услуги четко определяются через сущности.
  • Разрешение неоднозначности: Влияет на релевантность рекламы по запросам с неоднозначными терминами.

Когда применяется

  • Создание кампании: Когда рекламодатель создает новую кампанию (особенно автоматизированную) и предоставляет базовую информацию (URL, тип бизнеса).
  • Оптимизация кампании: Когда система предлагает рекомендации по улучшению таргетинга для существующей кампании.

Пошаговый алгоритм

Процесс генерации Selection Criteria:

  1. Получение Входных Данных: Система получает данные от рекламодателя: URL целевой страницы и информацию о типе бизнеса (Business Type Data).
  2. Идентификация Коллекций (Фаза 1: Анализ Бизнеса):
    • Компонент Collection Identifier определяет релевантные коллекции сущностей на основе Business Type.
    • Используется предопределенный маппинг и выбор коллекций с наивысшей оценкой качества (Quality Score) для данного типа бизнеса.
  3. Формирование Первой Группы Сущностей:
    • Компонент Entity Selection Engine выбирает набор сущностей из идентифицированных коллекций. Могут использоваться операции объединения (union) или пересечения (intersection).
  4. Аннотирование Лендинга (Фаза 2: Анализ Страницы):
    • Компонент Annotator анализирует контент целевой страницы.
    • Идентифицируются сущности. Для каждой вычисляются Confidence Score (используя контекст) и Topicality Score (используя расположение на странице).
  5. Формирование Второй Группы Сущностей:
    • Entity Selection Engine фильтрует сущности, найденные на лендинге, используя пороговые значения Confidence Score и Topicality Score.
  6. Сравнение Групп:
    • Компонент Entity Comparison Engine сравнивает Первую группу (из коллекций) и Вторую группу (с лендинга).
    • Выполняется операция пересечения (intersection) для поиска общих сущностей.
  7. Генерация Критериев Выбора: На основе совпадающих сущностей генерируются Selection Criteria. Они могут быть автоматически добавлены в кампанию.

Какие данные и как использует

Данные на входе

  • Контентные факторы: Весь текст лендинга анализируется компонентом Annotator для извлечения сущностей.
  • Структурные факторы: Расположение контента на странице (например, в заголовках, основном контенте, футере) используется для расчета Topicality Score.
  • Бизнес-факторы (Внешние): Business Type и Business Name, предоставленные рекламодателем.
  • Системные данные (Knowledge Graph): База данных сущностей, предопределенные Collections и их соответствия типам бизнеса.

Какие метрики используются и как они считаются

  • Quality Score (для коллекций): Оценка релевантности предопределенной коллекции указанному типу бизнеса. Согласно патенту, часто является заранее определенной (predetermined) и хранится в mapping.
  • Confidence Score (для сущностей): Оценка уверенности в том, что термин на странице действительно относится к конкретной сущности. Рассчитывается Annotator на основе контекста и окружающих терминов (например, «Jaguar» рядом с «дилер» повышает уверенность, что это автомобиль).
  • Topicality Score (для сущностей): Оценка важности сущности для темы страницы. Рассчитывается Annotator на основе расположения термина на странице (структурная значимость).
  • Методы анализа текста (NLP, entity extraction): Annotator использует парсинг текста и извлечение сущностей, опираясь на данные типа knowledge graph.
  • Методы вычислений: Используются операции теории множеств (Union, Intersection) для агрегации коллекций и сравнения групп сущностей.

Выводы

  1. Патент относится к Рекламе, не к органическому SEO: Описанный механизм предназначен для автоматизации таргетинга в Google Ads (Content Management System), а не для ранжирования в органическом поиске. Прямых SEO-рекомендаций в нем нет.
  2. Валидация через сравнение Сущностей: Ключевой механизм — это проверка релевантности путем сравнения того, что система ожидает увидеть для данного типа бизнеса (сущности из Collections), с тем, что реально присутствует на лендинге (сущности, извлеченные Annotator).
  3. Детализация оценки сущностей на странице (Confidence и Topicality): Патент раскрывает использование двух ключевых метрик при анализе контента: Confidence Score (уверенность в идентификации/разрешение неоднозначности) и Topicality Score (важность для темы страницы/структурная значимость). Эти технологии анализа контента универсальны и, вероятно, используются в органическом поиске.
  4. Коллекции как Эталон Контекста: Collections служат эталонным набором данных для определения контекста и категоризации бизнеса. Соответствие контента этим эталонам критично для правильной интерпретации тематики сайта системой.
  5. Разрешение Неоднозначности: Механизм эффективно разрешает двусмысленность. Совпадение сущности на странице (например, «Ягуар») с сущностью в релевантной коллекции (например, «Автомобили») позволяет системе уверенно определить правильный контекст.

Практика

ВАЖНОЕ ПРИМЕЧАНИЕ: Патент относится к системе контекстной рекламы (PPC). Практические выводы для SEO основаны на понимании базовых технологий Google по извлечению и интерпретации сущностей (Annotator, Confidence Score, Topicality Score), которые описаны в патенте.

Best practices (это мы делаем)

  • Четкое Представление Ключевых Сущностей (для Topicality Score): Патент подчеркивает важность Topicality Score, который зависит от расположения контента. SEO-специалисты должны убедиться, что основные сущности сайта (продукты, услуги, бренды) занимают центральное место в структуре документа (заголовки H1, основной контент), чтобы максимизировать их тематическую значимость.
  • Использование Контекста для Уточнения Сущностей (для Confidence Score): Для терминов с несколькими значениями (омонимов) необходимо предоставлять достаточный контекст (связанные термины и сущности). Это помогает Annotator достичь высокого Confidence Score и правильно интерпретировать сущность, разрешая неоднозначность.
  • Обеспечение Тематического Соответствия (Topical Alignment): Контент страницы должен семантически соответствовать общей тематике бизнеса. Механизм сравнения сущностей на лендинге с эталонными Collections показывает, что Google проверяет, соответствует ли содержимое страницы ожидаемому контенту для данной ниши.
  • Использование структурированных данных (Schema.org): Хотя патент не упоминает микроразметку, ее использование помогает Annotator точнее идентифицировать сущности и их контекст, что потенциально повышает Confidence Score.

Worst practices (это делать не надо)

  • Размытие Сущностей и Неоднозначность: Использование двусмысленных терминов без уточняющего контекста. Это снижает Confidence Score и затрудняет работу Annotator.
  • Несоответствие Контента и Тематики Сайта: Создание страниц, чьи основные сущности не имеют отношения к общей тематике сайта. В контексте патента, система не нашла бы пересечений между сущностями на странице и в ожидаемых Collections.
  • Скрытие Ключевых Сущностей: Размещение названий ключевых продуктов или услуг в неважных частях страницы (футер, дисклеймеры) приведет к низкому Topicality Score.
  • Размытие тематики лендинга (Topic Dilution): Попытка охватить слишком много разных сущностей на одной странице без явного фокуса, что снижает Topicality Score для целевых сущностей.

Стратегическое значение

Патент подтверждает стратегический фокус Google на Entity-Oriented Search. Он демонстрирует конкретную реализацию использования сущностей и тематических коллекций (Knowledge Graph) для понимания и валидации коммерческого контента. Технологии глубокого анализа контента (Annotator, расчет Confidence и Topicality Scores) являются фундаментальными. Долгосрочная SEO-стратегия должна фокусироваться на построении четкой семантической структуры сайта, которая однозначно позиционирует его в рамках релевантных тематических коллекций.

Практические примеры

Сценарий: Оптимизация карточки товара для повышения Confidence и Topicality Scores

Задача: Оптимизировать страницу нового смартфона «Galaxy S30», чтобы Google четко идентифицировал его как основной объект.

  1. Повышение Topicality Score: Убедиться, что сущность «Galaxy S30» присутствует в Title, H1 и первом абзаце описания. Это сигнализирует, что данная сущность является центральной темой.
  2. Повышение Confidence Score:
    1. Добавить контекст: Упомянуть связанные сущности: бренд («Samsung»), тип устройства («Смартфон»), характеристики («AMOLED-экран», «Процессор Exynos»). Наличие этих связанных сущностей усиливает контекст и помогает отличить продукт от других возможных значений.
    2. Использовать структурированные данные: Внедрить разметку Schema.org/Product с указанием name, brand, model. Это напрямую помогает Annotator.
  3. Ожидаемый результат: Annotator с высокой уверенностью (Confidence Score) определяет «Galaxy S30» как продукт Samsung и присваивает ему высокий Topicality Score, улучшая понимание контента страницы.

Вопросы и ответы

Описывает ли этот патент алгоритмы органического ранжирования Google?

Нет. Патент описывает Content Management System, то есть систему управления рекламными объявлениями (Google Ads). Он посвящен автоматической генерации критериев таргетинга (Selection Criteria) для рекламодателей, а не тому, как ранжируются сайты в органической выдаче.

Какая польза от этого патента для SEO-специалиста, если он про рекламу?

Основная польза заключается в детальном описании технологий анализа контента, которые использует Google. В частности, он показывает, как работает Annotator для извлечения сущностей и как оценивает их с помощью Confidence Score (уверенность) и Topicality Score (тематичность). Понимание этих процессов помогает лучше оптимизировать контент для правильной интерпретации поисковой системой.

Что такое Confidence Score и как его можно повысить?

Confidence Score — это мера уверенности системы в том, что термин на странице относится к конкретной сущности. Он используется для разрешения неоднозначности (например, «Apple» компания или фрукт). Повысить его можно, предоставляя четкий контекст: используя связанные термины и сущности (например, «Apple» + «iPhone», «iOS»), а также внедряя структурированные данные (Schema.org).

Что такое Topicality Score и как его можно повысить?

Topicality Score — это оценка того, насколько центральной является сущность для темы документа. Повысить его можно, размещая ключевые сущности в структурно важных элементах страницы: заголовках (Title, H1), основном контенте и в начале документа. Сущности в футере или дисклеймерах, вероятно, получат низкий балл.

Что такое «Коллекция» (Collection) сущностей в контексте патента?

Collection — это предопределенная группа сущностей, объединенных общим признаком (например, «Производители автомобилей» или «Типы мебели»). Система использует эти коллекции, чтобы понять, какие сущности в целом релевантны для определенного типа бизнеса (Business Type), заявленного рекламодателем.

Как Google определяет, какие коллекции подходят моему бизнесу?

Согласно патенту, система использует предопределенные соответствия (predetermined mapping) между типом бизнеса и коллекциями. Эти соответствия могут иметь оценку качества (Quality Score), которая указывает на степень релевантности коллекции данному типу бизнеса. Система выбирает коллекции с наивысшим Quality Score.

Почему система сравнивает сущности из коллекций с сущностями на посадочной странице?

Это механизм валидации релевантности. Сущности из коллекций представляют общее понимание категории бизнеса (ожидание). Сущности с посадочной страницы представляют конкретное предложение (реальность). Система ищет пересечение, чтобы гарантировать, что сгенерированные критерии таргетинга точно соответствуют и категории, и конкретному контенту страницы.

Что произойдет, если сущности на моей странице не совпадают с теми, которые Google ожидает от моего типа бизнеса?

В контексте патента, если пересечение минимально, система не сможет сгенерировать надежные критерии таргетинга. В контексте SEO это может указывать на проблему с тематической релевантностью: Google может посчитать, что контент страницы не соответствует заявленной тематике сайта или нише, что негативно скажется на ранжировании.

Как этот патент связан с E-E-A-T?

Прямой связи нет, так как патент фокусируется на автоматизации таргетинга, а не оценке качества. Однако точное распознавание сущностей (с высоким Confidence и Topicality) является необходимым базовым условием для того, чтобы системы оценки качества могли корректно определить тематику контента и затем применить сигналы E-E-A-T.

Каков главный вывод для контент-стратегии из этого патента?

Главный вывод — необходимость фокуса на семантической ясности и структурной организации контента. Контент-стратегия должна гарантировать, что ключевые сущности представлены однозначно (для высокого Confidence Score) и занимают центральное место в структуре документа (для высокого Topicality Score), обеспечивая правильную интерпретацию контента системами Google.

Похожие патенты

Как Google использует графы сущностей для точного семантического сопоставления запросов и контента
Google применяет семантический подход к выбору контента, строя «граф запроса» на основе сущностей в запросе и их связей в Knowledge Graph. Этот граф затем сопоставляется с «графами критериев выбора контента». Система также может автоматически генерировать эти критерии, анализируя целевой контент и выявляя статистически значимые семантические шаблоны.
  • US9501530B1
  • 2016-11-22
  • Семантика и интент

  • Knowledge Graph

Как Google использует коллекции сущностей для определения коммерческого интента запроса
Google анализирует сущности (entities), распознанные в поисковом запросе, и определяет, к каким «коллекциям» (группам связанных сущностей) они принадлежат. Оценивая характеристики этих коллекций, система вычисляет вероятность коммерческого намерения пользователя. Этот механизм используется для разрешения неоднозначностей и принятия решения о показе релевантного коммерческого контента.
  • US20150088648A1
  • 2015-03-26
  • Семантика и интент

  • Knowledge Graph

  • SERP

Как Google автоматически выбирает категории и контент для страниц сущностей, комбинируя данные о поведении пользователей и Knowledge Graph
Google использует механизм для автоматического создания страниц о сущностях (например, о фильмах или персонажах). Система определяет, какие категории (свойства) сущности наиболее интересны пользователям, сравнивая данные из Knowledge Graph с данными о том, что пользователи ищут или смотрят вместе с этой сущностью. Затем она наполняет эти категории популярным контентом.
  • US11036743B2
  • 2021-06-15
  • Knowledge Graph

  • Семантика и интент

  • Поведенческие сигналы

Как Google использует графы сущностей и их топологию для семантического понимания запросов и таргетинга контента
Google использует механизм выбора контента (например, рекламы), основанный на свойствах сущностей, а не только на ключевых словах. Система генерирует граф запроса, отражающий сущности и их взаимосвязи из Базы Знаний. Контент выбирается, только если его критерии точно соответствуют как содержанию, так и структуре (топологии) этого графа. Это позволяет учитывать семантический контекст, даже если он не выражен текстом запроса.
  • US9542450B1
  • 2017-01-10
  • Семантика и интент

  • Knowledge Graph

Как Google автоматически генерирует, ранжирует и отображает навигационные фильтры (структурированные сниппеты и Sitelinks) для результатов поиска и рекламы
Google использует систему для автоматического извлечения структурированных данных (заголовков и связанных элементов) с целевой страницы. Эти данные организуются в "Навигационные фильтры" — концептуально параллельные списки (например, "Бренды: Canon, Nikon, Sony"). Система ранжирует эти фильтры на основе запроса пользователя, его интересов и доступного пространства, а затем интегрирует их в сниппет результата поиска или рекламное объявление для улучшения навигации.
  • US9276855B1
  • 2016-03-01
  • SERP

  • Семантика и интент

Популярные патенты

Как Google использует клики и пропуски пользователей для оценки и корректировки правил близости терминов (Proximity Rules)
Google анализирует поведение пользователей для оценки эффективности правил близости (Proximity Rules), которые влияют на ранжирование в зависимости от расстояния между ключевыми словами на странице. Система отслеживает, кликают ли пользователи на результаты, где термины расположены далеко друг от друга, или пропускают их. На основе этих данных (Click Count, Skip Count) вычисляется оценка качества правила, что позволяет Google динамически адаптировать важность фактора близости.
  • US9146966B1
  • 2015-09-29
  • Поведенческие сигналы

  • SERP

Как Google генерирует блок "Похожие вопросы" (People Also Ask) на основе анализа кликов и поведения пользователей
Google анализирует топовые результаты по исходному запросу и определяет "Тематические запросы" (Topic Sets) — прошлые запросы, по которым пользователи кликали на эти результаты. Затем система ищет популярные вопросы, соответствующие этим темам, фильтрует дубликаты на основе общности кликов и показывает их в блоке PAA для дальнейшего исследования темы.
  • US9213748B1
  • 2015-12-15
  • SERP

  • Семантика и интент

  • Поведенческие сигналы

Как Google в Автоподсказках (Suggest) предлагает искать запрос в разных вертикалях поиска (Картинки, Новости, Карты)
Патент описывает механизм "разветвления" (forking) автоподсказок Google Suggest. Система анализирует введенные символы и определяет, в каких вертикалях поиска (Корпусах) — таких как Картинки, Новости или Карты — пользователи чаще всего ищут предложенный запрос. Если корреляция с конкретной вертикалью высока (на основе Corpus Score), система предлагает пользователю искать сразу в ней, наряду со стандартным универсальным поиском.
  • US9317605B1
  • 2016-04-19
  • Семантика и интент

  • SERP

  • Поведенческие сигналы

Как Google классифицирует интент запросов (например, поиск порнографии), анализируя историю использования фильтров (SafeSearch)
Google использует данные о том, как часто пользователи включают или отключают фильтры контента (например, SafeSearch) при вводе конкретного запроса. Анализируя нормализованное соотношение фильтрованных и нефильтрованных поисковых операций, система классифицирует запрос как целенаправленно ищущий определенный тип контента (например, adult). Эта классификация затем используется для повышения или понижения релевантности соответствующего контента в выдаче.
  • US9152701B2
  • 2015-10-06
  • Семантика и интент

  • Безопасный поиск

  • Поведенческие сигналы

Как Google автоматически распознает сущности в тексте и связывает их в Knowledge Graph с помощью динамических поисковых ссылок
Google использует автоматизированную систему для поддержания связей между сущностями (объектами) в своем хранилище фактов (Knowledge Graph). Система сканирует текст, статистически определяет значимые фразы и сверяет их со списком известных объектов. При совпадении создается динамическая «поисковая ссылка» вместо фиксированного URL. Это позволяет Google постоянно обновлять связи по мере добавления новых знаний.
  • US8260785B2
  • 2012-09-04
  • Knowledge Graph

  • Семантика и интент

  • Ссылки

Как Google обучается на поведении пользователя для персонализации весов источников в поисковой выдаче
Google использует сигналы интереса пользователя (клики, время просмотра) для динамической корректировки весов различных источников данных (например, ключевых слов, тем, типов контента). Система определяет, какие источники наиболее полезны для конкретного пользователя, и повышает их значимость при ранжировании последующих результатов поиска, тем самым персонализируя выдачу.
  • US8631001B2
  • 2014-01-14
  • Персонализация

  • Поведенческие сигналы

  • SERP

Как Google использует CTR и E-E-A-T сигналы для определения контекста ссылок и оценки качества внешних упоминаний
Google использует двухэтапный механизм для анализа внешних комментариев (например, блог-постов). Сначала система определяет истинный объект обсуждения, если в комментарии несколько ссылок, анализируя CTR, длину URL и тематику. Затем она оценивает качество комментария, используя рейтинг автора, авторитетность источника, свежесть и обратную связь пользователей, чтобы отобрать наиболее релевантный контент.
  • US8656266B2
  • 2014-02-18
  • Ссылки

  • EEAT и качество

  • Свежесть контента

Как Google классифицирует запросы как навигационные или исследовательские, чтобы регулировать количество показываемых результатов
Google использует систему для динамического определения количества отображаемых результатов поиска. Система классифицирует запрос как навигационный (поиск конкретного места/ресурса) или исследовательский (поиск вариантов). Классификация основана на анализе компонентов оценки релевантности (совпадение по названию vs. категории) и энтропии исторических кликов. При навигационном интенте количество результатов сокращается.
  • US9015152B1
  • 2015-04-21
  • Семантика и интент

  • Поведенческие сигналы

  • Local SEO

Как Google использует крупномасштабное машинное обучение и данные о поведении пользователей для предсказания кликов и ранжирования результатов
Google использует систему машинного обучения для создания модели ранжирования, которая предсказывает вероятность клика пользователя по документу. Модель обучается на огромных массивах данных о прошлых поисках (запросы, документы, клики). Система учитывает базовую вероятность клика (Prior Probability), основанную на позиции и предыдущей оценке документа, а затем корректирует её с помощью правил, выявляющих, какие признаки (Features) документа и запроса влияют на выбор пользователя.
  • US7231399B1
  • 2007-06-12
  • Поведенческие сигналы

Как Google использует анкорный текст входящих ссылок для определения синонимов и псевдонимов сущностей в Knowledge Graph
Google автоматически определяет синонимы и псевдонимы для сущностей (например, людей, компаний) в своем хранилище фактов (Knowledge Graph). Система анализирует анкорный текст ссылок, ведущих на исходные документы, из которых были извлечены факты о сущности. Это позволяет системе понять, что, например, "Биг Блю" и "IBM" относятся к одной и той же компании.
  • US8738643B1
  • 2014-05-27
  • Knowledge Graph

  • Семантика и интент

  • Ссылки

seohardcore