SEO HARDCORE
  • Разборы патентов
    • Патенты Google
  • Скоро SEO инструменты
  • Скоро SEO аналитика
  • seohardcore
SEO HARDCORE
назад

Как Google рассчитывает значимость сущности в документе (Entity Score) и использует всплески трафика (Traffic Spike Score) для рекомендации контента

IDENTIFYING DOCUMENTS FOR DISSEMINATION BY AN ENTITY (Идентификация документов для распространения субъектом)
  • US9098502B1
  • Google LLC
  • 2012-12-27
  • 2015-08-04
  • Индексация
  • Семантика и интент
  • Описание
  • Разбор
  • Выводы
  • Практика
  • FAQ
  • Похожие

Google использует систему для определения того, насколько важна конкретная сущность (человек или бренд) для документа. Система анализирует количество упоминаний, их расположение (заголовок, тело) и упоминания других сущностей для расчета «Entity Score». Этот механизм используется для предложения пользователям контента о них самих для распространения в социальных сетях, а также учитывает «Traffic Spike Score» (всплески трафика) для выявления актуальных документов.

Описание

Какую проблему решает

Патент решает проблему неосведомленности сущностей (людей, брендов, организаций) о контенте, который публикуется о них третьими сторонами в интернете. Зачастую такой контент сложно найти вручную. Система автоматизирует обнаружение этого контента и упрощает его распространение (dissemination) через онлайн-среды, контролируемые сущностью (например, профиль в социальной сети).

Что запатентовано

Запатентована система для автоматического предложения контента сущности для её дальнейшего распространения. Система идентифицирует документы, ссылающиеся на конкретную сущность, и вычисляет Entity Score — меру важности этой сущности для документа. На основе этого и других сигналов, таких как популярность контента (Traffic Spike Score) или авторитетность источника (Trusted Site), выбирается подмножество документов, которые предлагаются сущности.

Как это работает

Система функционирует следующим образом:

  • Индексирование сущностей: Документы анализируются для выявления упоминаний уникальных сущностей и сохраняются в Entity-Document Index.
  • Расчет Entity Score: Определяется, насколько документ сфокусирован на конкретной сущности. Учитывается частота упоминаний, их расположение (заголовок, начало текста) и соотношение упоминаний этой сущности к другим.
  • Отбор кандидатов: Выбираются документы, превышающие пороговое значение Entity Score.
  • Дополнительный отбор: В выборку могут быть добавлены документы с низким Entity Score, если они имеют высокий Traffic Spike Score (резкий рост популярности) или опубликованы на Trusted Site.
  • Предложение: Отобранные документы отображаются в онлайн-среде сущности с возможностью поделиться ими через Dissemination Element.

Актуальность для SEO

Средняя/Высокая. Хотя патент (подача 2012 г.) явно ориентирован на функционал социальных сетей (вероятно, Google+), лежащие в его основе технологии критически важны для современного поиска. Механизмы расчета значимости сущности (Entity Score), определение главной темы документа (Primary Subject), оценка авторитетности источников (Trusted Sites) и анализ трендов (Traffic Spike Score) активно используются в Google Search, Knowledge Panels и Google Discover.

Важность для SEO

Патент имеет значительное стратегическое влияние (7/10) на Entity SEO и Управление репутацией (ORM). Он не описывает ранжирование в веб-поиске, но детально раскрывает, как Google количественно оценивает взаимосвязь между документом и сущностью (Entity Score). Понимание этих механизмов позволяет оптимизировать контент так, чтобы четко сигнализировать поисковой системе, кто является главным субъектом документа.

Детальный разбор

Термины и определения

Dissemination Element (Элемент распространения)
Элемент пользовательского интерфейса (например, кнопка "Поделиться"), который позволяет сущности распространить предложенный документ среди других сущностей в онлайн-среде.
Document Date (Дата документа)
Дата, связанная с документом (например, дата публикации или индексации). Используется для обеспечения темпорального разнообразия предложенных документов.
Entity (Сущность)
Уникально идентифицируемый человек, место или концепция, часто представленные в Графе Знаний (Knowledge Graph).
Entity Score (Оценка сущности)
Метрика, определяющая меру важности (measure of importance) конкретной сущности для данного документа. Рассчитывается на основе количества, расположения и соотношения упоминаний сущности.
Entity-Document Index (Индекс Сущность-Документ)
База данных, хранящая связи между уникальными сущностями и документами, которые их упоминают.
Information Retrieval Score (Оценка информационного поиска)
Стандартная оценка релевантности, показывающая, насколько хорошо контент документа соответствует термину (например, имени сущности).
Primary Subject (Основной субъект)
Сущность, которая является главной темой документа.
Traffic Spike Score (Оценка всплеска трафика)
Значение, основанное на дисперсии (variance) или резком изменении количества пользовательских запросов к документу за определенный период времени. Указывает на виральность или трендовость контента.
Trusted Site (Надежный сайт)
Веб-сайт, классифицированный как надежный на основании качества размещенных на нем документов (например, оригинальность контента, форматирование, ссылочный профиль).

Ключевые утверждения (Анализ Claims)

Claim 1 (Независимый пункт): Описывает основной процесс предложения документов члену социальной сети, фокусируясь на взаимодействии Entity Score и Traffic Spike Score.

  1. Система идентифицирует документы, ссылающиеся на конкретного члена социальной сети (независимо от его запроса).
  2. Вычисляется Entity Score (мера важности), основанная на количестве упоминаний.
  3. Отбирается подмножество документов, у которых Entity Score превышает порог.
  4. Идентифицируется дополнительный документ, который ссылается на члена, но чей Entity Score ниже порога.
  5. Определяется, что этот документ имеет Traffic Spike Score (оценка дисперсии трафика), превышающий порог.
  6. Этот дополнительный (виральный) документ включается в набор предложенных документов на основании высокого Traffic Spike Score.
  7. Система предоставляет эти документы и Dissemination Element на странице социальной сети этого члена.

Ключевой аспект — механизм включения трендового контента (Traffic Spike Score) может компенсировать низкую базовую оценку важности (Entity Score).

Claim 2 (Зависимый от 1): Уточняет расчет Entity Score.

Entity Score определяется на основе как количества упоминаний, так и их расположения (locations) в документе.

Claim 3 (Зависимый от 1): Детализирует расчет Entity Score через соотношение.

  1. Определяется первое число: количество упоминаний целевой сущности.
  2. Определяется второе число: количество упоминаний других сущностей.
  3. Entity Score определяется как функция от первого и второго чисел.

Это подчеркивает важность эксклюзивности фокуса документа на сущности.

Claim 4 (Зависимый от 1): Описывает альтернативный критерий включения.

Документ может быть включен, если он одновременно размещен на Trusted Site (классифицированном как надежный) И система определила, что данная сущность является Primary Subject этого документа.

Claim 5 (Зависимый от 1): Описывает еще один критерий включения.

Документ может быть включен, если его заголовок (Title) содержит упоминание данной сущности.

Claim 7 (Зависимый от 1): Описывает механизм обеспечения разнообразия.

Если два документа имеют совпадающую Document Date и оба подходят для включения, система включает только один из них. Это обеспечивает темпоральное разнообразие.

Где и как применяется

Изобретение применяется в основном на уровне приложений (например, социальной сети), но критически зависит от данных, обработанных на этапе индексирования.

INDEXING – Индексирование и извлечение признаков
На этом этапе происходит основная подготовка данных:

  • Распознавание сущностей (Entity Recognition) в документах и их связывание с Knowledge Graph.
  • Создание и обновление Entity-Document Index.
  • Предварительная оценка качества сайтов для классификации их как Trusted Sites.
  • Сбор временных меток (Document Date).
  • Предварительный расчет Entity Scores.

Application Layer (Уровень Приложения)
Основная логика патента выполняется здесь (это не стандартный процесс RANKING для веб-поиска, а процесс генерации предложений):

  1. Получение данных: Система запрашивает документы из Entity-Document Index для конкретной сущности.
  2. Анализ оценок: Извлекаются Entity Scores. Анализируются данные о трафике для расчета Traffic Spike Score.
  3. Применение логики отбора: Применяются пороги и правила (Claims 1, 4, 5, 7) для формирования финального набора предложений.
  4. Интеграция в UI: Предложения и Dissemination Element встраиваются в интерфейс пользователя.

Входные данные:

  • Entity-Document Index.
  • Предварительно рассчитанные Entity Scores.
  • Данные о классификации сайтов (Trusted Sites).
  • Данные о трафике/запросах к документам (для Traffic Spike Score).
  • Document Dates.

Выходные данные:

  • Список предложенных документов, отображаемый в онлайн-среде сущности.
  • Dissemination Element (кнопка "Поделиться").

На что влияет

  • Конкретные типы контента: Влияет на любые документы, в которых распознаются сущности (новости, статьи, блоги, пресс-релизы).
  • Стратегии: Патент напрямую влияет на ORM (Online Reputation Management) и мониторинг упоминаний бренда, автоматизируя обнаружение важного или трендового контента. Косвенно влияет на Entity SEO, раскрывая механизмы определения значимости сущности.

Когда применяется

  • Условия работы: Алгоритм применяется при генерации ленты или блока предложений в онлайн-среде сущности (например, при загрузке профиля в социальной сети).
  • Триггеры активации: Активация происходит, когда документы удовлетворяют заданным критериям отбора:
    • Entity Score выше порога.
    • ИЛИ Traffic Spike Score выше порога (даже при низком Entity Score).
    • ИЛИ комбинация Trusted Site и Primary Subject.
    • ИЛИ упоминание сущности в Заголовке (Title).

Пошаговый алгоритм

Процесс отбора предложенных документов для сущности (E).

  1. Идентификация документов: Система идентифицирует набор документов (D), ссылающихся на конкретную сущность E (используя Entity-Document Index).
  2. Расчет Entity Score: Для каждого документа в D вычисляется Entity Score. Учитывается количество упоминаний E, их расположение (заголовок, начало текста) и соотношение упоминаний E к другим сущностям.
  3. Первичный отбор: Формируется первичное подмножество документов, чьи Entity Score превышают установленный порог.
  4. Идентификация дополнительных кандидатов: Система анализирует документы, не вошедшие в первичное подмножество (с низким Entity Score).
  5. Анализ дополнительных сигналов: Для дополнительных кандидатов проверяются условия:
    • Трендовость: Рассчитывается Traffic Spike Score. Если он превышает порог, документ добавляется.
    • Авторитетность и Фокус: Если документ размещен на Trusted Site И сущность E является Primary Subject, он добавляется.
    • Упоминание в заголовке: Если сущность E упомянута в заголовке документа, он может быть добавлен.
  6. Диверсификация (Дедупликация по времени): Финальное подмножество анализируется. Если несколько документов имеют одинаковую Document Date, система может выбрать только один из них.
  7. Предоставление результатов: Сформированный набор документов предоставляется в онлайн-среду сущности E вместе с Dissemination Element.

Какие данные и как использует

Данные на входе

  • Контентные факторы:
    • Текст документа: используется для подсчета количества упоминаний сущностей (целевой и других).
    • Заголовок (Title): Упоминание в заголовке является сильным сигналом для расчета Entity Score и отдельным критерием включения.
    • Расположение текста: Местоположение упоминаний (начало документа, тело, сноски) используется для взвешивания при расчете Entity Score.
  • Факторы авторитетности (Системные):
    • Хост/Домен: Используется для определения, является ли источник Trusted Site (на основе анализа качества контента сайта).
  • Поведенческие факторы (Трафик):
    • Данные о пользовательских запросах к документу (User Requests): Используются для анализа популярности и расчета Traffic Spike Score.
  • Временные факторы:
    • Document Date (дата публикации или индексации): Используется для обеспечения темпорального разнообразия.

Какие метрики используются и как они считаются

  • Entity Score (Оценка значимости сущности): Комплексная метрика. Рассчитывается как функция от:
    • Частота (Frequency): Общее количество упоминаний сущности.
    • Проминентность (Prominence): Взвешенные оценки расположения упоминаний (вес выше для заголовка и начала текста).
    • Эксклюзивность (Exclusivity/Ratio): Соотношение упоминаний целевой сущности к упоминаниям других сущностей.
  • Traffic Spike Score: Метрика трендовости. Рассчитывается на основе дисперсии (variance) или максимального изменения количества пользовательских запросов к документу за определенный период времени (например, сравнение трафика сегодня и вчера).
  • Trusted Site: Бинарная или пороговая классификация на уровне сайта, основанная на качестве контента.
  • Primary Subject: Классификация, указывающая, является ли сущность главной темой документа. Определяется на основе анализа Entity Score и доминирования сущности в тексте.

Выводы

  1. Квантификация значимости сущности (Entity Salience): Google использует сложную метрику (Entity Score) для определения фокуса документа на конкретной сущности. Это не просто подсчет упоминаний, а анализ частоты, проминентности (расположения) и эксклюзивности (соотношения).
  2. Критичность структуры контента и Заголовка (Title): Расположение упоминаний критически важно. Упоминание сущности в заголовке является настолько сильным сигналом, что выделено как самостоятельный критерий для отбора контента.
  3. Виральность и Тренды (Traffic Spike Score): Google активно отслеживает всплески популярности контента. Высокий Traffic Spike Score может компенсировать низкий Entity Score, подчеркивая важность актуальности и вовлеченности.
  4. Ценность авторитетных источников (Trusted Sites): Статус Trusted Site является важным фактором доверия. Комбинация авторитетного источника и четкого фокуса на сущности (Primary Subject) является сильным сигналом для системы.
  5. Разнообразие выдачи: Система применяет темпоральную диверсификацию (по Document Date), чтобы избежать предложения однотипного контента, опубликованного в одно время.

Практика

Best practices (это мы делаем)

Хотя патент не о ранжировании в поиске, он раскрывает механизмы NLP для определения значимости сущностей (Entity Score). Эти механизмы, вероятно, используются и в основном поиске, Google Discover и для Knowledge Graph.

  • Оптимизация значимости (Salience Optimization): При создании контента о целевой сущности (бренд, автор, продукт) убедитесь, что она является Primary Subject. Для этого необходимо упоминать сущность в ключевых местах: в заголовке (Title), в первых абзацах и естественно по всему тексту.
  • Повышение эксклюзивности (Минимизация Entity Dilution): Убедитесь, что целевая сущность имеет наибольшее количество упоминаний по сравнению с другими сущностями в документе. Если страница посвящена Сущности А, она не должна упоминать Сущность Б и В с той же частотой и проминентностью.
  • Digital PR и работа с Trusted Sites: Активно работайте над размещением контента на авторитетных площадках, которые Google может классифицировать как Trusted Sites. Согласно патенту, это значительно повышает ценность публикации.
  • Генерация инфоповодов и всплесков трафика: Интегрируйте SEO с PR и дистрибуцией контента для создания резких всплесков пользовательского интереса. Высокий Traffic Spike Score является сильным сигналом важности для Google.

Worst practices (это делать не надо)

  • Размытие фокуса документа: Создание контента, который упоминает множество сущностей без выделения Primary Subject. Это снижает Entity Score для каждой отдельной сущности из-за низкого соотношения упоминаний.
  • Размещение ключевой сущности в конце документа: Если основная сущность упоминается только в конце текста или в неважных блоках (например, в футере), это снижает Entity Score, так как система придает меньший вес таким упоминаниям.
  • Игнорирование качества площадки: Размещение важного контента о сущности на сайтах низкого качества, которые не являются Trusted Sites.
  • Создание однотипного контента в короткий срок: Публикация нескольких очень похожих материалов в один день может привести к тому, что система отфильтрует их из-за механизма темпоральной диверсификации.

Стратегическое значение

Патент подтверждает критическую важность распознавания сущностей (Entity Recognition) и определения их значимости (Entity Salience) в стеке NLP Google. Понимание расчета Entity Score критически важно для Entity SEO. Стратегии должны быть направлены на то, чтобы сделать основную сущность (Primary Subject) документа максимально очевидной для поисковых систем, что улучшает ассоциацию контента с этой сущностью в Knowledge Graph и повышает видимость в релевантных системах.

Практические примеры

Сценарий: Оптимизация пресс-релиза о запуске нового продукта (например, "Pixel 9") для максимизации Entity Score.

Задача: Обеспечить, чтобы система Google определила "Pixel 9" как Primary Subject и присвоила максимально высокий Entity Score.

  1. Действие (Проминентность - Title): Включить точное название "Pixel 9" в заголовок (например, "Google представляет Pixel 9: новые функции и дата выхода").
  2. Обоснование (Патент): Упоминание в заголовке является отдельным критерием включения (Claim 5) и имеет больший вес (Claim 2).
  3. Действие (Проминентность - Текст): В первом абзаце четко описать продукт и упомянуть "Pixel 9".
  4. Обоснование (Патент): Расположение упоминаний влияет на вес (Claim 2).
  5. Действие (Эксклюзивность): Убедиться, что в тексте релиза "Pixel 9" упоминается значительно чаще, чем другие сущности (например, имена спикеров или старые модели).
  6. Обоснование (Патент): Entity Score зависит от соотношения упоминаний разных сущностей (Claim 3).
  7. Действие (Авторитетность): Опубликовать релиз на официальном блоге или авторитетном новостном ресурсе (потенциальный Trusted Site).
  8. Обоснование (Патент): Комбинация Trusted Site и Primary Subject является критерием включения (Claim 4).

Вопросы и ответы

Что такое Entity Score и чем он отличается от стандартной оценки релевантности (IR Score)?

Entity Score — это специфическая метрика, измеряющая, насколько важна конкретная сущность для документа (Entity Salience). Она учитывает частоту, расположение (проминентность) и эксклюзивность (соотношение с другими сущностями). В отличие от нее, Information Retrieval (IR) Score — это стандартная оценка того, насколько документ релевантен запросу (например, имени сущности), часто основанная на совпадении терминов. Документ может иметь высокий IR Score, но низкий Entity Score, если сущность упоминается вскользь.

Как повысить Entity Score для моего бренда на странице?

Для повышения Entity Score необходимо сфокусироваться на трех аспектах. Упомяните название бренда в заголовке (Title и H1) и в первых абзацах текста (проминентность). Естественно используйте название бренда в контексте (частота). Убедитесь, что ваш бренд упоминается значительно чаще, чем любые другие сущности на этой странице (эксклюзивность).

Учитывает ли Google расположение упоминаний сущности на странице?

Да, абсолютно. Патент явно указывает (Claim 2), что местоположение ссылок на сущность используется при определении Entity Score. Упоминания в заголовках и в начале документа обычно имеют больший вес, чем упоминания в конце текста или в сносках.

Что произойдет, если на странице упоминается много разных сущностей?

Это затрудняет определение основного субъекта (Primary Subject) страницы. Патент учитывает это (Claim 3): Entity Score рассчитывается с учетом упоминаний других сущностей. Если вы упоминаете 10 сущностей с одинаковой частотой, Entity Score для каждой из них будет низким из-за плохого соотношения (эксклюзивности).

Что такое Traffic Spike Score и как он влияет на видимость контента?

Traffic Spike Score измеряет резкие всплески пользовательского интереса (трафика) к документу за короткий период, указывая на трендовость или виральность. Патент показывает, что Google использует это как сильный сигнал актуальности. Документ может быть продвинут системой, даже если его Entity Score низок, при условии высокого Traffic Spike Score.

Используется ли этот патент в Google Поиске или Google Discover?

Конкретная реализация (предложение контента в социальной сети), скорее всего, нет. Однако базовые технологии — расчет Entity Score (значимости сущности) и анализ Traffic Spike Score (популярности) — являются стандартными методами NLP, которые Google применяет повсеместно, особенно в системах рекомендаций контента, таких как Google Discover.

Что в патенте подразумевается под Trusted Site?

Trusted Site — это веб-сайт, классифицированный системой как надежный источник на основе качества размещаемых им документов (упоминаются оригинальность, форматирование, ссылочный профиль). Патент указывает, что размещение на таком сайте является самостоятельным критерием для отбора контента (при условии, что сущность является Primary Subject). Это соответствует концепциям E-E-A-T.

Может ли упоминание сущности в заголовке компенсировать низкую частоту упоминаний в тексте?

Да, в значительной степени. Патент выделяет упоминание в заголовке как отдельный критерий для включения документа (Claim 5), а также как фактор, повышающий вес при расчете Entity Score (Claim 2). Наличие сущности в заголовке — один из самых сильных сигналов значимости.

Как система обеспечивает разнообразие предлагаемого контента?

Патент описывает механизм диверсификации по времени (Claim 7). Если система находит несколько документов, удовлетворяющих критериям отбора (например, высокому Entity Score), но имеющих одинаковую дату публикации (Document Date), она может выбрать только один из них. Это увеличивает вероятность того, что предложенные документы будут касаться разных событий.

Как система отличает одного человека от другого с таким же именем?

Патент исходит из того, что работает с уникальными сущностями (uniquely identified person), связанными с Knowledge Graph. Система использует контекст документа (например, профессию, связанные события или других людей), чтобы устранить неоднозначность (disambiguate) и привязать упоминание к конкретному уникальному субъекту, прежде чем рассчитывать Entity Score.

Похожие патенты

Как Google связывает запросы с сущностями для формирования выдачи, подсказок и определения доминирующего интента
Google использует систему для определения того, какие сущности (люди, места, объекты) подразумеваются в поисковом запросе. Система анализирует, насколько релевантны топовые документы запросу и насколько центральное место в этих документах занимает конкретная сущность. На основе этого рассчитывается оценка Entity Score, которая определяет ранжирование сущностей для запроса. Этот механизм используется для показа блоков знаний, организации поисковой выдачи и предоставления уточняющих поисковых подсказок.
  • US20160224621A1
  • 2016-08-04
  • Семантика и интент

  • Knowledge Graph

  • SERP

Как Google использует Граф Сущностей для определения главных тем страницы и генерации релевантных рекомендаций контента
Патент Google описывает систему анализа веб-страницы для выявления ее главных тем («Центральных Сущностей») с помощью глобального Графа Сущностей, основанного на совместной встречаемости терминов. Система отфильтровывает периферийные и неоднозначные темы, генерирует на основе главных тем поисковые запросы и предлагает пользователю категоризированный дополнительный контент (новости, видео, товары).
  • US20160026727A1
  • 2016-01-28
  • Семантика и интент

  • Knowledge Graph

  • Мультимедиа

Как Google определяет и ранжирует наиболее важные факты о сущности на основе совместных упоминаний в интернете
Google использует механизм для определения наиболее важных свойств (фактов) о сущности в контексте ее типа. Система анализирует частоту совместного упоминания (co-occurrence) сущности и связанных с ней сущностей в интернете (Related Entity Score), агрегирует эти данные для каждого свойства (Property Score) и сортирует свойства по важности. Это определяет, какие факты будут показаны первыми в результатах поиска, например, в Панели знаний.
  • US9256682B1
  • 2016-02-09
  • Knowledge Graph

  • Семантика и интент

Как Google выбирает главное изображение для сущности, анализируя тематичность веб-страниц и визуальные характеристики картинки
Google использует многоэтапный процесс для выбора наиболее репрезентативного (evocative) изображения для сущности (например, для Knowledge Panel). Система оценивает, насколько тематически связаны с сущностью как само изображение, так и веб-страницы, на которых оно размещено. Изображения с нерелевантных страниц отфильтровываются. Финальный выбор делается на основе визуальных характеристик, таких как распознавание лиц, логотипов или флагов.
  • US9110943B2
  • 2015-08-18
  • Knowledge Graph

  • Мультимедиа

  • Семантика и интент

Как Google ранжирует сущности (книги, фильмы, людей), анализируя тематичность и авторитетность их упоминаний в вебе
Google использует механизм для оценки значимости конкретных сущностей (например, изданий книг или фильмов). Система анализирует, как эти сущности упоминаются на релевантных веб-страницах, учитывая уверенность распознавания (Confidence) и то, насколько страница посвящена именно этой сущности (Topicality). Эти сигналы агрегируются с учетом авторитетности и релевантности страниц для расчета итоговой оценки сущности, которая затем корректирует ее ранжирование в поиске.
  • US20150161127A1
  • 2015-06-11
  • Семантика и интент

  • EEAT и качество

  • SERP

Популярные патенты

Как Google использует контекст пользователя в реальном времени и машинное обучение для переранжирования результатов поиска
Google использует систему для прогнозирования истинного намерения пользователя на основе его текущего контекста (местоположение, время, среда, недавние действия) и исторических данных о поведении других пользователей в аналогичных ситуациях. Система переранжирует стандартные результаты поиска, чтобы выделить информацию (особенно "Search Features"), которая наиболее соответствует прогнозируемому намерению.
  • US10909124B2
  • 2021-02-02
  • Семантика и интент

  • Персонализация

  • SERP

Как Google определяет ключевые аспекты (фасеты) сущности для организации и диверсификации поисковой выдачи
Google использует систему для автоматической идентификации различных «аспектов» (подтем или фасетов) сущности в запросе. Анализируя логи запросов и базы знаний, система определяет, как пользователи исследуют информацию. Затем эти аспекты ранжируются по популярности и разнообразию и используются для организации результатов поиска в структурированном виде (mashup), облегчая пользователю навигацию и исследование темы.
  • US8458171B2
  • 2013-06-04
  • Семантика и интент

  • SERP

  • Поведенческие сигналы

Как Google использует персональное дерево интересов пользователя для определения важности слов в запросе и его переписывания
Google использует иерархический профиль интересов пользователя (Profile Tree), построенный на основе истории поиска и поведения, чтобы определить, какие слова в запросе наиболее важны для конкретного человека. Специфичные интересы (глубокие узлы в дереве) получают больший вес. Это позволяет системе отфильтровать шум в длинных запросах и сгенерировать более точный альтернативный запрос.
  • US8326861B1
  • 2012-12-04
  • Персонализация

  • Семантика и интент

  • Поведенческие сигналы

Как Google (YouTube) анализирует трафик конкурирующих видео для рекомендации улучшений метаданных
Google использует систему для анализа конкуренции между видео на основе общих поисковых запросов и времени просмотра. Система выявляет поисковые запросы, которые приводят трафик на конкурирующие (например, производные) видео, и сравнивает их с метаданными оригинального видео. Если обнаруживаются релевантные термины, отсутствующие у оригинала, они рекомендуются автору для улучшения видимости.
  • US10318581B2
  • 2019-06-11
  • Поведенческие сигналы

  • Мультимедиа

  • Семантика и интент

Как Google использует паттерны просмотра пользователей (Co-Visitation) и временную близость для определения тематики нетекстового контента (изображений и видео)
Google использует механизм для понимания контента без текста (изображения, видео), анализируя, какие другие (текстовые) страницы пользователи посещают в рамках той же сессии. Ключевые слова с этих текстовых страниц заимствуются и присваиваются нетекстовому ресурсу. Критически важным фактором является время перехода: чем быстрее пользователь перешел между ресурсами, тем больший вес получают ключевые слова.
  • US8572096B1
  • 2013-10-29
  • Поведенческие сигналы

  • Семантика и интент

  • Мультимедиа

Как Google использует анализ параллельных анкорных текстов и кликов пользователей для перевода запросов и кросс-язычного поиска
Google использует механизм для автоматического перевода запросов с одного языка или набора символов на другой. Система создает вероятностный словарь, анализируя, как анкорные тексты на разных языках ссылаются на одни и те же страницы (параллельные анкоры). Вероятности перевода затем уточняются на основе того, на какие результаты кликают пользователи. Это позволяет осуществлять кросс-язычный поиск (CLIR).
  • US8706747B2
  • 2014-04-22
  • Мультиязычность

  • Семантика и интент

  • Ссылки

Как Google обрабатывает клики по ссылкам на мобильные приложения (App Deep Links) в результатах поиска
Google использует механизм клиентской обработки результатов поиска, ведущих в нативные приложения. Если у пользователя не установлено нужное приложение, система на устройстве автоматически подменяет ссылку приложения (App Deep Link) на эквивалентный веб-URL. Это гарантирует доступ к контенту через браузер и обеспечивает бесшовный пользовательский опыт.
  • US10210263B1
  • 2019-02-19
  • Ссылки

  • SERP

Как Google использует внутренние ссылки и структуру DOM для генерации шаблонов сайта и извлечения структурированных сниппетов
Google анализирует повторяющиеся блоки внутренних ссылок (например, списки товаров). Если текст возле ссылки на исходной странице совпадает с текстом на целевой странице, Google определяет DOM-структуру этого текста и создает шаблон домена. Этот шаблон позволяет автоматически извлекать ключевую информацию (например, цену и характеристики) для сниппетов со всех однотипных страниц сайта, даже без микроразметки.
  • US9971746B2
  • 2018-05-15
  • Структура сайта

  • SERP

  • Ссылки

Как Google использует «Фразовую модель» (Phrase Model) для прогнозирования качества сайта на основе статистики использования N-грамм
Google прогнозирует оценку качества сайта, анализируя, какие фразы (N-граммы) используются и как часто они распределены по страницам сайта. Система создает «Фразовую модель», изучая известные высококачественные и низкокачественные сайты, а затем применяет эту модель для оценки новых сайтов по их лингвистическим паттернам.
  • US9767157B2
  • 2017-09-19
  • Семантика и интент

  • Техническое SEO

  • EEAT и качество

Как Google использует данные о кликах пользователей (CTR и Click Ratio) для определения официального сайта по навигационным запросам
Google анализирует журналы запросов, чтобы определить, какой результат пользователи подавляюще предпочитают по конкретному запросу. Если результат демонстрирует исключительно высокий CTR и/или Click Ratio по популярному запросу, система помечает его как «авторитетную страницу». Затем этот результат может отображаться на выдаче с особым выделением, потенциально переопределяя стандартное ранжирование.
  • US8788477B1
  • 2014-07-22
  • Поведенческие сигналы

  • EEAT и качество

  • SERP

seohardcore