SEO HARDCORE
  • Разборы патентов
    • Патенты Google
  • Скоро SEO инструменты
  • Скоро SEO аналитика
  • seohardcore
SEO HARDCORE
назад

Как Google динамически повышает детский контент в безопасном поиске, чтобы компенсировать недостаток данных о популярности

SELECTIVELY MODIFYING SCORES OF YOUTH-ORIENTED CONTENT SEARCH RESULTS (Выборочное изменение оценок результатов поиска контента, ориентированного на молодежь)
  • US10671616B1
  • Google LLC
  • 2015-02-22
  • 2020-06-02
  • Безопасный поиск
  • SERP
  • Поведенческие сигналы
  • Описание
  • Разбор
  • Выводы
  • Практика
  • FAQ
  • Похожие

Google использует механизм для улучшения видимости детского контента (Youth-Oriented, Y) в безопасной выдаче. Поскольку такой контент часто имеет меньше поведенческих данных, чем общий контент (General Audience, G), система вычисляет динамический повышающий коэффициент (Query-Dependent Factor). Этот коэффициент рассчитывается путем статистического сравнения метрик популярности Y и G контента для конкретного запроса и применяется только к результатам, прошедшим порог релевантности.

Описание

Какую проблему решает

Патент решает проблему недостаточной представленности (underrepresentation) контента, специально ориентированного на детей (Youth-oriented content, метка "Y"), в результатах безопасного поиска. Стандартные алгоритмы часто отдают предпочтение контенту для широкой аудитории (General audience content, метка "G"), так как он обычно аккумулирует больший объем поведенческих данных (logged past behavior или logging data). В результате специализированный детский контент теряется в выдаче, делая её менее интересной для целевой аудитории (упоминается диапазон 2-12 лет).

Что запатентовано

Запатентована система для выборочного и динамического повышения оценок ранжирования (Scores) контента, помеченного как "Y", в рамках пула безопасного контента (Y и G). Ключевым элементом является расчет Query-Dependent Factor — коэффициента, который вычисляется для конкретного запроса. Этот коэффициент предназначен для компенсации статистической недооцененности детского контента из-за разницы в доступных сигналах вовлеченности.

Как это работает

Система работает в среде ограниченного поиска (например, Safe Search или YouTube Kids):

  • Ограничение выборки: Поиск возвращает результаты, ограниченные безопасными категориями (Y и G).
  • Фильтрация: Контент Y фильтруется по порогу релевантности (Relevance Threshold), чтобы исключить повышение нерелевантного контента.
  • Расчет Динамического Буста: Система анализирует показатели вовлеченности (Logging Factor) для обеих групп (Y и G). Вычисляется Query-Dependent Factor, основанный на соотношении этих показателей (например, отношение медиан), чтобы определить степень недооцененности группы Y.
  • Применение Повышения: Оценки ранжирования отобранных результатов Y модифицируются (например, умножаются) на этот фактор.
  • Переранжирование: Модифицированные результаты Y объединяются с результатами G и сортируются заново.

Актуальность для SEO

Высокая для специализированных продуктов. Учитывая рост платформ для детей (например, YouTube Kids) и регулирование детского контента, способность Google обеспечивать релевантный и вовлекающий поиск в безопасной среде критически важна. Описанный механизм динамической компенсации оценок актуален для управления балансом контента в таких системах и демонстрирует подход к работе с нишами, испытывающими дефицит поведенческих данных (Data Sparsity).

Важность для SEO

Влияние на SEO (6.5/10) сильно зависит от ниши. Патент не влияет на общий поиск Google для взрослой аудитории. Однако он имеет критическое значение для создателей детского контента и платформ, использующих безопасный поиск. Он демонстрирует, что в этих средах контент, явно идентифицированный как детский (Y), получает расчетное повышение для конкуренции с общим контентом (G), при условии соответствия порогу релевантности.

Детальный разбор

Термины и определения

Boost factor (k) (Повышающий коэффициент)
Значение (постоянное или переменное), используемое для модификации Score результата поиска. Может быть аддитивным или мультипликативным.
Content Label (Метка контента)
Классификатор, указывающий на пригодность контента для определенной аудитории (например, Y, G, PG, TEEN).
General audience content label (G) (Контент для широкой аудитории)
Метка, указывающая на контент, безопасный для всех возрастов, но не ориентированный специально на детей.
Logging factor (S_L) (Фактор логирования)
Метрика, предназначенная для изоляции влияния поведенческих данных на оценку. В патенте предлагается рассчитывать его как Score(R) / Trust(R) (Eq. 4).
Query-dependent factor (k_p) (Фактор, зависящий от запроса)
Динамический Boost factor, рассчитываемый для конкретного запроса. Основан на статистическом сравнении Logging factors между разными типами контента (Y и G) в текущей выдаче (Eq. 5).
Relevance threshold (T) (Порог релевантности)
Минимальное значение Relevance value, необходимое для того, чтобы к результату мог быть применен бустинг. Используется для предотвращения повышения нерелевантного контента.
Relevance value (Значение релевантности)
Метрика, оценивающая релевантность результата запросу. Может включать Trust value (вероятность релевантности) и Volume value (объем доказательств релевантности).
Score (Оценка ранжирования)
Исходная оценка результата, сгенерированная поисковой системой.
Youth Intent Probability (Y(q)) (Вероятность молодежного интента)
Вероятность того, что запрос имеет молодежный интент. Может использоваться для дополнительной модуляции коэффициента повышения (Eq. 6).
Youth-oriented content label (Y) (Контент, ориентированный на молодежь)
Метка, указывающая на контент, специально созданный и предназначенный для детей.

Ключевые утверждения (Анализ Claims)

Claim 1 (Независимый пункт): Описывает основной метод выборочной модификации оценок с использованием динамического фактора, основанного на статистическом сравнении.

  1. Система идентифицирует множество результатов поиска. Каждый имеет Score и Content Label. Как минимум один результат помечен как Youth-Oriented Content (первая метка).
  2. Система выбирает два подмножества результатов:
    • Первое (например, Y): результаты с первой меткой, у которых Relevance Value соответствует первому Relevance Threshold.
    • Второе (например, G): результаты со второй меткой, у которых Relevance Value соответствует второму Relevance Threshold.
  3. Система выбирает оценки (Scores), связанные с первым подмножеством.
  4. Вычисляется Первый Фактор на основе оценок и значений релевантности из первого подмножества (соответствует Logging Factor для Y).
  5. Вычисляется Второй Фактор на основе оценок и значений релевантности из второго подмножества (соответствует Logging Factor для G).
  6. Вычисляется Query-Dependent Factor на основе Первого и Второго Факторов. Он является функцией статистической взаимосвязи (statistical relationship), выведенной из оценок первого и второго подмножеств (например, соотношение медианных Logging Factors).
  7. Оценки из первого подмножества (Y) модифицируются с использованием Query-Dependent Factor.

Ядро изобретения заключается в использовании сравнения статистических свойств двух разных типов контента (Y и G) для динамического расчета компенсаторного повышения для одного из них (Y) для данного конкретного запроса, при этом используя пороги релевантности как обязательное условие.

Claim 3 (Зависимый от 1): Уточняет, что модификация оценок в первом подмножестве происходит равномерно (uniformly) с использованием Query-Dependent Factor.

Где и как применяется

Изобретение применяется в системах поиска, где необходимо обеспечить безопасность контента и одновременно повысить его привлекательность для детской аудитории.

INDEXING – Индексирование и извлечение признаков
На этом этапе контенту должны быть присвоены Content Labels (Y, G), а также рассчитаны базовые показатели релевантности (Relevance Values, включая Trust Value).

RANKING – Ранжирование
Поисковая система генерирует первоначальный набор результатов с исходными Scores, ограниченный безопасными метками (Y и G). Также рассчитываются или извлекаются данные для Logging factors (S_L).

RERANKING – Переранжирование
Основной этап применения патента. Система анализирует результаты этапа RANKING:

  1. Фильтрация и Сегментация: Результаты делятся на группы (Y и G) и фильтруются по порогу релевантности (T).
  2. Вычисление Компенсации: Анализируется распределение Logging factors (S_L) в обеих группах. Вычисляется Query-Dependent Factor (k_p).
  3. Модификация Оценок: К оценкам группы Y применяется рассчитанный фактор.
  4. Финальная Сортировка: Происходит пересортировка объединенного набора результатов.

Входные данные:

  • Набор результатов поиска (ограниченный Y/G контентом).
  • Content Labels, исходные Scores и Relevance Values (в частности, Trust Value) для каждого результата.

Выходные данные:

  • Переранжированный список результатов поиска с модифицированными оценками для контента Y.

На что влияет

  • Конкретные типы контента: В патенте упоминаются мультимедийные элементы (видео, аудио, изображения). Наибольшее влияние на платформах типа YouTube Kids или в режиме Safe Search.
  • Специфические запросы: Наибольшее влияние на запросы, по которым существует большое количество G-контента, который обычно вытесняет специализированный Y-контент из-за большего объема поведенческих данных.
  • Конкретные ниши или тематики: Исключительно ниша детского контента (образование, развлечения).

Когда применяется

  • Условия работы алгоритма: Алгоритм работает в среде ограниченного (безопасного) поиска, где выдача фильтруется по меткам контента (только Y и G).
  • Триггеры активации: Повышение активируется для конкретного результата, если выполнены два условия:
    • Результат имеет метку Youth-Oriented Content (Y).
    • Значение релевантности (Relevance Value, например Trust Value) результата соответствует установленному порогу (Relevance Threshold T).
  • Условие расчета: Наличие в выдаче достаточного количества как Y, так и G контента для проведения статистического сравнения.

Пошаговый алгоритм

Процесс переранжирования результатов безопасного поиска:

  1. Инициализация и Ограничение: Получение результатов поиска, ограниченных контентом с метками Y (Youth-Oriented) и G (General Audience).
  2. Предварительные расчеты (Logging Factor): Для каждого результата R в наборах Y и G рассчитывается Logging Factor (S_L) по формуле (Eq. 4): SL(R)=score(R)/trust(R)S_L(R) = score(R)/trust(R)SL​(R)=score(R)/trust(R).
  3. Расчет Динамического Буста (Query-Dependent Factor): Вычисляется коэффициент (k_p) путем сравнения распределений S_L для наборов Y и G (Eq. 5). Например, используется отношение p-х перцентилей (например, медиан, p=50): kp=p

    Выводы

    1. Компенсация недостатка данных (Data Sparsity): Google активно компенсирует недостаток поведенческих сигналов (logging data). Система признает, что детский контент (Y) часто имеет меньше данных о взаимодействии, чем общий (G), и стремится выровнять их ранжирование в безопасной среде.
    2. Динамический и адаптивный бустинг: Ключевой вывод — бустинг не является статическим. Query-Dependent Factor рассчитывается динамически и зависит от того, насколько сильно Y-контент статистически отстает от G-контента по данному конкретному запросу.
    3. Изоляция популярности от релевантности: Используя Logging Factor (Score/Trust), система пытается отделить сигналы популярности от сигналов чистой релевантности. Это позволяет компенсировать именно дефицит популярности.
    4. Критичность меток контента (Content Labels): Правильная классификация контента (как Y) критически важна. Это необходимое условие для активации этих специализированных алгоритмов ранжирования.
    5. Порог релевантности как защита качества: Relevance threshold действует как защитный механизм. Бустинг применяется только к контенту, который уже прошел порог базовой релевантности или доверия (Trust value). Система не продвигает нерелевантный Y-контент.

    Практика

    Best practices (это мы делаем)

    Рекомендации применимы строго для SEO-продвижения детского контента в рамках безопасного поиска или специализированных платформ (например, YouTube Kids).

    • Обеспечение корректной маркировки контента: Необходимо убедиться, что контент правильно классифицирован как Youth-Oriented (Y) (например, указание аудитории "для детей" на YouTube). Это базовое условие для активации описанного механизма бустинга.
    • Фокус на высокой релевантности (Trust Value): Критически важно обеспечить высокую семантическую релевантность контента. Контент должен преодолеть Relevance threshold, иначе бустинг не будет применен, независимо от его метки.
    • Оптимизация метаданных: Используйте явные указания на целевую аудиторию в заголовках и описаниях (например, "для детей", "детский"). Патент упоминает, что наличие таких ключевых слов ("kids", "children") может служить сигналом для применения дополнительного бустинга.
    • Создание специализированного (Y), а не общего (G) контента: Для доминирования в детском поиске стратегически выгоднее создавать контент, который будет классифицирован как Y, так как только он получает компенсационный бустинг, позволяющий обойти G контент.

    Worst practices (это делать не надо)

    • Манипуляция метками контента: Попытки пометить контент для широкой аудитории (G) как детский (Y) с целью получения буста. Это может привести к нарушению правил платформы, пессимизации или удалению контента другими системами модерации.
    • Игнорирование базовой релевантности: Создание низкокачественного контента в надежде на буст не сработает. Если контент не преодолеет Relevance threshold (Trust value), механизм не активируется.
    • Применение стандартных SEO-стратегий: Опора только на метрики популярности, доминирующие в общем поиске, может быть неэффективной в детской среде, так как данный механизм корректирует эти метрики для компенсации недостатка данных.

    Стратегическое значение

    Патент демонстрирует, как Google решает проблему "Data Sparsity" (недостатка данных) для нишевого контента. Ранжирование в безопасном поиске — это отдельная экосистема с собственной логикой балансировки. Google использует сложные статистические методы для выравнивания шансов контента с меньшим количеством сигналов, при условии его качества и правильной классификации. Это важно для понимания ранжирования в любых нишах с дефицитом традиционных сигналов.

    Практические примеры

    Сценарий: Поиск на платформе для детей по запросу "Blue" (Синий)

    1. Исходная выдача (без бустинга): По запросу "Blue" доминируют G-результаты с высокими Scores за счет большого объема поведенческих данных: песня "I'm Blue", статья о настроении ("feeling blue"). Y-результат ("Почему небо голубое - объяснение для детей") находится на 5 позиции.
    2. Анализ системы: Система сравнивает Logging Factors. Она видит, что медианный Logging Factor у G-контента значительно выше, чем у Y-контента для этого запроса.
    3. Расчет k_p: Вычисляется Query-Dependent Factor на основе этого разрыва. Допустим, k_p = 5.
    4. Применение бустинга: Система проверяет Y-результат. Его Trust value выше порога T. Исходный Score Y-результата умножается на 5.
    5. Итоговая выдача: Y-результат ("Почему небо голубое") перемещается на 1 позицию, вытесняя часть G-контента и делая выдачу более релевантной для ребенка.

    Вопросы и ответы

    Что такое Logging Factor (SL) и почему он важен?

    Logging Factor (SL) — это метрика, рассчитываемая как отношение общей оценки ранжирования (Score) к оценке релевантности (Trust): SL = Score / Trust. Она предназначена для изоляции той части рейтинга, которая обусловлена популярностью и поведением пользователей (logging data), от чистой релевантности контента. Это позволяет системе измерить дефицит популярности детского контента по сравнению с общим.

    Как рассчитывается коэффициент повышения (Query-Dependent Factor, k_p)?

    Он рассчитывается динамически для каждого запроса. Система сравнивает статистическое распределение (например, медиану или p-й перцентиль) Logging Factors для общего контента (G) и детского контента (Y). Коэффициент равен отношению этих показателей (например, Median SL{G} / Median SL{Y}). Если общий контент в среднем гораздо популярнее, коэффициент будет высоким.

    Означает ли это, что популярность (просмотры, клики) не важна для детского контента?

    Нет, популярность по-прежнему важна и формирует базовую оценку (Score). Однако этот патент показывает, что Google признает структурный недостаток данных о популярности у детского контента и искусственно компенсирует его. Цель состоит в том, чтобы уравнять шансы детского контента с общим контентом, который имеет доступ к гораздо большей аудитории.

    Получит ли любой детский контент повышение в выдаче?

    Нет. В патенте четко указано обязательное условие: контент должен превышать определенный порог релевантности (Relevance Threshold T). Если система считает контент недостаточно релевантным или низкокачественным (низкий Trust Value), повышение применяться не будет.

    Применяется ли этот алгоритм в обычном поиске Google или только в YouTube Kids?

    Патент описывает механизм для сред, где поиск ограничен безопасным контентом (метки "Y" и "G"). Это наиболее характерно для специализированных детских продуктов, таких как YouTube Kids, Google Kids Space или при использовании строгого Безопасного Поиска (Safe Search). В стандартном поиске Google этот механизм не используется.

    Что такое "Trust Value" в контексте этого патента?

    Trust Value определяется как оценка вероятности того, что результат поиска релевантен запросу. Это ключевой показатель качества и релевантности, который используется и как фильтр для активации бустинга (порог T), и как делитель при расчете Logging Factor.

    Как SEO-специалист может повлиять на Trust value?

    На практике это означает необходимость тщательной проработки семантической релевантности контента, качественной оптимизации метаданных (заголовков, описаний) и создания контента, который точно соответствует интенту запроса детской аудитории. Качество контента является основой для высокого Trust Value.

    Может ли использование слов "для детей" в заголовке помочь ранжированию?

    Да. В патенте явно упоминается, что система может применять дополнительный бустинг к контенту, в метаданных которого присутствуют ключевые слова, ориентированные на молодежь (например, "kids", "children"). Это может служить дополнительным сигналом для повышения релевантности и правильной классификации в данной нише.

    Может ли система повысить один детский контент сильнее, чем другой?

    В основном варианте реализации (Claim 3) вычисленный коэффициент kpk_pkp​ применяется равномерно (uniformly) ко всему отобранному детскому контенту ("Y"). Однако в описании упоминаются и варианты с нелинейным применением, например, меньший бустинг для контента "Y", у которого уже высокий SL (предполагая, что он получает трафик от широкой аудитории).

    Если мой детский контент уже популярнее, чем общий контент по данному запросу, что произойдет?

    В этом случае Logging Factor для вашего контента (SL{Y}) будет выше или равен SL{G}. Рассчитанный коэффициент повышения kpk_pkp​ будет близок к 1 или меньше. Система не будет применять значительного повышения, так как компенсация недостатка данных не требуется.

    Похожие патенты

    Как Google рассчитывает «Рейтинг безопасности» запроса для фильтрации или блокировки выдачи (SafeSearch)
    Google анализирует рейтинги контента (например, «для всех возрастов» или «для взрослых») топовых результатов по запросу, чтобы вычислить его «Safety Score». Если выдача содержит слишком много неприемлемого контента, система может полностью заблокировать запрос или агрессивно отфильтровать результаты, показывая только гарантированно безопасный и релевантный контент.
    • US11829373B2
    • 2023-11-28
    • Безопасный поиск

    • SERP

    Как Google классифицирует интент запросов (например, поиск порнографии), анализируя историю использования фильтров (SafeSearch)
    Google использует данные о том, как часто пользователи включают или отключают фильтры контента (например, SafeSearch) при вводе конкретного запроса. Анализируя нормализованное соотношение фильтрованных и нефильтрованных поисковых операций, система классифицирует запрос как целенаправленно ищущий определенный тип контента (например, adult). Эта классификация затем используется для повышения или понижения релевантности соответствующего контента в выдаче.
    • US9152701B2
    • 2015-10-06
    • Семантика и интент

    • Безопасный поиск

    • Поведенческие сигналы

    Как Google динамически повышает порог качества для результатов поиска по «рискованным» запросам
    Google оценивает «риск» поискового запроса, анализируя общее качество топовых результатов. Если запрос часто привлекает спам, кликбейт или нежелательный контент (особенно видео), система динамически повышает минимальный порог качества. Контент, не соответствующий этому повышенному стандарту, понижается в выдаче, при этом учитываются такие сигналы, как показатель просмотров (Watch Rate).
    • US11609949B2
    • 2023-03-21
    • Антиспам

    • SERP

    • Поведенческие сигналы

    Как Google использует классификаторы запросов и контента для фильтрации и понижения оскорбительных результатов, связанных с защищенными группами
    Google применяет систему двойной классификации для защиты пользователей от неуместного или оскорбительного контента. Система оценивает, относится ли запрос к «защищенной группе людей» и содержит ли он деликатные термины. Параллельно анализируется, содержат ли результаты поиска оскорбительный контент. На основе комбинации этих классификаций и анализа сессии пользователя результаты могут быть отфильтрованы или понижены в ранжировании.
    • US10083237B2
    • 2018-09-25
    • Безопасный поиск

    • Семантика и интент

    • SERP

    Как Google динамически переоценивает значимость факторов ранжирования, основываясь на их надежности в контексте конкретной выдачи
    Google использует механизм для повышения качества ранжирования путем анализа надежности (Trustworthiness) различных факторов, влияющих на позицию документа. Если система обнаруживает значительную разницу в надежности сигналов среди результатов поиска, она снижает влияние менее достоверных факторов. Это гарантирует, что документы, получившие высокие оценки за счет ненадежных или легко манипулируемых сигналов, не будут ранжироваться выше документов с более достоверными показателями качества и релевантности.
    • US9623119B1
    • 2017-04-18
    • EEAT и качество

    • Поведенческие сигналы

    • SERP

    Популярные патенты

    Как Google использует паттерны просмотра пользователей (Co-Visitation) и временную близость для определения тематики нетекстового контента (изображений и видео)
    Google использует механизм для понимания контента без текста (изображения, видео), анализируя, какие другие (текстовые) страницы пользователи посещают в рамках той же сессии. Ключевые слова с этих текстовых страниц заимствуются и присваиваются нетекстовому ресурсу. Критически важным фактором является время перехода: чем быстрее пользователь перешел между ресурсами, тем больший вес получают ключевые слова.
    • US8572096B1
    • 2013-10-29
    • Поведенческие сигналы

    • Семантика и интент

    • Мультимедиа

    Как Google идентифицирует, оценивает и ранжирует «Глубокие статьи» (In-Depth Articles) и «Вечнозеленый контент»
    Google использует систему для идентификации и ранжирования высококачественного лонгрид-контента (In-Depth Articles). Система определяет авторитетные сайты на основе внешних наград и ссылочных паттернов. Контент оценивается по критериям «вечнозелености» (Evergreen Score), структуры (Article Score), отсутствия коммерческого интента и авторитетности автора (Author Score). Ранжирование основано на комбинации качества (IDA Score) и релевантности запросу (Topicality Score).
    • US9996624B2
    • 2018-06-12
    • EEAT и качество

    • Индексация

    • Семантика и интент

    Как Google использует время просмотра (Watch Time) и поведение пользователей для расчета независимой от запроса оценки качества видео
    Google рассчитывает независимый от запроса сигнал качества (Q) для видео, анализируя корреляции между поведенческими метриками: временем просмотра, рейтингами и количеством просмотров. Система использует математические функции (Predictor и Voting) для моделирования качества и определения достоверности данных, а также активно фильтрует спам в рейтингах. Этот сигнал Q затем используется для ранжирования видео в поиске.
    • US8903812B1
    • 2014-12-02
    • Поведенческие сигналы

    • SERP

    • Антиспам

    Как Google динамически переоценивает значимость факторов ранжирования, основываясь на их надежности в контексте конкретной выдачи
    Google использует механизм для повышения качества ранжирования путем анализа надежности (Trustworthiness) различных факторов, влияющих на позицию документа. Если система обнаруживает значительную разницу в надежности сигналов среди результатов поиска, она снижает влияние менее достоверных факторов. Это гарантирует, что документы, получившие высокие оценки за счет ненадежных или легко манипулируемых сигналов, не будут ранжироваться выше документов с более достоверными показателями качества и релевантности.
    • US9623119B1
    • 2017-04-18
    • EEAT и качество

    • Поведенческие сигналы

    • SERP

    Как Google определяет язык поискового запроса, используя язык интерфейса, статистику слов и поведение пользователей
    Google использует вероятностную модель для точной идентификации языка поискового запроса. Система комбинирует три ключевых фактора: статистику частотности слов в разных языках, язык интерфейса пользователя (например, Google.fr) и исторические данные о том, на какие результаты пользователи кликали ранее. Это позволяет корректно обрабатывать многоязычные и неоднозначные запросы для применения правильных синонимов и стемминга.
    • US8442965B2
    • 2013-05-14
    • Мультиязычность

    • Поведенческие сигналы

    Как Google снижает влияние ссылок с аффилированных сайтов и PBN для борьбы с манипуляциями в ранжировании
    Патент Google описывает систему ранжирования, которая идентифицирует группы сайтов под общим контролем (аффилированные узлы или PBN). Система резко снижает вес ссылок внутри такой группы и ограничивает общее влияние группы на другие сайты, учитывая только одну, самую сильную ссылку от всей группы. Также описывается механизм "Доверенных авторитетов", чьи ссылки передают максимальный вес независимо от количества исходящих ссылок.
    • US8719276B1
    • 2014-05-06
    • Антиспам

    • Ссылки

    • Техническое SEO

    Как Google использует свой индекс для автоматического обновления устаревших ссылок в закладках, истории поиска и на веб-страницах
    Система Google поддерживает актуальность различных коллекций URL (закладки пользователей, история поиска, электронные письма), используя основной поисковый индекс как эталон канонических адресов. Если сохраненный URL устарел, система автоматически заменяет его на актуальную версию. Также описан механизм уведомления владельцев сайтов о неработающих исходящих ссылках.
    • US20130144836A1
    • 2013-06-06
    • Ссылки

    • Индексация

    • Техническое SEO

    Как Google использует контент вокруг ссылок (вне анкора) для генерации «Синтетического Описательного Текста» и ранжирования вашего сайта
    Google может генерировать «Синтетический Описательный Текст» для страницы, анализируя контент и структуру сайтов, которые на нее ссылаются. Система создает структурные шаблоны для извлечения релевантного текста (например, заголовков или абзацев рядом со ссылкой), который затем используется как мощный сигнал ранжирования. Этот механизм позволяет лучше понять содержание страницы, особенно если традиционный анкорный текст низкого качества или отсутствует.
    • US9208233B1
    • 2015-12-08
    • Ссылки

    • Семантика и интент

    • Индексация

    Как Google использует историю чтения новостных сайтов для определения географических интересов пользователя и персонализации выдачи
    Google может определять географические интересы пользователя, анализируя местоположение издателей новостных сайтов, которые он посещал. Эта информация (Geo Signal) используется для корректировки ранжирования будущих поисковых запросов, повышая результаты, релевантные этим интересам, даже если пользователь физически находится в другом месте.
    • US20130246381A1
    • 2013-09-19
    • Персонализация

    • Поведенческие сигналы

    • SERP

    Как Google автоматически распознает сущности в тексте и связывает их в Knowledge Graph с помощью динамических поисковых ссылок
    Google использует автоматизированную систему для поддержания связей между сущностями (объектами) в своем хранилище фактов (Knowledge Graph). Система сканирует текст, статистически определяет значимые фразы и сверяет их со списком известных объектов. При совпадении создается динамическая «поисковая ссылка» вместо фиксированного URL. Это позволяет Google постоянно обновлять связи по мере добавления новых знаний.
    • US8260785B2
    • 2012-09-04
    • Knowledge Graph

    • Семантика и интент

    • Ссылки

    seohardcore