SEO HARDCORE
  • Разборы патентов
    • Патенты Google
  • Скоро SEO инструменты
  • Скоро SEO аналитика
  • seohardcore
SEO HARDCORE
назад

Как Google использует стабильность сигналов авторства для идентификации и исключения неавторского контента из специализированного индекса

FRAMEWORK FOR REMOVING NON-AUTHORED CONTENT DOCUMENTS FROM AN AUTHORED-CONTENT DATABASE (Фреймворк для удаления документов без авторского контента из базы данных авторского контента)
  • US20150127624A1
  • Google LLC
  • 2013-11-01
  • 2015-05-07
  • EEAT и качество
  • Индексация
  • Антиспам
  • Описание
  • Разбор
  • Выводы
  • Практика
  • FAQ
  • Похожие

Google отслеживает историю изменений данных об авторстве (имя автора, ссылки на профили) на веб-странице. Если авторство меняется слишком часто, система определяет, что это не статья одного автора (например, главная страница сайта или агрегатор), и исключает её из специализированной базы данных авторского контента. Это подчеркивает важность стабильных сигналов для E-E-A-T.

Описание

Какую проблему решает

Патент решает проблему поддержания чистоты специализированной базы данных авторского контента (Authored-Content Database). Системы идентификации авторства могут ошибочно принимать неавторский контент за авторский. Это происходит, когда документы (называемые resemblance documents) имеют сигналы, похожие на авторский контент (например, байлайны, ссылки на профили), но на самом деле являются агрегаторами, главными страницами новостных сайтов, комментариями или блоками "связанные статьи". Изобретение улучшает точность идентификации истинного авторского контента.

Что запатентовано

Запатентован метод для выявления и удаления документов, ошибочно классифицированных как авторский контент, путем анализа временной стабильности сигналов авторства. Система отслеживает историю данных об авторстве (sequence of authorship data) для каждого документа. Если эти данные (например, имя автора или ссылка на его профиль) меняются чаще установленного порога (set threshold), система классифицирует документ как нестабильный и удаляет его из базы данных авторского контента.

Как это работает

Механизм основан на предположении, что настоящий авторский контент (статья) редко меняет автора, в то время как страницы-агрегаторы часто меняют отображаемый контент и, следовательно, предполагаемых авторов.

  • Сбор данных: Система индексирует потенциальный авторский контент в Authored-Content Database, сохраняя Authorship Data (имена, ссылки на профили).
  • Мониторинг истории: Документы периодически пересканируются, формируя историю изменений (Authorship History).
  • Анализ стабильности: Система анализирует историю, чтобы определить частоту значимых изменений в данных об авторстве.
  • Применение порога: Если количество изменений превышает set threshold (например, три изменения за определенный период), документ помечается как неавторский контент.
  • Действие: Документ удаляется или заносится в черный список (blacklisted) в базе данных авторского контента.

Актуальность для SEO

Низкая (для конкретной реализации) / Средняя (для концепции). Патент подан в 2013 году и напрямую связан с программой Google Authorship (использование rel="author" и привязка к социальным профилям), которая была закрыта в 2014 году. Описанная инфраструктура в том виде, скорее всего, не используется. Однако, концепция использования временной стабильности данных для валидации сигналов и классификации типа контента остается актуальной, особенно в контексте E-E-A-T и идентификации сущностей.

Важность для SEO

Влияние на современные SEO-стратегии минимальное (3/10). Прямое тактическое применение низкое, так как описанная система Google Authorship не существует. Патент представляет скорее стратегический интерес, демонстрируя, как Google использует исторические данные и стабильность контента/метаданных для валидации сигналов. Это подчеркивает важность консистентности и стабильности информации об авторах (E-E-A-T) на сайте с течением времени.

Детальный разбор

Термины и определения

Authored-Content Database (База данных авторского контента)
Специализированная база данных или индекс, в котором хранятся документы, идентифицированные как содержащие авторский контент (например, статьи, посты в блогах).
Authored-Content Document (Документ с авторским контентом)
Документ, который содержит контент, авторство которого заявлено автором (например, через байлайн, rel="author" или связь с социальным профилем).
Authorship Data (Данные об авторстве)
Информация, извлеченная из документа, идентифицирующая автора. Включает имя автора (author name), ссылки на социальные профили (link URL), идентификатор профиля (profile ID) и информацию о том, как эти данные представлены.
Authorship History / Sequence of Authorship Data (История авторства / Последовательность данных об авторстве)
Хронологическая запись изменений данных об авторстве для конкретного документа с течением времени.
Authorship Identification Engine (Система идентификации авторства)
Компонент системы, который анализирует документы для выявления признаков авторского контента и определения авторов.
Non-Authored-Content Document / Resemblance Document (Документ с неавторским контентом / Похожий документ)
Документ, который не содержит основного авторского контента, но имеет сигналы, схожие с ним (например, главная страница сайта, страница категории, раздел комментариев).
Qualifying Authorship-Data Change (Квалифицирующее изменение данных об авторстве)
Значимое изменение в наборе данных об авторстве между двумя временными точками, при котором меняется имя автора, идентификатор профиля или ссылка на страницу профиля автора.
Set Threshold (Установленный порог)
Максимально допустимое количество квалифицирующих изменений данных об авторстве за определенный период времени. Превышение порога приводит к удалению документа из базы.

Ключевые утверждения (Анализ Claims)

Claim 1 (Независимый пункт): Описывает основной метод поддержания базы данных авторского контента.

  1. Система записывает последовательность данных об авторстве (sequence of authorship data) для документа, проиндексированного в authored-content database, в течение определенного периода времени.
  2. Система анализирует эту последовательность, чтобы определить, изменился ли документ сверх установленного порога (set threshold).
  3. Если изменения превышают порог, система удаляет документ из authored-content database.

Claim 2 и 3 (Зависимые): Уточняют процесс анализа.

  1. Система сравнивает первый набор данных из последовательности со вторым набором данных.
  2. Система количественно оценивает изменения данных (quantifying data changes) между этими двумя наборами.
  3. Эти количественные изменения применяются к установленному порогу.

Claim 4 (Зависимый): Приводит пример порогового значения. Установленный порог составляет три или более изменений в течение определенного периода времени.

Claim 5 (Зависимый): Определяет состав данных об авторстве. Последовательность данных об авторстве включает как минимум одно имя автора и информацию, относящуюся к расположению страницы профиля автора (т.е. ссылку на профиль).

Где и как применяется

Изобретение применяется на этапах сканирования и индексирования для классификации контента и поддержания качества специализированного индекса.

CRAWLING – Сканирование и Сбор данных
Краулер (Crawler) периодически посещает документы, которые ранее были идентифицированы как авторский контент. Он извлекает текущие данные об авторстве (имена, ссылки, разметку, например rel="author") для обновления истории.

INDEXING – Индексирование и извлечение признаков
Это основной этап применения патента.

  • Идентификация авторства: Authorship Identification Engine обрабатывает извлеченные данные для определения текущих авторов документа.
  • Обновление истории: Система обновляет Authorship History для документа, добавляя новую запись или отмечая отсутствие изменений.
  • Анализ и классификация: Система (используя Processing Framework, например, MapReduce) анализирует историю изменений, подсчитывает количество Qualifying Authorship-Data Changes и сравнивает его с Set Threshold.
  • Обновление индекса: На основе анализа принимается решение о сохранении документа в Authored-Content Database или его удалении/занесении в черный список.

Входные данные:

  • URL документа в Authored-Content Database.
  • Извлеченные сигналы авторства (байлайны, ссылки на профили, разметка).
  • Предыдущая история авторства (Authorship History).

Выходные данные:

  • Обновленная история авторства.
  • Решение о статусе документа (авторский или неавторский контент).
  • Обновленная Authored-Content Database (с удаленными или помеченными документами).

На что влияет

  • Конкретные типы контента: Влияет на классификацию контента. Помогает отделить статические авторские материалы (статьи, посты в блогах) от динамических страниц агрегации (главные страницы, страницы категорий, ленты новостей), которые могут имитировать сигналы авторства.
  • Конкретные ниши или тематики: Наиболее актуально для новостных сайтов, блогов и контентных проектов, где точное определение авторства важно (включая YMYL-тематики).

Когда применяется

  • При каких условиях работает алгоритм: Алгоритм применяется к документам, которые уже были предварительно идентифицированы как авторский контент и включены в Authored-Content Database.
  • Триггеры активации: Процесс анализа активируется во время повторного сканирования и индексирования документа. Триггером для удаления является обнаружение изменений в Authorship Data, превышающих порог.
  • Пороговые значения: Ключевым условием является превышение Set Threshold (например, 3 или более изменений за период).
  • Временные рамки: Сканирование может происходить с разной частотой (например, раз в день). Анализ учитывает изменения за определенный период. В патенте упоминается возможность использования временного ограничения (time cutoff, например, 60 дней), чтобы устаревшие изменения игнорировались.
  • Исключения: Упоминается возможность ручной отмены через белый список (white-listed table).

Пошаговый алгоритм

Процесс поддержания базы данных авторского контента:

  1. Наполнение базы данных: Authored-Content Database наполняется документами, идентифицированными как авторский контент. Для каждого сохраняются исходные Authorship Data.
  2. Периодическое сканирование: Краулер периодически повторно посещает проиндексированные документы.
  3. Извлечение и обновление данных: Текущие Authorship Data извлекаются из документа.
  4. Ведение истории авторства: Система обновляет Authorship History. Если набор авторов изменился по сравнению с предыдущей записью (Qualifying Authorship-Data Change), в историю добавляется новое событие.
  5. Анализ последовательности данных: Система периодически анализирует Authorship History за определенный период времени (например, за последние 60 дней).
  6. Квантификация изменений: Система подсчитывает количество квалифицирующих изменений. Это формирует "репутацию нестабильности" (reputation for instability) документа. Изменения, не связанные с авторством (например, реклама), игнорируются.
  7. Сравнение с порогом: Количество изменений сравнивается с Set Threshold (например, 3).
  8. Принятие решения:
    • Если порог превышен (ДА): Документ идентифицируется как нестабильный (non-authored-content document).
    • Если порог не превышен (НЕТ): Документ сохраняется в базе.
  9. Действие: Нестабильный документ удаляется из базы данных или заносится в черный список (blacklisted), с учетом возможных исключений из белого списка.

Какие данные и как использует

Данные на входе

Система фокусируется на данных, связанных с идентификацией автора.

  • Контентные и структурные факторы:
    • Байлайны (Bylines): Фразы типа "by Имя Фамилия" в тексте документа.
    • Аннотации (Annotations) и метаданные, указывающие на автора.
  • Технические факторы (Разметка):
    • Специальная разметка для указания авторства, например, тег <rel="author" link>.
    • Разметка rel=me для связи профилей.
  • Ссылочные факторы:
    • Ссылки на внутренние страницы профиля автора.
    • Ссылки на внешние профили в социальных сетях (social profile page).
    • Цепочки ссылок (chain of links), которые ведут от документа к верифицируемому профилю автора.
  • Временные факторы:
    • История изменений (Authorship History) документа во времени.

Какие метрики используются и как они считаются

  • Authorship Data Fields (Поля данных об авторстве): Конкретные значения, отслеживаемые в истории: Author name (Имя автора), Link URL (URL ссылки на профиль), Profile ID (Идентификатор профиля).
  • Qualifying Authorship-Data Change (Квалифицирующее изменение): Событие, фиксируемое при сравнении двух наборов Authorship Data (например, за два дня), если хотя бы одно поле в одном наборе не имеет эквивалента в другом наборе (по имени, ID или ссылке).
  • Reputation for Instability (Репутация нестабильности): Количественная метрика, представляющая собой сумму квалифицирующих изменений за определенный период.
  • Set Threshold (Установленный порог): Пороговое значение для количества изменений. Пример в патенте: 3 или более квалифицирующих изменений за определенный период.
  • Time Cutoff (Временное ограничение): Период, за который учитываются изменения (например, 60 дней). Используется для игнорирования устаревших изменений.

Выводы

  1. Временная стабильность как фактор классификации: Ключевая идея патента — использование стабильности информации во времени для определения типа контента. Стабильность атрибуции авторства является признаком настоящего авторского контента (статьи).
  2. Нестабильность указывает на агрегаторы: Если атрибутированный автор страницы часто меняется, система предполагает, что страница является агрегатором, главной страницей или другим динамическим контентом (Resemblance documents), а не статичной статьей одного автора.
  3. Фокус на значимых изменениях: Система отслеживает только Qualifying Authorship-Data Changes (имя, ID профиля, ссылка на профиль). Она игнорирует поверхностные изменения на странице (например, в рекламе или комментариях), если они не влияют на основные данные об авторстве.
  4. Гигиена специализированных индексов: Патент описывает механизм для поддержания целостности и качества специализированных баз данных (в данном случае, индекса авторов), а не алгоритм ранжирования основного поиска.
  5. Контекст Google Authorship и E-E-A-T: Хотя патент описывает инфраструктуру для устаревшей программы Google Authorship, он демонстрирует важность консистентности сигналов, связанных с сущностями и E-E-A-T. Нестабильность ключевой информации может привести к потере доверия системы.

Практика

ВАЖНО: Прямое практическое применение этого патента ограничено из-за прекращения программы Google Authorship. Выводы ниже основаны на общих принципах работы поисковых систем, извлеченных из патента.

Best practices (это мы делаем)

  • Обеспечение стабильности атрибуции авторства: Убедитесь, что техническая реализация указания авторства (байлайны, структурированные данные Schema.org/Person) является корректной и стабильной. Атрибуция автора для конкретной статьи не должна меняться при незначительных обновлениях контента или изменениях дизайна.
  • Использование консистентных идентификаторов и ссылок: Ссылки на страницы авторов и их идентификаторы должны быть постоянными. Если используется структурированная разметка (например, author.url или sameAs), эти URL не должны часто меняться.
  • Четкое разделение основного контента и динамических элементов: Структурируйте страницы так, чтобы системы могли легко отличить основного автора статьи от авторов комментариев или связанных материалов. Это минимизирует риск ошибочной идентификации и последующей нестабильности.

Worst practices (это делать не надо)

  • Динамическое изменение атрибутированного автора: Нельзя динамически подставлять разных авторов для одной и той же статьи (например, указывать в качестве автора текущего редактора, а не оригинального автора). Это будет зафиксировано как Qualifying Authorship-Data Change.
  • Частое изменение идентификаторов авторов или URL их профилей: Изменение структуры URL профилей авторов или их внутренних идентификаторов может быть воспринято как изменение авторства, что приведет к повышению reputation for instability.
  • Использование вводящих в заблуждение сигналов авторства: Размещение байлайнов или разметки авторства на страницах, которые не являются авторским контентом (например, на страницах категорий или главной странице). Система выявит нестабильность, так как контент и предполагаемые авторы будут постоянно меняться.

Стратегическое значение

Патент подтверждает важность темпорального анализа (анализа данных во времени) в алгоритмах Google. Стабильность и консистентность сигналов, особенно связанных с E-E-A-T и идентификацией сущностей, критически важны для корректной классификации контента и формирования доверия. Нестабильность этих сигналов может привести к тому, что Google будет игнорировать авторство или неправильно классифицировать тип страницы, что сведет на нет усилия по продвижению экспертности авторов.

Практические примеры

Сценарий 1: Фильтрация главной страницы новостного сайта

  1. Ситуация: Главная страница новостного сайта (site.com) содержит анонсы последних статей с подписями авторов. Authorship Identification Engine ошибочно индексирует site.com в Authored-Content Database.
  2. Мониторинг (День 1): Система фиксирует Authorship Data для site.com: Авторы А, Б, В.
  3. Мониторинг (День 2): Контент на главной странице обновился. Система фиксирует Authorship Data: Авторы Г, Д, Е.
  4. Детекция изменений: Система фиксирует Qualifying Authorship-Data Change.
  5. Последующие дни: Изменения продолжают фиксироваться ежедневно.
  6. Результат: Количество изменений превышает Set Threshold (например, 3). Система определяет, что site.com является нестабильным resemblance document, и удаляет его из Authored-Content Database.

Сценарий 2: Риск при частых изменениях авторства статьи

  1. Публикация: Опубликована статья автора "Иван Петров". Google начинает вести Authorship History.
  2. Изменение 1: Через месяц автор меняется на "Анна Сидорова" (при обновлении материала). Google фиксирует 1 изменение.
  3. Изменение 2: Через неделю по ошибке CMS автор меняется на "Отдел Новостей". Google фиксирует 2 изменения.
  4. Изменение 3: Через день ошибка исправляется, автор снова "Анна Сидорова". Google фиксирует 3 изменения.
  5. Результат: Порог достигнут (3 изменения за короткий период). Система может классифицировать страницу как нестабильную. В современных реалиях это может негативно сказаться на оценке E-E-A-T этой страницы.

Вопросы и ответы

Связан ли этот патент с Google Authorship?

Да, напрямую. Описанные механизмы (использование социальных профилей, rel="author") и время подачи заявки (2013 год) указывают на то, что изобретение решало проблемы качества идентификации в рамках программы Google Authorship. Эта программа была официально закрыта в 2014 году.

Актуален ли этот патент сейчас (в 2025 году)?

В описанном виде — нет. Конкретная реализация (Authored-Content Database на основе Google+) устарела. Однако базовая идея — использование стабильности данных во времени для валидации типа контента — высокоактуальна. Google по-прежнему стремится идентифицировать авторов для оценки E-E-A-T, и стабильность этой информации является важным фактором доверия.

Что такое "Resemblance documents" (Похожие документы)?

Это документы, которые содержат сигналы, похожие на авторский контент, но таковым не являются. Классические примеры: главная страница новостного сайта, на которой отображаются заголовки и авторы последних статей, или страница категории. Система стремится отфильтровать такие документы.

Как система определяет, что изменение является значимым (квалифицирующим)?

Изменение считается значимым (Qualifying Authorship-Data Change), если меняется само идентифицированное авторство: имя автора, ID его профиля или ссылка на профиль. Изменения в тексте статьи, добавление комментариев или смена рекламных блоков игнорируются, если они не затрагивают эти основные данные.

Какой порог изменений используется для удаления документа из базы?

В патенте в качестве примера приводится порог (Set Threshold) в три или более значимых изменений в течение определенного периода времени. Также упоминается использование временного окна, например, 60 дней (time cutoff), за пределами которого старые изменения не учитываются.

Что произойдет, если я легитимно изменю автора статьи (например, при обновлении материала другим экспертом)?

Единичное или редкое изменение допустимо и не приведет к превышению порога нестабильности. Система ищет паттерн частых изменений, характерный для агрегаторов. Если вы измените автора один раз при существенном обновлении контента, это не вызовет проблем. Важно поддерживать стабильность после изменения.

Как этот патент влияет на E-E-A-T?

Косвенно. Он демонстрирует, что консистентность и стабильность сигналов, связанных с авторством и экспертизой, важны для Google. Если информация об авторе постоянно меняется, это может подорвать доверие к источнику и негативно сказаться на оценке E-E-A-T, так как система не сможет надежно связать контент с автором.

Нужно ли мне беспокоиться об этом патенте при редизайне сайта или смене CMS?

Да, если эти изменения затрагивают способ отображения, верстку или микроразметку авторов. Резкое изменение сигналов может быть зафиксировано как изменение. Важно убедиться, что после обновления система по-прежнему корректно и стабильно идентифицирует автора, и избегать частых изменений в реализации.

Применяется ли этот метод к разметке Schema.org/Author?

В патенте разметка Schema.org не упоминается, он фокусируется на rel="author" и анализе контента. Однако абсолютно логично предположить, что современные системы Google применяют аналогичный подход к анализу стабильности данных об авторстве, полученных из микроразметки.

Что такое "репутация нестабильности" (reputation for instability)?

Это внутренняя метрика, упомянутая в патенте, которая количественно оценивает, как часто меняются данные об авторстве для конкретного документа в течение определенного временного окна. Чем выше эта метрика, тем больше вероятность того, что документ является динамическим, а не стабильной авторской работой.

Похожие патенты

Как Google определяет оригинальность контента для расчета Авторского Ранга (Author Rank) и влияния на ранжирование
Google использует систему для идентификации оригинального контента и повышения авторитета его создателей. Система разбивает документы на фрагменты (content pieces) и отслеживает их первое появление. Авторы (включая домены) ранжируются на основе количества созданного ими оригинального контента и частоты его копирования другими. Ранг автора затем используется для повышения в выдаче документов этого автора, особенно свежих публикаций.
  • US8983970B1
  • 2015-03-17
  • EEAT и качество

  • Свежесть контента

  • SERP

Как Google обнаруживает неавторизованное использование контента (текст, изображения, видео, аудио), сохраняя конфиденциальность
Система позволяет владельцам контента загружать образцы (текст, изображения, видео, аудио) и проверять, существуют ли совпадения в индексах Google, включая веб-индекс и пользовательские базы данных. Система сообщает о факте наличия совпадения, не раскрывая источник напрямую, и может предоставить зашифрованный идентификатор для дальнейшего расследования.
  • US20080288509A1
  • 2008-11-20
  • Индексация

  • Мультимедиа

Как Google использует цифровые отпечатки контента для автоматического выявления и исправления орфографических ошибок в метаданных
Google использует технологию цифровых отпечатков (fingerprinting) для идентификации идентичного контента (например, видео, аудио, изображений), загруженного разными пользователями. Сравнивая метаданные (заголовки, теги) этих идентичных файлов, система автоматически выявляет распространенные опечатки и орфографические ошибки. Это позволяет улучшить полноту поисковой выдачи, связывая разные варианты написания.
  • US8458156B1
  • 2013-06-04
  • Индексация

  • Мультимедиа

Как Google использует данные аналитики в реальном времени и контролируемый трафик для установления оригинального авторства контента
Google патентует метод для точной идентификации автора контента до того, как его обнаружит веб-краулер. Система использует уникальные идентификаторы (например, код веб-аналитики) и отслеживает первую активность автора с неопубликованным контентом (например, переходы по скрытым ссылкам между черновиками). Это позволяет зафиксировать временную метку в реальном времени, защищая от плагиата и обеспечивая корректную атрибуцию в поиске.
  • US9372927B1
  • 2016-06-21
  • EEAT и качество

  • Индексация

  • Краулинг

Как Google отслеживает возраст отдельных фрагментов контента на странице и отличает существенные обновления от незначительных правок
Google использует систему для определения даты первой публикации отдельных фрагментов контента (например, предложений или абзацев). Система сегментирует контент и отслеживает его историю в «Карте дат» (Date Map). Используя нечеткое сравнение (Edit Distance) и нормализацию, система игнорирует незначительные правки и точно датирует только существенные обновления контента.
  • US8332408B1
  • 2012-12-11
  • Свежесть контента

  • Индексация

  • Техническое SEO

Популярные патенты

Как Google определяет популярность и ранжирует физические события (концерты, выставки) в локальной выдаче
Google использует специализированную систему для ранжирования физических событий в определенном месте и времени. Система вычисляет оценку популярности события на основе множества сигналов: количества упоминаний в интернете, кликов на официальную страницу, популярности связанных сущностей (артистов, команд), значимости места проведения и присутствия в общих поисковых запросах о событиях. Затем результаты переранжируются для обеспечения разнообразия, понижая схожие события или события одной категории.
  • US9424360B2
  • 2016-08-23
  • Local SEO

  • Поведенческие сигналы

Как Google определяет ключевую тематику зданий и адресов, используя клики пользователей для показа релевантной рекламы
Google использует этот механизм для понимания основного назначения физического местоположения (адреса или здания). Система анализирует все бизнесы в этой локации и определяет, какие поисковые запросы чаще всего приводят к кликам по их листингам. Самый популярный запрос используется как доминирующее ключевое слово для выбора релевантной рекламы, когда пользователи ищут этот адрес или взаимодействуют с ним на Картах или в Street View.
  • US20120278171A1
  • 2012-11-01
  • Local SEO

  • Семантика и интент

  • Поведенческие сигналы

Как Google использует социальные связи для выявления предвзятых ссылок и борьбы со ссылочными схемами и кликфродом
Google анализирует взаимоотношения между администраторами веб-сайтов (используя данные социальных сетей), чтобы определить независимость ссылок или кликов по рекламе. Если обнаружена тесная связь, это интерпретируется как предвзятость (Bias). В результате вес ссылки для ранжирования может быть снижен (борьба с Search Spamming), или клик по рекламе может быть дисконтирован (борьба с Ad Spamming).
  • US10402457B1
  • 2019-09-03
  • Ссылки

  • Антиспам

  • Краулинг

Как Google использует историю поиска и браузинга для персонализации выдачи и определения предпочтений пользователя
Google записывает и анализирует историю действий пользователя: запросы, клики по результатам и рекламе, посещенные страницы. Система группирует связанные действия в сессии, определяет "Предпочитаемые локации" на основе частоты и времени визитов (stay-time), и использует эту историю для изменения порядка ранжирования, повышая позиции ранее посещенных сайтов в персональной выдаче.
  • US20060224583A1
  • 2006-10-05
  • Персонализация

  • Поведенческие сигналы

Как Google использует клики пользователей в поиске по картинкам для понимания содержания изображений и улучшения таргетинга
Google анализирует поведение пользователей в поиске по картинкам для идентификации содержания изображений. Если пользователи ищут определенный запрос (идею) и массово кликают на конкретное изображение в результатах, система связывает это изображение с данным запросом (концепцией). Эти данные используются для улучшения ранжирования в поиске картинок и для предложения релевантных ключевых слов рекламодателям, загружающим схожие изображения.
  • US11409812B1
  • 2022-08-09
  • Поведенческие сигналы

  • Семантика и интент

  • SERP

Как Google использует социальные связи и анализ контекста рекомендаций (Endorsements) для персонализации поисковой выдачи
Google анализирует контент (например, посты в микроблогах и социальных сетях), созданный контактами пользователя. Система определяет, является ли ссылка в этом контенте "подтверждением" (Endorsement) на основе окружающих ключевых слов. Если да, то при поиске пользователя эти результаты могут быть аннотированы, указывая, кто из контактов и через какой сервис подтвердил результат, и потенциально повышены в ранжировании.
  • US9092529B1
  • 2015-07-28
  • Поведенческие сигналы

  • Персонализация

  • EEAT и качество

Как Google использует географическое положение и историю поведения пользователей для разрешения неоднозначных запросов
Google применяет механизм для интерпретации неоднозначных поисковых запросов, которые имеют несколько географических или категориальных значений. Система определяет доминирующий интент, анализируя, как пользователи в том же регионе ранее уточняли похожие запросы и насколько они были удовлетворены результатами. На основе этих локализованных данных (гистограмм и метрик неудовлетворенности) выбирается наиболее вероятная интерпретация, и выдача фильтруется соответственно.
  • US8478773B1
  • 2013-07-02
  • Семантика и интент

  • Персонализация

  • Поведенческие сигналы

Как Google динамически меняет формулы ранжирования, адаптируя веса факторов под контекст запроса и пользователя
Google не использует единую модель ранжирования. Система использует машинное обучение для создания множества специализированных моделей (Predicted Performance Functions), обученных на исторических данных о кликах для разных контекстов (Search Contexts). При получении запроса система определяет контекст (тип запроса, язык, локация пользователя) и применяет ту модель, которая лучше всего предсказывает CTR в этой ситуации, динамически изменяя значимость различных сигналов ранжирования.
  • US8645390B1
  • 2014-02-04
  • Персонализация

  • Поведенческие сигналы

  • SERP

Как Google обрабатывает клики по ссылкам на мобильные приложения (App Deep Links) в результатах поиска
Google использует механизм клиентской обработки результатов поиска, ведущих в нативные приложения. Если у пользователя не установлено нужное приложение, система на устройстве автоматически подменяет ссылку приложения (App Deep Link) на эквивалентный веб-URL. Это гарантирует доступ к контенту через браузер и обеспечивает бесшовный пользовательский опыт.
  • US10210263B1
  • 2019-02-19
  • Ссылки

  • SERP

Как Google использует историю местоположений для определения физической активности пользователя и гиперперсонализации поиска
Google анализирует историю перемещений пользователя (местоположения и скорость), чтобы определить его текущую физическую активность (например, поход, шоппинг) и способ передвижения (например, пешком, на автобусе). Эта информация используется для радикальной персонализации: система корректирует ранжирование результатов, изменяет запросы и формирует подсказки, чтобы они соответствовали контексту реальных действий пользователя.
  • US20150006290A1
  • 2015-01-01
  • Поведенческие сигналы

  • Персонализация

  • Local SEO

seohardcore