SEO HARDCORE
  • Разборы патентов
    • Патенты Google
  • Скоро SEO инструменты
  • Скоро SEO аналитика
  • seohardcore
SEO HARDCORE
назад

Как Google предлагает использовать номера версий контента для генерации в Sitemap, если реальная дата изменения недоступна

SITEMAP GENERATION WHERE LAST MODIFIED TIME IS NOT AVAILABLE TO A NETWORK CRAWLER (Генерация Sitemap, когда время последнего изменения недоступно для сетевого краулера)
  • US7865497B1
  • Google LLC
  • 2008-02-21
  • 2011-01-04
  • Краулинг
  • Техническое SEO
  • Индексация
  • Свежесть контента
  • Описание
  • Разбор
  • Выводы
  • Практика
  • FAQ
  • Похожие

Патент описывает метод для генерации Sitemaps на сайтах, где фактическое время последнего изменения контента недоступно (например, для данных в БД). Система сравнивает текущий номер версии контента с версией на момент прошлой генерации Sitemap. Если версия изменилась, в тег устанавливается текущее время, что гарантирует повторное сканирование обновленного контента краулером.

Описание

Какую проблему решает

Патент решает проблему обеспечения эффективного сканирования и своевременного обновления поискового индекса для контента, у которого отсутствует доступная или надежная метка времени последнего изменения (actual last modified time). Это особенно актуально для контента, хранящегося в базах данных (например, UGC, медиа-галереи, товары в E-commerce), где изменения в содержимом не отражаются на уровне временных меток файловой системы. Без точного сигнала об изменении краулер не может эффективно приоритизировать повторное сканирование.

Что запатентовано

Запатентован метод генерации файла Sitemap, который использует номера версий контента (Version Numbers) в качестве альтернативного индикатора изменений, когда фактическое время модификации недоступно. Система сравнивает текущую версию элемента с версией, зафиксированной при предыдущей генерации Sitemap. При обнаружении различий система искусственно устанавливает значение Last Modified Time (тег <lastmod>) на актуальное время, сигнализируя о необходимости пересканирования.

Как это работает

Механизм реализуется на стороне веб-сайта в процессе генерации Sitemap:

  • Хранение истории: Система сохраняет список номеров версий (Historical List или stored version number) на момент последней генерации Sitemap.
  • Сравнение версий: Во время новой генерации система получает текущие номера версий из базы данных и сравнивает их с историческими данными.
  • Обнаружение изменений: Если номер версии изменился или элемент новый (отсутствует в историческом списке), фиксируется изменение.
  • Манипуляция <lastmod>: Для измененных элементов система устанавливает <lastmod> на время, более позднее, чем время предыдущей генерации (например, текущее системное время).
  • Сигнал краулеру: Поисковая система воспринимает этот сигнал и планирует повторное сканирование URL.

Актуальность для SEO

Высокая. Управление краулинговым бюджетом и обеспечение свежести индекса остаются критически важными задачами технического SEO. Хотя современные CMS часто лучше обрабатывают временные метки, проблема остается актуальной для крупных, управляемых базами данных сайтов, самописных систем и UGC-платформ. Этот патент предлагает надежный резервный механизм для таких случаев.

Важность для SEO

Патент имеет значительное инфраструктурное влияние на техническое SEO. Он не описывает алгоритмы ранжирования, но критически важен для обеспечения базовых процессов сканирования и индексации. Для сайтов с ненадежными временными метками внедрение подхода на основе версий при генерации Sitemap является ключевым для поддержания актуальности контента в индексе и эффективного расходования краулингового бюджета.

Детальный разбор

Термины и определения

Actual Last Modified Time (Фактическое время последнего изменения)
Реальное время изменения контента. Патент применяется, когда эта информация недоступна.
Content Database (База данных контента)
Хранилище контента сайта (тексты, изображения, видео), доступ к которому осуществляется через СУБД, а не файловую систему.
Current Version Number (Текущий номер версии)
Актуальный идентификатор версии элемента контента на момент генерации Sitemap.
Historical List / Stored Version Number (Исторический список / Сохраненный номер версии)
Список номеров версий, зафиксированный во время предыдущей генерации Sitemap. Используется для сравнения.
Last Modified Time (<lastmod>)
Значение в файле Sitemap (тег <lastmod>), указывающее краулеру дату изменения. В данном патенте это значение устанавливается искусственно на основе изменения версии.
Sitemap Generator (Генератор Sitemap)
Программное обеспечение на стороне веб-сайта, реализующее логику сравнения версий для создания файлов Sitemap.
Version Number (Номер версии)
Индикатор, который обновляется при каждом изменении элемента контента. Используется как прокси для определения факта изменения.

Ключевые утверждения (Анализ Claims)

Claim 8 (Независимый пункт, Метод): Описывает основной процесс обработки отдельного элемента контента.

  1. Считывается текущий номер версии (current version number) элемента контента.
  2. Определяется наличие ранее сохраненного номера версии (previously stored version number).
  3. Текущий номер сравнивается с сохраненным.
  4. Если номера различаются, система устанавливает Last Modified Time в записи Sitemap для этого элемента на время, более позднее, чем время генерации последнего Sitemap.
  5. Ключевое условие: этот метод применяется, когда фактическое время изменения контента недоступно (actual last modified time... is not available).

Claim 17 (Независимый пункт, Метод): Описывает процесс пакетной обработки через сравнение списков.

  1. Генерируется текущий список (current list) номеров версий контента из базы данных.
  2. Этот список сравнивается с историческим списком (historical list).
  3. Для элементов, чьи номера версий отличаются, устанавливается Last Modified Time в Sitemap на время, более позднее, чем время генерации последнего Sitemap.
  4. Условие применения аналогично: когда фактическое время изменения недоступно.

Claim 1 (Независимый пункт, Система): Определяет архитектуру системы.

  1. Наличие базы данных для хранения файлов и их номеров версий.
  2. Наличие Sitemap Generator, который сравнивает текущий номер версии с ранее сохраненным.
  3. Генератор создает Sitemap, где значение Last Modified Time основано на результате сравнения, при условии, что фактическое время изменения недоступно.

Зависимые пункты (например, Claims 11, 12, 14): Уточняют детали реализации и контекст:

  • В качестве нового Last Modified Time может использоваться текущее системное время (Claim 14).
  • Метод применим к сайтам обмена фотографиями (photograph sharing website), где инструменты редактирования обновляют номер версии изображения (Claims 11, 12).

Где и как применяется

Изобретение описывает механизм, реализуемый на инфраструктуре веб-сайта (Sitemap Generator) для управления поведением поисковой системы.

CRAWLING – Сканирование и Сбор данных
Это основная фаза, на которую влияет изобретение. Сгенерированный Sitemap с точно рассчитанными значениями <lastmod> напрямую управляет планированием сканирования (Crawl Scheduling). Предоставление актуальной даты изменения позволяет Network Crawler оптимизировать ресурсы и приоритизировать сканирование обновленного контента, даже если стандартные сигналы (например, HTTP-заголовок Last-Modified) недоступны.

INDEXING – Индексирование и извлечение признаков
Обеспечивая своевременное повторное сканирование, механизм гарантирует, что в индекс (Index) и кеш (Item Cache) попадает самая свежая версия контента, поддерживая актуальность данных для ранжирования.

Входные данные (для Sitemap Generator):

  • Элементы контента из Content Database.
  • Текущие номера версий (Current Version Numbers) этих элементов.
  • Исторический список номеров версий (Historical List) с момента последней генерации.
  • Текущее системное время.

Выходные данные (для Network Crawler):

  • Файл Sitemap с URL (<loc>) и временем последнего изменения (<lastmod>). Для измененного контента <lastmod> будет содержать искусственно установленное свежее время.

На что влияет

  • Конкретные типы контента: Наибольшее влияние на контент, управляемый базами данных, где временные метки файловой системы нерелевантны. Это включает изображения и видео на хостингах, товары в E-commerce, профили пользователей, UGC.
  • Конкретные ниши или тематики: Критично для фотобанков, видеохостингов, крупных интернет-магазинов и агрегаторов. В патенте явно упоминаются сайты обмена фотографиями (photograph sharing website).

Когда применяется

  • Условие активации: Генерация файла Sitemap для контента, у которого недоступно или ненадежно фактическое время последнего изменения (actual last modified time).
  • Необходимые данные: Наличие системы версионирования контента на стороне сайта, при которой изменение контента приводит к обновлению его version number.
  • Частота применения: Каждый раз при генерации файла Sitemap.

Пошаговый алгоритм

Процесс генерации Sitemap с использованием номеров версий:

  1. Инициализация: Запуск процесса генерации Sitemap. Загрузка исторического списка номеров версий (Historical List).
  2. Чтение элемента и текущей версии: Считывание элемента контента и его текущего номера версии (Current Version Number) из базы данных.
  3. Сравнение версий: Сравнение текущего номера версии с номером версии этого же элемента в историческом списке.
  4. Проверка изменений: Определение, изменился ли номер версии или элемент является новым (отсутствует в историческом списке).
    • Если ДА (изменение или новый элемент): Переход к шагу 5.
    • Если НЕТ (изменений нет): Переход к шагу 6.
  5. Установка времени изменения: Установка значения <lastmod> для этого элемента на время, которое позже времени предыдущей генерации Sitemap (например, текущее системное время).
  6. Формирование записи Sitemap: Создание записи в Sitemap с URL элемента и установленным значением <lastmod> (либо свежим из шага 5, либо историческим, если изменений не было).
  7. Обновление исторического списка (в процессе или по завершении): Сохранение текущего номера версии в новом историческом списке для будущего использования.
  8. Итерация: Переход к следующему элементу контента и возврат к шагу 2.
  9. Завершение: Сохранение файла Sitemap и предоставление его поисковой системе.

Какие данные и как использует

Данные на входе

Патент фокусируется исключительно на данных, необходимых для определения факта изменения контента.

  • Технические факторы / Данные из БД:
    • Version Number: Ключевой фактор. Индикатор, который должен обновляться при любом изменении контента.
    • Идентификаторы элементов (Keys/ID) или URL: Используются для сопоставления элементов в текущем и историческом списках.
  • Мультимедиа факторы: В патенте упоминается применение к изображениям (image files), аудио, видео и текстовым файлам.

Какие метрики используются и как они считаются

Система не вычисляет сложные метрики, а использует прямое сравнение и системные данные.

  • Сравнение версий: Прямое сравнение на равенство/неравенство между Current Version Number и Stored Version Number.
  • Текущее системное время: Используется для установки нового значения <lastmod> при обнаружении изменений. Указывается, что можно использовать текущее время или текущий день.

Выводы

  1. Приоритет точности сигналов для краулинга: Патент подтверждает критическую важность тега <lastmod> в Sitemap для управления поведением краулера и оптимизации краулингового бюджета.
  2. Версионирование как валидированная альтернатива датам: Google признает ограничения инфраструктуры (отсутствие надежных временных меток) и предлагает использование внутренних номеров версий как надежный резервный механизм (fallback) для определения изменений.
  3. Ответственность на стороне сайта: Реализация этого механизма (отслеживание версий и генерация Sitemap) лежит на владельце сайта или разработчиках CMS. Вебмастер несет ответственность за предоставление точных сигналов об обновлениях.
  4. Искусственное обновление времени допустимо: Патент описывает механизм, при котором <lastmod> устанавливается искусственно (на текущее время), если обнаружено изменение версии. Это допустимая практика, если она точно отражает факт обновления контента.
  5. Критичность для динамического контента: Метод необходим для обеспечения актуальности индексации для E-commerce, медиа-хостингов и UGC-платформ, управляемых базами данных.

Практика

Best practices (это мы делаем)

  • Аудит точности временных меток: Проверьте, насколько точно ваша CMS/сервер отдает HTTP-заголовок Last-Modified и заполняет <lastmod> в Sitemap. Они должны соответствовать времени значимого изменения контента.
  • Внедрение версионирования (если необходимо): Если инфраструктура не может надежно предоставлять точное время изменения (особенно для контента в БД), необходимо внедрить систему отслеживания версий (счетчик изменений или хеш-сумма контента) для всего индексируемого контента.
  • Адаптация генератора Sitemap: Убедитесь, что генератор Sitemap использует логику из патента: сравнивает текущую версию/хеш с исторической и обновляет <lastmod> только при наличии изменений.
  • Тщательная проверка точности: Убедитесь, что <lastmod> (и номер версии) обновляется только при значимых изменениях контента, а не при технических или незначительных правках.

Worst practices (это делать не надо)

  • Игнорирование <lastmod> для динамического контента: Отсутствие актуальной информации в <lastmod> приведет к замедлению обнаружения изменений и устареванию индекса.
  • Ложное обновление <lastmod> (Crawl Budget Waste): Установка текущей даты для всего контента при каждой генерации Sitemap, независимо от того, менялся ли контент (и его версия). Это приводит к массовому повторному сканированию неизмененных страниц и может привести к игнорированию сигналов из Sitemap.
  • Непоследовательное версионирование: Если система версионирования работает некорректно (например, номер версии не обновляется при изменении контента), описанный механизм будет бесполезен.

Стратегическое значение

Патент подтверждает стратегическую важность файлов Sitemap как надежного канала коммуникации для управления сканированием. Он подчеркивает, что SEO-стратегия должна включать обеспечение технической инфраструктуры, способной точно сигнализировать об изменениях контента. Для современных веб-приложений, часто использующих сложные базы данных, реализация альтернативных методов отслеживания изменений является необходимостью для обеспечения конкурентоспособности в поиске.

Практические примеры

Сценарий: Обеспечение актуальности карточек товаров в E-commerce на самописной CMS

Интернет-магазин хранит товары в базе данных. Цены и наличие часто меняются, но CMS не обновляет метки времени Last-Modified.

  1. Реализация версионирования: В базу данных добавляется поле content_hash. При любом изменении товара (цена, описание, наличие) рассчитывается новый хеш контента и сохраняется в этом поле.
  2. Настройка генератора Sitemap: Разрабатывается скрипт генерации Sitemap. При запуске он сохраняет текущее состояние хешей в лог-файл (Historical List).
  3. Процесс генерации: При следующей генерации скрипт сравнивает текущий content_hash в БД со значением в лог-файле.
  4. Обновление <lastmod>: Если хеши отличаются, скрипт устанавливает в теге <lastmod> для этого товара текущую дату и время. Если хеши равны, дата <lastmod> остается прежней.
  5. Результат: Google получает Sitemap, видит свежую дату <lastmod> только для измененных товаров и оперативно ставит их в очередь на пересканирование.

Вопросы и ответы

Является ли описанный механизм заменой HTTP-заголовка Last-Modified?

Нет, это резервный механизм (fallback). В идеале сайт должен корректно отдавать HTTP-заголовок Last-Modified и использовать ту же дату в <lastmod>. Метод из патента предназначен строго для ситуаций, когда получение этой фактической даты невозможно или она ненадежна (как указано в патенте: actual last modified time... is not available).

Что делать, если у моего контента нет системы нумерации версий?

Если стандартные метки времени недоступны, необходимо внедрить механизм отслеживания изменений. Это не обязательно должен быть номер версии (1.1, 1.2). Можно использовать хеш-сумму значимого контента страницы. Если контент меняется, меняется и хеш. Главное, чтобы генератор Sitemap мог сравнить текущее значение с предыдущим.

Как именно система определяет, что контент изменился?

Система полагается на данные, предоставляемые CMS или базой данных. Она сохраняет состояние индикатора изменений (номера версии или хеша) на момент последней генерации Sitemap (Historical List) и сравнивает его с текущим состоянием. Любое несовпадение интерпретируется как изменение контента.

Что произойдет, если номер версии изменился?

Sitemap Generator искусственно устанавливает значение тега <lastmod> в новом файле Sitemap на текущее системное время (или любую дату, более позднюю, чем предыдущая генерация). Это служит сигналом для краулера о том, что контент обновлен и его нужно пересканировать.

Что произойдет, если я буду указывать свежую дату <lastmod> для страниц, которые не менялись?

Это крайне не рекомендуется и противоречит сути патента. Если вы постоянно сигнализируете об изменениях, но краулер не обнаруживает нового контента, Google начнет терять доверие к вашим файлам Sitemap. Это приведет к неэффективному расходованию краулингового бюджета и может замедлить индексацию действительно важных обновлений.

Влияет ли этот патент на ранжирование?

Напрямую нет. Это патент, связанный с инфраструктурой сканирования и индексации. Однако косвенное влияние есть: если обновленный контент быстрее попадает в индекс благодаря этому механизму, он быстрее начнет ранжироваться по актуальным данным. Это особенно важно для контента, чувствительного ко времени (QDF).

Для каких сайтов этот патент наиболее актуален?

Он наиболее актуален для сайтов, где контент хранится в базах данных и управляется сложными или самописными системами, которые не могут надежно предоставлять фактическое время изменения. Примеры включают крупные платформы UGC, сайты отзывов, E-commerce каталоги и медиа-хостинги (как указано в патенте).

Как хранить исторический список версий (Historical List)?

Это зависит от реализации вашего генератора Sitemap. Исторический список можно хранить в отдельной таблице базы данных, в кеше (например, Redis) или в файле на сервере (например, в формате JSON). Важно, чтобы этот список был доступен при следующей генерации Sitemap и обновлялся после ее завершения.

Может ли этот механизм использоваться для изображений или видео?

Да, патент явно упоминает это. Например, если пользователь отредактировал фотографию с помощью инструментов на сайте (поворот, обрезка), система должна обновить номер версии этого изображения. Генератор Sitemap обнаружит это изменение и обновит <lastmod>, гарантируя, что поисковая система проиндексирует новую версию.

Может ли этот метод помочь с индексацией новых страниц?

Да. В алгоритме (FIG. 2) указано, что если элемент отсутствует в последнем сгенерированном Sitemap (ITEM NOT PRESENT IN LAST GENERATED SITEMAP), он также обрабатывается как измененный. Для него устанавливается свежее время <lastmod>, что способствует его приоритетному сканированию и индексации.

Похожие патенты

Как Google использует метаданные XML Sitemap (lastmod, changefreq, priority) для планирования и приоритизации сканирования
Патент Google, описывающий фундаментальные механизмы протокола Sitemaps. Планировщик сканирования использует метаданные, предоставленные веб-сайтами: lastmod для предотвращения сканирования неизмененного контента, changefreq для прогнозирования обновлений и priority в качестве повышающего коэффициента (boost factor) в очереди сканирования, оптимизируя краулинговый бюджет.
  • US7769742B1
  • 2010-08-03
  • Краулинг

  • Техническое SEO

  • Свежесть контента

Как Google использует мобильные Sitemaps для выбора правильного краулера и оптимизации сканирования
Патент Google, описывающий механизм использования специализированных карт сайта (Sitemaps) для мобильного контента. Система позволяет вебмастерам указывать формат мобильных страниц (например, XHTML, WML). На основе этой информации Google выбирает соответствующий краулер (User-Agent) для корректного сканирования и индексирования мобильной версии сайта. Патент также детально описывает инфраструктуру обработки Sitemaps, включая использование метаданных (Priority, ChangeFreq, LastMod) для управления приоритетом и частотой сканирования.
  • US7653617B2
  • 2010-01-26
  • Краулинг

  • Индексация

  • Техническое SEO

Как Google заложил основу протокола Sitemaps для автоматической генерации и уведомления о списках URL
Этот фундаментальный патент описывает механизм, позволяющий веб-серверам автоматически генерировать Sitemaps (списки URL с метаданными, такими как дата изменения, частота обновления и приоритет), используя данные из файловой системы, логов доступа или CMS. Система также автоматически уведомляет поисковые системы о наличии обновленного Sitemap, решая проблемы неполного покрытия краулинга и повышая его эффективность.
  • US7801881B1
  • 2010-09-21
  • Краулинг

  • Техническое SEO

  • Индексация

Как Google отслеживает возраст отдельных фрагментов контента на странице и отличает существенные обновления от незначительных правок
Google использует систему для определения даты первой публикации отдельных фрагментов контента (например, предложений или абзацев). Система сегментирует контент и отслеживает его историю в «Карте дат» (Date Map). Используя нечеткое сравнение (Edit Distance) и нормализацию, система игнорирует незначительные правки и точно датирует только существенные обновления контента.
  • US8332408B1
  • 2012-12-11
  • Свежесть контента

  • Индексация

  • Техническое SEO

Как Google идентифицирует сайты, поддерживающие удаление контента, и ускоряет обновление индекса после запроса на удаление
Google разработал систему для идентификации контент-провайдеров, которые поддерживают стандартизированный процесс удаления контента (например, по DMCA или законам о приватности). Поисковая система обнаруживает эту возможность через Sitemap или проверку URL, помечает такие результаты в выдаче специальным индикатором и может ранжировать их выше. После запроса пользователя на удаление, система ускоряет повторное сканирование сайта и обновление индекса.
  • US8510286B1
  • 2013-08-13
  • Индексация

  • Краулинг

  • SERP

Популярные патенты

Как Google определяет географическую релевантность сайта по локали ссылающихся на него ресурсов и их аудитории
Google использует географические сигналы ссылающихся сайтов для определения локальной релевантности целевого домена. Система анализирует контент, технические данные и, что важно, географию аудитории ссылающихся ресурсов, чтобы вычислить «Link Based Locale Score». Эта оценка комбинируется с собственными сигналами сайта и используется для повышения позиций в релевантных географических регионах.
  • US8788490B1
  • 2014-07-22
  • Local SEO

  • Ссылки

  • SERP

Как Google использует клики пользователей в Поиске по Картинкам для определения реального содержания изображений
Google использует данные о поведении пользователей для автоматической идентификации содержания изображений. Если пользователи вводят определенный запрос (Идею) и массово кликают на конкретное изображение в результатах поиска, система ассоциирует это изображение с Концептом, производным от запроса. Это позволяет Google понимать, что изображено на картинке, не полагаясь исключительно на метаданные или сложный визуальный анализ, и улучшает релевантность ранжирования в Image Search.
  • US8065611B1
  • 2011-11-22
  • Поведенческие сигналы

  • Семантика и интент

  • Мультимедиа

Как Google использует историю запросов, сделанных на Картах, для ранжирования локальных результатов и рекламы
Google анализирует, что пользователи ищут, когда просматривают определенную географическую область на карте (Viewport). Эта агрегированная история запросов используется для определения популярности локальных бизнесов и контента в этом конкретном районе. Результаты, которые часто запрашивались в этой области, особенно недавно, получают значительное повышение в ранжировании.
  • US9129029B1
  • 2015-09-08
  • Local SEO

  • Поведенческие сигналы

  • Свежесть контента

Как Google собирает и структурирует данные о поведении пользователей в Поиске по картинкам (включая ховеры, клики и 2D-позицию)
Патент Google описывает инфраструктуру для детального сбора данных в Поиске по картинкам. Система фильтрует общие логи, фиксируя не только клики, но и наведение курсора (ховеры), длительность взаимодействия и точное 2D-расположение (строка/столбец) изображения на выдаче. Эти данные агрегируются в Модель Запросов Изображений для оценки релевантности.
  • US8898150B1
  • 2014-11-25
  • Поведенческие сигналы

  • SERP

  • Мультимедиа

Как Google использует вовлеченность пользователей на связанных страницах (Reachability Score) для ранжирования основного документа
Google рассчитывает «Оценку Достижимости» (Reachability Score), анализируя, как пользователи взаимодействуют со страницами, на которые ссылается основной документ (внутренние и исходящие ссылки). Если пользователи активно переходят по этим ссылкам (высокий CTR) и проводят время на целевых страницах (высокое время доступа), основной документ получает повышение в ранжировании. Этот механизм измеряет потенциальную глубину и качество пользовательской сессии.
  • US8307005B1
  • 2012-11-06
  • Поведенческие сигналы

  • Ссылки

  • SERP

Как Google A/B тестирует и оптимизирует сниппеты (заголовки, описания, изображения) для повышения CTR
Google использует механизм для оптимизации отображения контента (сниппетов). Система показывает разные варианты заголовков, описаний или изображений для одной и той же ссылки разным пользователям или на разных платформах. Затем она измеряет кликабельность (CTR) каждого варианта и выбирает наиболее эффективный для дальнейшего использования, учитывая также тип устройства пользователя.
  • US9569432B1
  • 2017-02-14
  • SERP

  • Поведенческие сигналы

  • Персонализация

Как Google идентифицирует и верифицирует локальные бизнесы для показа карт и адресов в органической выдаче
Google использует этот механизм для улучшения органических результатов. Система определяет, связана ли веб-страница с одним конкретным бизнесом. Затем она верифицирует ее локальную значимость, проверяя, ссылаются ли на нее другие топовые результаты по тому же запросу. Если страница верифицирована, Google дополняет стандартную «синюю ссылку» интерактивными локальными данными, такими как адреса и превью карт.
  • US9418156B2
  • 2016-08-16
  • Local SEO

  • SERP

  • Ссылки

Как Google использует историю поиска и ссылки с предпочитаемых пользователем сайтов для персонализации выдачи
Google может персонализировать результаты поиска, используя историю запросов или просмотров пользователя для создания набора предпочтений (Document Bias Set). Если документы из этого набора, особенно те, которые также признаны глобально качественными, ссылаются на результаты поиска, эти результаты переранжируются (повышаются или понижаются) в соответствии с весами предпочтений пользователя.
  • US8538970B1
  • 2013-09-17
  • Персонализация

  • Поведенческие сигналы

  • SERP

Как Google динамически перестраивает выдачу, если пользователь игнорирует результаты, связанные с определенной сущностью
Google использует механизм уточнения интента пользователя в реальном времени при обработке неоднозначных запросов. Система группирует результаты поиска по связанным сущностям. Если пользователь демонстрирует отсутствие интереса к одной из групп (например, прокручивает или смахивает результаты), система динамически модифицирует выдачу, понижая или удаляя все результаты, связанные с этой отклоненной сущностью.
  • US9348945B2
  • 2016-05-24
  • Семантика и интент

  • SERP

  • Поведенческие сигналы

Как Google использует визуальное расположение новостей на главных страницах СМИ для ранжирования в Google News
Google анализирует главные страницы авторитетных новостных сайтов («Hub Pages»), чтобы определить важность новостей. Система оценивает «визуальную заметность» (Prominence) ссылки на статью — ее расположение (выше/ниже), размер шрифта, наличие картинки и сниппета. Чем заметнее ссылка на сайте СМИ, тем выше статья ранжируется в агрегаторах новостей.
  • US8375073B1
  • 2013-02-12
  • EEAT и качество

  • SERP

  • Ссылки

seohardcore