SEO HARDCORE
  • Разборы патентов
    • Патенты Google
  • Скоро SEO инструменты
  • Скоро SEO аналитика
  • seohardcore
SEO HARDCORE
назад

Как Google учитывает объем трафика для загрузки страницы при ранжировании, особенно для пользователей с лимитированным интернетом

RANKING A SEARCH RESULT DOCUMENT BASED ON DATA USAGE TO LOAD THE SEARCH RESULT DOCUMENT (Ранжирование документа в результатах поиска на основе объема данных, необходимого для загрузки документа)
  • US9201929B1
  • Google LLC
  • 2013-08-09
  • 2015-12-01
  • Техническое SEO
  • Индексация
  • Описание
  • Разбор
  • Выводы
  • Практика
  • FAQ
  • Похожие

Google может измерять объем данных, необходимый для полной загрузки веб-страницы (включая HTML, изображения, скрипты). Этот показатель используется как условный сигнал ранжирования: более "легкие" страницы могут получать преимущество, особенно если система определяет, что пользователь находится в сети с ограниченной пропускной способностью или лимитированным тарифным планом.

Описание

Какую проблему решает

Патент решает проблему ухудшения пользовательского опыта у людей, использующих интернет в условиях ограничений трафика (например, лимитированные тарифные планы мобильной связи или низкая пропускная способность сети). Загрузка "тяжелых" веб-страниц приводит к излишнему расходу данных и увеличению времени ожидания. Цель изобретения — скорректировать ранжирование так, чтобы отдавать предпочтение более эффективным с точки зрения потребления данных ресурсам, когда это уместно.

Что запатентовано

Запатентована система, которая измеряет объем данных, необходимый для загрузки документа (data measure), и использует этот показатель как сигнал ранжирования. Ключевой особенностью является условное применение этого сигнала: он активируется или усиливается, когда система определяет, что запрос, вероятно, отправлен через limited data plan (лимитированный тарифный план), и/или когда запрос является не навигационным (non-navigational).

Как это работает

Система работает в два этапа:

  • Индексирование: Модуль (Document Data Usage Module) во время сканирования определяет объем данных, необходимый для полной отрисовки документа (включая HTML и все связанные ресурсы: изображения, скрипты и т.д.). Этот показатель (data measure) сохраняется в индексе.
  • Ранжирование: При получении запроса модуль анализа (Query Analysis Module) оценивает контекст (тип запроса, предполагаемый тип сети пользователя). Если условия соблюдены (например, обнаружен limited data plan), система корректирует ранжирование. Более "легкие" документы получают повышение. Если обнаруживаются документы с похожим контентом (similar content), предпочтение отдается тому, который требует меньше данных для загрузки.

Актуальность для SEO

Высокая. С ростом мобильного трафика и сохраняющейся актуальностью проблемы стоимости и скорости данных во многих регионах мира, эффективность загрузки остается критически важной. Этот патент напрямую связан с общим направлением Google на улучшение Page Experience и Core Web Vitals, поскольку объем передаваемых данных напрямую влияет на скорость загрузки в реальных условиях.

Важность для SEO

Влияние на SEO значительно, но специфично. Патент подчеркивает важность технической оптимизации и эффективности ресурсов (изображений, скриптов). Хотя сигнал применяется условно (в основном при обнаружении limited data plan), он критически важен для стратегий мобильного SEO и продвижения на международных рынках с дорогой или медленной мобильной связью. Оптимизация под этот патент синергична с оптимизацией под Core Web Vitals.

Детальный разбор

Термины и определения

Data Measure (Показатель объема данных)
Метрика, связанная с документом, которая указывает на объем данных (трафика), необходимый для его загрузки и отрисовки. Может быть фактическим измеренным значением (в байтах, кБ, МБ) или нормализованной оценкой.
Document Data Usage Module (Модуль оценки объема данных документа)
Компонент системы индексирования, отвечающий за доступ к документу, измерение объема трафика при его загрузке и сохранение Data Measure.
Document Similarity Module (Модуль схожести документов)
Компонент системы ранжирования, который определяет, содержат ли два или более документа похожий контент (similar content).
Limited Data Plan (Лимитированный тарифный план)
Условие подключения пользователя, при котором объем потребляемых данных ограничен или тарифицируется помегабайтно. Обнаружение этого условия является ключевым триггером для активации алгоритма.
Navigational Query (Навигационный запрос)
Запрос, указывающий на намерение найти конкретный веб-сайт или страницу (например, "facebook"). Для таких запросов алгоритм может отключаться.
Non-navigational Query (Не навигационный запрос)
Запрос (информационный или транзакционный), не имеющий целью конкретный сайт. Для таких запросов алгоритм применяется с большим весом.
Query Analysis Module (Модуль анализа запросов)
Компонент, определяющий характеристики запроса и контекст пользователя, в частности, является ли запрос навигационным и используется ли Limited Data Plan.

Ключевые утверждения (Анализ Claims)

Claim 1 (Независимый пункт): Описывает основной процесс ранжирования с учетом объема данных и контекста пользователя.

  1. Система получает поисковый запрос.
  2. Определяется, что запрос, вероятно, отправлен через limited data plan.
  3. Идентифицируются релевантные документы.
  4. Определяется first data measure для первого документа (на основе данных, полученных при предыдущем извлечении документа).
  5. Первый документ ранжируется относительно других документов на основе (i) first data measure И (ii) факта определения limited data plan.

Ядро изобретения заключается в условном применении фактора объема данных: ранжирование корректируется только тогда (или сильнее), когда система считает, что пользователь ограничен в потреблении трафика.

Claim 2, 3, 4 (Зависимые): Детализируют сценарий с похожими документами.

  1. Определяется, что второй документ похож на первый.
  2. Определяется second data measure для второго документа.
  3. Ранжирование первого документа относительно второго основывается на сравнении их data measures (Claim 3).
  4. Если data measure первого документа указывает на меньшее потребление данных, чем у второго, первый документ ранжируется выше (Claim 4).

Если контент схож, система предпочитает более "легкую" версию.

Claim 5 (Зависимый): Добавляет дополнительное условие.

Ранжирование на основе data measure происходит, только если запрос определен как non-navigational.

Claim 6, 7, 8 (Зависимые): Описывают механизм корректировки оценки.

  1. Определяется начальный рейтинг (initial ranking) документа, не зависящий от data measure (Claim 6).
  2. Начальный рейтинг модифицируется на основе data measure.
  3. Если data measure пропорционален объему данных, модификация может происходить путем умножения начальной оценки релевантности (initial relevance score) на величину, обратную data measure (1 / Data Measure) (Claim 8).

Это математически означает, что чем больше объем данных, тем ниже итоговая оценка.

Claim 13 (Зависимый): Уточняет механизм взвешивания.

Вес (weighting) фактора data measure в ранжировании зависит от степени вероятности (likelihood) того, что запрос отправлен через limited data plan.

Где и как применяется

Изобретение затрагивает несколько этапов поиска, связывая данные индексирования с контекстом запроса для корректировки ранжирования.

INDEXING – Индексирование и извлечение признаков
На этом этапе работает Document Data Usage Module. Он загружает документ и все необходимые для его отрисовки ресурсы (изображения, JS, CSS) и измеряет общий объем потребленных данных. Полученный Data Measure сохраняется в индексе вместе с идентификатором документа.

QUNDERSTANDING – Понимание Запросов
На этом этапе работает Query Analysis Module. Он анализирует запрос и контекст пользователя в реальном времени, чтобы определить:

  • Является ли запрос навигационным или нет.
  • Какова вероятность того, что пользователь использует Limited Data Plan (на основе IP, типа сети и т.д.).

RANKING / RERANKING – Ранжирование и Переранжирование
Основное применение патента. Ranking Engine использует результаты этапа QUNDERSTANDING как триггеры.

  1. Применение сигнала: Если обнаружен Limited Data Plan и/или запрос Non-navigational, Data Measure используется как сигнал ранжирования (например, для модификации initial relevance score).
  2. Обработка схожести: Document Similarity Module может идентифицировать документы с похожим контентом. В этом случае их взаимное ранжирование определяется сравнением их Data Measures.

Входные данные:

  • Запрос пользователя и контекстные данные (сеть, устройство).
  • Набор релевантных документов из индекса.
  • Предварительно рассчитанные Data Measures для этих документов.
  • Начальные оценки релевантности (Initial relevance scores).

Выходные данные:

  • Скорректированный набор результатов поиска, где позиции документов изменены с учетом объема данных, необходимого для их загрузки.

На что влияет

  • Конкретные типы контента: Сильнее всего влияет на страницы с большим количеством неоптимизированных медиафайлов (изображения, видео), избыточным кодом JavaScript и многочисленными сторонними скриптами (реклама, аналитика).
  • Определенные форматы контента: Дает преимущество оптимизированным форматам (например, легким мобильным версиям) перед тяжелыми десктопными версиями при поиске с мобильных устройств.
  • Географические факторы: Имеет критическое значение в регионах, где распространены медленные мобильные сети (например, 2G/3G) или дорогие тарифные планы с оплатой за трафик.

Когда применяется

Алгоритм применяется выборочно, при выполнении определенных условий:

  • Триггер активации 1 (Основной): Система определяет высокую вероятность того, что запрос отправлен пользователем, использующим limited data plan.
  • Триггер активации 2 (Уточняющий): Запрос классифицирован как non-navigational. Для навигационных запросов фактор может игнорироваться, так как пользователь хочет попасть на конкретный сайт независимо от его размера.
  • Условие сравнения: Когда в выдаче присутствуют два или более документа, идентифицированных как имеющие similar content.

Пошаговый алгоритм

Процесс А: Измерение объема данных (Этап Индексирования)

  1. Идентификация документа: Система обнаруживает документ для индексации.
  2. Доступ и загрузка: Document Data Usage Module загружает документ, эмулируя поведение браузера (загрузка HTML и всех связанных ресурсов для отрисовки).
  3. Измерение: Определяется общий объем данных (трафика), использованный для загрузки. Это может быть среднее значение по нескольким загрузкам, если контент динамический (например, реклама).
  4. Сохранение: Идентификатор документа ассоциируется с рассчитанным Data Measure в индексе.

Процесс Б: Ранжирование (Real-time)

  1. Получение запроса.
  2. Анализ контекста (QUNDERSTANDING): Query Analysis Module определяет вероятность использования Limited Data Plan и классифицирует запрос (Navigational/Non-navigational).
  3. Определение веса фактора: На основе анализа контекста определяется вес (weighting) для Data Measure. Если вероятность Limited Data Plan низкая, вес может быть нулевым или минимальным.
  4. Идентификация и начальное ранжирование: Система находит релевантные документы и рассчитывает initial relevance scores.
  5. Анализ схожести (Опционально): Document Similarity Module проверяет наличие документов с похожим контентом среди кандидатов.
  6. Корректировка ранжирования:
    • Сценарий 1 (Общий): Если вес фактора > 0, initial relevance scores модифицируются с учетом Data Measure (например, делением на Data Measure).
    • Сценарий 2 (Схожий контент): Если найдены похожие документы, их взаимное ранжирование корректируется так, чтобы документ с меньшим Data Measure получил более высокую позицию.
  7. Предоставление результатов: Формируется финальная выдача.

Какие данные и как использует

Данные на входе

  • Технические факторы: Общий объем байтов, загруженных при доступе к документу. Это включает размер HTML-кода, CSS, JavaScript, изображений, шрифтов, видео и других ресурсов, необходимых для отрисовки страницы.
  • Пользовательские факторы: Данные об устройстве и подключении пользователя (например, IP-адрес, User-Agent, информация о сети, MAC-адрес, cookies), которые используются для определения вероятности использования Limited Data Plan.
  • Поведенческие факторы (косвенно): История кликов (selection rate) по запросу может использоваться для определения, является ли запрос Navigational (например, если один результат получает подавляющее большинство кликов).
  • Контентные факторы: Текст, метаданные, ключевые слова, сущности (entities) используются для определения схожести контента между документами.

Какие метрики используются и как они считаются

  • Data Measure: Измеряется путем фактической загрузки документа и подсчета использованного трафика на этапе индексирования.
  • Likelihood of Limited Data Plan: Вероятностная оценка, основанная на контексте пользователя.
  • Формулы и алгоритмы расчета: Патент предлагает несколько вариантов корректировки рейтинга:
    • Умножение начальной оценки на обратную величину Data Measure (Claim 8):

Выводы

  1. Эффективность использования данных как фактор ранжирования: Google запатентовал механизм, позволяющий использовать объем трафика, необходимый для загрузки страницы, в качестве прямого сигнала ранжирования. Более "легкие" страницы имеют преимущество.
  2. Условное применение сигнала (Контекст пользователя): Это не универсальный фактор ранжирования. Согласно основному пункту формулы (Claim 1), он активируется или усиливается, когда система определяет, что пользователь, вероятно, использует limited data plan. Это делает фактор критически важным для мобильного SEO и определенных географических регионов.
  3. Приоритет для не навигационных запросов: Система спроектирована так, чтобы не мешать пользователям находить конкретные сайты (navigational queries), даже если они "тяжелые". Фактор применяется в основном к информационным и транзакционным запросам.
  4. Конкурентное преимущество при схожем контенте: Если несколько сайтов предлагают одинаковый или очень похожий контент (например, новостные агрегаторы, синдицированный контент, стандартные описания товаров), система предпочтет ту версию, которая требует меньше данных для загрузки.
  5. Измерение на этапе индексирования: Data Measure рассчитывается заранее, что позволяет использовать его в ранжировании в реальном времени без задержек на измерение. Измеряется общий объем данных для отрисовки, а не только размер HTML.

Практика

Best practices (это мы делаем)

  • Оптимизация медиа-ресурсов: Это самый важный аспект. Необходимо использовать современные форматы изображений (WebP, AVIF), применять адаптивное сжатие и гарантировать, что размеры изображений соответствуют размерам области просмотра. Это напрямую уменьшает Data Measure.
  • Эффективное использование кода и минимизация ресурсов: Применять минификацию и сжатие (Gzip, Brotli) для CSS и JavaScript. Удалять неиспользуемый код (Tree Shaking). Это уменьшает объем передаваемых текстовых данных.
  • Оптимизация сторонних скриптов: Аудит и минимизация использования тяжелых сторонних скриптов (рекламные сети, чаты, аналитика), которые значительно увеличивают общий объем загрузки страницы.
  • Использование Lazy Loading: Применять отложенную загрузку для изображений и видео, которые находятся за пределами первой области просмотра. Это уменьшает объем данных, необходимых для начальной отрисовки страницы, что вероятно учитывается при расчете Data Measure.
  • Фокус на мобильной оптимизации и International SEO: Учитывать, что этот фактор ранжирования наиболее активен для пользователей в сетях с ограничениями. Если целевая аудитория находится в регионах с дорогой мобильной связью, оптимизация объема данных становится приоритетом.

Worst practices (это делать не надо)

  • Игнорирование оптимизации изображений: Загрузка изображений высокого разрешения без сжатия и масштабирования для мобильных устройств приведет к высокому Data Measure и потенциальному понижению в ранжировании.
  • Раздутый (Bloated) код и фреймворки: Использование избыточно тяжелых CSS/JS фреймворков без очистки от неиспользуемых компонентов увеличивает объем загрузки.
  • Агрессивная загрузка рекламы и трекеров: Перегрузка страниц многочисленными рекламными блоками и скриптами отслеживания, которые потребляют значительный объем трафика. Патент явно указывает, что реклама учитывается при измерении.
  • Автовоспроизведение тяжелого контента: Автоматический запуск видео или анимаций при загрузке страницы значительно увеличивает потребление данных.

Стратегическое значение

Патент подтверждает важность технического SEO и производительности не только с точки зрения скорости, но и с точки зрения эффективности использования данных. Он демонстрирует, что Google учитывает экономические и инфраструктурные ограничения пользователей при ранжировании. Стратегически это означает, что оптимизация Page Experience и Core Web Vitals дает преимущество не только за счет улучшения метрик скорости, но и за счет снижения Data Measure, что может быть решающим фактором в конкурентных нишах, особенно при работе с мобильным трафиком.

Практические примеры

Сценарий 1: Выбор между сайтами с одинаковым товаром (Схожий контент)

  1. Контекст: Пользователь в Индии ищет "купить кроссовки Nike Air Max" с мобильного телефона через сеть 3G. Google определяет это как limited data plan и non-navigational query.
  2. Кандидаты: Сайт A и Сайт B продают одну и ту же модель по схожей цене. Document Similarity Module определяет, что описания товара очень похожи.
  3. Измерение: Сайт A использует неоптимизированные JPG и много сторонних скриптов (Data Measure = 2.5 MB). Сайт B использует WebP и оптимизированный код (Data Measure = 800 KB).
  4. Результат: Система активирует алгоритм и ранжирует Сайт B выше Сайта A, основываясь на сравнении их Data Measures, чтобы сэкономить трафик пользователя.

Сценарий 2: Общее понижение тяжелого сайта (Модификация оценки)

  1. Контекст: Пользователь ищет информационный запрос в условиях ограниченной сети.
  2. Кандидаты: Сайт C имеет релевантный контент, но его Data Measure составляет 5 MB из-за автовоспроизводимого видео и большого количества рекламы.
  3. Результат: Система применяет корректировку к начальной оценке релевантности Сайта C (например, используя формулу

Вопросы и ответы

Как именно Google измеряет объем данных (Data Measure) для страницы?

Согласно патенту, измерение происходит на этапе индексирования с помощью Document Data Usage Module. Этот модуль эмулирует загрузку страницы браузером, запрашивая не только HTML-код, но и все связанные ресурсы, необходимые для полной отрисовки (изображения, скрипты, стили, рекламу). Data Measure — это общий объем трафика, потребленного во время этой эмуляции.

Заменяет ли этот патент факторы скорости загрузки (например, Core Web Vitals)?

Нет, не заменяет, но тесно с ними связан. Core Web Vitals измеряют скорость и отзывчивость с точки зрения пользователя, а Data Measure измеряет эффективность использования данных (объем трафика). Оптимизация объема данных (уменьшение Data Measure) почти всегда положительно влияет на метрики скорости. Этот патент добавляет дополнительный стимул для оптимизации, фокусируясь на экономии трафика пользователя.

Как Google определяет, что у пользователя лимитированный тарифный план (Limited Data Plan)?

Патент не детализирует методы определения, но указывает, что Query Analysis Module использует данные, представленные с запросом (IP-адрес, MAC-адрес, cookies). На практике это может включать анализ типа сети (мобильная связь 2G/3G/4G), географическое положение пользователя (регионы с дорогой связью) или использование API для определения характеристик подключения.

Если мой сайт "тяжелый", он вообще не будет ранжироваться?

Будет, но он может быть пессимизирован в определенных условиях. Если система не обнаружит limited data plan у пользователя или если запрос будет классифицирован как навигационный (пользователь ищет именно ваш сайт), фактор Data Measure может не применяться или иметь низкий вес. Однако в условиях медленного интернета ваш сайт будет проигрывать более легким конкурентам.

Что делать, если у меня много синдицированного контента или стандартных описаний?

Это ситуация, где данный патент может дать значительное преимущество. Если ваш контент схож с контентом конкурентов (что определяется Document Similarity Module), решающим фактором может стать эффективность загрузки. Необходимо убедиться, что ваши страницы технически более оптимизированы и требуют меньше данных для загрузки, чем у конкурентов, публикующих тот же контент.

Влияет ли реклама на Data Measure?

Да, влияет. Патент указывает, что измеряется объем данных, необходимый для загрузки страницы, включая инструкции (например, JavaScript), используемые в рекламе. Если на странице много тяжелых рекламных блоков, это увеличит Data Measure и может негативно сказаться на ранжировании в описанных условиях.

Как быть с динамическим контентом, где размер страницы меняется?

Патент предусматривает это. Для документов с меняющимся контентом (например, из-за динамической рекламы или частых обновлений блога) Data Measure может рассчитываться как среднее значение по результатам нескольких извлечений документа (например, среднее за последние X загрузок).

Если я использую Lazy Loading, будет ли учитываться контент за пределами первого экрана?

Патент указывает, что может измеряться объем данных, необходимый для загрузки "по крайней мере части документа" или для "первоначальной полной отрисовки". Если Lazy Loading реализован корректно, контент за пределами экрана не должен загружаться сразу. Это предполагает, что Lazy Loading является эффективным способом снижения Data Measure, измеренного для начальной загрузки.

Какая формула используется для понижения рейтинга?

Патент предлагает несколько вариантов. Один из них (Claim 8) — умножение начальной оценки на величину, обратную Data Measure (т.е. деление на объем данных). Другой вариант, описанный в тексте патента, — деление на квадратный корень из Data Usage. В обоих случаях, чем больше данных требуется, тем сильнее понижение.

Может ли тяжелая, но очень популярная страница быть понижена этим алгоритмом?

Возможно, нет. В описании патента упоминается возможность использования Data Measure как сигнала ранжирования только для документов с популярностью (например, selection rate) ниже определенного порога. Это может предотвратить понижение очень популярных документов, даже если они "тяжелые". Также алгоритм не должен применяться к навигационным запросам.

Похожие патенты

Как Google отображает размер и стоимость загрузки страниц в результатах поиска для пользователей с лимитированным интернетом
Google использует систему для информирования пользователей о размере и предполагаемой стоимости загрузки веб-страницы до того, как пользователь нажмет на ссылку. Это предназначено для пользователей с лимитированными или дорогими тарифными планами (metered networks). В результатах поиска могут отображаться метки с указанием размера (КБ/МБ) или стоимости загрузки в местной валюте. Система также позволяет пользователям фильтровать результаты поиска, исключая слишком «тяжелые» или дорогие страницы.
  • US20130246312A1
  • 2013-09-19
  • SERP

Как Google использует реальные данные о скорости загрузки страниц (RUM) для повышения быстрых и понижения медленных сайтов в выдаче
Google собирает данные о времени загрузки страниц у реальных пользователей (RUM) и использует их для корректировки ранжирования. Система сравнивает скорость сайта с глобальными порогами, основанными на процентилях. Если сайт медленнее большинства других (например, медленнее 85% или 96%), его рейтинг понижается. Очень быстрые сайты могут получать повышение. Оценка скорости учитывает географию и тип устройства пользователя.
  • US8645362B1
  • 2014-02-04
  • Техническое SEO

  • Поведенческие сигналы

  • SERP

Как Google использует данные о показах для оценки эффективности генерации превью и сниппетов
Google измеряет, насколько полно сгенерированы "быстрые данные для предпросмотра" (сниппеты, превью) для страниц, которые реально показываются пользователям. Патент описывает статистический метод сэмплирования и взвешивания по показам, который позволяет эффективно оценить это "покрытие", уделяя больше внимания популярным страницам.
  • US8438155B1
  • 2013-05-07
  • SERP

Как Google рассчитывает и использует оценки Mobile-Friendliness для ранжирования результатов и маркировки сайтов
Google рассчитывает Mobile-Friendliness Score, рендеря страницы как мобильное устройство и оценивая такие сигналы, как размер кликабельных элементов, читаемость текста, настройки области просмотра (viewport) и скорость загрузки. Эта оценка используется для повышения позиций удобных для мобильных страниц в мобильном поиске и для добавления метки «Mobile-Friendly» в поисковой выдаче.
  • US20160314215A1
  • 2016-10-27
  • Техническое SEO

  • Индексация

Как Google использует машинное обучение и поведенческие данные для прогнозирования полезности документов и решает, что включать в поисковый индекс
Google использует модель машинного обучения для определения, какие документы включать в поисковый индекс. Модель обучается на исторических данных о кликах и показах, чтобы предсказать будущую «оценку полезности» (Utility Score) документа. Документы ранжируются по этой оценке, а также с учетом других факторов (например, PageRank, стоимость индексации, свежесть, квоты), и лучшие из них попадают в индекс.
  • US8255386B1
  • 2012-08-28
  • Индексация

  • Поведенческие сигналы

Популярные патенты

Как Google генерирует «синтетический анкорный текст», анализируя структуру и контекст ссылающихся страниц
Google анализирует структурно похожие страницы, ссылающиеся на различные ресурсы. Определяя, где известные поисковые запросы (Seed Queries) появляются в структуре этих ссылающихся страниц (например, в заголовках или Title), Google создает шаблоны. Эти шаблоны затем используются для извлечения текста из аналогичных мест на других страницах, создавая «синтетический описательный текст» (аналог анкорного текста) для целевых ресурсов. Это улучшает ранжирование, даже если фактический анкорный текст низкого качества.
  • US9208232B1
  • 2015-12-08
  • Ссылки

  • Структура сайта

  • Семантика и интент

Как Google использует генеративный ИИ для создания динамических и гиперперсонализированных бизнес-профилей
Google разрабатывает систему, которая заменяет статические бизнес-профили динамическими «курируемыми профилями», генерируемыми ИИ (например, LLM). Эти профили адаптируются в реальном времени под конкретного пользователя, учитывая его запрос, предпочтения, историю поиска и демографию, чтобы показать наиболее релевантный контент, продукты и описания бренда.
  • US20250054045A1
  • 2025-02-13
  • Персонализация

  • Поведенческие сигналы

  • Семантика и интент

Как Google (YouTube) анализирует трафик конкурирующих видео для рекомендации улучшений метаданных
Google использует систему для анализа конкуренции между видео на основе общих поисковых запросов и времени просмотра. Система выявляет поисковые запросы, которые приводят трафик на конкурирующие (например, производные) видео, и сравнивает их с метаданными оригинального видео. Если обнаруживаются релевантные термины, отсутствующие у оригинала, они рекомендуются автору для улучшения видимости.
  • US10318581B2
  • 2019-06-11
  • Поведенческие сигналы

  • Мультимедиа

  • Семантика и интент

Как Google использует данные о кликах пользователей (CTR и Click Ratio) для определения официального сайта по навигационным запросам
Google анализирует журналы запросов, чтобы определить, какой результат пользователи подавляюще предпочитают по конкретному запросу. Если результат демонстрирует исключительно высокий CTR и/или Click Ratio по популярному запросу, система помечает его как «авторитетную страницу». Затем этот результат может отображаться на выдаче с особым выделением, потенциально переопределяя стандартное ранжирование.
  • US8788477B1
  • 2014-07-22
  • Поведенческие сигналы

  • EEAT и качество

  • SERP

Как Google определяет скрытый интент сессии, используя универсальные уточняющие слова, и переранжирует выдачу
Google идентифицирует универсальные слова-модификаторы (например, «фото», «отзывы», «pdf»), которые пользователи часто добавляют к разным запросам. Если такое слово появляется в сессии, система определяет скрытый интент пользователя. Затем Google переранжирует выдачу, основываясь на том, какие документы исторически предпочитали пользователи с таким же интентом, адаптируя результаты под контекст сессии.
  • US8868548B2
  • 2014-10-21
  • Семантика и интент

  • Поведенческие сигналы

  • Персонализация

Как Google использует клики пользователей в поиске по картинкам для понимания содержания изображений и улучшения таргетинга
Google анализирует поведение пользователей в поиске по картинкам для идентификации содержания изображений. Если пользователи ищут определенный запрос (идею) и массово кликают на конкретное изображение в результатах, система связывает это изображение с данным запросом (концепцией). Эти данные используются для улучшения ранжирования в поиске картинок и для предложения релевантных ключевых слов рекламодателям, загружающим схожие изображения.
  • US11409812B1
  • 2022-08-09
  • Поведенческие сигналы

  • Семантика и интент

  • SERP

Как Google обучает ИИ-модели для автоматической оценки качества сайтов на основе данных асессоров и предвзятой выборки
Патент Google, описывающий фундаментальную методологию создания систем оценки качества сайтов. Google использует машинное обучение (например, SVM), чтобы найти корреляции между оценками асессоров и измеримыми сигналами сайта (PageRank, клики). Для повышения точности применяется метод «предвзятой выборки» (Biased Sampling): система намеренно собирает больше оценок для сайтов среднего качества («сложных случаев»), чем для очевидно плохих или хороших.
  • US8442984B1
  • 2013-05-14
  • SERP

  • EEAT и качество

  • Поведенческие сигналы

Как Google использует данные о выделении текста пользователями (явно или неявно) для генерации сниппетов и анализа контента
Google может собирать данные о том, какие фрагменты текста пользователи выделяют на веб-страницах, используя специальные инструменты или просто выделяя текст мышью. Эти данные агрегируются для определения наиболее важных частей документа. На основе этой "популярности" Google может динамически генерировать поисковые сниппеты, включающие наиболее часто выделяемые фрагменты.
  • US8595619B1
  • 2013-11-26
  • Поведенческие сигналы

  • SERP

Как Google персонализирует поисковую выдачу, анализируя историю кликов и поведение пользователя на сайте
Google использует механизм для персонализации поисковой выдачи на основе истории взаимодействия пользователя с результатами поиска. Система отслеживает, какие сайты пользователь выбирает, как долго он на них остается (Dwell Time), частоту и контекст выбора. Основываясь на этих данных, предпочитаемые пользователем ресурсы повышаются в ранжировании при его последующих запросах.
  • US9037581B1
  • 2015-05-19
  • Персонализация

  • Поведенческие сигналы

  • SERP

Как Google подменяет ссылки в выдаче, чтобы обойти медленные редиректы на мобильные версии сайтов
Google оптимизирует скорость загрузки, определяя, когда клик по результату поиска вызовет условный редирект (например, с десктопной версии на мобильную). Система заранее подменяет исходную ссылку в выдаче на конечный URL редиректа. Это позволяет устройству пользователя сразу загружать нужную страницу, минуя промежуточный запрос и экономя время.
  • US9342615B2
  • 2016-05-17
  • Техническое SEO

  • SERP

  • Ссылки

seohardcore