SEO HARDCORE
  • Разборы патентов
    • Патенты Google
  • Скоро SEO инструменты
  • Скоро SEO аналитика
  • seohardcore
SEO HARDCORE
назад

Как Google использует математическую аппроксимацию (Ряд Тейлора) для быстрого расчета релевантности категорий к местоположению пользователя

DETERMINING RELEVANCE SCORES FOR LOCATIONS (Определение оценок релевантности для местоположений)
  • US8407211B1
  • Google LLC
  • 2010-12-16
  • 2013-03-26
  • Local SEO
  • SERP
  • Описание
  • Разбор
  • Выводы
  • Практика
  • FAQ
  • Похожие

Google использует механизм для быстрой оценки того, насколько релевантна определенная категория (например, «рестораны») для точного местоположения пользователя. Поскольку точный расчет занимает много ресурсов, система заранее вычисляет оценки и математические коэффициенты (Taylor coefficients) для опорных локаций. Затем она использует эти данные для быстрой аппроксимации релевантности в любой другой точке поблизости, ускоряя адаптацию поисковой выдачи, рекламы и подсказок.

Описание

Какую проблему решает

Патент решает проблему высокой вычислительной сложности при определении релевантности категории (например, бизнес-категории) к конкретному географическому местоположению в реальном времени. Расчет этой релевантности требует агрегации данных по большому количеству сущностей (например, отдельных бизнесов). Выполнение таких сложных вычислений для каждой уникальной локации пользователя (например, GPS-координат) является ресурсоемким и медленным.

Что запатентовано

Запатентована система для эффективной аппроксимации оценок релевантности категории к местоположению (category-location relevance scores). Система заранее рассчитывает точные оценки и производные (в виде Taylor coefficients) для набора предопределенных географических локаций. Когда требуется оценка для новой локации, система находит ближайшую предопределенную локацию и использует ее сохраненные коэффициенты и физическое расстояние для быстрой аппроксимации оценки с помощью разложения в ряд Тейлора (Taylor series).

Как это работает

Система работает в двух режимах:

  • Офлайн (Предварительный расчет): Система выбирает опорные географические локации. Для каждой локации и категории она рассчитывает общую оценку релевантности путем суммирования оценок релевантности отдельных сущностей (category-entity-location relevance scores). Затем она вычисляет и сохраняет Taylor coefficients для этой функции релевантности в данной точке.
  • Онлайн (Аппроксимация): Когда поступает запрос для новой локации пользователя, система идентифицирует ближайшую опорную локацию с сохраненными коэффициентами. Используя эти коэффициенты и расстояние между локациями, система быстро вычисляет аппроксимированное значение функции релевантности через Taylor series.

Актуальность для SEO

Средняя. Проблема эффективного вычисления геозависимых сигналов остается крайне актуальной. Хотя конкретный математический метод (Ряд Тейлора), описанный в патенте (подача 2010 г.), мог быть дополнен или заменен более современными методами машинного обучения, базовый принцип предварительного вычисления и быстрой аппроксимации является стандартной практикой в высоконагруженных системах.

Важность для SEO

Влияние на SEO-стратегии минимальное (3/10, Инфраструктура). Патент описывает внутренние механизмы повышения вычислительной эффективности Google и не вводит новых факторов ранжирования. Он не определяет, что делает категорию релевантной, а описывает, как быстро рассчитать эту релевантность в любой точке. Он подтверждает, что Google обладает инфраструктурой для использования сложных моделей локальной релевантности в реальном времени.

Детальный разбор

Термины и определения

Category (Категория)
Классификация сущностей. Примеры включают бизнес-категории, такие как рестораны, кинотеатры, общественный транспорт.
Entity (Сущность)
Отдельный элемент, принадлежащий категории (например, конкретный бизнес или точка интереса (POI)).
Category-location relevance score (Оценка релевантности категории к локации)
Агрегированная метрика, определяющая общую релевантность категории к заданному местоположению. Является результатом вычисления функции релевантности f(x)f(x).
Category-entity-location relevance score (Оценка релевантности сущности в категории к локации)
Метрика, определяющая релевантность отдельной сущности (y) к заданному местоположению (x). Является результатом вычисления подфункции (Sub-function) g(x,y)g(x, y). В патенте физическое расстояние часто используется как пример основы для этой оценки.
Prominent geographic locations (Значимые географические локации)
Опорные локации, для которых система заранее рассчитывает и сохраняет Taylor coefficients. Это могут быть густонаселенные районы, достопримечательности или локации, часто фигурирующие в запросах.
Taylor Coefficients (Коэффициенты Тейлора)
Значения производных функции релевантности f(x)f(x) в определенной точке. Используются для аппроксимации значения функции в соседних точках.
Taylor Series (Ряд Тейлора)
Математический метод аппроксимации функции в окрестности данной точки с использованием её производных (Коэффициентов Тейлора).
Automatic Differentiation (Автоматическое дифференцирование)
Метод, упомянутый в патенте для численной оценки производной функции, необходимый для вычисления коэффициентов Тейлора.

Ключевые утверждения (Анализ Claims)

Claim 1 (Независимый пункт): Описывает основной метод хранения и аппроксимации оценок релевантности.

  1. Система хранит category-location relevance scores для набора географических локаций.
  2. Ключевой механизм хранения: Хранение осуществляется путем сохранения Taylor coefficients для функции релевантности f(x)f(x) в этой локации. Функция f(x)f(x) определяется путем оценки подфункций g(x,y)g(x, y) для каждой сущности.
  3. Механизм аппроксимации: Для определения оценки в новой (первой) локации система выбирает сохраненную (вторую) локацию и вычисляет оценку на основе данных второй локации и physical distance (физического расстояния) между ними.
  4. Применение: Полученная оценка используется для выбора элемента (например, рекламы или подсказки запроса) из кандидатов путем их ранжирования и выбора наилучшего.

Claim 3 (Зависимый от 1): Уточняет природу данных.

Категория является business category, сущности — бизнесами. Оценка category-entity-location relevance score (подфункция g(x,y)g(x, y)) основана на physical distance между адресом бизнеса и географической локацией.

Claim 7 (Зависимый от 1): Уточняет метод аппроксимации.

Аппроксимация оценки включает вычисление ряда Тейлора (Taylor series) для функции, используя Taylor coefficients, сохраненные для второй локации, и physical distance между первой и второй локациями.

Где и как применяется

Изобретение является инфраструктурным и затрагивает этапы предварительного расчета данных и их использования в реальном времени для локализации результатов.

INDEXING – Индексирование и извлечение признаков
На этом этапе происходит офлайн-обработка. Система рассчитывает функцию релевантности f(x)f(x) и ее Taylor coefficients для предопределенных опорных локаций. Это требует доступа к базе данных сущностей (например, бизнесов) и их географических координат.

QUNDERSTANDING – Понимание Запросов
Механизм может использоваться для улучшения поисковых подсказок (query suggestions). Когда пользователь вводит часть запроса (query stub), система может быстро аппроксимировать релевантность различных категорий к текущему местоположению пользователя и предложить подсказки из наиболее релевантных категорий.

RANKING / RERANKING
Аппроксимированные оценки category-location relevance scores используются для выбора и ранжирования контента в реальном времени:

  • Локализация результатов: Ранжирование результатов поиска может быть скорректировано с учетом релевантности категорий, связанных с этими результатами, к локации пользователя.
  • Выбор рекламы: Система может использовать оценки для ранжирования и выбора локально релевантных рекламных объявлений (упомянуто в Claim 2).

Входные данные (Онлайн):

  • Точное местоположение пользователя (Первая локация).
  • Категория, для которой требуется оценка.
  • База данных опорных локаций (Вторые локации) с сохраненными Taylor coefficients.

Выходные данные (Онлайн):

  • Аппроксимированный category-location relevance score для запрошенной категории и локации.

На что влияет

  • Конкретные типы контента: В первую очередь влияет на локальный контент, страницы бизнесов (Local SEO), точки интереса (POI) и рекламу с гео-таргетингом.
  • Специфические запросы: Влияет на запросы с локальным интентом, а также на формирование поисковых подсказок, особенно на мобильных устройствах.
  • Конкретные ниши или тематики: Наибольшее влияние в нишах с высокой плотностью локальных бизнесов (ритейл, рестораны, услуги).

Когда применяется

  • Условия работы: Алгоритм аппроксимации применяется, когда требуется высокая скорость ответа (real-time) для определения category-location relevance score в локации, которая не совпадает с одной из предопределенных опорных локаций.
  • Триггеры активации: Запрос от другой системы (ранжирования, рекламы, подсказок) на получение локационной оценки релевантности, когда прямой расчет функции слишком ресурсоемок для выполнения онлайн.

Пошаговый алгоритм

Процесс А: Офлайн — Предварительный расчет коэффициентов

  1. Выбор опорной локации: Система выбирает географическую локацию (x) (например, из списка значимых локаций).
  2. Итерация по сущностям: Для определенной категории система перебирает все связанные сущности (Y).
  3. Вычисление подфункции: Для каждой сущности (y) вычисляется подфункция g(x,y)g(x, y) (например, на основе расстояния).
  4. Агрегация (Вычисление функции): Вычисляется функция релевантности f(x)f(x) как сумма значений подфункций: f(x)=∑y∈Yg(x,y)f(x) = \sum_{y \in Y} g(x, y).
  5. Вычисление производных: Система вычисляет производные функции f(x)f(x) в данной локации (например, используя Automatic Differentiation).
  6. Сохранение коэффициентов: Taylor coefficients, основанные на этих производных, сохраняются для данной опорной локации.
  7. Повтор: Процесс повторяется для всех опорных локаций и категорий.

Процесс Б: Онлайн — Аппроксимация оценки релевантности

  1. Получение запроса: Система получает запрос на category-location relevance score для новой локации (x).
  2. Поиск ближайшей опоры: Определяется ближайшая опорная локация (a), для которой сохранены Taylor coefficients.
  3. Вычисление ряда Тейлора: Система аппроксимирует f(x)f(x), используя сохраненные коэффициенты для точки (a) и расстояние (x-a). Используется конечный набор членов Taylor series.
  4. Предоставление оценки: Аппроксимированная оценка возвращается запросившей системе.

Какие данные и как использует

Данные на входе

Патент сосредоточен на инфраструктуре вычислений и использует следующие типы данных:

  • Географические факторы:
    • Координаты опорных локаций и координаты пользователя.
    • Адреса/координаты сущностей (бизнесов). Физическое расстояние (physical distance) между локацией пользователя и адресом сущности является ключевым элементом, используемым как основа для подфункции g(x,y)g(x, y) и для аппроксимации.
  • Структурные данные:
    • Привязка сущностей к категориям (например, какие бизнесы относятся к категории «Рестораны»).

Какие метрики используются и как они считаются

  • Category-entity-location relevance score (g(x,y)g(x, y)): Рассчитывается подфункцией. Конкретная формула не приводится, но в качестве основного примера используется физическое расстояние.
  • Category-location relevance score (f(x)f(x)): В офлайн-режиме рассчитывается точно как сумма g(x,y)g(x, y). В онлайн-режиме аппроксимируется с помощью Taylor series.
  • Taylor Coefficients: Рассчитываются путем дифференцирования функции f(x)f(x) в опорных точках. Формула коэффициента: f(n)(a)n!\frac{f^{(n)}(a)}{n!}.
  • Формула аппроксимации (Ряд Тейлора): Для аппроксимации функции f(x) в точке x используется разложение в точке a (ближайшая опорная локация): ∑n=0∞f(n)(a)n!(x−a)n\sum_{n=0}^{\infty} \frac{f^{(n)}(a)}{n!}(x-a)^n. На практике используется конечное число членов ряда.

Выводы

Патент описывает внутренние процессы Google, направленные на повышение вычислительной эффективности. Прямых рекомендаций для SEO он не дает, но позволяет лучше понять инфраструктуру локального поиска.

  1. Эффективность и скорость: Google готов использовать аппроксимацию вместо точного расчета для обеспечения максимальной скорости ответа в реальном времени. Это позволяет использовать сложные функции релевантности f(x)f(x) (включающие миллионы сущностей) без задержек.
  2. Релевантность на уровне категорий: Google системно оценивает релевантность не только отдельных сущностей, но и целых категорий к местоположению пользователя. Это используется для адаптации поисковых подсказок, рекламы и, возможно, смешивания результатов в выдаче.
  3. Влияние плотности и близости сущностей: Поскольку category-location relevance score является суммой оценок отдельных сущностей, а эти оценки часто базируются на расстоянии (согласно Claim 3), патент подтверждает, что плотность и близость релевантных бизнесов определяют локальную релевантность категории.
  4. Гиперлокализация: Механизм позволяет адаптировать выдачу на основе очень точного местоположения пользователя (например, GPS), а не только на уровне города или района.
  5. Зависимость от точных данных о сущностях: Эффективность системы напрямую зависит от точности координат сущностей (бизнесов), так как они являются основой для расчета функции f(x)f(x) и ее производных.

Практика

ВАЖНО: Патент является инфраструктурным и описывает методы вычислительной оптимизации. Он не дает прямых рекомендаций по SEO-оптимизации контента, но подтверждает фундаментальные принципы Local SEO.

Best practices (это мы делаем)

  • Обеспечение точности геолокационных данных (Local SEO): Критически важно поддерживать абсолютную точность адресов и координат в Google Business Profile (GBP) и других каталогах (NAP). Поскольку функция релевантности и ее производные рассчитываются на основе этих данных (в частности, расстояния), ошибки могут привести к неверной оценке релевантности вашего бизнеса к локации пользователя.
  • Правильная категоризация бизнеса: Система вычисляет релевантность на уровне категорий. Важно правильно выбирать основную и дополнительные категории в GBP, чтобы бизнес корректно учитывался при расчете агрегированной релевантности категории для данной местности.
  • Регистрация всех филиалов: Для сетевого бизнеса важно, чтобы каждая точка присутствия была зарегистрирована как отдельная сущность. Это увеличивает общую плотность сущностей и влияет на расчет category-location relevance score в районах присутствия.

Worst practices (это делать не надо)

  • Предоставление неточных адресов или координат: Это искажает входные данные для функции релевантности f(x)f(x) и подфункции g(x,y)g(x, y), что может привести к потере видимости в локальном поиске.
  • Создание виртуальных офисов для имитации присутствия: Этот патент является частью инфраструктуры, которая полагается на точное физическое расположение сущностей. Манипуляции с локацией противоречат принципам Google и несут риски пессимизации.

Стратегическое значение

Патент подтверждает стратегический фокус Google на гиперлокализации и мобильном поиске. Он демонстрирует инвестиции в инфраструктуру, позволяющую в реальном времени понимать, какие категории наиболее актуальны для пользователя в конкретной точке пространства. Для SEO это означает, что локальные сигналы (присутствие, близость) остаются критически важными, и их обработка становится все более точной и быстрой.

Практические примеры

Сценарий: Адаптация поисковых подсказок на основе локации

  1. Ситуация: Пользователь находится в центре крупного города (Локация А) и вводит поисковый запрос «Star».
  2. Обработка: Система понимания запросов запрашивает category-location relevance scores для Локации А.
  3. Расчет (Аппроксимация): Используя описанный механизм, система быстро определяет (аппроксимирует), что категория «Кофейни» имеет высокую релевантность в Локации А из-за высокой плотности кофеен поблизости.
  4. Результат: Система предлагает поисковую подсказку «Starbucks».
  5. Альтернативная ситуация: Тот же пользователь находится в обсерватории в горах (Локация Б) и вводит «Star».
  6. Расчет (Аппроксимация): Система аппроксимирует оценки для Локации Б и определяет, что категория «Астрономия» имеет высокую релевантность, а «Кофейни» — низкую.
  7. Результат: Система предлагает подсказку «Star gazing» или названия звезд.

Вопросы и ответы

Означает ли этот патент, что Google использует новые факторы ранжирования в локальном поиске?

Нет, этот патент не вводит новые факторы ранжирования. Он описывает математический метод (аппроксимация с помощью ряда Тейлора) для повышения эффективности вычислений уже существующих оценок релевантности. Патент объясняет, как Google может быстро рассчитать сложный локационный сигнал, а не то, из чего этот сигнал состоит.

Что такое «Category-location relevance score» и как он используется?

Это оценка того, насколько определенная категория (например, «рестораны») релевантна для конкретного местоположения. Она рассчитывается на основе количества и близости сущностей этой категории. Google использует эту оценку для адаптации поисковых подсказок, ранжирования локальных результатов и выбора релевантной рекламы в зависимости от того, где находится пользователь.

Почему Google просто не рассчитывает эти оценки в реальном времени, зачем нужна аппроксимация?

Расчет точной оценки может потребовать анализа миллионов сущностей (например, всех бизнесов в городе). Делать это за миллисекунды для каждого пользователя с уникальными GPS-координатами слишком ресурсоемко. Аппроксимация позволяет использовать заранее рассчитанные данные из ближайшей опорной точки и получить очень близкий к точному результат почти мгновенно.

Как этот патент влияет на работу с Google Business Profile (GBP)?

Патент подчеркивает критическую важность точности геолокационных данных в GBP. Координаты вашего бизнеса являются входными данными для расчета функции релевантности и ее производных (Taylor coefficients). Если ваши координаты указаны неверно, система не сможет корректно оценить релевантность вашего бизнеса и вашей категории в данной локации.

Что такое «Taylor coefficients» в контексте этого патента?

Taylor coefficients — это математическое представление того, как быстро меняется релевантность категории при смещении из данной точки в любом направлении (производные функции). Сохраняя эти коэффициенты в опорных точках, Google может предсказать, какой будет релевантность в соседней точке без необходимости заново пересчитывать все сущности.

Влияет ли этот механизм на десктопный поиск?

Да, если местоположение пользователя известно или если пользователь указывает конкретную локацию в запросе. Механизм универсален. Однако наибольшее значение он имеет для мобильного поиска, где локация пользователя известна точно и постоянно меняется.

Как определяются опорные локации (Prominent geographic locations) для предварительных расчетов?

Патент предлагает несколько вариантов. Это могут быть «значимые географические локации», такие как достопримечательности или популярные города. Также это могут быть локации, расположенные на равномерной сетке, чтобы гарантировать, что любая точка находится не дальше порогового расстояния от ближайшей опоры.

Если мой бизнес находится далеко от опорной локации, будет ли оценка релевантности менее точной?

Теоретически, точность аппроксимации с помощью ряда Тейлора снижается по мере удаления от опорной точки. Однако Google может контролировать это, размещая опорные локации достаточно плотно или используя большее количество коэффициентов Тейлора для повышения точности на большем расстоянии.

Основана ли релевантность сущности к локации только на расстоянии?

В патенте физическое расстояние (physical distance) приводится как основной пример реализации подфункции g(x,y)g(x, y) (Claim 3). Однако упоминается, что подфункция может использовать и другие сигналы. На практике Google использует множество факторов (рейтинг, отзывы, популярность), но расстояние остается фундаментальным.

Влияет ли это на Google Ads?

Да, в патенте прямо указано (Claim 2), что выбор элемента может включать выбор рекламы (ad) для пользователя, ассоциированного с определенным местоположением. Система может использовать аппроксимированную оценку релевантности категории рекламы для местоположения пользователя при ранжировании объявлений.

Похожие патенты

Как Google использует данные о кликах и запросах для определения схожести локальных бизнесов
Google определяет, насколько похожи друг на друга локальные бизнесы (например, рестораны), анализируя поведение пользователей. Система изучает, какие запросы вводят пользователи и как часто они кликают на конкретный бизнес в ответ на эти запросы. Сравнивая эти поведенческие профили, Google вычисляет меру сходства, учитывая распределение кликов и отфильтровывая общие или навигационные термины.
  • US9858291B1
  • 2018-01-02
  • Local SEO

  • Поведенческие сигналы

Как Google определяет 'эталонное расстояние' для локальных бизнесов, чтобы сбалансировать релевантность и близость похожих мест
Google использует механизм для определения списка похожих локальных бизнесов. Система агрегирует несколько списков похожих мест, ранжированных по разным сигналам (например, по типу кухни, по отзывам). Затем вычисляется 'эталонное расстояние' на основе того, как далеко находятся наиболее похожие бизнесы. Это расстояние используется для корректировки финального списка: слишком далекие места понижаются, даже если они очень похожи по тематике.
  • US10025830B1
  • 2018-07-17
  • Local SEO

Как Google определяет географическую релевантность документа, анализируя неоднозначные термины и названия мест
Google использует классификатор местоположений для определения географической привязки документа, даже если в нем нет точного адреса. Система анализирует неоднозначные термины (например, названия районов или улиц) и использует профили георелевантности (гистограммы), показывающие, где эти термины чаще всего используются. Перемножая эти профили, Google разрешает неоднозначность и вычисляет наиболее вероятное местоположение контента.
  • US7716162B2
  • 2010-05-11
  • Local SEO

  • Семантика и интент

  • Индексация

Как Google стандартизирует и расширяет географическую релевантность сайтов на соседние локации
Google использует систему Семантических Геотокенов для стандартизации упоминаний местоположений на веб-страницах. Система не только определяет точное местоположение, но и ассоциирует ресурс с соседними географическими областями. Это позволяет сайту ранжироваться по запросам в близлежащих локациях, даже если они явно не упомянуты на странице.
  • US8949277B1
  • 2015-02-03
  • Семантика и интент

  • Local SEO

  • Индексация

Как Google определяет, когда игнорировать местоположение пользователя и показывать глобальные результаты для уникальных сущностей
Google использует систему для динамического выбора между показом результатов, привязанных к предполагаемому местоположению пользователя (например, по IP или GPS), и глобальными результатами. Если глобальные результаты географически тесно сгруппированы вокруг определенного места, система может решить, что пользователь ищет конкретную уникальную сущность (например, известный ресторан в другом городе), и предпочтет эти глобальные результаты локальным.
  • US10037357B1
  • 2018-07-31
  • Local SEO

  • SERP

Популярные патенты

Как Google кластеризует похожие страницы, анализируя, куда пользователи переходят дальше (Co-visitation)
Google анализирует навигационные пути пользователей для определения схожести документов. Если после просмотра Страницы А и Страницы Б пользователи часто переходят к одному и тому же набору последующих страниц, Google считает Страницу А и Страницу Б похожими и объединяет их в кластер. Этот механизм позволяет определять тематическую близость на основе поведения пользователей.
  • US8650196B1
  • 2014-02-11
  • Поведенческие сигналы

  • SERP

  • Семантика и интент

Как Google использует клики и пропуски пользователей для оценки и корректировки правил близости терминов (Proximity Rules)
Google анализирует поведение пользователей для оценки эффективности правил близости (Proximity Rules), которые влияют на ранжирование в зависимости от расстояния между ключевыми словами на странице. Система отслеживает, кликают ли пользователи на результаты, где термины расположены далеко друг от друга, или пропускают их. На основе этих данных (Click Count, Skip Count) вычисляется оценка качества правила, что позволяет Google динамически адаптировать важность фактора близости.
  • US9146966B1
  • 2015-09-29
  • Поведенческие сигналы

  • SERP

Как Google использует визуальные цитаты и обратную связь для генерации и уточнения ответов в мультимодальном поиске
Google генерирует ответы на мультимодальные запросы (изображение + текст), находя визуально похожие изображения в интернете и используя текст с их исходных страниц как основу для LLM. Система показывает эти изображения как «визуальные цитаты» для подтверждения ответа и позволяет пользователям исключать нерелевантные источники, чтобы мгновенно уточнить сгенерированный результат.
  • US20240378236A1
  • 2024-11-14
  • Мультимедиа

  • EEAT и качество

  • Ссылки

Как Google использует погоду, время и местоположение для понимания истинного намерения пользователя и адаптации поисковой выдачи
Google анализирует, как физическое окружение (погода, время, местоположение) влияет на то, что ищут пользователи. Система выявляет корреляции между средой и поведением пользователей в прошлом (включая длительность кликов), чтобы лучше понять текущий интент многозначных запросов. Затем она переранжирует выдачу или переписывает запрос для предоставления наиболее релевантных результатов и рекламы.
  • US8898148B1
  • 2014-11-25
  • Семантика и интент

  • Поведенческие сигналы

  • Персонализация

Как Google улучшает результаты поиска, подбирая похожие "идеальные" запросы из логов и структурированных данных
Google идентифицирует запросы, которые стабильно показывают высокое вовлечение пользователей (CTR, долгие клики), и генерирует синтетические запросы из структурированных данных (например, частотного анкорного текста). Когда пользователь вводит похожий, но потенциально плохо сформулированный запрос, Google использует эти "аугментирующие запросы" для предоставления более качественных и релевантных результатов.
  • US9128945B1
  • 2015-09-08
  • SERP

  • Поведенческие сигналы

  • EEAT и качество

Как Google использует контекст внешних страниц для понимания и идентификации видео и аудио контента
Google анализирует внешние веб-страницы, которые ссылаются на медиафайлы или встраивают их (например, видео YouTube). Система извлекает метаданные из контекста этих страниц — заголовков, окружающего текста, URL. Надежность данных проверяется частотой их повторения на разных сайтах. Эта информация используется для улучшения понимания содержания медиафайла и повышения эффективности систем идентификации контента (Content ID).
  • US10318543B1
  • 2019-06-11
  • Ссылки

  • Индексация

  • Мультимедиа

Как Google использует модель предвзятости представления (Presentation Bias), чтобы отделить клики по релевантности от кликов по позиции
Google использует механизм для интерпретации поведения пользователей (CTR), который учитывает, как именно представлены результаты поиска. Система рассчитывает ожидаемый CTR для конкретной позиции и визуального оформления (сниппет, выделение). Чтобы получить буст от поведенческих факторов, реальный CTR документа должен значительно превышать этот ожидаемый уровень. Это позволяет отфильтровать клики, обусловленные высокой позицией или привлекательным сниппетом, и выделить сигналы истинной релевантности.
  • US8938463B1
  • 2015-01-20
  • Поведенческие сигналы

  • SERP

Как Google использует внешние сигналы (соцсети, новости, блоги) для верификации реальной популярности контента и фильтрации накруток
Google верифицирует популярность контента (например, видео) проверяя, упоминается ли он на внешних источниках: блогах, новостных сайтах и в социальных сетях. Это позволяет формировать списки "популярного", отражающие подлинный широкий интерес, отфильтровывая контент с искусственно завышенными просмотрами или узконишевой популярностью. Система также учитывает географическую релевантность внешних упоминаний.
  • US9465871B1
  • 2016-10-11
  • Антиспам

  • SERP

  • Ссылки

Как Google использует повторные клики, прямой трафик и время на сайте для расчета оценки качества домена и корректировки ранжирования
Google анализирует поведение пользователей на уровне домена (группы ресурсов) для вычисления модификатора ранжирования. Ключевые метрики включают долю повторных кликов (Repeat Click Fraction), долю прямого трафика (Deliberate Visit Fraction) и среднюю продолжительность визита (Average Duration). Эти данные используются для корректировки исходных оценок страниц сайта, понижая ресурсы с низкими показателями пользовательской лояльности и вовлеченности.
  • US9684697B1
  • 2017-06-20
  • Поведенческие сигналы

  • SERP

Как Google автоматически выбирает категории и контент для страниц сущностей, комбинируя данные о поведении пользователей и Knowledge Graph
Google использует механизм для автоматического создания страниц о сущностях (например, о фильмах или персонажах). Система определяет, какие категории (свойства) сущности наиболее интересны пользователям, сравнивая данные из Knowledge Graph с данными о том, что пользователи ищут или смотрят вместе с этой сущностью. Затем она наполняет эти категории популярным контентом.
  • US11036743B2
  • 2021-06-15
  • Knowledge Graph

  • Семантика и интент

  • Поведенческие сигналы

seohardcore