SEO HARDCORE
  • Разборы патентов
    • Патенты Google
  • Скоро SEO инструменты
  • Скоро SEO аналитика
  • seohardcore
SEO HARDCORE
назад

Как Google использует машинное обучение для распознавания разных смыслов запроса и ранжирования изображений в Image Search

USING SENSES OF A QUERY TO RANK IMAGES ASSOCIATED WITH THE QUERY (Использование смыслов запроса для ранжирования связанных с ним изображений)
  • US8923655B1
  • Google LLC
  • 2012-10-12
  • 2014-12-30
  • Семантика и интент
  • Мультимедиа
  • SERP
  • Описание
  • Разбор
  • Выводы
  • Практика
  • FAQ
  • Похожие

Google использует модель машинного обучения для улучшения ранжирования в поиске по картинкам. Система определяет различные смыслы (senses) неоднозначного запроса (например, "Jaguar" как автомобиль и как животное), проецирует изображения в многомерное пространство признаков и строит гиперплоскости (hyperplanes) для разделения этих смыслов. Итоговый ранг изображения определяется его близостью к любому из релевантных смыслов.

Описание

Какую проблему решает

Патент решает проблему ранжирования изображений для неоднозначных запросов, имеющих несколько смыслов (senses). Традиционный поиск по изображениям часто полагается на текст, окружающий картинку, который может быть зашумленным или нерелевантным визуальному контенту. Изобретение предлагает метод, который позволяет эффективно ранжировать изображения, гарантируя, что картинки, релевантные любому из действительных смыслов запроса, получат высокие позиции, одновременно отфильтровывая нерелевантный визуальный шум.

Что запатентовано

Запатентована система ранжирования изображений, которая явно моделирует множественные смыслы (senses) поискового запроса. Система использует модель машинного обучения (называемую в описании IMAX), которая совместно оптимизирует ранжирование по всем обнаруженным смыслам. Изображения проецируются в пространство признаков, где определяются гиперплоскости (hyperplanes) для отделения релевантных изображений (принадлежащих к определенному смыслу) от нерелевантных.

Как это работает

Механизм работает следующим образом:

  • Извлечение признаков и Маппинг: Изображения, представленные векторами признаков (например, визуальными характеристиками), проецируются как точки в многомерное пространство (D-dimensional space).
  • Обучение модели (Офлайн): Для запроса система обучается определять оптимальное количество смыслов S(q)S(q)S(q) и соответствующие им гиперплоскости (hyperplanes). Эти гиперплоскости разделяют пространство так, чтобы сгруппировать изображения, относящиеся к одному смыслу.
  • Расчет оценок: Оценка релевантности изображения рассчитывается на основе его расстояния до этих гиперплоскостей.
  • Агрегация оценок (MAX): Итоговая оценка изображения fq(x)f_q(x)fq(x) является максимальной оценкой среди всех смыслов (например, fq(x)=max⁡s∈S(q)fq,s(x)f_q(x) = \max_{s \in S(q)} f_{q,s}(x)fq(x)=maxs∈S(q)​fq,s(x)). Это означает, что изображение должно быть релевантно хотя бы одному смыслу, чтобы получить высокий ранг.
  • Ранжирование: Изображения сортируются на основе итоговой оценки.

Актуальность для SEO

Средняя/Высокая. Проблема неоднозначности запросов (query ambiguity) остается одной из центральных задач в поиске, особенно в визуальном поиске. Хотя конкретные методы машинного обучения, упомянутые в патенте (например, Kernel PCA, textons), могли эволюционировать в сторону глубоких нейронных сетей, базовая концепция моделирования множественных интентов и разделения пространства признаков остается высоко актуальной.

Важность для SEO

Патент имеет значительное влияние на SEO для изображений (Image SEO). Он демонстрирует, что Google активно стремится понять визуальный контекст и кластеризовать изображения по смыслу, а не просто по окружающему тексту. Для SEO-специалистов это подчеркивает критическую важность того, чтобы визуальное содержание изображения четко соответствовало одному из основных смыслов целевого запроса. Визуальные признаки (visual features) имеют приоритет над потенциально зашумленным текстом при определении релевантности смыслу.

Детальный разбор

Термины и определения

Sense (Смысл)
Конкретное значение или категория изображений, связанных с запросом. Например, для запроса "Jaguar" один смысл — это автомобиль, другой — животное.
Hyperplane (Гиперплоскость)
Подпространство в многомерном пространстве признаков, которое разделяет точки данных. В контексте патента гиперплоскость отделяет изображения, принадлежащие к определенному смыслу, от всех остальных.
Feature Space / D-dimensional space (Пространство признаков)
Многомерное математическое пространство, в которое проецируются изображения на основе их признаков (визуальных характеристик).
S(q) (Количество смыслов)
Количество семантических классов (смыслов) и, следовательно, гиперплоскостей, используемых моделью для данного запроса q. S(q)S(q)S(q) определяется автоматически для каждого запроса.
fq,s(x) (Оценка ранжирования по смыслу)
Оценка, вычисляемая функцией ранжирования для запроса q, смысла s и изображения x. Измеряет степень соответствия между изображением и конкретным смыслом запроса. fq,s(x)f_{q,s}(x)fq,s(x).
Wq,s (Векторы весов)
Параметры модели, определяющие положение и ориентацию гиперплоскости для конкретного запроса q и смысла s. Wq,sW_{q,s}Wq,s.
IMAX
Название, данное предложенному алгоритму/модели в разделе описания экспериментов.
Training Data (Обучающие данные)
Данные, используемые для обучения модели. Включают click-through based training data или human-annotated training data. Состоят из положительных (релевантных, X+X^+X+) и отрицательных (нерелевантных, X−X^-X−) примеров изображений для запроса.

Ключевые утверждения (Анализ Claims)

Claim 1 (Независимый пункт): Описывает основной метод ранжирования изображений.

  1. Система определяет набор изображений для запроса, причем изображения связаны с одним или несколькими смыслами (senses) запроса.
  2. Система проецирует (mapping) изображения в пространство (space), представляя каждое изображение точкой.
  3. Система определяет одну или несколько гиперплоскостей (hyperplanes) в этом пространстве на основе этих точек. Уточняется, что первая гиперплоскость связана с первым смыслом, а вторая — со вторым смыслом.
  4. Система рассчитывает оценки (scores) для изображений на основе точек и гиперплоскостей.
  5. Система ранжирует изображения на основе этих оценок.

Claim 6 (Зависимый от 1): Детализирует процесс проецирования (mapping) и пространственного разделения.

  1. Точки, связанные с первым смыслом, размещаются в первой области пространства.
  2. Точки, связанные со вторым смыслом, размещаются во второй области, отличной от первой.
  3. Точки, не связанные ни с первым, ни со вторым смыслом (нерелевантные), размещаются в третьей области, отличной от первых двух.

Это описывает цель обучения модели: добиться четкого пространственного разделения между разными смыслами и шумом.

Claim 8 (Зависимый от 1): Детализирует механизм расчета оценок (scoring).

  1. Определяется первая оценка (first score) на основе расстояния между конкретной точкой (изображением) и первой гиперплоскостью.
  2. Определяется вторая оценка (second score) на основе расстояния между этой же точкой и второй гиперплоскостью.
  3. Определяется итоговая оценка (particular score) для изображения на основе первой и второй оценок.

Claim 9 (Зависимый от 8): Определяет метод агрегации оценок.

Итоговая оценка равна первой оценке, если первая оценка больше второй. Итоговая оценка равна второй оценке, если вторая оценка больше первой. Это критически важный момент: используется функция MAX. Изображению достаточно быть высокорелевантным только одному смыслу, чтобы получить высокий итоговый балл.

Claim 10 (Зависимый от 8): Описывает альтернативный метод расчета итоговой оценки с использованием взвешивания.

  1. Определяется первая взвешенная оценка на основе первого веса и первой оценки.
  2. Определяется вторая взвешенная оценка на основе второго веса и второй оценки.
  3. Итоговая оценка определяется на основе взвешенных оценок.
  4. Уточняется, что веса могут базироваться на click-through rate (CTR) для изображений, связанных с соответствующим смыслом.

Это позволяет системе приоритизировать более популярные смыслы запроса.

Где и как применяется

Изобретение применяется в системе поиска по изображениям (Image Search Engine) и затрагивает несколько этапов поиска, а также офлайн-процессы обучения моделей.

INDEXING – Индексирование и извлечение признаков
На этом этапе из изображений извлекаются и сохраняются визуальные признаки (visual features). Описание упоминает гистограммы цвета и текстур (color and texton histograms). Также собираются данные для обучения (клики, метки).

(Офлайн-обработка / Обучение модели)
Это ключевой этап для данного патента. Модель обучается для конкретных запросов с использованием обучающих данных и признаков изображений. Система определяет количество смыслов S(q)S(q)S(q) и вычисляет параметры гиперплоскостей Wq,sW_{q,s}Wq,s.

RANKING – Ранжирование (в Image Search)
Когда поступает запрос, система использует предварительно обученную модель для этого запроса. Она вычисляет оценки fq(x)f_q(x)fq(x) для изображений-кандидатов на основе их признаков и изученных гиперплоскостей, после чего ранжирует их.

Входные данные (Online):

  • Запрос пользователя (q).
  • Изображения-кандидаты (x).
  • Векторы признаков для изображений-кандидатов.
  • Параметры предобученной модели (Wq,sW_{q,s}Wq,s, S(q)S(q)S(q)).

Выходные данные (Online):

  • Отсортированный список изображений на основе итоговых оценок fq(x)f_q(x)fq(x).

На что влияет

  • Специфические запросы: Наибольшее влияние оказывается на неоднозначные запросы (ambiguous queries), где одно и то же слово имеет несколько визуальных интерпретаций (например, "Apple", "Jaguar", "Palm", "Cell"). Это могут быть как информационные, так и коммерческие запросы.
  • Конкретные типы контента: Влияет на все типы изображений в индексе Image Search.

Когда применяется

  • Условия работы: Алгоритм применяется на этапе ранжирования для запросов, для которых система предварительно обучила модель.
  • Триггеры активации: Активируется в особенности для запросов, которые были идентифицированы как имеющие несколько смыслов (S(q)>1S(q)>1S(q)>1).
  • Временные рамки: Обучение модели происходит офлайн. Применение модели (расчет оценок и ранжирование) происходит в реальном времени при обработке запроса.

Пошаговый алгоритм

Процесс разделен на две части: офлайн-обучение и онлайн-ранжирование.

Процесс А: Офлайн-обучение модели (IMAX)

  1. Подготовка данных: Для запроса q собираются обучающие данные: положительные примеры X+X^+X+ (релевантные изображения) и отрицательные примеры X−X^-X− (нерелевантные). Извлекаются признаки изображений.
  2. Инициализация: Веса Wq,sW_{q,s}Wq,s инициализируются случайным образом.
  3. Выбор количества смыслов: Система перебирает разное количество смыслов S(q)S(q)S(q) (например, от 1 до 5).
  4. Оптимизация (SGD): Для каждого S(q)S(q)S(q) веса оптимизируются с использованием стохастического градиентного спуска (Stochastic Gradient Descent). Цель оптимизации — максимизировать маржу (margin) между положительными и отрицательными примерами, стремясь к тому, чтобы максимальная оценка положительного примера была больше максимальной оценки отрицательного примера плюс маржа (например, max⁡f(x+)>max⁡f(x−)+1\max f(x^+) > \max f(x^-) + 1maxf(x+)>maxf(x−)+1).
  5. Валидация и Сохранение: Выбирается модель с оптимальным S(q)S(q)S(q) (которая дает наименьшую ошибку валидации), и ее параметры сохраняются.

Процесс Б: Онлайн-ранжирование

  1. Получение запроса: Система получает запрос q от пользователя.
  2. Идентификация кандидатов: Определяется набор изображений-кандидатов.
  3. Извлечение модели и признаков: Загружаются предобученные параметры модели (Wq,sW_{q,s}Wq,s) для запроса q и векторы признаков для изображений-кандидатов x.
  4. Расчет оценок по смыслам: Для каждого изображения x рассчитывается оценка для каждого изученного смысла s: fq,s(x)=Wq,s⋅xf_{q,s}(x) = W_{q,s} \cdot xfq,s(x)=Wq,s⋅x (скалярное произведение векторов весов и признаков).
  5. Расчет итоговой оценки: Вычисляется финальная оценка путем выбора максимального значения среди всех оценок по смыслам: fq(x)=max⁡sfq,s(x)f_q(x) = \max_s f_{q,s}(x)fq(x)=maxsfq,s(x). (Или используется взвешенный максимум, если применяются веса на основе CTR, как описано в Claim 10).
  6. Ранжирование и Выдача: Изображения ранжируются по fq(x)f_q(x)fq(x) и предоставляются пользователю. Результаты могут быть сгруппированы по смыслам.

Какие данные и как использует

Данные на входе

  • Мультимедиа факторы (Визуальные признаки): Это основные данные для ранжирования. В описании упоминается использование "пространственных и/или многомасштабных гистограмм цвета и текстур (texton histograms)". Для снижения размерности этих признаков используется метод главных компонент ядра (Kernel Principal Component Analysis, Kernel PCA), например, до 100 измерений. Эти признаки формируют входные векторы (x).
  • Поведенческие факторы (Для обучения): Используются офлайн для обучения модели. Упоминаются click-through based training data — данные о том, сколько пользователей кликнули на изображение по данному запросу. Также (Claim 10) click-through rate может использоваться для взвешивания важности разных смыслов.
  • Контентные факторы (Для обучения и идентификации): Используются офлайн для обучения: human-annotated training data (изображения, размеченные людьми как релевантные/нерелевантные). Также (Claim 5) упоминается использование терминов (terms used to label) для первоначальной идентификации изображений.

Какие метрики используются и как они считаются

  • Оценка ранжирования по смыслу (fq,s(x)f_{q,s}(x)fq,s(x)): Рассчитывается как скалярное произведение вектора весов и вектора признаков изображения (Wq,s⋅xW_{q,s} \cdot xWq,s⋅x). Интерпретируется как расстояние от точки до гиперплоскости.
  • Итоговая оценка ранжирования (fq(x)f_q(x)fq(x)): Максимальная оценка среди всех смыслов: max⁡s∈S(q)fq,s(x)\max_{s \in S(q)} f_{q,s}(x)maxs∈S(q)​fq,s(x).
  • Количество смыслов (S(q)S(q)S(q)): Определяется во время обучения с помощью кросс-валидации.
  • Метрика оптимизации: Модель минимизирует функцию потерь ранжирования (ranking loss function / margin-based ranking error) с учетом ограничений на векторы весов (регуляризация, например, ∣∣Wq,s∣∣2≤C||W_{q,s}||^2 \le C∣∣Wq,s∣∣2≤C).
  • Веса смыслов (Claim 10): Опциональные веса, применяемые к оценкам на основе CTR, связанного с каждым смыслом.

Выводы

  1. Активное моделирование неоднозначности: Google не просто ищет совпадения, а активно моделирует неоднозначность в Image Search, идентифицируя различные "смыслы" (senses) для запроса.
  2. Ранжирование по принципу MAX (Claim 9): Ранжирование основано на релевантности любому действительному смыслу. Итоговая оценка — это максимальная оценка среди всех смыслов, а не среднее значение. Это позволяет разнообразным, но релевантным изображениям занимать высокие позиции.
  3. Приоритет визуальных признаков: Система в значительной степени полагается на визуальные признаки (цвет, текстуры) для различения смыслов, что снижает зависимость от окружающего текста, который может быть ненадежным.
  4. Использование гиперплоскостей для разделения: Модель (IMAX) использует hyperplanes в пространстве признаков для создания границ принятия решений, отделяя релевантные изображения от нерелевантных для каждого конкретного смысла.
  5. Автоматическое определение количества смыслов: Количество смыслов S(q)S(q)S(q) является переменным и определяется автоматически для каждого запроса во время офлайн-обучения.
  6. Учет популярности смыслов (Claim 10): Система может приоритизировать более популярные смыслы, взвешивая оценки на основе данных о кликах (CTR), что обеспечивает более релевантную выдачу для большинства пользователей.

Практика

Best practices (это мы делаем)

  • Обеспечение визуальной четкости и различимости: Изображения должны быть визуально четкими и являться сильными представителями предполагаемого смысла. Если вы оптимизируете под запрос "Jaguar" (автомобиль), изображение должно визуально однозначно идентифицироваться как автомобиль этой марки и не иметь признаков, которые могут быть спутаны с животным.
  • Оптимизация под основные смыслы запроса: Необходимо проанализировать выдачу и определить основные визуальные смыслы целевого запроса. Создаваемый визуальный контент должен четко соответствовать одному из этих основных смыслов, поскольку модель обучается распознавать их явным образом.
  • Усиление контекстуальных сигналов (для индексации и обучения): Хотя ранжирование в этой модели опирается на визуальные признаки, патент отмечает (Claim 5), что для первоначальной идентификации изображений и сбора обучающих данных используются связанные тексты и данные о кликах. Поддержание строгой контекстуальной релевантности на странице, где размещено изображение (текст, заголовки, alt-атрибуты), поможет Google правильно связать изображение с запросом и его смыслом на этапах индексации и обучения модели.

Worst practices (это делать не надо)

  • Использование визуально неоднозначных изображений: Размещение размытых, загроможденных изображений или изображений, которые плохо передают суть объекта. Их признаки, скорее всего, окажутся далеко от гиперплоскостей релевантных смыслов в пространстве признаков.
  • Несоответствие визуального ряда и текста: Попытка ранжирования изображения только за счет окружающего текста или alt-тегов, в то время как само изображение визуально нерелевантно или принадлежит к другому смыслу. В этой модели визуальные признаки доминируют при расчете оценки.
  • Использование кликбейтных изображений: Изображения, предназначенные для привлечения кликов, но не являющиеся репрезентативными для смысла запроса, будут плохо ранжироваться этой моделью, так как их визуальные признаки не будут соответствовать изученным гиперплоскостям.

Стратегическое значение

Этот патент подтверждает стратегический сдвиг в Image Search от анализа текста вокруг изображения к анализу самого изображения. Он подтверждает использование Google сложного машинного обучения для понимания визуального контента и неоднозначности интента. Для SEO это означает, что качество, четкость и визуальная релевантность самого изображения имеют первостепенное значение для ранжирования в поиске по картинкам.

Практические примеры

Сценарий: Оптимизация интернет-магазина под запрос "Bass"

Запрос "Bass" имеет как минимум два основных смысла: рыба (Fish) и музыкальный инструмент (Guitar).

  1. Анализ Смыслов: SEO-специалист определяет, что Google распознает оба смысла и строит для них отдельные гиперплоскости (hyperplanes).
  2. Действие (Смысл 1: Рыба, если магазин продает снасти): Использовать высококачественные, четкие фотографии басса (рыбы) или снастей, где рыба четко видна. Визуальные признаки (форма, цвет, текстура) должны позволить модели поместить изображение близко к гиперплоскости для смысла "рыба".
  3. Действие (Смысл 2: Гитара, если магазин продает инструменты): Использовать четкие изображения, фокусирующиеся на бас-гитаре. Модель обучила отдельную гиперплоскость для инструмента. Изображение должно быть чистым, без визуального шума, который мог бы сместить его в пространстве признаков.
  4. Ожидаемый результат: Обеспечивая визуальную четкость для конкретного смысла, изображение достигает высокой оценки для этого смысла (fq,s(x)f_{q,s}(x)fq,s(x)). Поскольку итоговая оценка является максимальной (MAX), изображение хорошо ранжируется по общему запросу "Bass", независимо от того, какой смысл пользователь предпочитает.

Вопросы и ответы

Применяется ли этот патент к веб-поиску или только к поиску по картинкам?

Патент описывает методы, специфичные для ранжирования изображений (Image Search). Он фокусируется на использовании визуальных признаков для разрешения неоднозначности запросов. Хотя общие принципы разрешения неоднозначности применяются и в веб-поиске, описанные здесь технические механизмы (гиперплоскости на основе визуальных гистограмм и текстур) относятся именно к поиску по картинкам.

Какие именно "признаки" (features) Google использует для анализа изображений согласно патенту?

Патент упоминает конкретные типы визуальных признаков: "пространственные и/или многомасштабные гистограммы цвета и текстур (texton histograms)". Это методы компьютерного зрения, которые описывают визуальное содержание изображения математически. Затем эти высокоразмерные данные обрабатываются с помощью Kernel PCA для создания компактного представления (например, 100-мерного вектора), используемого моделью.

Как Google решает, сколько смыслов (senses) имеет запрос?

Количество смыслов S(q)S(q)S(q) определяется автоматически во время офлайн-обучения модели. Система тестирует разное количество смыслов (например, от 1 до 5) и выбирает то количество, которое обеспечивает наилучшую производительность (наименьшую ошибку) на валидационном наборе данных. Это процесс кросс-валидации.

Если у запроса несколько смыслов, отдает ли Google предпочтение одному из них?

Да, это возможно. Claim 10 описывает механизм взвешивания оценок разных смыслов. Веса могут базироваться на click-through rate (CTR) для каждого смысла. Если пользователи значительно чаще кликают на изображения, относящиеся к смыслу А, чем к смыслу Б, система может присвоить смыслу А больший вес, тем самым отдавая ему предпочтение в ранжировании.

Что означает "Гиперплоскость" (Hyperplane) в этом контексте?

В машинном обучении Hyperplane — это граница принятия решений в многомерном пространстве признаков. Если представить все изображения как точки в этом пространстве, гиперплоскость делит это пространство на две части. В данном патенте для каждого смысла создается своя гиперплоскость, которая отделяет изображения, релевантные этому смыслу, от всех остальных. Оценка изображения определяется его расстоянием до этой гиперплоскости.

Насколько важен текст, окружающий изображение, согласно этому патенту?

Текст играет вспомогательную роль. Он важен на начальных этапах: для первоначальной идентификации изображений-кандидатов (Claim 5) и для сбора обучающих данных (например, через аннотации или анализ кликов по запросам). Однако сам механизм ранжирования, описанный в патенте, основан на анализе визуальных признаков изображения, а не окружающего текста.

Как система обрабатывает изображение, которое релевантно двум разным смыслам одновременно?

Система использует функцию MAX для определения итоговой оценки (Claim 9). Если изображение релевантно обоим смыслам, оно получит высокие оценки от обеих соответствующих гиперплоскостей. Итоговая оценка будет равна наибольшей из этих двух оценок. Таким образом, такие изображения будут ранжироваться очень высоко.

Что такое алгоритм "IMAX", упомянутый в описании?

IMAX — это внутреннее название, данное авторами патента предложенной модели ранжирования. Это модель машинного обучения, которая оптимизирует ранжирование, явно учитывая множественные смыслы запроса и используя функцию MAX для агрегации оценок по разным смыслам.

Обучается ли эта система в режиме реального времени?

Нет. Обучение модели, включая определение количества смыслов и расчет гиперплоскостей, происходит офлайн с использованием исторических данных (логи кликов, аннотации). В режиме реального времени, когда пользователь вводит запрос, система применяет уже обученную модель для быстрого расчета оценок и ранжирования изображений.

Каков основной вывод для оптимизации изображений товаров в e-commerce?

Ключевой вывод — абсолютная необходимость визуальной четкости и однозначности изображений товаров. Изображение товара должно быть максимально репрезентативным для своего типа. Это гарантирует, что его визуальные признаки будут расположены близко к гиперплоскости соответствующего смысла запроса, что приведет к высокому Ranking Score.

Похожие патенты

Как Google комбинирует визуальное сходство и семантические метки для улучшения поиска по картинке (Visual Search)
Google использует систему поиска по изображению, которая сочетает анализ визуальных характеристик и семантических меток. Система генерирует высокоточные метки (High Confidence Labels) для изображения, анализируя текст, связанный с визуально похожими картинками в интернете. Затем она ранжирует кандидатов, используя модель визуального сходства, обученную на основе человеческих оценок, и применяет правила фильтрации для обеспечения однородности результатов.
  • US8429173B1
  • 2013-04-23
  • Семантика и интент

  • Мультимедиа

  • SERP

Как Google использует машинное обучение для ранжирования в Поиске по Картинкам, динамически взвешивая сигналы изображения и посадочной страницы
Google использует модель машинного обучения для ранжирования изображений, которая совместно обрабатывает признаки запроса, самого изображения и посадочной страницы, на которой оно размещено. Это позволяет системе динамически определять важность визуальных характеристик изображения и контекста страницы в зависимости от конкретного запроса, улучшая релевантность выдачи.
  • US20200201915A1
  • 2020-06-25
  • Мультимедиа

  • SERP

Как Google связывает изображения с семантическими сущностями для устранения неоднозначности в поиске по картинкам
Google использует систему для понимания того, что именно изображено на картинке, связывая её с конкретной семантической сущностью (например, статьей в Wikipedia или Freebase). Это позволяет устранить неоднозначность (понимать разницу между «Ягуаром» машиной и животным) и предоставлять более точные результаты при поиске по изображению (например, в Google Lens).
  • US9171018B2
  • 2015-10-27
  • Семантика и интент

  • Knowledge Graph

  • Мультимедиа

Как Google использует query-specific модели для переранжирования изображений на основе их визуальных характеристик в реальном времени
Google использует систему для корректировки ранжирования изображений непосредственно в момент запроса (онлайн). Для популярных запросов система заранее обучает индивидуальные модели релевантности на основе исторических данных о кликах. При получении нового запроса система активирует наиболее подходящую модель и использует визуальные характеристики (цвет, текстура) для переоценки и переранжирования результатов, обеспечивая точное соответствие визуального контента интенту пользователя.
  • US10311096B2
  • 2019-06-04
  • Мультимедиа

  • SERP

  • Поведенческие сигналы

Как Google комбинирует текстовый запрос и изображение-образец для уточнения поиска по картинкам
Google использует механизм для обработки гибридных запросов (текст + изображение). Система находит изображения, которые одновременно релевантны тексту и визуально похожи на образец. Для этого создаются компактные визуальные дескрипторы и используются "визуальные ключи" для быстрого поиска. Финальная выдача ранжируется по степени визуального сходства с образцом.
  • US9043316B1
  • 2015-05-26
  • Мультимедиа

  • Семантика и интент

Популярные патенты

Как Google планировал использовать цифровые подписи для расчета репутации авторов (Agent Rank) независимо от сайта публикации
Патент Google, описывающий концепцию "Agent Rank". Система предлагает авторам (агентам) использовать цифровые подписи для подтверждения авторства контента. Это позволяет рассчитывать репутационный рейтинг агента, используя алгоритмы, подобные PageRank, на основе того, кто ссылается на их подписанный контент. Этот рейтинг затем используется для влияния на ранжирование, независимо от того, где контент опубликован.
  • US7565358B2
  • 2009-07-21
  • EEAT и качество

  • Ссылки

Как Google использует фразы и тематические кластеры из истории пользователя для персонализации результатов поиска
Google может строить модель интересов пользователя, анализируя семантически значимые фразы и тематические кластеры в контенте, который пользователь потребляет (просматривает, сохраняет, печатает). При последующих запросах система повышает в ранжировании те документы, которые содержат фразы, одновременно релевантные запросу и присутствующие в профиле интересов пользователя.
  • US7580929B2
  • 2009-08-25
  • Персонализация

  • Семантика и интент

  • Поведенческие сигналы

Как Google использует модель D-Q-D и поведение пользователей для предложения разнообразных запросов, связанных с конкретными результатами поиска
Google использует модель "Документ-Запрос-Документ" (D-Q-D), построенную на основе данных о поведении пользователей (клики, время просмотра), для генерации связанных поисковых подсказок. Система предлагает альтернативные запросы, привязанные к конкретному результату, только если эти запросы ведут к новому, разнообразному набору документов, облегчая исследование смежных тем.
  • US8583675B1
  • 2013-11-12
  • Поведенческие сигналы

  • SERP

  • Семантика и интент

Как Google использует личную историю поиска и профиль интересов для персонализации подсказок Autocomplete
Google персонализирует поисковые подсказки (Autocomplete), используя профиль интересов пользователя, созданный на основе его прошлых запросов и кликов. Система сравнивает тематику потенциальных подсказок с интересами пользователя и повышает в списке те варианты, которые соответствуют его предпочтениям, с учетом актуальности этих интересов.
  • US20140108445A1
  • 2014-04-17
  • Персонализация

  • Поведенческие сигналы

  • Семантика и интент

Как Google переносит поведенческие сигналы через ссылки для повышения в ранжировании первоисточников контента
Google использует механизм для корректного учета поведенческих сигналов (например, времени пребывания). Если пользователь кликает на результат в выдаче, а затем переходит по ссылке на другую страницу, система может перенести позитивные сигналы с исходной страницы на целевую. Это позволяет повышать в рейтинге первоисточники информации, а не страницы-посредники.
  • US8959093B1
  • 2015-02-17
  • Поведенческие сигналы

  • Ссылки

  • SERP

Как Google использует данные веб-поиска и клики пользователей для классификации бизнесов и построения иерархии категорий
Google анализирует логи веб-поиска (введенные ключевые слова и последующие клики по результатам), чтобы понять, как пользователи интуитивно классифицируют бизнесы. Эти данные используются для автоматического построения динамической иерархической структуры категорий. Эта структура затем применяется для улучшения точности поиска, в частности, для оптимизации моделей распознавания речи в голосовых системах.
  • US7840407B2
  • 2010-11-23
  • Поведенческие сигналы

  • Семантика и интент

  • Структура сайта

Как Google использует социальный граф и активность друзей для персонализации и переранжирования результатов поиска
Google использует данные из социального графа пользователя и активность его контактов (лайки, шеры, комментарии, плейлисты) для изменения ранжирования результатов поиска. Контент, одобренный социальным окружением, повышается в выдаче и сопровождается аннотациями, объясняющими причину повышения и указывающими на свежесть социального действия.
  • US8959083B1
  • 2015-02-17
  • Персонализация

  • Поведенческие сигналы

  • SERP

Как Google определяет географическую зону релевантности бизнеса на основе реального поведения пользователей (Catchment Areas)
Google определяет уникальную "зону охвата" (Catchment Area) для локального бизнеса, анализируя, из каких географических точек пользователи кликали на его результаты в поиске. Эта динамическая зона заменяет фиксированный радиус и используется для фильтрации кандидатов при локальном поиске, учитывая известность бренда, категорию бизнеса и физические препятствия.
  • US8775434B1
  • 2014-07-08
  • Local SEO

  • Поведенческие сигналы

Как Google автоматически распознает сущности в тексте и связывает их в Knowledge Graph с помощью динамических поисковых ссылок
Google использует автоматизированную систему для поддержания связей между сущностями (объектами) в своем хранилище фактов (Knowledge Graph). Система сканирует текст, статистически определяет значимые фразы и сверяет их со списком известных объектов. При совпадении создается динамическая «поисковая ссылка» вместо фиксированного URL. Это позволяет Google постоянно обновлять связи по мере добавления новых знаний.
  • US8260785B2
  • 2012-09-04
  • Knowledge Graph

  • Семантика и интент

  • Ссылки

Как Google использует «Локальный авторитет» для переранжирования документов на основе их взаимосвязей внутри конкретной выдачи
Google может улучшить ранжирование, анализируя структуру ссылок внутри начального набора результатов поиска. Документы, на которые часто ссылаются другие высокорелевантные документы по этому же запросу («локальные эксперты»), получают повышение. Этот процесс включает строгие фильтры для обеспечения независимости этих ссылок-голосов.
  • US6526440B1
  • 2003-02-25
  • Ссылки

  • Антиспам

  • SERP

seohardcore