Как Google обновляет индекс визуального поиска в реальном времени, используя динамические и статические индексы

SYSTEMS AND METHODS FOR DYNAMIC VISUAL SEARCH ENGINE (Системы и методы для динамической визуальной поисковой системы)

US8898139B1
Google LLC
2012-06-22
2014-11-25

Патент Google, описывающий инфраструктуру визуального поиска (например, Google Images, Lens). Система использует два индекса: быстрый «Динамический индекс» для немедленного добавления новых изображений (несжатые данные) и основной «Статический индекс» (сжатый и распределенный по шардам) для масштабного поиска. Патент объясняет, как эти индексы периодически объединяются без прерывания работы системы.

Какую проблему решает

Патент решает фундаментальную инфраструктурную проблему масштабирования систем визуального поиска: как поддерживать огромный индекс изображений, который одновременно является эффективным для поиска и актуальным (свежим). Эффективность требует сжатия данных (Compressed Image Descriptors) и их распределения (Sharding), что затрудняет быстрое обновление. Актуальность требует возможности немедленного добавления новых изображений в индекс. Патент предлагает архитектуру, совмещающую эти требования без остановки работы поисковой системы.

Что запатентовано

Запатентована двухкомпонентная система индексации для визуального поиска. Она включает Динамический индекс (несжатый, быстрый для записи) для немедленного добавления новых изображений и Статический индекс (сжатый, шардированный, быстрый для чтения) для основного масштабного поиска. Ключевым элементом является механизм (Index Manager) для периодического и бесшовного слияния данных из динамического индекса в статический путем создания новых версий шардов и их подмены без простоя.

Как это работает

Система работает по следующему принципу:

Индексация: Новые изображения (Reference Images) обрабатываются, их дескрипторы извлекаются и помещаются в Динамический индекс в несжатом виде. Они сразу становятся доступны для поиска.
Поиск: При получении запроса (Query Image) система ищет совпадения одновременно в Статическом и Динамическом индексах. Результаты объединяются.
Слияние (Merging): Когда Динамический индекс достигает определенного порога (размера или количества записей), Index Manager инициирует миграцию. Данные из Динамического индекса классифицируются, сжимаются и объединяются с данными Статического индекса, создавая новые версии шардов.
Бесшовная замена (Swapping): Старые шарды заменяются новыми версиями «на лету», часто по одному (one-by-one), что позволяет системе продолжать обслуживать запросы без прерывания.
Очистка: После подтверждения слияния данные удаляются из Динамического индекса.

Актуальность для SEO

Высокая (для инфраструктуры визуального поиска). С ростом популярности Google Images и развитием технологий вроде Google Lens, необходимость в масштабируемых и быстро обновляемых системах визуального распознавания критична. Описанный гибридный подход к индексации является стандартной практикой в высоконагруженных системах.

Важность для SEO

Влияние на SEO-стратегии минимальное (1/10). Это инфраструктурный патент, описывающий внутренние механизмы хранения и обновления индекса визуального поиска. Он не раскрывает алгоритмов ранжирования изображений, факторов релевантности или сигналов качества. Патент полезен для понимания того, как быстро визуальный контент попадает в индекс, но не дает прямых рекомендаций для SEO-оптимизации.

Термины и определения

Image Descriptor (Дескриптор изображения) / Image Feature (Признак изображения): Математическое представление (например, вектор чисел) визуальных характеристик изображения или его части, обычно вокруг точки интереса (Image Interest Point). Используется для сравнения изображений.
Static Index (Статический индекс): Основной индекс визуальной поисковой системы. Хранит дескрипторы в сжатом виде (Compressed Image Descriptors) для экономии памяти и повышения скорости поиска. Разделен на множество частей (шардов).
Dynamic Index (Динамический индекс): Временный индекс, хранящий дескрипторы в несжатом виде (Uncompressed Image Descriptors). Оптимизирован для быстрой вставки новых изображений, позволяя им становиться доступными для поиска немедленно. Может храниться в оперативной памяти (RAM).
Database Shard (Шард базы данных) / Set of image features (Набор признаков изображения): Отдельная часть (партиция) Статического индекса. Шардирование позволяет распределить индекс по нескольким серверам и обновлять его по частям.
Index Manager (Менеджер индекса): Компонент системы, отвечающий за мониторинг Динамического индекса, инициацию миграции данных в Статический индекс и управление заменой шардов.
Exemplars (Эталоны/Экземпляры): Представители кластеров (центроиды) в пространстве дескрипторов. Используются для партиционирования (шардирования) и сжатия индекса. Дескрипторы могут группироваться в шард на основе ближайшего к ним эталона.
Query Image (Изображение-запрос): Изображение, предоставленное пользователем для поиска.
Reference Image (Эталонное изображение): Изображение, добавляемое в индекс поисковой системы.

Ключевые утверждения (Анализ Claims)

Claim 1 (Независимый пункт): Описывает основной процесс миграции данных из динамического индекса в статический.

Система определяет необходимость миграции признаков (image features) из Динамического индекса (хранит в несжатой форме) в Статический индекс (хранит в сжатой форме). Оба индекса используются для поиска.
В ответ на это система классифицирует несжатые признаки из Динамического индекса в соответствии со схемой классификации (classification scheme) Статического индекса, определяя, к какому существующему набору признаков (шарду) они относятся.
Система сжимает эти классифицированные признаки.
Генерируется новый набор признаков (replacement set), включающий (i) новые сжатые признаки и (ii) существующие сжатые признаки из соответствующего набора.
Существующий набор признаков в Статическом индексе заменяется новым (replacement set).

Claim 2 и 3 (Зависимые): Уточняют условия инициации миграции (Шаг 1 из Claim 1).

Миграция инициируется, когда количество признаков (Claim 2) или общий размер данных (Claim 3) в Динамическом индексе превышает заданный порог (threshold).

Claim 6 (Зависимый): Описывает завершающий этап миграции.

После того как признаки были классифицированы и успешно перенесены (путем замены шарда), эти же признаки удаляются (deleting/purging) из Динамического индекса.

Claim 8 (Зависимый): Уточняет процесс классификации и объединения (Шаги 2 и 4 из Claim 1), предлагая альтернативный вариант реализации.

Процесс классификации может включать декомпрессию существующих признаков из соответствующего набора (шарда) Статического индекса и объединение этих декомпрессированных признаков с новыми несжатыми признаками из Динамического индекса. Это подразумевает, что для создания обновленного шарда может потребоваться совместная обработка (и последующее сжатие) старых и новых данных.

Где и как применяется

Изобретение относится к инфраструктуре исключительно визуального поиска (Google Images, Google Lens) и затрагивает этапы индексирования и ранжирования в этой вертикали.

INDEXING – Индексирование и извлечение признаков
Это основной этап применения патента. На этом этапе происходит обработка новых изображений. Их дескрипторы извлекаются и немедленно помещаются в Динамический индекс. Также этот этап включает фоновый процесс (управляемый Index Manager) периодической миграции и консолидации данных из Динамического индекса в Статический индекс.

RANKING – Ранжирование (Этап отбора кандидатов)
Во время выполнения запроса система запускает параллельный поиск. First Search Engine ищет совпадения в шардах Статического индекса, а Second Search Engine ищет в Динамическом индексе. Это гарантирует полноту выдачи, включая самые свежие данные. Система спроектирована так, чтобы процесс слияния не прерывал процесс поиска.

Входные данные:

Новые изображения (Reference Images) для добавления в индекс.
Изображения-запросы (Query Images).
Существующие данные Статического и Динамического индексов.
Критерии партиционирования (например, Exemplars).

Выходные данные:

Результаты поиска (совпадающие изображения и их метаданные).
Обновленный Статический индекс и очищенный Динамический индекс (после завершения миграции).

На что влияет

Конкретные типы контента: Влияет исключительно на изображения и видео-кадры, обрабатываемые системами визуального поиска. Не влияет на ранжирование текстовых веб-страниц.
Свежесть (Freshness): Основное влияние — на скорость появления новых изображений в поиске. Система гарантирует, что добавленный визуальный контент индексируется и становится доступным почти мгновенно.
Конкретные ниши: Наибольшее влияние в нишах с высокой частотой появления новых изображений (Новости, E-commerce).

Когда применяется

При добавлении контента: Система постоянно принимает новые изображения и записывает их в Динамический индекс.
При обработке запросов: Система постоянно использует оба индекса для ответа на поисковые запросы.
Триггеры активации миграции: Процесс миграции запускается периодически. Триггером служит достижение порогового значения размера Динамического индекса (по количеству изображений, количеству дескрипторов или использованию памяти), срабатывание расписания или ручная команда.

Пошаговый алгоритм

Система работает в трех параллельных режимах.

Процесс А: Добавление изображения (Real-time)

Получение данных: Система получает новое эталонное изображение (Reference Image).
Извлечение признаков: Из изображения извлекаются дескрипторы (Image Descriptors).
Запись в Динамический индекс: Несжатые дескрипторы сохраняются в Динамическом индексе.
Обеспечение доступности: Изображение немедленно становится доступным для поиска.

Процесс Б: Обработка запроса (Real-time)

Получение запроса: Система получает изображение-запрос (Query Image).
Извлечение признаков: Извлекаются дескрипторы запроса.
Параллельный поиск: Запускается поиск совпадений одновременно в Статическом индексе (по всем шардам) и в Динамическом индексе.
Объединение результатов: Результаты из обоих индексов объединяются, ранжируются и предоставляются пользователю.

Процесс В: Миграция индекса (Фоновый процесс)

Мониторинг и Триггер: Index Manager отслеживает размер Динамического индекса. При превышении порога инициируется миграция.
Определение критериев: Определяются критерии партиционирования (например, Exemplars), используемые в статическом индексе.
Классификация: Несжатые дескрипторы из Динамического индекса анализируются и распределяются по соответствующим шардам согласно этим критериям.
Создание новых шардов (Replacement Sets): Генерируются новые версии шардов, объединяющие старые и новые данные. Возможны варианты:
- Вариант 1 (Claim 1): Новые дескрипторы сжимаются и добавляются к существующим сжатым данным шарда.
- Вариант 2 (Claim 8): Существующие данные шарда декомпрессируются, объединяются с новыми несжатыми данными, и весь набор совместно обрабатывается (например, пересжимается).
Замена шардов (Swapping): Index Manager заменяет старые версии шардов новыми. Замена может происходить последовательно (one-by-one), чтобы минимизировать влияние на текущие поисковые запросы.
Очистка (Purging): Смигрированные данные удаляются из Динамического индекса, освобождая место для новых изображений.

Какие данные и как использует

Данные на входе

Патент фокусируется на управлении индексом, а не на анализе контента.

Мультимедиа факторы: Изображения (как запросы, так и эталонные). Система использует пиксельные данные для генерации Image Descriptors вокруг точек интереса (Image Interest Points). Также упоминаются Object Metadata, связанные с эталонными изображениями.
Системные данные: Критерии шардирования и сжатия (например, наборы Exemplars).

Какие метрики используются и как они считаются

Размер Динамического индекса: Метрика, используемая для инициации миграции. Может измеряться в количестве изображений, количестве дескрипторов или объеме занимаемой памяти (RAM или диск).
Пороги (Thresholds): Предопределенные значения для размера Динамического индекса, служащие триггером для миграции.
Критерии партиционирования (Classification scheme): Метод, используемый для разделения дескрипторов на шарды. Патент упоминает, что это может быть основано на наборе эталонов (Exemplars) в пространстве дескрипторов, определенных, например, с помощью кластеризации (k-means).

Инфраструктурное решение для визуального поиска: Патент описывает не алгоритм ранжирования, а инфраструктуру, необходимую для работы масштабной системы визуального поиска, такой как Google Images или Google Lens. Практических выводов для традиционного SEO нет.
Дуальная архитектура для скорости и свежести: Google использует двухслойную архитектуру: Dynamic Index для обеспечения свежести (быстрая запись, несжатые данные) и Static Index для обеспечения масштаба и скорости поиска (сжатые данные, шардинг).
Мгновенная доступность контента: Благодаря Dynamic Index новые изображения могут попадать в результаты поиска практически мгновенно после их обработки.
Механизм бесшовного обновления: Ключевое изобретение — это способность объединять индексы без остановки системы и без заметного снижения производительности поиска. Это достигается за счет создания новых версий шардов и их постепенной замены (Swapping).
Отсутствие SEO-инсайтов по ранжированию: Патент не содержит информации о том, как рассчитывается релевантность изображений или какие факторы влияют на их ранжирование.

ВАЖНО: Патент является инфраструктурным и не дает прямых практических выводов для SEO-стратегий ранжирования.

Best practices (это мы делаем)

Понимание скорости индексации визуального контента: Патент подтверждает, что у Google есть механизмы (Dynamic Index) для чрезвычайно быстрого включения новых изображений в поисковую выдачу. Это подчеркивает важность оперативной публикации актуального визуального контента (например, для новостных сайтов или E-commerce) и использования инструментов для быстрого уведомления поисковых систем (например, Image Sitemaps).
Обеспечение технической доступности изображений: Чтобы контент эффективно попадал в первичный Dynamic Index, необходимо обеспечить быструю отдачу изображений краулеру и не блокировать их сканирование.

Worst practices (это делать не надо)

Информация о худших практиках в патенте отсутствует. Патент не направлен против каких-либо конкретных SEO-тактик или манипуляций, он описывает архитектуру баз данных.

Стратегическое значение

Патент подтверждает, что визуальный поиск является стратегически важной вертикалью, требующей сложной инфраструктуры. Система построена для обработки огромного количества данных и обеспечения их обновления в реальном времени. Это демонстрирует, что свежесть визуального контента является приоритетом, для чего создана специальная инфраструктура (Dynamic Index).

Практические примеры

Практических примеров применения для SEO нет, так как патент описывает внутреннюю инфраструктуру управления индексом. Можно привести пример работы системы:

Сценарий: Быстрая индексация товара в E-commerce

Событие: Интернет-магазин добавляет новый товар с фотографиями.
Сканирование: Googlebot обнаруживает новые изображения через XML Sitemap.
Индексация (Dynamic): Система извлекает Image Descriptors из фотографий и немедленно добавляет их в Dynamic Index.
Доступность: Вскоре пользователи могут найти этот товар через Google Images или Google Lens.
Миграция (Позже): Позже (например, ночью), Index Manager запускает процесс слияния, и дескрипторы этого товара переносятся в Static Index для долговременного хранения.

Поможет ли этот патент лучше ранжироваться в Google Images?

Нет, напрямую не поможет. Патент описывает инфраструктуру управления индексом — как Google хранит, обрабатывает и обновляет базу данных изображений. Он не касается алгоритмов ранжирования, которые определяют, почему одно изображение показывается выше другого в результатах поиска.

Что такое «Статический индекс» и «Динамический индекс»?

Static Index — это основной, огромный индекс. Он оптимизирован для масштаба: данные сжаты и разделены на части (шарды) для хранения на разных серверах. Dynamic Index — это меньший индекс для свежих данных. Он оптимизирован для скорости добавления: данные не сжаты и часто хранятся в оперативной памяти, что позволяет искать по ним сразу после добавления.

Насколько быстро новое изображение может появиться в поиске Google Images?

Согласно этому патенту, практически мгновенно после обработки. Как только изображение сканируется, из него извлекаются дескрипторы и добавляются в Dynamic Index, оно сразу становится доступным для поиска. Система специально разработана для обеспечения максимальной свежести.

Что такое «дескрипторы изображений» (Image Descriptors)?

Это математическое представление ключевых визуальных характеристик (признаков) изображения или его части. Когда Google «смотрит» на изображение, он преобразует его в набор таких дескрипторов. Сравнивая дескрипторы запроса с дескрипторами в индексе, система находит похожие изображения.

Почему в Статическом индексе данные сжаты, а в Динамическом — нет?

Сжатие критично для основного (Статического) индекса, так как позволяет эффективнее хранить огромный объем данных и быстрее выполнять поиск в масштабе миллиардов изображений. В Динамическом индексе данные хранятся в несжатом виде, чтобы максимально ускорить процесс добавления новых изображений, жертвуя эффективностью хранения ради скорости записи.

Что такое «шарды» (Database Shards) и зачем они нужны?

Шарды — это части, на которые разделен основной Static Index. Шардирование позволяет распределить нагрузку по множеству серверов (масштабируемость). Также это позволяет обновлять индекс по частям: система обновляет только те шарды, в которые добавляются новые данные, и заменяет их без остановки работы.

Прерывается ли поиск по картинкам во время обновления основного индекса?

Нет, это ключевая особенность патента. Процесс слияния и замены шардов (Swapping) спроектирован так, чтобы происходить без остановки системы и без заметного снижения производительности поиска для пользователей. Замена может происходить поочередно ("one-by-one").

Как часто происходит миграция данных из Динамического индекса в Статический?

Патент указывает, что миграция запускается, когда Динамический индекс достигает определенного порога (по размеру или количеству записей). Это может происходить раз в несколько часов или раз в день, в зависимости от объема поступающих новых изображений и настроек системы.

Применяется ли этот механизм в обычном веб-поиске?

Патент описывает систему специально для визуального поиска (Dynamic Visual Search Engine). Хотя архитектура с использованием динамических и статических индексов может применяться и в других системах Google для обеспечения свежести (например, Caffeine для веб-поиска), данная реализация специфична для обработки дескрипторов изображений.

Каков главный вывод для SEO из этого патента?

Главный вывод — подтверждение того, что инфраструктура Google готова к обработке визуального контента в реальном времени. Это подчеркивает важность работы над Image SEO и обеспечения быстрой доставки нового контента поисковой системе (через Sitemaps, обеспечение скорости загрузки), так как он может быть проиндексирован и показан пользователям практически немедленно.

Как Google объединяет дубликаты изображений в кластеры и индексирует их как единое целое для улучшения визуального поиска

Google оптимизирует визуальный поиск, группируя почти идентичные изображения (измененный размер, обрезка) в единый кластер. Система индексирует не отдельные картинки, а совокупность всех визуальных признаков ("визуальных слов") из всех вариантов в кластере. Это повышает эффективность индекса и гарантирует согласованность результатов при поиске по изображению.

US8923626B1
2014-12-30

Индексация
Мультимедиа

Как Google использует единый Image Embedding для параллельного поиска по разным вертикалям (Web, Shopping, Local) при визуальном запросе

Google патентует механизм для улучшения визуального поиска (например, Google Lens). Система генерирует единое векторное представление (Image Embedding) для изображения-запроса и использует его для одновременного поиска визуально похожих результатов в нескольких разных базах данных (например, в общем веб-индексе и специализированном индексе товаров или локаций). Контекст пользователя (местоположение, история) помогает системе выбрать, какие специализированные базы активировать для поиска.

US20240311421A1
2024-09-19

Мультимедиа
Индексация
Семантика и интент

Как Google использует визуальное сходство для связывания изображений и видео, кластеризации выдачи и обогащения метаданных

Google анализирует визуальное содержимое изображений и ключевых кадров видео для выявления сходств. Это позволяет связывать разнотипный контент, даже если у него мало текстовых данных. Система использует эти связи для переноса метаданных (например, ключевых слов или геопозиции) от одного ресурса к другому, а также для кластеризации и смешивания изображений и видео в результатах поиска.

US9652462B2
2017-05-16

Мультимедиа
SERP
Семантика и интент

Как Google комбинирует визуальное сходство и семантические метки для улучшения поиска по картинке (Visual Search)

Google использует систему поиска по изображению, которая сочетает анализ визуальных характеристик и семантических меток. Система генерирует высокоточные метки (High Confidence Labels) для изображения, анализируя текст, связанный с визуально похожими картинками в интернете. Затем она ранжирует кандидатов, используя модель визуального сходства, обученную на основе человеческих оценок, и применяет правила фильтрации для обеспечения однородности результатов.

US8429173B1
2013-04-23

Семантика и интент
Мультимедиа
SERP

Как Google разбирает визуальные запросы, отправляя их одновременно в несколько специализированных поисковых систем (OCR, распознавание лиц, объектов)

Google использует архитектуру для обработки визуальных запросов (изображений), которая одновременно отправляет изображение в несколько параллельных поисковых систем (распознавание текста, лиц, объектов, штрихкодов). Система агрегирует результаты, часто создавая интерактивный документ, где разные части изображения связаны с соответствующими результатами поиска, и использует обратную связь для обучения.

US9135277B2
2015-09-15

Мультимедиа
SERP

Как Google использует контекст пользователя для предоставления информации без явного запроса (Технология предиктивного поиска)

Google использует технологию предиктивного (проактивного) поиска, которая анализирует текущий контекст пользователя (местоположение, время, календарь, скорость движения, привычки) для автоматического предоставления релевантной информации. Система реагирует на «запрос без параметров» (например, открытие приложения или простое действие с устройством) и самостоятельно определяет информационные потребности пользователя.

US8478519B2
2013-07-02

Персонализация
Семантика и интент
Поведенческие сигналы

Как Google решает, показывать ли промежуточную страницу (превью) или направлять пользователя сразу на сайт при клике в Поиске по картинкам

Google анализирует, насколько хорошо веб-страница представляет выбранное изображение («image-centricity»). Если изображение на странице качественное, заметное и удовлетворяет интент пользователя (на основе статических и поведенческих данных), Google направляет трафик из Поиска по картинкам напрямую на сайт. В противном случае, Google показывает промежуточный экран (Image Overlay).

US9135317B2
2015-09-15

Поведенческие сигналы
Мультимедиа
Семантика и интент

Как Google решает, показывать ли прямой ответ, анализируя частоту использования естественного языка в исторических запросах о факте

Google анализирует исторические данные о том, как пользователи ищут конкретный факт. Если они часто используют естественный язык (например, «какая высота у Эйфелевой башни»), система считает, что пользователи действительно ищут этот факт. На основе этого рассчитывается «Оценка поиска фактов» (Fact-Seeking Score). Эта оценка используется как сигнал ранжирования, чтобы решить, нужно ли показывать прямой ответ (Factual Answer) и насколько высоко его разместить в результатах поиска.

US9396235B1
2016-07-19

Семантика и интент
SERP
Поведенческие сигналы

Как Google создает и использует базу «идеальных» ответов (Canonical Content Items) для ответов на вопросы пользователей

Google использует систему для идентификации и создания «канонических элементов контента» — образцовых объяснений тем, часто в формате вопрос-ответ. Система анализирует огромные массивы существующего контента, кластеризует похожие вопросы и ответы и выбирает или синтезирует идеальную версию. Когда пользователь задает вопрос, система сопоставляет его с этой базой данных, чтобы мгновенно предоставить высококачественный, модельный ответ.

US9396263B1
2016-07-19

Семантика и интент
EEAT и качество

Как Google использует клики (CTR) и время на сайте (Click Duration) для выявления спама и корректировки ранжирования в тематических выдачах

Google использует итеративный процесс для улучшения классификации контента и выявления спама, анализируя поведенческие сигналы (CTR и продолжительность клика). Если пользователи быстро покидают документ или игнорируют его в выдаче, он помечается как спам или нерелевантный теме. Эти данные затем используются для переобучения классификатора и корректировки ранжирования для будущих тематических запросов.

US7769751B1
2010-08-03

Поведенческие сигналы
Антиспам
SERP

Как Google использует данные о кликах и пропусках для валидации и удаления неэффективных синонимов в поиске

Google постоянно тестирует правила подстановки (синонимы) для расширения запросов. Этот патент описывает механизм оценки эффективности этих правил с помощью анализа поведения пользователей (клики и пропуски результатов). Если пользователи часто пропускают результаты, содержащие подставленный термин, система автоматически удаляет это правило, очищая понимание запросов от нерелевантных синонимов.

US8965875B1
2015-02-24

Поведенческие сигналы
Семантика и интент
EEAT и качество

Как Google агрегирует, оценивает и ранжирует комментарии, отзывы и упоминания о веб-странице из разных источников

Google собирает комментарии, отзывы и посты в блогах, относящиеся к определенной веб-странице. Система использует сложные алгоритмы для определения основной темы упоминаний (особенно если в них несколько ссылок) и ранжирует эти комментарии на основе авторитетности автора, свежести, качества языка и обратной связи пользователей, чтобы представить наиболее полезные мнения.

US8745067B2
2014-06-03

EEAT и качество
Свежесть контента
Семантика и интент

Как Google использует данные о поведении пользователей внутри документов (время чтения разделов, закладки) для улучшения ранжирования

Google может собирать и анализировать данные о том, как пользователи взаимодействуют с электронными документами (например, PDF, DOC, HTML). Система отслеживает, какие разделы или страницы просматриваются дольше всего или добавляются в закладки. Эта агрегированная информация используется для повышения в ранжировании документов, чьи ключевые слова находятся в наиболее используемых (и, следовательно, ценных) разделах.

US8005811B2
2011-08-23

Поведенческие сигналы
SERP

Как Google ранжирует контент на других языках, основываясь на поведении пользователей с одинаковыми языковыми настройками

Google использует статистику кликов (CTR), сегментированную по языковым предпочтениям пользователей, для корректировки ранжирования. Если пользователи, предпочитающие язык X, часто кликают на результат на языке Y, этот результат будет повышен в выдаче для других пользователей с предпочтением языка X. Это позволяет ранжировать контент, популярный у определенной языковой группы, независимо от языка самого контента.

US8375025B1
2013-02-12

Мультиязычность
Поведенческие сигналы
Персонализация

Как Google использует историю браузера, закладки и поведение пользователей для персонализации результатов поиска в e-commerce

Система отслеживает поведение пользователей (клики, время на сайте, покупки) и их сохраненные закладки (content pointers) в сетевой среде. На основе этих данных создается персональная модель релевантности и иерархия предпочтений. Эта модель используется для дополнения запросов, переранжирования результатов поиска и предоставления рекомендаций, обеспечивая персонализированный опыт в e-commerce.

US7089237B2
2006-08-08

Поведенческие сигналы
Персонализация
SERP