SEO HARDCORE
  • Разборы патентов
    • Патенты Google
  • Скоро SEO инструменты
  • Скоро SEO аналитика
  • seohardcore
SEO HARDCORE
назад

Как Google распределяет запросы между серверами для оптимизации кэширования и повышения безопасности

SERVER SELECTION BASED UPON TIME AND QUERY DEPENDENT HASHING (Выбор сервера на основе хеширования, зависящего от времени и запроса)
  • US8166203B1
  • Google LLC
  • 2009-05-29
  • 2012-04-24
  • Безопасный поиск
  • Описание
  • Разбор
  • Выводы
  • Практика
  • FAQ
  • Похожие

Google использует механизм временно-зависимого хеширования для маршрутизации запросов от фронтенд-серверов к бэкенд-серверам. Запрос направляется на один и тот же сервер в течение определенного временного интервала, что позволяет эффективно использовать кэш. По истечении интервала маршрутизация меняется, что улучшает балансировку нагрузки и защищает систему от целенаправленных атак.

Описание

Какую проблему решает

Патент решает инфраструктурную задачу балансировки между эффективностью кэширования и безопасностью/распределением нагрузки в поисковой системе. Для максимальной эффективности кэширования один и тот же запрос должен направляться на один и тот же back-end server. Однако такое статическое распределение создает уязвимость: злоумышленники могут идентифицировать, какие запросы обрабатывает конкретный сервер, и перегрузить его (DDoS-атака). Также это может приводить к неравномерной нагрузке, если определенные серверы постоянно обрабатывают самые популярные запросы.

Что запатентовано

Запатентован метод выбора бэкенд-сервера для обработки запроса с использованием time-dependent hashing (хеширования, зависящего от времени). Система комбинирует запрос с числом, уникальным для текущего временного интервала, и хеширует результат для определения целевого сервера. Ключевой особенностью, описанной в Claims, является использование рандомизированной длины интервала и рандомизированного "семени" (random seed) для хеширования, что делает изменение маршрутизации непредсказуемым.

Как это работает

Система работает на уровне front-end servers, которые получают запросы от пользователей. Запрос конвертируется в число (Query Number). Параллельно система определяет текущий временной интервал (длина которого может быть случайной) и уникальное число для этого интервала (Second Number или Random Seed). Query Number и Random Seed комбинируются и хешируются. Результат хеширования определяет, какой back-end server обработает запрос. В течение этого временного интервала маршрутизация стабильна, что позволяет бэкенд-серверу эффективно кэшировать результаты. По истечении интервала генерируются новые параметры (длина и семя), и маршрутизация запросов меняется.

Актуальность для SEO

Высокая (с точки зрения инфраструктуры). Эффективное кэширование, балансировка нагрузки и защита от DDoS являются критически важными задачами для любой крупномасштабной распределенной системы, такой как поиск Google. Подобные механизмы динамической маршрутизации, вероятно, используются в продакшене.

Важность для SEO

Влияние на SEO минимальное (1/10). Патент имеет исключительно инфраструктурное значение. Он описывает внутренние механизмы маршрутизации запросов Google для оптимизации производительности (скорости ответа за счет кэширования) и безопасности. Он не содержит информации об алгоритмах ранжирования, понимания запросов или оценки качества контента и не предоставляет никаких действенных рекомендаций для SEO-специалистов по оптимизации сайтов.

Детальный разбор

Термины и определения

Back-end server (Бэкенд-сервер)
Сервер, который выполняет основную обработку запроса — поиск в индексе или базе данных (Datastore), вычисление результатов и их кэширование.
Cache (Кэш)
Временное хранилище на бэкенд-сервере, где сохраняются результаты для конкретных запросов. Позволяет быстро отвечать на повторяющиеся запросы без повторного вычисления.
Front-end server (Фронтенд-сервер)
Сервер, который принимает запросы от пользователей (или других систем) и распределяет их между бэкенд-серверами.
Hash collision (Хеш-коллизия)
Ситуация, когда разные входные данные (в данном случае, разные запросы) приводят к одному и тому же хеш-значению.
Hash table (Хеш-таблица)
Структура данных, которая связывает хеш-значения (индексы) с записями (в данном случае, с идентификаторами бэкенд-серверов).
Hash value (Хеш-значение / Индекс)
Результат операции хеширования. Используется как индекс для выбора сервера в хеш-таблице.
Hashing operation (Операция хеширования)
Процесс преобразования входных данных (комбинации запроса и временного семени) в хеш-значение.
Present time interval (Текущий временной интервал)
Период времени, в течение которого параметры хеширования (Random Seed) остаются постоянными. Длина этого интервала может быть фиксированной или случайной.
Query Number (Числовое представление запроса)
Результат конвертации текста запроса в числовой формат (например, ASCII, Unicode), пригодный для хеширования.
Random seed (Случайное семя)
Случайное число, генерируемое в начале временного интервала. Используется как второй компонент при хешировании запроса для обеспечения временно-зависимой маршрутизации.
Second number / Time-dependent number (Второе число / Число, зависящее от времени)
Общий термин для числа, которое комбинируется с запросом при хешировании. Может быть детерминированным (на основе временной метки time-stamp) или случайным (Random Seed).

Ключевые утверждения (Анализ Claims)

Основным защищаемым ядром изобретения является метод выбора сервера с использованием рандомизации как длительности временного интервала, так и параметра хеширования.

Claim 1 (Независимый пункт): Описывает метод выбора сервера для обработки запроса.

  1. Определение длины текущего временного интервала на основе вывода первого генератора случайных чисел.
  2. Определение случайного семени (random seed) для текущего временного интервала на основе вывода второго генератора случайных чисел.
  3. Конвертация запроса в query number.
  4. Выполнение операции хеширования над комбинацией query number и random seed для генерации hash value.
  5. Выбор сервера из множества серверов на основе hash value.
  6. Отправка запроса на выбранный сервер.
  7. Повторное определение длины временного интервала (с новым случайным значением) и повторное определение random seed (с новым случайным значением) по истечении текущего временного интервала.

Ядром изобретения является использование двух уровней рандомизации (длительность интервала и семя для хеширования) для обеспечения стабильной маршрутизации запросов в течение непредсказуемого периода времени, с последующим непредсказуемым изменением этой маршрутизации. Это позволяет эффективно использовать кэш (пока интервал длится), одновременно защищая систему от атак, которые полагаются на знание того, какой сервер обрабатывает конкретные запросы (поскольку это знание быстро устаревает непредсказуемым образом).

Где и как применяется

Патент описывает инфраструктурный процесс маршрутизации, который происходит после получения запроса пользователем и до начала его фактической обработки (понимания и ранжирования).

Этапы поиска:

Система не относится напрямую к этапам CRAWLING или INDEXING.

Она функционирует как механизм диспетчеризации перед этапами QUNDERSTANDING и RANKING. Front-end server использует описанный механизм, чтобы определить, какой именно back-end server будет выполнять работу по пониманию запроса, отбору кандидатов и ранжированию.

Взаимодействие компонентов:

  • Фронтенд-серверы: Принимают запрос, генерируют (или получают) параметры временного интервала и random seed, выполняют хеширование и маршрутизируют запрос.
  • Бэкенд-серверы: Принимают маршрутизированный запрос, проверяют локальный кэш, вычисляют результат (если его нет в кэше) и возвращают ответ.

Входные данные:

  • Текст входящего запроса.
  • Параметры текущего временного интервала (длина и Random Seed), сгенерированные случайным образом.
  • (В альтернативном варианте): Текущая временная метка (timestamp) и количество бэкенд-серверов.

Выходные данные:

  • Идентификатор бэкенд-сервера, выбранного для обработки запроса.

На что влияет

Это универсальный механизм маршрутизации инфраструктуры.

  • Типы контента, запросы, ниши, языки: Влияет на обработку абсолютно всех запросов равномерно. Механизм не анализирует содержание запроса или его тематику для принятия решения о маршрутизации; он использует запрос только как входные данные для хеш-функции.

Когда применяется

  • Условия работы: Алгоритм выбора сервера применяется при получении каждого запроса фронтенд-сервером.
  • Триггеры активации: Изменение маршрутизации активируется по истечении текущего временного интервала. Поскольку длина интервала случайна (согласно Claim 1), время изменения маршрутизации непредсказуемо.

Пошаговый алгоритм

Описание процесса на основе рандомизированного подхода (Claim 1).

  1. Инициализация Интервала: Система определяет длину для нового временного интервала, используя генератор случайных чисел.
  2. Инициализация Семени: Система определяет случайное семя (Random Seed) для этого интервала, используя другой (или тот же) генератор случайных чисел.
  3. Получение Запроса: Фронтенд-сервер получает входящий запрос.
  4. Конвертация: Запрос конвертируется в числовое представление (Query Number). Например, путем преобразования текста в ASCII или Unicode.
  5. Хеширование: Выполняется операция хеширования над комбинацией (например, суммой или конкатенацией) Query Number и текущего Random Seed.
  6. Выбор Сервера: Результат хеширования (Hash Value) используется как индекс в хеш-таблице для выбора конкретного бэкенд-сервера. Может применяться операция взятия остатка от деления на количество доступных серверов.
  7. Маршрутизация: Запрос отправляется на выбранный бэкенд-сервер.
  8. Обработка (на бэкенде): Бэкенд-сервер проверяет локальный кэш на наличие готового результата для этого запроса.
    • Если есть: Возвращает кэшированный результат.
    • Если нет: Вычисляет результат (обращается к индексу/базе данных), кэширует его для будущих запросов в этом интервале и возвращает его.
  9. Проверка Истечения: Система проверяет, истек ли текущий временной интервал.
    • Если ДА: Процесс возвращается к Шагу 1 (генерация новых случайных параметров).
    • Если НЕТ: Система ожидает следующий запрос и использует текущие параметры (возврат к Шагу 3).

Какие данные и как использует

Данные на входе

Патент фокусируется исключительно на инфраструктурной маршрутизации и не использует стандартные SEO-факторы.

  • Контентные, Технические, Ссылочные, Поведенческие факторы: Не используются в описанном механизме.
  • Временные факторы: Время используется для определения моментов смены временных интервалов. В рандомизированном варианте используются случайные числа, которые меняются с течением времени (Random Seed). В детерминированном варианте используется непосредственно временная метка (timestamp).
  • Данные запроса: Текст запроса является основным входным параметром для хеширования.

Какие метрики используются и как они считаются

  • Query Number: Числовое представление запроса. Рассчитывается путем конвертации текста.
  • Random Seed: Случайное число, уникальное для временного интервала. Генерируется случайным образом.
  • Hash Value: Результат хеширования. Рассчитывается как Hash(Query Number + Random Seed).
  • Server ID: Идентификатор сервера. Может рассчитываться как Hash Value % Number_of_Servers (операция взятия остатка от деления).

Альтернативный детерминированный метод (описан в патенте, но не в Claim 1):

Патент также описывает вариант, где вместо Random Seed используется детерминированное число на основе временной метки и количества серверов.

  • Quantize_time (Квантованное время) (Eq. 1): floor(timestamp

    Выводы

    Патент описывает внутренние процессы Google без прямых рекомендаций для SEO.

    1. Инфраструктурный фокус: Патент полностью посвящен оптимизации инфраструктуры поисковой системы, а именно — маршрутизации запросов от фронтенд- к бэкенд-серверам.
    2. Баланс Кэширования и Безопасности: Изобретение решает дилемму между необходимостью статической маршрутизации для эффективного кэширования и необходимостью динамической маршрутизации для балансировки нагрузки и защиты от DDoS-атак.
    3. Временно-зависимое Хеширование: Ключевой механизм — time-dependent hashing. Маршрутизация стабильна в течение определенного временного интервала, но изменяется по его истечении.
    4. Рандомизация как защита: Основной вариант реализации (Claim 1) использует рандомизацию как длины временного интервала, так и "семени" (Random Seed) для хеширования. Это делает поведение системы непредсказуемым для внешних наблюдателей.
    5. Отсутствие SEO-инсайтов: Патент не содержит информации об алгоритмах ранжирования, факторах оценки качества контента, ссылок или любых других сигналов, используемых для определения позиций сайтов в выдаче. Практических выводов для SEO-стратегии нет.

    Практика

    Патент является инфраструктурным и не дает практических выводов для SEO.

    Best practices (это мы делаем)

    Патент не предоставляет прямых рекомендаций для SEO-специалистов. Он описывает, как Google оптимизирует свою собственную производительность. Косвенно, это подтверждает, что скорость ответа поисковой системы является приоритетом для Google (за счет оптимизации кэширования), но не дает новых знаний о том, как SEO-специалистам оптимизировать свои сайты.

    Worst practices (это делать не надо)

    Патент не направлен против каких-либо конкретных SEO-тактик или манипуляций с выдачей. Он направлен на защиту инфраструктуры Google от перегрузки и целенаправленных атак (DDoS) на конкретные бэкенд-серверы.

    Стратегическое значение

    Стратегическое значение для SEO равно нулю. Патент интересен с точки зрения понимания сложности, масштабируемости и мер безопасности, применяемых в инфраструктуре Google, но он не влияет на долгосрочную или краткосрочную SEO-стратегию.

    Практические примеры

    Практических примеров применения в SEO нет. Ниже приведен пример работы описанной инфраструктуры.

    Сценарий: Маршрутизация запроса "погода в Москве"

    1. Начало Интервала (00:00:00): Система случайно определяет длину интервала = 12 минут. Система случайно определяет Random Seed = 583.
    2. Обработка запросов (00:00:01 - 00:11:59): Каждый раз, когда пользователь вводит запрос "погода в Москве", фронтенд-сервер выполняет хеширование: Hash("погода в Москве" + 583). Допустим, результат указывает на Бэкенд-Сервер №10.
    3. Кэширование: Первый запрос обрабатывается Сервером №10, результат кэшируется. Все последующие идентичные запросы в течение этих 12 минут также направляются на Сервер №10 и получают быстрый ответ из кэша.
    4. Конец Интервала (00:12:00): Интервал истек. Система случайно определяет новую длину интервала = 8 минут. Система случайно определяет новый Random Seed = 912.
    5. Обработка запросов (00:12:01 - 00:19:59): Теперь фронтенд-сервер выполняет хеширование: Hash("погода в Москве" + 912). Результат теперь указывает на Бэкенд-Сервер №25.
    6. Результат: Нагрузка перераспределена, и злоумышленник, пытавшийся атаковать Сервер №10, теперь направляет трафик не по адресу.

    Вопросы и ответы

    Влияет ли описанный в патенте механизм на ранжирование сайтов?

    Нет, не влияет. Патент описывает исключительно инфраструктурный процесс маршрутизации запросов между серверами Google для оптимизации нагрузки и использования кэша. Он не затрагивает алгоритмы, которые определяют релевантность или качество контента.

    Что такое "временно-зависимое хеширование" (time-dependent hashing), описанное в патенте?

    Это метод, при котором результат хеширования запроса зависит не только от самого запроса, но и от текущего момента времени. Достигается это путем комбинирования запроса со специальным числом (Random Seed или Second Number), которое периодически меняется. Это позволяет запросу направляться на один и тот же сервер в течение определенного интервала, но менять целевой сервер по истечении этого интервала.

    Зачем Google периодически меняет серверы, обрабатывающие один и тот же запрос?

    Это делается по двум основным причинам. Первая — безопасность: если маршрутизация статична, злоумышленники могут определить, какой сервер обрабатывает конкретные запросы, и целенаправленно атаковать его (DDoS). Вторая — балансировка нагрузки: периодическое перераспределение позволяет избежать постоянной перегрузки серверов, обрабатывающих самые популярные запросы.

    Что означает использование "Random Seed" в этом патенте?

    Random Seed (случайное семя) — это число, генерируемое случайным образом в начале каждого временного интервала. Оно добавляется к числовому представлению запроса перед хешированием. Использование случайного числа вместо детерминированного (например, основанного на точном времени) делает изменение маршрутизации непредсказуемым для внешних наблюдателей, повышая безопасность системы.

    В патенте указано, что длина временного интервала также случайна. Зачем это нужно?

    Рандомизация длины интервала (present time interval length) добавляет еще один уровень непредсказуемости. Если бы интервалы были фиксированными (например, ровно 10 минут), злоумышленник мог бы синхронизировать свои действия с этими интервалами. Случайная длина интервала усложняет планирование атак на инфраструктуру.

    Может ли этот механизм объяснить внезапные колебания позиций сайта в выдаче?

    Маловероятно. Хотя запрос обрабатывается разными бэкенд-серверами в разные периоды времени, эти серверы должны работать с синхронизированными копиями индекса и использовать одинаковые алгоритмы ранжирования. Колебания позиций обычно связаны с обновлениями индекса, изменениями алгоритмов или работой систем переранжирования, а не с тем, какой именно физический сервер обработал запрос.

    Влияет ли этот патент на то, как Google сканирует или индексирует мой сайт?

    Нет. Описанный механизм относится к этапу обработки уже полученных пользовательских запросов (Query Processing). Он не затрагивает процессы сканирования (Crawling) интернета или индексирования (Indexing) контента.

    Помогает ли этот механизм Google быстрее отвечать на запросы?

    Да, это одна из целей изобретения. Благодаря тому, что в течение временного интервала один и тот же запрос стабильно направляется на один и тот же бэкенд-сервер, этот сервер может эффективно кэшировать результат. Ответ из кэша значительно быстрее, чем полное перевычисление результатов поиска.

    Очищается ли кэш на серверах при смене временного интервала?

    Патент упоминает, что кэши могут быть очищены или помечены для перезаписи по истечении временного периода. Это логично, так как после смены интервала сервер начнет получать новый набор запросов, и старый кэш станет менее актуальным для текущего потока трафика.

    Есть ли в этом патенте хоть какая-то польза для практикующего SEO-специалиста?

    Практической пользы для оптимизации сайтов (SEO) нет. Патент полезен для инженеров, занимающихся разработкой распределенных систем и балансировкой нагрузки, но он не содержит информации, которая могла бы повлиять на стратегию продвижения сайтов.

    Похожие патенты

    Как Google адаптивно управляет краулинговым бюджетом и скоростью сканирования на основе производительности сервера
    Google использует распределенную систему управления сканированием, которая группирует URL по хостам и определяет оптимальное время следующего обращения к серверу («Stall Time»). Эта система адаптивно регулирует частоту запросов на основе фактической скорости ответа сервера («Retrieval Time»), чтобы эффективно сканировать интернет, не перегружая отдельные сайты.
    • US7305610B1
    • 2007-12-04
    • Краулинг

    • Техническое SEO

    Как Google использует многоуровневую архитектуру индекса (Standard и Extended) для баланса скорости, стоимости и полноты поиска
    Патент Google описывает архитектуру поиска с двумя уровнями индексации. Standard Index (основной, быстрый) содержит авторитетные документы (высокий PageRank) и обрабатывает большинство запросов. Extended Index (дополнительный, медленный) содержит менее важные или редкие документы. Система обращается к Extended Index только тогда, когда в Standard Index недостаточно качественных результатов, обеспечивая баланс скорости и максимального охвата.
    • US7174346B1
    • 2007-02-06
    • Индексация

    Как Google приоритизирует сканирование, управляет краулинговым бюджетом и повторно использует контент
    Google использует распределенную систему планирования для оптимизации сканирования. Приоритет URL определяется их важностью (Page Importance/PageRank) и специальными коэффициентами (Boost Factor). Система фильтрует постоянно недоступные страницы и решает, загружать ли контент заново или использовать кэшированную версию (Reuse), основываясь на истории изменений и важности страницы.
    • US8042112B1
    • 2011-10-18
    • Краулинг

    • Свежесть контента

    • Индексация

    Как Google динамически управляет очередью сканирования и отклоняет низкоприоритетные URL при ограниченной пропускной способности сервера
    Google использует адаптивную систему управления краулинговым бюджетом. Система прогнозирует вероятность успешного сканирования URL на основе скорости ответов сервера и приоритета запроса. Если пропускная способность ограничена, низкоприоритетные URL немедленно отклоняются (Early Rejection), не дожидаясь таймаута, чтобы обеспечить быстрое сканирование важного контента.
    • US8676783B1
    • 2014-03-18
    • Краулинг

    Как Google предварительно вычисляет результаты поиска для ожидаемых запросов, чтобы ускорить выдачу и повысить её качество
    Google использует систему предиктивного поиска для повышения скорости и эффективности. Система прогнозирует, какие запросы пользователи введут в будущем, и заранее вычисляет для них результаты поиска, сохраняя их в специальном «предиктивном кэше». Это позволяет мгновенно обслуживать популярные и трендовые запросы, а также использовать более сложные алгоритмы ранжирования, поскольку вычисления происходят до получения запроса.
    • US20100318538A1
    • 2010-12-16
    • Индексация

    Популярные патенты

    Как Google переписывает неявные запросы, определяя сущность по местоположению пользователя и истории поиска
    Google использует местоположение пользователя для интерпретации запросов, которые явно не упоминают конкретную сущность (например, [часы работы] или [отзывы]). Система идентифицирует ближайшие объекты, анализирует исторические паттерны запросов для этих объектов и переписывает исходный запрос, добавляя в него название наиболее вероятной сущности.
    • US20170277702A1
    • 2017-09-28
    • Семантика и интент

    • Local SEO

    • Персонализация

    Как Google группирует похожие запросы и поисковые подсказки, определяя интент пользователя через анализ сессий и кликов
    Google использует графовую модель (Марковскую цепь) для кластеризации поисковых подсказок и связанных запросов. Система анализирует, какие запросы пользователи вводят в одной сессии и на какие документы они кликают. Это позволяет сгруппировать запросы, ведущие к схожему контенту, и предложить пользователю разнообразный набор подсказок, отражающих разные интенты.
    • US8423538B1
    • 2013-04-16
    • Семантика и интент

    • Поведенческие сигналы

    • SERP

    Как Google использует контент вокруг ссылок (вне анкора) для генерации «Синтетического Описательного Текста» и ранжирования вашего сайта
    Google может генерировать «Синтетический Описательный Текст» для страницы, анализируя контент и структуру сайтов, которые на нее ссылаются. Система создает структурные шаблоны для извлечения релевантного текста (например, заголовков или абзацев рядом со ссылкой), который затем используется как мощный сигнал ранжирования. Этот механизм позволяет лучше понять содержание страницы, особенно если традиционный анкорный текст низкого качества или отсутствует.
    • US9208233B1
    • 2015-12-08
    • Ссылки

    • Семантика и интент

    • Индексация

    Как Google генерирует "Свежие связанные запросы" на основе анализа трендов и новостного контента
    Google анализирует недавние поисковые логи, чтобы выявить запросы, демонстрирующие резкий рост популярности или отклонение от ожидаемой частоты. Эти "свежие" запросы проходят обязательную валидацию: они должны возвращать достаточное количество новостных результатов и иметь хорошие показатели вовлеченности (CTR). Это позволяет Google динамически обновлять блок "Связанные поиски", отражая актуальные события и тренды.
    • US8412699B1
    • 2013-04-02
    • Свежесть контента

    • Поведенческие сигналы

    • SERP

    Как Google использует контент веб-страниц для генерации, верификации и адаптации AI-ответов в поиске (SGE/AI Overviews)
    Google использует Большие Языковые Модели (LLM) для создания генеративных сводок (AI Overviews/SGE). Для обеспечения точности система не полагается только на знания LLM, а обрабатывает контент из актуальных результатов поиска (SRDs). Патент описывает архитектуру этого процесса: как выбираются источники, как генерируется сводка на их основе (Grounding), как проверяется информация для добавления ссылок (Verification), и как ответ адаптируется под контекст и действия пользователя.
    • US20250005303A1
    • 2025-01-02
    • SERP

    • EEAT и качество

    • Персонализация

    Как Google выбирает, сортирует и форматирует динамические Sitelinks на основе типа контента и свежести страниц
    Патент Google описывает систему генерации Sitelinks (саб-ссылок), которые ведут непосредственно на конечный контент (статьи, видео, товары), а не на разделы сайта. Система определяет категорию контента и применяет специфические правила сортировки (например, по свежести для новостей), которые отличаются от стандартного ранжирования. Также используется специальное форматирование для улучшения навигации в SERP.
    • US9081832B2
    • 2015-07-14
    • Ссылки

    • SERP

    • Свежесть контента

    Как Google использует поведение пользователей в веб-поиске для динамической категоризации локальных бизнесов
    Google динамически формирует категории для бизнесов, основываясь на том, как пользователи ищут их (используемые ключевые слова и клики) в веб-поиске и голосовом поиске. Эти данные формируют иерархическое понимание типов бизнеса. Эта структура затем используется для повышения точности распознавания названий компаний в голосовых запросах.
    • US8041568B2
    • 2011-10-18
    • Local SEO

    • Поведенческие сигналы

    • Семантика и интент

    Как Google использует паттерны просмотра пользователей (co-visitation) для определения связанности документов и улучшения поиска
    Google использует систему для определения того, насколько тесно связаны два документа, основываясь на агрегированных данных о поведении пользователей. Система рассчитывает вероятность того, что пользователь просмотрит Документ B в течение определенного времени после того, как Документ А был показан ему в результатах поиска. Эти данные используются для персонализации выдачи, предложения рекомендаций и улучшения релевантности на основе контекста сессии пользователя.
    • US8447760B1
    • 2013-05-21
    • Поведенческие сигналы

    • Персонализация

    • Семантика и интент

    Как Google использует нейросетевые эмбеддинги (Two-Tower Model) для семантического поиска изображений с учетом контекста страницы
    Google использует систему поиска изображений, основанную на нейронных сетях (модель "Две Башни"). Система создает векторные представления (эмбеддинги) для поисковых запросов и для пар "изображение + посадочная страница", помещая их в общее семантическое пространство. Это позволяет находить релевантные изображения не по ключевым словам, а по близости векторов, учитывая как содержание картинки, так и контекст страницы, на которой она размещена.
    • US11782998B2
    • 2023-10-10
    • Семантика и интент

    • Индексация

    • Мультимедиа

    Как Google использует контент, который вы смотрите (например, на ТВ), для автоматического переписывания и персонализации ваших поисковых запросов
    Google может анализировать контент (фильмы, шоу, аудио), который пользователь потребляет на одном устройстве (например, ТВ), и использовать эту информацию как контекст для уточнения последующих поисковых запросов. Система распознает аудиовизуальный контекст и автоматически дополняет неоднозначные запросы пользователя, чтобы предоставить более релевантные результаты, в том числе на связанных устройствах (например, смартфоне).
    • US9244977B2
    • 2016-01-26
    • Персонализация

    • Семантика и интент

    • Поведенческие сигналы

    seohardcore