Google использует инфраструктурный механизм «Эпох» для обновления поискового индекса в реальном времени. Система отслеживает активные поисковые запросы и гарантирует, что устаревшие данные (например, старые версии документов) удаляются только тогда, когда ни один активный запрос их больше не использует. Это позволяет поддерживать максимальную свежесть индекса без прерывания обслуживания пользователей.
Автор: Виктор Репин
Google может повышать в рейтинге рекламные объявления, если товар или услугу одобрил эксперт (Endorser), которому доверяет кто-то из социального круга пользователя (Social Network). Система анализирует социальный граф, чтобы определить связь между пользователем и рекомендателем, и использует это социальное доказательство как сигнал для ранжирования рекламы.
Google использует систему для управления мгновенным отображением результатов поиска (например, изображений) по мере ввода запроса пользователем (Instant Search). Если система автодополнения предлагает запрос, который классифицируется как потенциально неприемлемый или шокирующий (например, медицинские термины), система превентивно блокирует показ изображений. Это предотвращает неожиданное отображение шокирующего контента до того, как пользователь подтвердит свой запрос.
Патент Яндекса (от авторов CatBoost) описывает инфраструктурный метод обучения ML-моделей. Чтобы предотвратить переобучение (overfitting) и утечку целевой переменной (target leakage), обучающие примеры упорядочиваются. Признаки (текстовые или векторные) для каждого примера рассчитываются только на основе предшествующих данных в последовательности, игнорируя последующие.
Google использует систему для поддержания актуальности информации в документах (например, в Google Docs или Gmail). Система распознает сущности и их чувствительные ко времени атрибуты (например, время рейса или цену акции). Затем она проверяет актуальное значение через поисковую систему и предлагает пользователю обновить устаревшие данные в тексте.
Патент Google, описывающий метод представления результатов поиска в виде многомерного графика. Вместо стандартного списка система отображает результаты (например, в виде иконок или миниатюр) на графике, где одна ось представляет релевантность запросу, а другая — альтернативную характеристику, такую как цена, дата публикации или географическое расстояние. Это позволяет пользователю визуально оценить компромисс между разными параметрами сортировки.
Google патентует систему для создания локального «персонализированного репозитория сущностей» на устройстве пользователя. Глобальная база знаний разделяется на тематические и географические наборы («срезы»). Устройство анализирует контекст (местоположение, контент на экране) и загружает только релевантные срезы, что позволяет быстро распознавать сущности и предлагать действия без подключения к сети.
Google может персонализировать выдачу поиска по картинкам, показывая изображения, которые пользователь недавно выбирал (кликал). Это происходит, если текущий запрос пользователя признан похожим на предыдущий. Недавно просмотренные результаты отображаются в отдельном блоке для улучшения пользовательского опыта.
Анализ патента Google, описывающего механизм ретаргетинга в поиске (известный как RLSA). Система позволяет рекламодателям показывать рекламу в ответ на поисковый запрос пользователям, которые ранее совершили определенное действие на их сайте. Это достигается путем сопоставления поискового запроса с ключевыми словами и проверки наличия идентификатора пользователя в списке ретаргетинга.
Яндекс патентует метод изменения интерфейса поисковой выдачи. Вместо того чтобы заменять SERP выбранным сайтом, система реорганизует выдачу (например, перемещает ее в левую колонку) и отображает выбранный сайт рядом (в правой колонке). Это позволяет пользователю видеть и SERP, и контент сайта одновременно. Также описан механизм автоматического показа первого результата выдачи рядом с SERP без клика пользователя.
Патент Google описывает интерфейс приложения для набора номера (Dialer App). При поиске компании система отображает один результат в расширенном формате (Knowledge Panel) с фото, картой и отзывами, а остальные — в кратком формате. Пользователь может развернуть любой результат, не покидая приложения, чтобы увидеть детали перед звонком.
Google использует механизм для повышения стабильности и эффективности Визуального поиска (например, Google Lens). Вместо того чтобы распознавать объект по одному кадру, система анализирует последовательность кадров с камеры устройства. Используя байесовское обновление вероятностей (в частности, Бета-распределение), система накапливает уверенность в классификации объекта и выдает результат только при достижении определенного порога. Это предотвращает «мерцание» результатов и снижает вычислительную нагрузку.
Патент описывает механизм замены индивидуального отслеживания (например, third-party cookies) на квазиперсонализацию. Google анализирует историю просмотров миллиардов пользователей, выделяет общие паттерны и создает модель классификации. Браузер локально определяет, к какой группе (кластеру) относится пользователь, и отправляет анонимный идентификатор группы при запросе контента (например, рекламы), обеспечивая релевантность без раскрытия личных данных.
Google использует эту архитектуру для автоматического сбора необработанных данных (местоположение, движение, использование приложений, устройства поблизости) с устройств пользователя. Система обрабатывает эти данные для выявления «событий» (например, пробежка, посещение мероприятия) и создает временной «поток событий». Затем она синхронизирует связанные события между подключенными пользователями, находящимися рядом (например, синхронизация фотографий с общего мероприятия).
Этот патент описывает инфраструктурную оптимизацию поискового индекса Google. В нем представлена «гибридная структура данных», которая ускоряет извлечение информации (например, местоположение фраз в документах) путем объединения бинарных деревьев с таблицами поиска и использования высокоэффективных методов сортировки. Это делает поиск быстрее, но не влияет на алгоритмы ранжирования.
Патент Google, описывающий механизм временной кастомизации поиска. Пользователь может отключить влияние персонализированных сигналов (социальные связи, местоположение, история поиска) на выдачу в рамках текущей сессии. После завершения сессии система автоматически возвращается к стандартному персонализированному поиску.
Google использует систему для отслеживания изменений характеристик продуктов (цены, ставки по ипотеке) во времени. Система заранее определяет типичные сценарии поиска, периодически собирает данные по ним, агрегирует результаты в статистику (например, средняя цена за день) и сохраняет эту историю. Это позволяет быстро отображать графики трендов, когда пользователь выполняет похожий поиск.
Google использует метод выборочной подсветки ключевых слов в результатах поиска. Ключевые слова, найденные в заголовке (Title), подсвечиваются там, но затем специально исключаются из подсветки в сниппете (Snippet). Это призвано уменьшить визуальный шум и улучшить читабельность, гарантируя, что каждое релевантное ключевое слово будет выделено как минимум один раз.
Патент Google, описывающий механизм для рекламодателей (PPC). Если рекламодатель считает контекст определенной поисковой выдачи (SERP) подходящим для размещения рекламы, система автоматически анализирует исходный запрос, органические результаты и показанные объявления конкурентов, чтобы сгенерировать эффективные критерии таргетинга (ключевые слова, темы) для кампании.
Патент описывает инфраструктурные оптимизации для поисковых систем, в частности, для поиска по исходному коду. Он включает два основных механизма: 1) Кэширование результатов для дорогих повторяющихся запросов с обновлением кэша в реальном времени во время индексации. 2) Высокоэффективное префильтрование запросов с регулярными выражениями (regex) с помощью суффиксных массивов и обратного обхода автоматов.