Автор: Виктор Репин

2014 Google Shopping Индексация Патенты Google Свежесть контента

Как Google рассчитывает точные цены на авиабилеты для разных продавцов в рамках одного запроса (Google Flights)

Патент Google, описывающий внутренний механизм систем планирования путешествий (например, Google Flights). Он позволяет эффективно и точно рассчитывать стоимость авиабилетов, учитывая разные правила (цены, налоги, ограничения) для разных продавцов (авиакомпаний и агентств) в рамках одного поискового запроса, избегая ошибок и высоких вычислительных затрат.

2022 Патенты Google Свежесть контента

Как Google использует гибридную архитектуру индекса (RAM+SSD) для баланса скорости, свежести и стоимости хранения данных

Google использует двухуровневую архитектуру индекса для обработки огромных объемов данных. «Свежий» индекс хранится в быстрой, но дорогой оперативной памяти (RAM) для мгновенных обновлений. Основной «стабильный» индекс хранится на более медленных, но дешевых SSD-накопителях. Это позволяет системе балансировать между скоростью доступа, актуальностью контента и стоимостью инфраструктуры.

2007 Индексация Патенты Google

Как Google ускоряет обработку запросов к многомерным базам данных (например, в Google Analytics) с помощью хеширования фиксированной длины

Патент Google, описывающий инфраструктурную оптимизацию баз данных для ускорения сложных запросов к многомерным данным (например, отчетам веб-аналитики). Система создает компактный хеш фиксированной длины для каждой записи, разбивая его на сегменты для каждого поля. Это позволяет быстро фильтровать данные, сравнивая хеши запроса с хешами записей, вместо доступа к полным данным.

2010 Патенты Google Персонализация

Как Google динамически балансирует количество рекламных объявлений для основного и связанных запросов на странице выдачи

Google использует механизм для оптимизации показа рекламы на SERP. Система генерирует связанные запросы к исходному запросу пользователя и формирует отдельные блоки рекламы для каждого из них. Затем она балансирует количество объявлений в этих блоках, динамически расширяя или сужая критерии подбора рекламы (семантический охват), чтобы обеспечить разнообразие и равномерное заполнение рекламного пространства.

2005 Knowledge Graph Патенты Google

Как Google использует фильтры Блума, чтобы быстро решать, искать ли ответ в базе фактов (Knowledge Graph)

Google использует фильтры Блума для оптимизации доступа к своей базе фактов (Facts Repository/Knowledge Graph). Система быстро проверяет, содержатся ли термины запроса и потенциальные пары атрибут-значение в базе данных. Это позволяет избежать дорогостоящих операций поиска, если ответ заведомо отсутствует.

2017 Метрики качества поиска Обучение моделей Патенты Яндекс Поведенческие факторы

Как Яндекс ускоряет A/B тестирование, прогнозируя будущее поведение пользователей для оценки изменений в поиске

Яндекс патентует метод повышения чувствительности и скорости A/B тестов. Вместо длительного сбора данных система использует машинное обучение (например, градиентный бустинг) для прогнозирования будущих метрик пользователей (клики, сессии) на основе краткосрочных данных. Это позволяет быстрее и точнее оценивать влияние изменений в алгоритмах ранжирования или интерфейсе SERP.

2006 Индексация Патенты Google Свежесть контента

Как Google непрерывно обновляет свой индекс и освобождает место, используя систему хранения «Treadmilling» (Беговая дорожка)

Анализ инфраструктурного патента Google, описывающего высокоэффективную систему управления хранилищем данных (Tokenspace Repository). Патент раскрывает механизм «Treadmilling», который позволяет Google постоянно обновлять документы в индексе и эффективно удалять старые версии, восстанавливая дисковое пространство без остановки обработки поисковых запросов. Это основа для обеспечения свежести и масштабируемости поиска.

2005 Патенты Google Персонализация

Как Google предлагает автоматически закреплять результаты поиска и рекламу в виде постоянных вкладок (Persistent References) для улучшения навигации

Патент Google описывает механизм улучшения UX при навигации по результатам поиска или рекламе. Система может автоматически или вручную «назначать» интересующие ссылки и отображать их как «постоянные ссылки» (например, вкладки), которые остаются видимыми при переходе на другие страницы. Это позволяет пользователю быстро переключаться между выбранными результатами без возврата на исходную страницу SERP.

2012 Matthew Sharifi Индексация Мультимедиа Патенты Google

Как Google фильтрует статичные кадры и тишину из живых трансляций перед индексацией контента

Патент описывает инфраструктурный механизм для повышения эффективности систем сопоставления контента (таких как Content ID). Система в реальном времени анализирует входящие живые аудио- и видеопотоки, вычисляет цифровые отпечатки и сравнивает их внутри скользящего временного окна. Если отпечатки слишком похожи (например, статичное изображение или тишина), система помечает этот сегмент как неактивный и предотвращает его добавление в индекс, экономя ресурсы и снижая количество ложных срабатываний.

2024 Антиспам Обучение моделей Патенты Яндекс Ранжирование

Как Яндекс улучшает обучение ранжирующих моделей (CatBoost) с помощью инъекции шума на старте

Яндекс патентует метод обучения алгоритмов на основе деревьев решений (например, CatBoost). Вместо стандартного начала обучения, система создает начальные «шумовые деревья» со случайными значениями, в том числе в пустых узлах. Это служит техникой регуляризации, повышая стабильность и качество итоговой модели ранжирования и делая ее более устойчивой к переобучению.

2025 Патенты Яндекс Рекомендательные системы Яндекс Дзен Яндекс Музыка

Как Яндекс использует Item-Specific Decision Trees (ISDT) и CatBoost для масштабирования систем рекомендаций

Яндекс патентует архитектуру для систем рекомендаций (например, Музыка, Дзен), основанную на Gradient Boosting (CatBoost). Вместо одной большой модели система создает отдельную модель (ISDT) для каждого элемента (трека или статьи). Каждая ISDT-модель предсказывает вероятность взаимодействия с этим элементом, используя в качестве признаков историю взаимодействия пользователя с другими элементами. Это позволяет эффективно масштабировать обучение.

2024 Обучение моделей Патенты Яндекс Рекомендательные системы Яндекс Музыка

Как Яндекс строит индивидуальные модели рекомендаций для каждого элемента контента с помощью CatBoost (Архитектура ISDT)

Яндекс патентует архитектуру для рекомендательных систем (например, Музыка, Дзен). Вместо одной большой модели используется множество Item-Specific Decision Trees (ISDT) — по одной модели CatBoost для каждого трека или статьи. Каждая модель предсказывает вероятность взаимодействия с элементом, используя в качестве признаков исключительно историю взаимодействий пользователя с другими элементами. Это позволяет масштабировать и распараллеливать обучение.

2012 Мультимедиа Патенты Google

Как Google использует гомографию для группировки изображений, снятых с идентичного ракурса

Google использует технологию компьютерного зрения для анализа геометрических отношений (гомографии) между изображениями в больших коллекциях. Система кластеризует фотографии, которые показывают одну и ту же сцену, и идентифицирует те, которые сняты с практически идентичной точки обзора, сравнивая матрицу гомографии с Единичной матрицей. Это улучшает навигацию в сервисах, таких как Google Maps и Image Search.

2011 Мультиязычность Патенты Google

Как Google определяет язык смешанных запросов с помощью посимвольного анализа на стороне клиента

Google использует легковесный механизм для определения языка поисковых подсказок, который может выполняться на стороне клиента. Система анализирует каждый символ подсказки и оценивает, насколько он уникален для разных языков, используя локальную базу данных. Это позволяет точно определить исходный язык даже для смешанных запросов (например, Английский + Китайский) и обеспечить качественный машинный перевод кросс-язычных подсказок.

2008 Индексация Патенты Google

Как Google оптимизирует хранение и скорость поиска в больших индексах с помощью субсемплирования (LSH)

Патент Google, описывающий инфраструктурный механизм для эффективного управления размером индекса и скоростью поиска. Вместо полного игнорирования часто встречающихся признаков (ключей), Google пропорционально сокращает (субсемплирует) количество ссылок на документы, содержащие эти признаки. Это позволяет учитывать общие элементы контента при поиске совпадений, не перегружая систему.

2016 Мультимедиа Патенты Google

Как Google ускоряет голосовой поиск, предугадывая окончание запроса и заранее загружая результаты

Google использует механизм оптимизации производительности голосового поиска. Система анализирует начало фразы пользователя (промежуточную транскрипцию) и ищет совпадения с популярными запросами из логов. Результаты для этих популярных запросов загружаются заранее (prefetching). Если финальный запрос пользователя совпадает с одним из предугаданных, результаты отдаются мгновенно из кэша, минуя стандартный поиск.

2012 Google Shopping Патенты Google

Как Google позволяет рекламодателям размещать платный контент прямо в блоке поисковых подсказок (Autocomplete)

Патент описывает систему и интерфейс (например, Google Ads), позволяющий рекламодателям таргетировать показ спонсируемого контента непосредственно в выпадающем блоке поисковых подсказок (Search Suggestion Control). Система позволяет выбирать частичные запросы (префиксы) и участвовать в аукционе за размещение рекламы рядом с органическими вариантами автозаполнения.

2014 Google Shopping Мультимедиа Патенты Google

Как Google группирует похожие результаты в вертикальном поиске (например, Google Flights) и отображает их на временной шкале

Механизм UX/UI для вертикального поиска (например, Google Flights). Система кластеризует похожие результаты (например, рейсы с близкой ценой и длительностью) и отображает их в виде компактной группы на временной шкале (Timeline), улучшая восприятие выдачи.

2003 Индексация Патенты Google

Как Google использует многоуровневые индексы (Standard и Extended) и оптимизирует поиск по дополнительному индексу

Google использует систему многоуровневых индексов: стандартный (быстрый) и расширенный (полный). Расширенный индекс ищется, только если в стандартном найдено мало результатов. Для ускорения поиска по большому расширенному индексу система использует «Индекс разделов» (Partition Index), который позволяет искать только в тех сегментах базы данных, где содержатся искомые термины, пропуская остальные.

Local SEO Вертикальный поиск Патенты Яндекс Яндекс Карты

Как Яндекс интегрирует поиск по организациям прямо в адресную книгу мобильного устройства

Яндекс патентует метод расширения функциональности стандартной адресной книги мобильного устройства. Система позволяет пользователю искать контакты не только среди сохраненных локально, но и в удаленной базе данных Яндекса (например, в Справочнике организаций). При вводе имени или запроса система ищет совпадения локально и запрашивает данные с сервера, объединяя результаты в единый интерфейс и учитывая местоположение пользователя.