Автор: Виктор Репин

Google использует гибридную систему (DMD) для распознавания объектов на изображениях. Она сочетает модель глубокого обучения, имитирующую зрительную кору мозга (анализ краев и форм), с подходом, основанным на данных (анализ цветов и текстур). Это позволяет системе точно идентифицировать объекты, улучшая понимание содержания изображений для поиска.

Патент Google описывает метод машинного обучения для создания моделей обнаружения объектов. Система анализирует положительные (с объектом) и отрицательные (без объекта) примеры, чтобы найти ключевые визуальные признаки (Distinguishing Feature Values) в определенных местах (Distinctive Locations), которые лучше всего отличают объект от фона. Эти признаки используются для построения дерева решений или инициализации модели деформируемых частей (DPM).

Google разработал систему для агрегации взаимодействий (постов, комментариев) вокруг определенного контента, независимо от того, где они были созданы. Система использует канонические идентификаторы для связи обсуждений на разных платформах (например, в социальной сети и на сайте-источнике) и приоритизирует отображение этих обсуждений на основе социального графа пользователя.

Яндекс патентует метод оптимизации выбора признаков (факторов) для обучения ML-моделей (например, формулы ранжирования). Система использует Условную Взаимную Информацию (CMI) для оценки взаимодействия факторов. Цель — выбрать набор, который совместно дает максимальную предсказательную силу (синергия) и при этом минимально дублирует информацию (избыточность), повышая эффективность модели.

Google отслеживает историю изменений IP-адресов для хостнеймов, чтобы определить, какие сайты размещены на одном физическом сервере или хостинг-сущности. Анализируя эти временные ряды, система группирует сайты со схожими паттернами IP. Это позволяет Google точно управлять нагрузкой (Crawl Rate) и распределять краулинговый бюджет, не перегружая хостинг, даже при использовании CDN или балансировки нагрузки.

Google использует метод глубокого анализа визуальной структуры изображений. Система разделяет изображение на мелкие участки (патчи), вычисляет их характеристики и анализирует, как они соотносятся с соседними участками (автокорреляция). Это позволяет идентифицировать текстуры и повторяющиеся формы в больших областях изображения, создавая уникальный визуальный «отпечаток» для улучшения классификации и поиска похожих изображений (Google Images, Google Lens).

Google использует систему для унифицированного поиска медиаконтента (фильмы, сериалы) из различных источников (стриминговые сервисы, ТВ, локальные хранилища). Система локально определяет, к каким сервисам у пользователя есть доступ (подписки), и фильтрует результаты, показывая только тот контент, который пользователь реально может посмотреть. Это механизм обеспечения видимости контента в агрегированных медиа-платформах.

Google использует гибридный подход для отображения локальных результатов на картах. Чтобы избежать перегрузки браузера и визуального шума, система разделяет результаты. Лучшие результаты передаются как текст для создания интерактивных иконок. Остальные результаты объединяются в единое статичное изображение (оверлей), причем их выбор основан на ранжировании и географической плотности, чтобы точно отразить распределение бизнеса в разных районах.

Google позволяет пользователям исправлять ошибки распознавания голоса естественным образом (например, фразой «Нет, я имел в виду…»). Система анализирует исходный запрос и последующее уточнение, генерирует кандидатов на исправление, оценивает их популярность и фонетическое сходство, и формирует новый, корректный поисковый запрос.

Google улучшает визуальный поиск, анализируя, как различные части изображения соотносятся друг с другом (используя Deformable Parts Model). Это позволяет системе кластеризовать изображения по конкретным подклассам и ракурсам (например, «седан, вид сбоку») и точно идентифицировать похожие объекты, даже если общая композиция изображения отличается.

Google разработал систему для отображения текстовых сниппетов в поисковой выдаче с сохранением их оригинального стиля (шрифт, размер, форматирование) из исходного документа. Для этого система создает отдельные индексы для текста и стилей. Это позволяет пользователям оценить визуальный контекст, важность контента и эстетику сайта непосредственно в SERP, влияя на выбор результата.

Яндекс патентует метод повышения эффективности рекомендательных систем с помощью Item-Specific Decision Trees (ISDT). Вместо одной общей модели система создает отдельную модель деревьев решений (GBDT) для каждого элемента контента. Эта модель предсказывает вероятность взаимодействия пользователя с элементом, используя его взаимодействия с другими элементами в качестве признаков.

Яндекс патентует метод генерации поисковых подсказок (саджеста), который учитывает точное положение курсора в поле ввода. В зависимости от того, находится ли курсор в начале, конце запроса или внутри слова, система применяет разные алгоритмы (вставка, замена или удаление слова), чтобы предложить релевантные варианты на основе истории поисковых запросов.

Этот патент Google описывает систему ранжирования платных рекламных объявлений (PPC) для показа на картах (например, Google Maps). Система использует границы отображаемой карты для определения географического контекста. Ключевым механизмом является аукцион, который отдает приоритет локализованным данным (ставкам и CTR для конкретного местоположения) над общими данными для более точной оценки дохода и релевантности.

Google улучшает поиск изображений, предлагая переводы исходного запроса на языки, где могут быть лучшие результаты. Система оценивает качество переводов на основе поведения пользователей (CTR, частота использования) и показывает визуальное превью для каждой опции. Для превью выбирается изображение, которое пользователи чаще всего кликают по данному переводу.

Патент Google, описывающий механизм улучшения таргетинга рекламы для запросов, содержащих географическое название (например, «посещение Сан-Франциско»). Если по исходному запросу доступно мало рекламы, система идентифицирует коммерчески активные фразы, связанные с этой локацией (например, «отели», «авиабилеты»), формирует новые целевые запросы и использует их для подбора релевантных объявлений.

Google патентует технологию использования радарных систем (например, Project Soli) для улучшения поиска путем интерпретации физических жестов и физиологических данных пользователя в реальном времени. Система может распознать, куда указывает пользователь или в каком направлении он движется, и использовать эту информацию для уточнения поискового запроса (например, поиск кафе в направлении движения) или даже для инициирования поиска без текстового ввода.

Google персонализирует рекомендации контента, анализируя контекст подключения пользователя. Система учитывает тип устройства (смартфон, ПК, ТВ), скорость интернета, время суток и день недели, чтобы определить, какой контент предложить далее. Это позволяет адаптировать рекомендации, например, предлагая короткие видео для мобильных устройств с медленным соединением.

Google обрабатывает визуальные запросы (изображения с текстом), выполняя OCR и оценивая качество распознавания с помощью языковых моделей, адаптированных к географическому положению пользователя. Система идентифицирует надежные текстовые строки и сопоставляет их с базой данных авторитетных («канонических») документов, учитывая также структуру верстки. Это позволяет вернуть пользователю оригинальный цифровой текст или изображение источника.

Google использует статистические методы и структуру данных «суффиксное дерево» для автоматического создания правил изменения окончаний слов (стемминга и генерации вариантов). Система анализирует наблюдаемые пары слов, обобщает их до правил и использует алгоритмы оптимизации, чтобы определить, когда эти правила применимы, а когда нет. Это обеспечивает точность обработки языка даже для редких слов.