Автор: Виктор Репин

2011 Мультимедиа Патенты Google

Как Google использует гибридную архитектуру глубокого обучения для распознавания объектов на изображениях

Google использует гибридную систему (DMD) для распознавания объектов на изображениях. Она сочетает модель глубокого обучения, имитирующую зрительную кору мозга (анализ краев и форм), с подходом, основанным на данных (анализ цветов и текстур). Это позволяет системе точно идентифицировать объекты, улучшая понимание содержания изображений для поиска.

2013 Мультимедиа Патенты Google

Как Google обучает системы компьютерного зрения распознавать объекты на изображениях с помощью дискриминативных признаков

Патент Google описывает метод машинного обучения для создания моделей обнаружения объектов. Система анализирует положительные (с объектом) и отрицательные (без объекта) примеры, чтобы найти ключевые визуальные признаки (Distinguishing Feature Values) в определенных местах (Distinctive Locations), которые лучше всего отличают объект от фона. Эти признаки используются для построения дерева решений или инициализации модели деформируемых частей (DPM).

2013 Патенты Google Персонализация

Как Google объединяет комментарии и посты о контенте с разных платформ, используя канонические идентификаторы и социальный граф

Google разработал систему для агрегации взаимодействий (постов, комментариев) вокруг определенного контента, независимо от того, где они были созданы. Система использует канонические идентификаторы для связи обсуждений на разных платформах (например, в социальной сети и на сайте-источнике) и приоритизирует отображение этих обсуждений на основе социального графа пользователя.

2020 EEAT Обучение моделей Патенты Яндекс Ранжирование

Как Яндекс автоматически выбирает факторы ранжирования для ML-моделей, учитывая их синергию и устраняя избыточность

Яндекс патентует метод оптимизации выбора признаков (факторов) для обучения ML-моделей (например, формулы ранжирования). Система использует Условную Взаимную Информацию (CMI) для оценки взаимодействия факторов. Цель — выбрать набор, который совместно дает максимальную предсказательную силу (синергия) и при этом минимально дублирует информацию (избыточность), повышая эффективность модели.

2010 Индексация Краулинг Патенты Google Техническое SEO

Как Google использует историю изменения IP-адресов для определения границ хостинга и управления краулинговым бюджетом

Google отслеживает историю изменений IP-адресов для хостнеймов, чтобы определить, какие сайты размещены на одном физическом сервере или хостинг-сущности. Анализируя эти временные ряды, система группирует сайты со схожими паттернами IP. Это позволяет Google точно управлять нагрузкой (Crawl Rate) и распределять краулинговый бюджет, не перегружая хостинг, даже при использовании CDN или балансировки нагрузки.

2012 Мультимедиа Патенты Google

Как Google анализирует текстуры и повторяющиеся паттерны в изображениях с помощью автокорреляции локальных признаков

Google использует метод глубокого анализа визуальной структуры изображений. Система разделяет изображение на мелкие участки (патчи), вычисляет их характеристики и анализирует, как они соотносятся с соседними участками (автокорреляция). Это позволяет идентифицировать текстуры и повторяющиеся формы в больших областях изображения, создавая уникальный визуальный «отпечаток» для улучшения классификации и поиска похожих изображений (Google Images, Google Lens).

2012 Мультимедиа Патенты Google Персонализация

Как Google агрегирует и фильтрует медиаконтент на основе подписок пользователя на платформах типа Google TV

Google использует систему для унифицированного поиска медиаконтента (фильмы, сериалы) из различных источников (стриминговые сервисы, ТВ, локальные хранилища). Система локально определяет, к каким сервисам у пользователя есть доступ (подписки), и фильтрует результаты, показывая только тот контент, который пользователь реально может посмотреть. Это механизм обеспечения видимости контента в агрегированных медиа-платформах.

2009 Local SEO Патенты Google

Как Google балансирует ранжирование, плотность и производительность при отображении локальных результатов на картах

Google использует гибридный подход для отображения локальных результатов на картах. Чтобы избежать перегрузки браузера и визуального шума, система разделяет результаты. Лучшие результаты передаются как текст для создания интерактивных иконок. Остальные результаты объединяются в единое статичное изображение (оверлей), причем их выбор основан на ранжировании и географической плотности, чтобы точно отразить распределение бизнеса в разных районах.

2015 Патенты Google Семантика и интент

Как Google исправляет ошибки распознавания голосовых запросов с помощью последующих уточнений пользователя

Google позволяет пользователям исправлять ошибки распознавания голоса естественным образом (например, фразой «Нет, я имел в виду…»). Система анализирует исходный запрос и последующее уточнение, генерирует кандидатов на исправление, оценивает их популярность и фонетическое сходство, и формирует новый, корректный поисковый запрос.

2014 SERP Индексация Мультимедиа Патенты Google

Как Google использует «Модели деформируемых частей» (DPM) для распознавания конкретных объектов и ракурсов на изображениях

Google улучшает визуальный поиск, анализируя, как различные части изображения соотносятся друг с другом (используя Deformable Parts Model). Это позволяет системе кластеризовать изображения по конкретным подклассам и ракурсам (например, «седан, вид сбоку») и точно идентифицировать похожие объекты, даже если общая композиция изображения отличается.

2014 SERP Мультимедиа Патенты Google

Как Google извлекает и может отображать оригинальный дизайн (стили) контента в сниппетах поисковой выдачи

Google разработал систему для отображения текстовых сниппетов в поисковой выдаче с сохранением их оригинального стиля (шрифт, размер, форматирование) из исходного документа. Для этого система создает отдельные индексы для текста и стилей. Это позволяет пользователям оценить визуальный контекст, важность контента и эстетику сайта непосредственно в SERP, влияя на выбор результата.

2024 Обучение моделей Патенты Яндекс Рекомендательные системы Яндекс Дзен Яндекс Музыка

Как Яндекс использует индивидуальные модели деревьев решений (ISDT) для ранжирования контента в рекомендательных системах (Музыка, Дзен)

Яндекс патентует метод повышения эффективности рекомендательных систем с помощью Item-Specific Decision Trees (ISDT). Вместо одной общей модели система создает отдельную модель деревьев решений (GBDT) для каждого элемента контента. Эта модель предсказывает вероятность взаимодействия пользователя с элементом, используя его взаимодействия с другими элементами в качестве признаков.

2017 Интент пользователя Патенты Яндекс Поведенческие факторы Поисковые подсказки

Как Яндекс динамически меняет поисковые подсказки в зависимости от положения курсора в строке поиска

Яндекс патентует метод генерации поисковых подсказок (саджеста), который учитывает точное положение курсора в поле ввода. В зависимости от того, находится ли курсор в начале, конце запроса или внутри слова, система применяет разные алгоритмы (вставка, замена или удаление слова), чтобы предложить релевантные варианты на основе истории поисковых запросов.

2005 Патенты Google Поведенческие сигналы

Как Google ранжирует платные объявления на Картах, отдавая приоритет локализованным ставкам и истории эффективности

Этот патент Google описывает систему ранжирования платных рекламных объявлений (PPC) для показа на картах (например, Google Maps). Система использует границы отображаемой карты для определения географического контекста. Ключевым механизмом является аукцион, который отдает приоритет локализованным данным (ставкам и CTR для конкретного местоположения) над общими данными для более точной оценки дохода и релевантности.

2009 Мультимедиа Мультиязычность Патенты Google

Как Google использует поведенческие данные и превью для улучшения кросс-языкового поиска по картинкам

Google улучшает поиск изображений, предлагая переводы исходного запроса на языки, где могут быть лучшие результаты. Система оценивает качество переводов на основе поведения пользователей (CTR, частота использования) и показывает визуальное превью для каждой опции. Для превью выбирается изображение, которое пользователи чаще всего кликают по данному переводу.

2011 Патенты Google Семантика и интент

Как Google переписывает геолокационные запросы для показа более релевантной рекламы, если исходный запрос имеет низкий коммерческий потенциал

Патент Google, описывающий механизм улучшения таргетинга рекламы для запросов, содержащих географическое название (например, «посещение Сан-Франциско»). Если по исходному запросу доступно мало рекламы, система идентифицирует коммерчески активные фразы, связанные с этой локацией (например, «отели», «авиабилеты»), формирует новые целевые запросы и использует их для подбора релевантных объявлений.

2014 Патенты Google Персонализация

Как Google использует радар для понимания жестов и физического состояния пользователя при обработке поисковых запросов

Google патентует технологию использования радарных систем (например, Project Soli) для улучшения поиска путем интерпретации физических жестов и физиологических данных пользователя в реальном времени. Система может распознать, куда указывает пользователь или в каком направлении он движется, и использовать эту информацию для уточнения поискового запроса (например, поиск кафе в направлении движения) или даже для инициирования поиска без текстового ввода.

2013 Патенты Google Персонализация

Как Google использует тип устройства, скорость соединения и время суток для персонализации рекомендаций контента

Google персонализирует рекомендации контента, анализируя контекст подключения пользователя. Система учитывает тип устройства (смартфон, ПК, ТВ), скорость интернета, время суток и день недели, чтобы определить, какой контент предложить далее. Это позволяет адаптировать рекомендации, например, предлагая короткие видео для мобильных устройств с медленным соединением.

2011 Мультимедиа Мультиязычность Патенты Google

Как Google использует OCR, геолокацию и структуру текста для сопоставления изображений с каноническими документами

Google обрабатывает визуальные запросы (изображения с текстом), выполняя OCR и оценивая качество распознавания с помощью языковых моделей, адаптированных к географическому положению пользователя. Система идентифицирует надежные текстовые строки и сопоставляет их с базой данных авторитетных («канонических») документов, учитывая также структуру верстки. Это позволяет вернуть пользователю оригинальный цифровой текст или изображение источника.

2009 SERP Индексация Мультиязычность Патенты Google

Как Google автоматически генерирует правила нормализации слов и поиска вариантов с помощью суффиксных деревьев

Google использует статистические методы и структуру данных «суффиксное дерево» для автоматического создания правил изменения окончаний слов (стемминга и генерации вариантов). Система анализирует наблюдаемые пары слов, обобщает их до правил и использует алгоритмы оптимизации, чтобы определить, когда эти правила применимы, а когда нет. Это обеспечивает точность обработки языка даже для редких слов.