Автор: Виктор Репин

2011 Антиспам Краулинг Патенты Google Свежесть контента

Как Google оптимизирует скорость генерации поисковой выдачи с помощью адаптивного планирования внутренних задач

Google использует систему адаптивного планирования для ускорения ответа на поисковый запрос. Система разбивает запрос на множество внутренних задач (например, поиск, парсинг, фильтрация) и прогнозирует время их выполнения на основе исторических данных и контекста (например, времени суток). Это позволяет оптимально распределить нагрузку на процессоры и минимизировать общее время генерации SERP.

2014 EEAT и качество Индексация Патенты Google Семантика и интент

Как Google предотвращает конфликты правил в системах проспективного поиска (фильтрации потоков данных)

Анализ патента Google, описывающего управление проспективными поисковыми запросами. В отличие от стандартного веб-поиска, проспективный поиск фильтрует входящие потоки данных по заранее заданным правилам (например, системы обновлений устройств). Патент предлагает метод для обнаружения перекрывающихся или конфликтующих правил (запросов) на этапе их создания, чтобы избежать дублирования действий при обработке данных.

2012 Патенты Google Поведенческие сигналы

Как Google предлагает сменить поисковую систему, если пользователь не удовлетворен текущими результатами поиска

Патент описывает механизм, работающий на устройстве пользователя (например, в браузере или тулбаре), который отслеживает взаимодействие с первой поисковой системой. Если система определяет, что информационная потребность пользователя не удовлетворена (например, нет кликов по результатам, частые переформулировки), она предлагает воспользоваться альтернативной поисковой системой.

2024 Антиспам Обучение моделей Патенты Яндекс Ранжирование

Как Яндекс (CatBoost) преобразует категориальные признаки в числа для машинного обучения и борется с переобучением

Патент описывает ключевые механизмы алгоритма CatBoost, используемого Яндексом для ранжирования. Он раскрывает, как система преобразует категориальные признаки (например, регион, тип сайта, URL) в числовые значения. Для предотвращения переобучения используется метод упорядочивания данных и расчета статистики признака только на основе «прошлых» данных в этом порядке, что повышает надежность моделей ранжирования.

2012 Shumeet Baluja Патенты Google Семантика и интент

Как Google использует контент сайтов, встраивающих карты, для понимания тематики локаций и таргетинга рекламы

Google анализирует контент веб-сайтов, которые встраивают карты определенных географических локаций (например, через Maps API). Ключевые слова извлекаются с этих сайтов и ассоциируются с соответствующими географическими областями («ячейками карты»). Эти данные затем используются для повышения релевантности рекламных объявлений, таргетированных на эти локации.

2010 Gal Chechik Мультимедиа Патенты Google

Как Google использует «слуховые образы» и разреженные признаки для понимания и поиска аудиоконтента по текстовым запросам

Патент описывает систему поиска аудиофайлов (и аудиодорожек видео) по текстовым запросам. Google преобразует звук в «слуховой образ», имитируя человеческое ухо (кохлеарная модель), извлекает из него разреженные признаки (sparse features) и обучает модель связывать эти звуковые признаки с ключевыми словами. Это позволяет классифицировать и находить аудиоконтент (например, «рев льва», «шум дождя») без использования метаданных.

2008 Индексация Краулинг Патенты Google

Как Google статистически определяет значимые шаблоны URL (префиксы и суффиксы) для улучшения каноникализации и эффективности сканирования

Google использует статистический метод для анализа больших наборов URL и выявления общих префиксов или суффиксов, которые встречаются чаще, чем ожидалось случайно. Это помогает Google понять структуру URL, сгруппировать похожий контент и определить нерелевантные части URL (например, общие префиксы пути или поддомены), чтобы улучшить каноникализацию и избежать сканирования дублирующегося контента.

2011 Мультиязычность Патенты Google

Как Google использует логи запросов, чтобы выбирать лучшие переводы для межъязыковых подсказок в Autocomplete

Google разработал систему для улучшения качества межъязыковых поисковых подсказок (Autocomplete). Вместо буквального перевода система оценивает различные варианты перевода, отдавая предпочтение тем фразам, которые чаще всего используются носителями целевого языка в качестве реальных поисковых запросов. Это гарантирует, что предложенная подсказка является не только точным переводом, но и эффективным поисковым запросом.

2008 Краулинг Патенты Google Свежесть контента Техническое SEO

Как Google предлагает использовать номера версий контента для управления <lastmod> в Sitemap и обеспечивать свежесть индекса

Патент описывает метод обеспечения актуальности индекса для контента, у которого нет надежной даты последнего изменения (например, данные в БД). Система отслеживает внутренние номера версий контента. Если версия изменилась с момента последней генерации Sitemap, в тег <lastmod> принудительно ставится текущая дата, что заставляет краулер обновить данные в индексе.

2008 Мультимедиа Патенты Google

Как Google итеративно генерирует запросы из метаданных контента для поиска «Похожих Видео» (на примере YouTube)

Google (в частности, YouTube, упомянутый в патенте) использует итеративный процесс для генерации списков связанного контента. Система анализирует метаданные (заголовок, описание, теги) просматриваемого элемента и создает упорядоченный список ключевых слов. Затем она формирует внутренний поисковый запрос и автоматически уточняет его — сужая добавлением слов или расширяя удалением слов — пока не будет найдено оптимальное количество похожих результатов.

2013 Патенты Google Персонализация Семантика и интент

Как Google определяет, когда показывать пользователю его личные данные (Gmail, Контакты) вместо результатов веб-поиска

Google создает детальную модель пользователя (User Model) на основе его личного контента (письма, контакты, события). При получении запроса система анализирует эту модель, чтобы определить намерение пользователя (Intent Score): ищет ли он свои личные данные или общую информацию в интернете. Это позволяет автоматически активировать персональный поиск только тогда, когда это релевантно контексту и времени.

2009 Shumeet Baluja Мультимедиа Патенты Google

Как Google использует машинное обучение для распознавания изображений и создания неявных связей между документами

Google использует комбинацию алгоритмов машинного обучения (AdaBoost и Hillclimbing) для точного отделения изображений от текста на сканированных страницах. Система анализирует локальные визуальные признаки (например, SIFT), чтобы классифицировать контент и находить идентичные изображения в разных документах, создавая на их основе неявные связи (implicit links) между источниками.

2021 Мультимедиа Патенты Google

Как Google создает и показывает интерактивные 3D-модели и видео локаций в Поиске и Картах

Google разрабатывает систему для показа интерактивных 3D-моделей или видеороликов конкретных мест (например, достопримечательностей) в ответ на запросы о локациях. Система извлекает модель конкретного объекта из глобальной 3D-реконструкции мира и может добавлять симуляцию реальных условий, таких как погода или трафик. Это меняет представление результатов в SERP, Картах и AR-приложениях.

2012 Matthew Sharifi Мультимедиа Патенты Google

Как Google использует цифровые отпечатки контента для автоматического изучения и исправления опечаток в метаданных

Google использует технологию цифровых отпечатков (фингерпринтинг) для идентификации одинакового контента (например, видео), загруженного разными пользователями. Сравнивая метаданные (заголовки, теги) этих идентичных файлов, система автоматически выявляет распространенные опечатки и создает базу соответствий. Это позволяет улучшить полноту поисковой выдачи, включая в нее контент с ошибками в метаданных.

2003 Патенты Google Персонализация

Как Google позволяет пользователям настраивать ранжирование и отбор источников в агрегаторе новостей (Google News)

Патент Google, описывающий механизм персонализации новостного агрегатора (Google News). Система позволяет пользователям создавать постоянные новостные разделы на основе запросов и настраивать правила ранжирования внутри них: выбирать предпочтительные источники, блокировать нежелательные, повышать статьи по ключевым словам или авторам, а также управлять сортировкой по свежести или важности.

2017 SERP Метрики качества поиска Патенты Яндекс Яндекс Директ

Как Яндекс адаптирует выбор и размещение рекламы в зависимости от качества органической выдачи

Яндекс патентует механизм адаптации показа рекламы на SERP. Система рассчитывает «Коэффициент Релевантности» органических результатов, предсказывая удовлетворенность пользователя на основе исторических поведенческих данных. В зависимости от этого коэффициента, Яндекс выбирает, какие рекламные объявления (из разных групп, например, по CTR или CPC) и на каких позициях показывать.

2003 Мультиязычность Патенты Google

Как Google определяет язык и кодировку документа, комбинируя метаданные и анализ байтовых последовательностей

Google использует вероятностную модель (Байесовский классификатор) для точной идентификации языка и кодировки документа. Система анализирует две группы сигналов: атрибуты документа (домен верхнего уровня, HTTP-заголовки, HTML-теги) и непосредственно текст, анализируемый на уровне байтовых триграмм. Это позволяет корректно определять язык даже при противоречивых метаданных и эффективно обрабатывать многобайтовые кодировки (например, азиатские языки).

2003 Индексация Патенты Google

Как Google индексирует числа для обеспечения эффективного поиска по диапазонам (цены, даты, размеры)

Патент Google, описывающий механизм индексирования чисел и обработки запросов с числовыми диапазонами. Система раскладывает каждое число на компоненты (логарифмическую характеристику и отдельные цифры) и сохраняет их как специальные числовые термины в индексе. Это позволяет пользователям эффективно находить документы, содержащие числа в заданном диапазоне (например, товары по цене от $200 до $500).

2008 Индексация Краулинг Патенты Google

Как Google использует итеративное зондирование для сканирования и индексации контента, скрытого за веб-формами (Deep Web)

Google применяет систему для индексации «Глубокого веба» (Deep Web), автоматически определяя, какие ключевые слова вводить в веб-формы. Система использует итеративное зондирование: извлекает начальные слова, отправляет их, анализирует уникальность результатов и извлекает новые слова. Это позволяет находить контент, недоступный при обычном сканировании, и оптимизировать краулинговый бюджет на основе обратной связи по трафику.

2014 Патенты Google Персонализация Поведенческие сигналы

Как Google использует репутацию и социальные связи пользователей для ранжирования приложений в App Store (ASO)

Анализ патента Google, описывающего механизм ранжирования для магазинов приложений (ASO). Система создает связи между приложениями через пользователей, которые их установили. Ранжирование основано на «Reputation Score» (влиятельности пользователя в соцсетях) и «Trust Score» (социальной близости к ищущему). Приложения, установленные влиятельными людьми или друзьями, ранжируются выше.