Google разработал систему для обнаружения веб-ресурсов, предлагающих поддержку через чат. Система может встраивать стандартизированный чат-интерфейс прямо в страницу результатов поиска (SERP) рядом с соответствующей ссылкой или предлагать начать чат через голосового помощника. Google выступает посредником (gateway), контролируя интерфейс и поддерживая стабильность соединения.
Автор: Виктор Репин
Google использует систему для оценки авторов онлайн-контента, рассчитывая показатели репутации (на основе отзывов и известности), подлинности (проверяя личность автора) и авторитетности (на основе подтвержденного опыта, такого как образование, работа и цитирования). Эти оценки, детально описанные в патенте, используются для влияния на поисковое ранжирование и распределение доходов.
Google анализирует фотографии, загружаемые пользователями (например, в социальные сети), для выявления трендовых событий в реальном времени. Система распознает объекты на фото, определяет тематику и местоположение, а затем ищет кластеры похожих фотографий. Обнаружение значительного кластера сигнализирует о важном событии и используется для корректировки доставки контента (новости, тренды) и лучшего понимания актуальных поисковых запросов.
Google анализирует разницу между полным кодом страницы (DOM) и тем, что фактически видит пользователь (Render Tree). Текст, присутствующий в коде, но невидимый при загрузке (например, скрытый в выпадающих меню, через CSS или мелким шрифтом), помечается как «скрытый». Система использует эти данные для пессимизации скрытого текста при выборе сниппетов и понижает в ранжировании страницы, злоупотребляющие невидимым контентом.
Анализ патента Google, описывающего метрику LACTR для ранжирования цифровых ресурсов (например, приложений). Система измеряет долгосрочную удовлетворенность пользователей, вычитая «короткие удаления» (быстрое удаление после установки) из общего числа загрузок. Это позволяет продвигать ресурсы, которые пользователи оставляют надолго, и фильтровать кликбейт, фокусируясь на удержании (Retention).
Патент описывает эффективные алгоритмы (Shingling) для создания цифровых отпечатков веб-страниц. Разбивая контент на перекрывающиеся последовательности (шинглы) и выбирая репрезентативное подмножество, Google может быстро сравнивать миллиарды документов для выявления дубликатов, почти дубликатов (near-duplicates) и шаблонного контента.
Google анализирует не только тему запроса, но и его характеристики, такие как чрезмерная длина (специфичность) или частое повторение. Обнаружение этих нетипичных паттернов позволяет системе сделать вывод о принадлежности пользователя к определенной группе (например, студенты ВУЗа или жители города). Затем характеристики этой группы приписываются пользователю для более точного таргетинга контента и рекламы.
Google анализирует контент фотографий, размещенных в интернете или загруженных пользователями, используя автоматические метки и данные о геолокации/времени. Это позволяет системе создавать детальные описания территорий, определять точки интереса (POI), отслеживать события и изменения (например, открытие бизнеса), не полагаясь только на текстовые данные.
Google использует сигналы интереса пользователя (клики, время просмотра) для динамической корректировки весов различных источников данных (например, ключевых слов, тем, типов контента). Система определяет, какие источники наиболее полезны для конкретного пользователя, и повышает их значимость при ранжировании последующих результатов поиска, тем самым персонализируя выдачу.
Google патентует систему проактивной доставки контента («микросайтов»), которая не требует запроса пользователя. Система анализирует контекст (данные сенсоров, местоположение, время, активность) и профиль пользователя (интересы, история, социальные связи). Контент ранжируется с использованием многофакторной модели, включающей сигналы популярности, персонализации и социальные факторы, и автоматически доставляется на устройство в нужный момент.
Google использует эволюционный механизм для определения оптимальной последовательности применения корректировок ранжирования (Adjusters/Twiddlers). Система тестирует различные упорядоченные списки, используя исторические данные о кликах и времени на сайте (Dwell Time), чтобы определить, какая последовательность лучше всего ранжирует результаты, предпочитаемые пользователями.
Система Google для визуального поиска товаров, которая анализирует изображения, извлекая глобальные и локальные признаки (цвет, форма, текстура). Патент описывает, как это позволяет пользователям искать похожие товары, выделяя конкретные части объекта (например, узор на сумке или форму каблука), используя технологию, лежащую в основе Google Lens.
Google использует систему для выявления уникальных интересов пользователей в конкретных городах путем идентификации «избыточных запросов» — тем, которые ищут значительно чаще, чем в среднем по стране. Анализируя эти паттерны во времени, система находит другие города с похожим поисковым поведением. Эта информация используется для переноса данных таргетинга между похожими локациями.
Google использует систему для валидации данных о сущностях от сторонних поставщиков перед их добавлением в Knowledge Graph. Система группирует похожие сущности (используя «семантические отпечатки»), проверяет их на соответствие правилам (например, наличие обязательных полей) и генерирует отчеты об ошибках или автоматически дополняет данные для успешного онбординга.
Google использует вероятностную модель для ранжирования поисковых подсказок (Autosuggest). Система вычисляет вероятность того, что пользователь ищет Запрос или URL, и является ли это повторным или новым поиском. Подсказки из разных источников (личная история, глобальная история) ранжируются на основе этой вероятности, а не по источнику происхождения.
Патент Google, описывающий систему анализа поведения пользователя после перехода по ссылке. Система измеряет интерес пользователя (время визита, взаимодействие с контентом), чтобы отличать случайные клики от качественных сессий. Эти данные используются для изменения вида посещенных ссылок и, что критически важно, для переупорядочивания результатов поиска.
Анализ патента, описывающего фундаментальные методы Information Retrieval для представления документов и пользователей в виде векторов. Патент охватывает использование различных модальностей (текст, ссылки, URL, жанр, характеристики изображений, поведение пользователей) для расчета схожести, кластеризации контента и создания систем рекомендаций, основанных на анализе паттернов потребления информации.
Google использует продвинутые статистические модели (глубокие сверточные нейронные сети) для анализа изображений фасадов бизнеса (например, Street View или фото пользователей). Система автоматически определяет множественные иерархические категории (например, «Пиццерия» → «Ресторан» → «Еда»), используя онтологию и анализируя визуальные признаки. Это позволяет Google верифицировать данные о бизнесе и улучшать релевантность локального поиска.
Google использует систему для сбора и проверки данных о точках интереса (POI) от пользователей мобильных устройств. Система проверяет точность данных двумя способами: автоматически, через кластеризацию (если несколько пользователей сообщают об одном и том же объекте в одном месте), или вручную, через модерацию. Также используется система репутации для оценки надежности пользователей, предоставляющих данные.
Google использует систему для оценки того, насколько визуальное содержание изображения соответствует теме веб-страницы, на которой оно размещено. Система независимо определяет темы страницы (из текста) и темы изображения (используя компьютерное зрение) и рассчитывает показатель соответствия (Topic Match Score). В поиске по картинкам предпочтение отдается изображениям, которые не только релевантны запросу, но и тематически соответствуют контенту страницы-хоста.