Google анализирует активность контактов пользователя в социальных сетях (посты, комментарии, лайки) и извлекает из этого контента ключевые фразы (n-grams). Эти фразы ранжируются по значимости, учитывая объем активности и близость контактов (affinity). Наиболее релевантные фразы используются для генерации персонализированных подсказок или рекомендуемых действий внутри социальной платформы.
Автор: Виктор Репин
Google записывает действия пользователя (запросы, клики по результатам и рекламе, посещенные сайты) для персонализации поиска. Система может изменять порядок стандартных результатов, повышая сайты на основе частоты и времени предыдущих посещений. Также она может внедрять в выдачу релевантные исторические события и отображать индикаторы прошлой активности, такие как дата последнего визита.
Google использует механизм, позволяющий авторизованным владельцам сайтов напрямую отправлять структурированные данные (например, цены, наличие товара) в поисковый индекс. Этот процесс происходит по требованию («unscheduled update sequence»), значительно быстрее стандартного сканирования, и позволяет передавать приватные данные, недоступные публично на сайте.
Этот патент описывает, как Google автоматически идентифицирует страницы электронной коммерции и извлекает структурированные данные о товарах (такие как цена и изображение) из неструктурированного HTML. Система использует анализ близости элементов, структуру HTML и сигналы форматирования для поиска правильных атрибутов, что формирует основу для поисковых систем по товарам, таких как Google Shopping.
Яндекс патентует метод для рекомендательных систем, позволяющий прогнозировать векторное представление (эмбеддинг) нового контента до того, как пользователи начали с ним взаимодействовать. Система обучается предсказывать, каким будет поведенческий эмбеддинг (основанный на коллаборативной фильтрации, например, SVD), используя только содержание элемента (текст). Это позволяет сразу рекомендовать свежий контент релевантным пользователям.
Google разрабатывает систему для обнаружения и индексации NFT непосредственно из данных блокчейна. Система анализирует байт-код, чтобы идентифицировать потенциальные NFT, проверяя события-триггеры смарт-контрактов, соответствие стандартам (например, EIP-721) и намерения создателей. Перед индексацией система оценивает качество связанного цифрового актива (разрешение, уникальность, содержание), чтобы отфильтровать низкокачественный или нежелательный контент.
Google использует этот механизм для интеграции персонализированного контента (из социальных сетей и подписок пользователя) в общую поисковую выдачу. Система применяет сложное дерево решений, чтобы определить, когда показывать этот контент, основываясь на его свежести (Recency), тематической актуальности (Topicality Score) и общем качестве/релевантности для пользователя (Post Score), а также адаптируясь под трендовые запросы.
Google использует технологию анализа структуры документа (DOM-дерева) для отделения основного содержания страницы от шаблонных элементов (boilerplate) — таких как навигационные меню, футеры, списки ссылок и рекламные блоки. Система анализирует геометрические, структурные и иерархические признаки элементов (например, размер, форму, количество дочерних ссылок, расположение), чтобы классифицировать контент как шаблонный и исключить его при анализе тематики страницы.
Google может идентифицировать, когда органический результат поиска и рекламное объявление (спонсируемый контент) относятся к одному и тому же бренду или сущности. В этом случае система объединяет элементы из обоих источников (например, органическую ссылку, текст и изображения из рекламы, карту, отзывы) в единый, визуально расширенный блок. Этот блок отображается как один результат поиска и заменяет исходные элементы на странице выдачи.
Google использует систему для анализа видеоконтента с помощью текстовых, визуальных и аудиосигналов. Система определяет «ключевые моменты» (salient topics), генерирует для них текстовые метки и интеллектуально выбирает наиболее релевантные стоп-кадры. Эти «временные анкоря» (Video Timed Anchors) позволяют пользователям понять структуру видео и перейти к интересующему сегменту прямо из поиска или плеера.
Google использует механизм неконтролируемого (автоматического) извлечения фактов для пополнения Knowledge Graph. Система находит уже известный факт на странице и анализирует окружающую его HTML-структуру («контекстуальный шаблон»). Затем этот изученный шаблон используется для извлечения других, ранее неизвестных фактов с этой же страницы. Это позволяет Google понимать полуструктурированные данные без ручной настройки.
Google ранжирует ближайшие точки интереса (POI) не только по расстоянию, но и с учетом контекста. Система анализирует недавние обновления в социальных сетях (особенно от друзей), релевантность категории в текущее время суток и насколько хорошо пользователь знаком с данной местностью (Familiarity Score), чтобы предоставить персонализированные локальные результаты.
Google связывает физические адреса компании с ее веб-сайтом. На основе этих адресов, категории бизнеса и плотности населения система динамически определяет «зону обслуживания» (Coverage Area). При локальном поиске система проверяет, попадает ли пользователь в эту зону, и повышает сайт в выдаче, причем бустинг обратно пропорционален кратчайшему расстоянию до ближайшего филиала.
Google использует механизм предиктивного поиска (Queryless Search), который анализирует местоположение пользователя, время суток, историю поиска и историю перемещений. На основе этих данных система автоматически предлагает релевантные категории (например, «Рестораны», «Бары») еще до ввода запроса. Система адаптирует предложения в зависимости от знакомства пользователя с локацией и фильтрует результаты по времени работы и близости.
Патент описывает механизм интеграции поиска непосредственно в интерфейс Календаря. Пользователь может искать события, места или услуги, не покидая приложение, и создавать новое событие на основе выбранного результата поиска. Система автоматически классифицирует результат и извлекает данные (URL, описание, местоположение) для автозаполнения деталей события.
Google использует систему для поиска сайтов, похожих на заданный «примерный ресурс». Система анализирует логи поисковых запросов, чтобы определить, по каким запросам пользователи находили этот ресурс, а затем находит другие сайты, которые также появлялись в выдаче по этим же запросам. Это позволяет генерировать списки потенциальных клиентов (лидов) или площадок для рекламодателей.
Google улучшает распознавание объектов на изображениях, проверяя их контекстуальную согласованность. Система анализирует, как часто названия потенциальных объектов встречаются вместе в огромном корпусе текстов (например, в Интернете). Это позволяет выбирать наиболее вероятные метки, основываясь не только на визуальном анализе, но и на знаниях о мире, полученных из текстов.
Google анализирует, как часто видео встраивается на внешних авторитетных (whitelisted) сайтах. Чем чаще видео встраивается в контент по определенной теме (сущности Knowledge Base), тем выше его «новостная ценность». Эта метрика используется для отправки персонализированных уведомлений пользователям, заинтересованным в данной теме (высокий Affinity Score).
Google может извлекать из веб-страниц специальные аннотации (Structured Data), описывающие интерактивные элементы (User Interface), такие как кнопки «Купить» или поля ввода. Эти элементы встраиваются напрямую в сниппет на странице результатов поиска (SERP). Это позволяет пользователю выполнить действие (например, покупку), минуя целевую страницу. Отображение этих элементов строго зависит от оценки качества сайта (Static Metric).
Google использует механизм ранжирования для parameterless search (поиск без запроса, например, Discover). Система оценивает не только релевантность контента контексту пользователя, но и его формат (видео, аудио, текст) и адаптирует выдачу под текущее состояние устройства (заряд батареи, скорость сети, подключенные наушники), чтобы предложить наиболее подходящий для немедленного потребления контент.