Анализ патента Google, описывающего инфраструктуру для выполнения алгоритмов распространения меток (LPA) на огромных графах. Эта технология позволяет Google эффективно классифицировать веб-страницы и сайты (например, по качеству, тематике или спамности), распространяя …
Индексация
Google разрабатывает систему сбора пользовательского контента (UGC) о веб-страницах, называемого «Link Notes». Система использует генеративный ИИ для создания персонализированных подсказок, мотивируя пользователей оставлять качественные отзывы на основе их экспертизы. Эти …
Google использует модель машинного обучения для прогнозирования «Оценки полезности» (Utility Score) документа, основанной на вероятности его показа и клика. Документы ранжируются по этой оценке, и только самые полезные (с учетом …
Google индексирует не только анкорный текст ссылки, но и окружающий ее текст («annotation text») в исходном документе. Эта информация ассоциируется с целевой страницей и используется для ее ранжирования, даже если …
Google анализирует структурно похожие страницы, ссылающиеся на различные ресурсы. Определяя, где известные поисковые запросы (Seed Queries) появляются в структуре этих ссылающихся страниц (например, в заголовках или Title), Google создает шаблоны. …
Патент Google, описывающий фундаментальный механизм Universal Search. Система определяет, когда запрос связан со специализированной вертикалью (например, ТВ-программы), используя систему триггеров (ключевые слова, белые и черные списки). Затем она одновременно запрашивает …
Google выявляет поисковый спам, анализируя группы (кластеры) документов, а не только отдельные страницы. Система ищет подозрительные структуры, такие как сети ссылок (плотные двудольные графы), и агрегирует сигналы манипуляции (скрытый текст, …
Google индексирует структурированные данные (Action Data), описывающие функциональность ресурса (например, бронирование, покупка, воспроизведение медиа). Если запрос пользователя подразумевает намерение совершить действие, Google рассчитывает Action Score, отдавая предпочтение ресурсам, которые позволяют …
Google использует модель машинного обучения для определения того, какой тип контента (Новости, Картинки, Товары, Веб-страницы) пользователь хочет видеть в ответ на запрос. Модель анализирует запрос, контекст пользователя и исторические данные …
Google анализирует взаимодействие пользователей (клики, время пребывания, вовлеченность) с контентом в Поиске, Соцсетях и Новостных лентах, чтобы определить, в каких темах конкретный источник (сайт или автор) является экспертным. Если источник …
Google использует механизм "псевдо-рендеринга" для анализа геометрической структуры веб-страницы и ее разделения на семантически различные области (чанки), такие как основное содержимое, навигация, футер и реклама. Это позволяет системе определять важность …
Google использует гибридный подход для классификации контента в детальные иерархические категории. Система анализирует, какие запросы (N-граммы) приводят пользователей к кликам на контент из определенных категорий. Эти запросы становятся «подтверждающими» (Supporters) …
Google анализирует цепочки запросов пользователей в рамках поисковых сессий. Если пользователь начинает с общего или неточного запроса и уточняет его до тех пор, пока не найдет конкретный авторитетный ресурс, система …
Google использует систему для оценки качества ссылочного профиля сайта. Система фильтрует входящие ссылки (удаляя шаблонные и дублирующиеся с одного домена), группирует оставшиеся по качеству источника (например, Vital, Good, Bad) и …
Google использует механизм переранжирования для обеспечения разнообразия (Diversity) в поисковой выдаче или ленте рекомендаций. Система определяет ключевые признаки (Features) для каждого результата (например, домен, автор, тип контента) и назначает им …
Патент описывает систему Google для верификации того, что нативное мобильное приложение и соответствующая веб-страница отображают идентичный контент (Consistent Content). Система сравнивает контент, используя N-gram анализ, сопоставление сущностей и сравнение признаков. …
Google анализирует вовлеченность пользователей (полезность), сравнивая фактическую удовлетворенность (Good Utilization Events) с ожидаемой вовлеченностью для данной позиции ранжирования. На основе этого рассчитывается Correction Factor для повышения документов, превосходящих ожидания, и …
Google использует внешние «офлайн-сигналы» для ранжирования документов с плохой ссылочной структурой (книги, журналы). К ним относятся: попадание в списки бестселлеров (с учетом локации пользователя), данные о тиражах, общие продажи издателя …
Google использует этот механизм для интеграции контента из нативных приложений в веб-поиск. Если приложение установлено у пользователя и система определяет высокую релевантность его контента запросу, в выдачу добавляется специальный элемент …
Google использует «гибридные запросы» (например, «тема + бренд» или «тема + автор») для выявления авторитетных источников и экспертов. Анализируя логи запросов и клики пользователей, система создает ассоциации между темами и …