Индексация

Как Google использует алгоритмы распространения меток (Label Propagation) для классификации сайтов и сущностей в масштабе всей сети

2012 • Антиспам • Индексация • Ссылки

US20250148013A1 2025-05-08 2012-01-19

Анализ патента Google, описывающего инфраструктуру для выполнения алгоритмов распространения меток (LPA) на огромных графах. Эта технология позволяет Google эффективно классифицировать веб-страницы и сайты (например, по качеству, тематике или спамности), распространяя …

Как Google использует генеративный ИИ и контекст пользователя для сбора отзывов (Link Notes) и их влияния на ранжирование поиска

2023 • EEAT и качество • Индексация • Ссылки

US20250148030A1 2025-05-08 2023-12-21

Google разрабатывает систему сбора пользовательского контента (UGC) о веб-страницах, называемого «Link Notes». Система использует генеративный ИИ для создания персонализированных подсказок, мотивируя пользователей оставлять качественные отзывы на основе их экспертизы. Эти …

Как Google прогнозирует полезность страниц (Utility Score), чтобы решить, какие из них включать в индекс

2008 • EEAT и качество • Индексация • Ссылки

US8554759B1 2013-10-08 2008-01-30

Google использует модель машинного обучения для прогнозирования «Оценки полезности» (Utility Score) документа, основанной на вероятности его показа и клика. Документы ранжируются по этой оценке, и только самые полезные (с учетом …

Как Google использует текст ссылок и окружающий контекст для понимания и ранжирования целевых страниц

2003 • Индексация • Семантика и интент • Ссылки

US10210256B2 2019-02-19 2003-07-03

Google индексирует не только анкорный текст ссылки, но и окружающий ее текст («annotation text») в исходном документе. Эта информация ассоциируется с целевой страницей и используется для ее ранжирования, даже если …

Как Google генерирует «синтетический анкорный текст», анализируя структуру и контекст ссылающихся страниц

2012 • Paul Haahr • Индексация • Поведенческие сигналы • Ссылки

US9208232B1 2015-12-08 2012-12-31

Google анализирует структурно похожие страницы, ссылающиеся на различные ресурсы. Определяя, где известные поисковые запросы (Seed Queries) появляются в структуре этих ссылающихся страниц (например, в заголовках или Title), Google создает шаблоны. …

Как Google использует архитектуру Universal Search для смешивания вертикальных результатов (например, ТВ-программ) с основным веб-поиском

2007 • Индексация • Семантика и интент • Ссылки

US9084025B1 2015-07-14 2007-08-06

Патент Google, описывающий фундаментальный механизм Universal Search. Система определяет, когда запрос связан со специализированной вертикалью (например, ТВ-программы), используя систему триггеров (ключевые слова, белые и черные списки). Затем она одновременно запрашивает …

Как Google использует кластерный анализ и двудольные графы для выявления сетей сайтов и ссылочных схем (спама)

2003 • Антиспам • Индексация • Ссылки

US7302645B1 2007-11-27 2003-12-10

Google выявляет поисковый спам, анализируя группы (кластеры) документов, а не только отдельные страницы. Система ищет подозрительные структуры, такие как сети ссылок (плотные двудольные графы), и агрегирует сигналы манипуляции (скрытый текст, …

Как Google индексирует и ранжирует ресурсы (сайты и приложения) на основе действий, которые они позволяют выполнить

2015 • EEAT и качество • Индексация • Поведенческие сигналы

US20250028769A1 2025-01-23 2015-06-18

Google индексирует структурированные данные (Action Data), описывающие функциональность ресурса (например, бронирование, покупка, воспроизведение медиа). Если запрос пользователя подразумевает намерение совершить действие, Google рассчитывает Action Score, отдавая предпочтение ресурсам, которые позволяют …

Как Google использует машинное обучение для определения типа контента (Вертикали), который ищет пользователь (Universal Search)

2005 • Simon Tong • Индексация • Поведенческие сигналы • Семантика и интент

US9639579B2 2017-05-02 2005-06-29

Google использует модель машинного обучения для определения того, какой тип контента (Новости, Картинки, Товары, Веб-страницы) пользователь хочет видеть в ответ на запрос. Модель анализирует запрос, контекст пользователя и исторические данные …

Как Google определяет тематическую авторитетность источников (сайтов и авторов) на основе поведения пользователей для бустинга нового контента

2013 • EEAT и качество • Индексация • Поведенческие сигналы

US8949228B2 2015-02-03 2013-01-15

Google анализирует взаимодействие пользователей (клики, время пребывания, вовлеченность) с контентом в Поиске, Соцсетях и Новостных лентах, чтобы определить, в каких темах конкретный источник (сайт или автор) является экспертным. Если источник …

Как Google сегментирует веб-страницы на семантические блоки (хедер, футер, контент) с помощью анализа геометрии рендеринга

2004 • Индексация • Семантика и интент • Ссылки

US7913163B1 2011-03-22 2004-09-22

Google использует механизм "псевдо-рендеринга" для анализа геометрической структуры веб-страницы и ее разделения на семантически различные области (чанки), такие как основное содержимое, навигация, футер и реклама. Это позволяет системе определять важность …

Как Google использует поисковые запросы и клики пользователей для детальной тематической классификации контента

2009 • Индексация • Поведенческие сигналы • Семантика и интент

US8725732B1 2014-05-13 2009-03-13

Google использует гибридный подход для классификации контента в детальные иерархические категории. Система анализирует, какие запросы (N-граммы) приводят пользователей к кликам на контент из определенных категорий. Эти запросы становятся «подтверждающими» (Supporters) …

Как Google использует историю уточнений запросов для выявления навигационных ресурсов и повышения их в выдаче

2009 • Trystan G. Upstill • Индексация • Поведенческие сигналы • Семантика и интент

US10204138B1 2019-02-12 2009-01-15

Google анализирует цепочки запросов пользователей в рамках поисковых сессий. Если пользователь начинает с общего или неточного запроса и уточняет его до тех пор, пока не найдет конкретный авторитетный ресурс, система …

Как Google анализирует распределение качества входящих ссылок для классификации и понижения сайтов в выдаче

2012 • Антиспам • Индексация • Ссылки

US9002832B1 2015-04-07 2012-06-04

Google использует систему для оценки качества ссылочного профиля сайта. Система фильтрует входящие ссылки (удаляя шаблонные и дублирующиеся с одного домена), группирует оставшиеся по качеству источника (например, Vital, Good, Bad) и …

Как Google обеспечивает разнообразие выдачи (Diversity), принудительно понижая результаты с повторяющимися признаками (домен, автор, тема)

2015 • EEAT и качество • Антиспам • Индексация

US10055463B1 2018-08-21 2015-11-19

Google использует механизм переранжирования для обеспечения разнообразия (Diversity) в поисковой выдаче или ленте рекомендаций. Система определяет ключевые признаки (Features) для каждого результата (например, домен, автор, тип контента) и назначает им …

Как Google проверяет соответствие контента в мобильных приложениях и на веб-страницах для показа App Deep Links в поиске

2014 • Индексация • Семантика и интент • Ссылки

US11403271B2 2022-08-02 2014-03-11

Патент описывает систему Google для верификации того, что нативное мобильное приложение и соответствующая веб-страница отображают идентичный контент (Consistent Content). Система сравнивает контент, используя N-gram анализ, сопоставление сущностей и сравнение признаков. …

Как Google использует нормализованные сигналы удовлетворенности пользователей для переранжирования выдачи и управления краулингом/индексацией

2011 • EEAT и качество • Индексация • Поведенческие сигналы

US9223897B1 2015-12-29 2011-05-26

Google анализирует вовлеченность пользователей (полезность), сравнивая фактическую удовлетворенность (Good Utilization Events) с ожидаемой вовлеченностью для данной позиции ранжирования. На основе этого рассчитывается Correction Factor для повышения документов, превосходящих ожидания, и …

Как Google использует офлайн-сигналы (продажи, тиражи, списки бестселлеров) для ранжирования книг и печатных изданий

2004 • EEAT и качество • Индексация • Поведенческие сигналы

US8762225B1 2014-06-24 2004-09-30

Google использует внешние «офлайн-сигналы» для ранжирования документов с плохой ссылочной структурой (книги, журналы). К ним относятся: попадание в списки бестселлеров (с учетом локации пользователя), данные о тиражах, общие продажи издателя …

Как Google позволяет пользователям «углубиться» в контент установленного мобильного приложения прямо из веб-выдачи

2015 • Индексация • Поведенческие сигналы • Ссылки

US10579687B2 2020-03-03 2015-09-01

Google использует этот механизм для интеграции контента из нативных приложений в веб-поиск. Если приложение установлено у пользователя и система определяет высокую релевантность его контента запросу, в выдачу добавляется специальный элемент …

Как Google определяет авторитетные сайты и экспертных авторов с помощью «гибридных запросов» (Тема + Бренд/Автор)

2012 • EEAT и качество • Индексация • Поведенческие сигналы

US9390183B1 2016-07-12 2012-12-31

Google использует «гибридные запросы» (например, «тема + бренд» или «тема + автор») для выявления авторитетных источников и экспертов. Анализируя логи запросов и клики пользователей, система создает ассоциации между темами и …