Google использует двухэтапный метод доставки результатов поиска через API и виджеты (например, Google Maps) на сторонних сайтах. Сначала отображается только базовое описание результата и присваивается уникальный защищенный токен. Полный контент …
Антиспам
Патент Google описывает систему ранжирования, которая идентифицирует группы сайтов под общим контролем (аффилированные узлы или PBN). Система резко снижает вес ссылок внутри такой группы и ограничивает общее влияние группы на …
Google использует механизм дедупликации для повышения разнообразия выдачи. Если несколько разных URL в результатах поиска перенаправляют пользователя на одну и ту же целевую страницу (например, из-за редиректа на мобильную версию, …
Google выявляет поисковый спам, анализируя группы (кластеры) документов, а не только отдельные страницы. Система ищет подозрительные структуры, такие как сети ссылок (плотные двудольные графы), и агрегирует сигналы манипуляции (скрытый текст, …
Google использует механизм для уточнения ранжирования, анализируя ссылочные связи исключительно между документами, уже попавшими в топ выдачи по конкретному запросу. Система рассчитывает оценку локальной авторитетности (LocalScore), повышая документы, на которые …
Google использует механизм для расчета оценок качества документов (Ranking Scores), который учитывает аффилированность между ссылающимися источниками. Если несколько ссылок исходят от сайтов, контролируемых одной организацией (например, PBN), система учитывает только …
Google анализирует поведение пользователей на уровне домена (группы ресурсов) для вычисления модификатора ранжирования. Ключевые метрики включают долю повторных кликов (Repeat Click Fraction), долю прямого трафика (Deliberate Visit Fraction) и среднюю …
Google может обрабатывать запросы, включающие определенные метки (labels). Система идентифицирует домены, связанные с этими метками через внешние аннотации (annotations), которые определяют соответствие метки и шаблона URL (URL pattern). Поисковая выдача …
Патент Google описывает систему, которая анализирует ссылки на любой веб-странице и присваивает им оценку (Score), используя метрики, такие как PageRank, CTR и популярность. На основе этих оценок система может динамически …
Google оценивает «риск» поискового запроса, анализируя общее качество топовых результатов. Если запрос часто привлекает спам, кликбейт или нежелательный контент (особенно видео), система динамически повышает минимальный порог качества. Контент, не соответствующий …
Google использует метрику Codomain Relationship Measure (CDR), чтобы определить, какой сайт показать в качестве целевой страницы в Поиске по Картинкам. Система анализирует связь между доменом контента и доменом хостинга изображения. …
Google анализирует статистику взаимодействий (кликов) для групп связанных бизнес-листингов (Common Business). Система вычисляет статистически нормальный уровень активности и устанавливает порог (Anomaly Detection Threshold). Резкий всплеск активности выше этого порога (например, …
Google патентует метод ранжирования, альтернативный классическому PageRank, который трансформирует расчет авторитетности в задачу поиска кратчайшего пути в веб-графе. Система определяет набор доверенных "Seed" сайтов и измеряет расстояние от них до …
Google использует систему для оценки качества ссылочного профиля сайта. Система фильтрует входящие ссылки (удаляя шаблонные и дублирующиеся с одного домена), группирует оставшиеся по качеству источника (например, Vital, Good, Bad) и …
Google использует систему для идентификации изображений, которые привлекают клики по причинам, не связанным с их качеством или релевантностью (например, сенсационный контент). Система анализирует категории запросов, по которым кликают на изображение. …
Система ранжирования для поиска по блогам, которая комбинирует релевантность запросу (Relevance Score) с независимой оценкой качества (Quality Score). Эта оценка качества вычисляется на основе индикаторов, специфичных для блогов: паттерны частоты …
Google использует механизм переранжирования для обеспечения разнообразия (Diversity) в поисковой выдаче или ленте рекомендаций. Система определяет ключевые признаки (Features) для каждого результата (например, домен, автор, тип контента) и назначает им …
Google использует итеративный процесс для улучшения классификации контента и выявления спама, анализируя поведенческие сигналы (CTR и продолжительность клика). Если пользователи быстро покидают документ или игнорируют его в выдаче, он помечается …
Патент Google описывает систему классификации изображений, которая переносит поведенческие сигналы (клики, наведения) с известных изображений ("Seed Images") на визуально похожие копии. Это позволяет системе идентифицировать нежелательный контент (например, сатирический "spoof" …
Google использует статистический анализ для обнаружения спама и переоптимизации. Система определяет ожидаемое количество связанных концепций (фраз) в типичном документе. Если документ содержит неестественно большое количество связанных фраз по сравнению с …