
Google использует систему контроля для Программируемых Поисковых Систем (PSE), где третьи стороны могут влиять на выдачу через "Контекстные Файлы". Патент описывает двухэтапный процесс (офлайн и во время запроса) для обнаружения и фильтрации спама или предвзятости (Bias). Система сравнивает кастомизированные результаты с результатами основного поиска, чтобы гарантировать объективность выдачи.
Патент решает проблему контроля качества и объективности в рамках Programmable Search Engine (PSE) — системы, позволяющей внешним сторонам (Vertical Content Providers) влиять на обработку запросов и ранжирование результатов с помощью Context Files. Основная задача — предотвратить манипуляции, при которых третьи стороны могут использовать свои Context Files для внедрения спама или существенного искажения (предвзятости, Bias) поисковой выдачи, особенно когда пользователь взаимодействует с PSE напрямую.
Запатентована система и метод для обнаружения и фильтрации спама и предвзятости (Bias) в результатах, генерируемых Программируемой Поисковой Системой (PSE). Система использует офлайн-анализ Context Files для выявления ссылок на спам-ресурсы. Во время обработки запроса система применяет Spam Filter к результатам и использует Bias Filter для сравнения результатов, обработанных с учетом контекста (Context Processed Results), с результатами по исходному запросу (Native Query Results). При превышении порогов спама или предвзятости соответствующие контексты и результаты исключаются.
Механизм работает в два этапа:
Context Files (в частности, Site/Page Annotation Files) от сторонних провайдеров. Spam Filter анализирует URL-адреса, перечисленные в этих файлах. Если значительная часть URL ведет на спам, провайдер или файл помечаются как связанные со спамом и исключаются из дальнейшего использования при прямых запросах к PSE.Context Files. Далее активируются два фильтра: average spam score) превышает порог, спам-результаты и связанный с ними контекст (аннотации, ссылки) удаляются.distance measure). Если результаты слишком сильно отличаются (превышен порог расстояния), контекст считается предвзятым, и его влияние на выдачу нейтрализуется.Средняя. Концепция Программируемых Поисковых Систем (например, Google Custom Search/Programmable Search Engine) продолжает существовать. Механизмы защиты от спама и предвзятости критически важны для поддержания качества любой платформы, допускающей внешнее влияние на ранжирование. Хотя конкретные методы фильтрации могли эволюционировать, базовая необходимость в описанных механизмах контроля остается актуальной.
Влияние на SEO — умеренное (6/10). Патент напрямую не влияет на ранжирование в основном поиске Google, но критически важен для тех, кто использует или создает кастомизированные поисковые решения на базе технологий Google (PSE). Он устанавливает границы допустимого влияния на выдачу через Context Files. Попытки агрессивного продвижения коммерческих интересов (спам) или радикального искажения выдачи (предвзятость) в рамках PSE будут алгоритмически пресекаться описанными механизмами.
Context Processed Results с Native Query Results. Он вычисляет distance measure между двумя наборами результатов для выявления предвзятости.Context Files для модификации запроса и/или результатов поиска.Context File, и результаты, полученные по этому модифицированному запросу.Bias Filter для количественной оценки различий между Context Processed Results и Native Query Results. Например, процент совпадения результатов.Context Files.Context File, который содержит список URL-адресов с метками (tags), рейтингами и комментариями, отражающими мнение Vertical Content Provider об этих ресурсах.Context Files), так и во время запроса (для анализа результатов поиска) для выявления спама.Context Files для кастомизации поиска в PSE, основываясь на своей экспертизе.Патент фокусируется на трех основных методах защиты PSE от некачественных контекстов.
Claim 1 (Независимый пункт): Описывает офлайн-метод фильтрации Context Files перед их добавлением в коллекцию PSE.
Context Files от третьих сторон.Context Files для добавления в коллекцию.spam web pages), перечисленных в этом файле.threshold number), файл не добавляется в коллекцию.Ядром этого утверждения является предварительная проверка качества Context Files (вероятно, Site/Page Annotation Files). Если провайдер аннотирует или включает слишком много ресурсов, которые система классифицирует как спам, его контекстный файл блокируется от использования в PSE.
Claim 9 (Независимый пункт): Описывает метод фильтрации спама во время выполнения запроса (Query Time).
Context File.Context Processed Results с использованием команд контекста.spam measure) для этих результатов.spam threshold), система исключает спам-результаты, ссылки, аннотации или другой связанный контент из финальной выдачи.Это динамическая защита. Даже если Context File прошел офлайн-проверку, но его команды (например, переписывание запроса) привели к выдаче с высоким уровнем спама, система активирует фильтрацию в реальном времени. Spam measure может быть средним баллом спама или процентом спам-документов в топе.
Claim 12 (Независимый пункт): Описывает метод обнаружения предвзятости (Bias) во время выполнения запроса.
Context Processed Results и Native Processed Results (по исходному запросу).distance measure) между двумя наборами результатов.distance threshold), система удаляет из Context Processed Results те результаты, которых нет в Native Processed Results, создавая отфильтрованные результаты.Это механизм защиты от предвзятости. Он гарантирует, что кастомизация не исказит выдачу слишком радикально по сравнению с базовой выдачей поисковой системы. Если контекст уводит пользователя слишком далеко от того, что PSE считает релевантным по умолчанию, система принудительно возвращает выдачу ближе к базовой.
Изобретение применяется в рамках инфраструктуры Программируемой Поисковой Системы (PSE) и затрагивает этапы индексирования/сбора данных и переранжирования.
CRAWLING / INDEXING (Офлайн-процессы)
На этом этапе происходит сбор и анализ Context Files.
Context File Crawler или Context Registration Interface получают Context Files от Vertical Content Providers.Spam Filter. URL, указанные в них, проверяются на спам.Cached/Global Context Files) и исключение файлов/провайдеров, связанных со спамом.RERANKING (Онлайн-процессы во время запроса)
Основное применение патента происходит после того, как стандартное ранжирование (RANKING) завершено (как для контекстного, так и для нативного запроса), и система выполняет контроль качества.
Spam Filter анализирует Context Processed Results в реальном времени.Bias Filter сравнивает Context Processed Results с Native Query Results.Spam, bias filtered results).Входные данные:
Context Files (включая Site/Page Annotation Files).Context Files (офлайн).Native Query).Context Processed Results и Native Query Results).Выходные данные:
Context Files или провайдеров (офлайн).Алгоритмы применяются в двух сценариях:
Context Files от Vertical Content Providers.Context Files для обработки этого запроса.Триггеры активации и пороговые значения:
Context File, превышает threshold number (например, 40%).spam measure (например, средний балл спама) результатов превышает spam threshold.distance measure между контекстными и нативными результатами превышает distance threshold.Процесс А: Офлайн-фильтрация спама в Context Files (FIG. 10)
Vertical Context Files от провайдера через интерфейс регистрации или краулер.Site/Page Annotation File).Spam Filter анализирует каждый извлеченный URL для определения, является ли он спамом.threshold number).Context File не добавляется в кэш (Cached/Global Context Files) или провайдер помечается как связанный со спамом и исключается из обработки прямых запросов к PSE.Процесс Б: Фильтрация спама и предвзятости во время запроса (FIG. 11)
Native Query) от клиента.Context Processor идентифицирует применимые Context Files и генерирует Context Processed Query.Search Engine выполняет поиск по обоим запросам, генерируя Context Processed Results и Native Query Results.Spam Filter анализирует Context Processed Results (например, топ-N результатов).spam measure).spam threshold, спамные результаты и связанный контекст (аннотации, ссылки от этого провайдера) помечаются для удаления.Bias Filter сравнивает Context Processed Results и Native Query Results.distance measure) между двумя наборами.distance threshold (т.е. результаты слишком разные), система идентифицирует предвзятость.Context Processed Results, например, удаляя результаты, которых нет в Native Query Results, или удаляя контекстные элементы от предвзятого провайдера.Патент фокусируется на анализе метаданных и результатов поиска, а не на традиционных факторах ранжирования.
Context Files, полученные от третьих сторон. Они содержат инструкции по обработке и данные аннотаций (URL, метки, рейтинги в Site/Page Annotation Files).Context Files, анализируются офлайн для определения их статуса спама.Context Processed Results и Native Query Results, генерируемые поисковой системой во время запроса.Spam Filter (методы расчета балла в патенте не детализированы).average spam score) или процентом спамных документов в наборе.percentage of context processed search results that are the same as native search results). Критерии "одинаковости" могут варьироваться.Пороговые значения:
Context File (упоминается пример 40%).Spam Measure для активации фильтрации во время запроса.Distance Measure для активации фильтра предвзятости.Context Files путем анализа аннотированных ими URL. Онлайн-анализ проверяет фактические результаты, сгенерированные с учетом контекста.Native Results). Базовая выдача используется как эталон объективности.Distance Threshold), она считается предвзятой, и система принудительно приближает ее к эталону. Это ограничивает возможности радикального изменения SERP через PSE.Context Files критически важно ссылаться на качественные ресурсы. Аннотирование спам-сайтов приведет к блокировке всего контекстного файла на этапе офлайн-проверки.ВАЖНО: Этот патент в первую очередь применим к средам Программируемых Поисковых Систем (PSE), таким как Google Programmable Search Engine (ранее Google Custom Search Engine), а не напрямую к алгоритмам ранжирования основного органического поиска Google.
Рекомендации применимы к специалистам, создающим кастомизированные поисковые системы на базе Google PSE.
Site/Page Annotation Files для влияния на выдачу PSE необходимо тщательно отбирать авторитетные и неспамные ресурсы. Система проводит офлайн-проверку этих URL, и наличие спама может привести к блокировке всего контекстного файла.Bias и отфильтрованы.Context Files влияют на выдачу по ключевым запросам. Сравнивайте результаты PSE с результатами основного поиска Google (Native Results), чтобы оценить потенциальную меру расстояния и риск активации фильтра предвзятости.Context Files для аннотирования или повышения в ранжировании низкокачественных или спамных сайтов будут обнаружены либо на этапе офлайн-проверки, либо во время запроса через Spam Filter.Bias), если мера расстояния от нативной выдачи превысит порог.Патент подтверждает стратегический подход Google к контролю качества: основной поиск (Native Search) выступает в роли арбитра или эталона объективности. Любые попытки внешнего влияния оцениваются по степени отклонения от этого эталона. Это демонстрирует методологию Google для оценки качества и намерений внешних участников, влияющих на поиск, подчеркивая, что кастомизация не должна противоречить базовым принципам качества и релевантности.
Сценарий 1: Блокировка предвзятого контекста (Bias Filtering)
Context File, который сильно повышает в ранжировании сайт Бренда А и понижает всех конкурентов по запросу [лучшие протеиновые батончики].Context File. В топе выдачи PSE доминирует Бренд А.Distance Measure очень велика, так как топ выдачи радикально отличается. Порог превышен.Context File.Сценарий 2: Офлайн-блокировка спамного контекста (Offline Spam Filtering)
Site/Page Annotation File, где помимо качественных ресурсов указывает несколько сайтов по бронированию отелей, которые платят ему комиссию, но классифицируются Google как спам.Spam Filter идентифицирует, что 50% указанных сайтов являются спамом.Context File, и он не используется в PSE.Влияет ли этот патент на ранжирование в основном органическом поиске Google?
Нет, напрямую не влияет. Патент описывает механизмы контроля качества исключительно в рамках Программируемых Поисковых Систем (PSE), таких как Google Custom Search. Он регулирует, как внешние стороны могут влиять на выдачу внутри этих кастомизированных систем, но не описывает алгоритмы ранжирования основного поиска Google.
Что такое "Предвзятость" (Bias) в контексте этого патента?
Предвзятость определяется как существенное отклонение результатов, обработанных с учетом контекста (Context Processed Results), от результатов по исходному запросу (Native Results). Если кастомизированная выдача слишком сильно отличается от того, что основной поиск считает релевантным, она классифицируется как предвзятая. Базовая выдача Google используется как эталон объективности.
Как Google измеряет разницу между кастомизированной и базовой выдачей?
Система использует метрику Distance Measure (Мера расстояния). Это может быть процент совпадения результатов между двумя наборами выдачи. Если процент совпадения слишком низкий (или разница слишком велика) и превышает установленный порог (Distance Threshold), активируется фильтр предвзятости.
Что произойдет, если система посчитает мой Context File (для Google CSE) предвзятым?
Если Bias Filter активируется во время запроса, система предпримет корректирующие действия для нейтрализации предвзятости. В частности, патент (Claim 12) описывает удаление из кастомизированной выдачи тех результатов, которых не было в нативной выдаче. Это принудительно приближает вашу выдачу к стандартной выдаче Google.
Что такое офлайн-проверка Context Files?
Это превентивная мера безопасности. Перед тем как добавить Context File (например, файл с аннотациями сайтов) в систему PSE, Google анализирует все URL, перечисленные в этом файле, с помощью Spam Filter. Если слишком много из этих URL ведут на спам-ресурсы (например, более 40%), весь файл будет отклонен.
Могу ли я использовать PSE для гарантированного вывода моего сайта на первое место в кастомном поиске?
Теоретически, Context Files позволяют влиять на ранжирование в рамках вашего PSE. Однако этот патент описывает ограничения. Если такое агрессивное повышение приведет к значительному отклонению от нативной выдачи Google, механизм Bias Filter может нейтрализовать ваши правила ранжирования, посчитав их предвзятыми.
Как система определяет спам во время запроса?
Во время запроса Spam Filter анализирует фактические результаты, полученные после применения Context File. Система вычисляет Spam Measure — например, средний балл спама для топовых результатов. Если этот показатель превышает порог, спамные результаты и связанные с ними аннотации удаляются из выдачи.
Применяются ли эти фильтры, если пользователь ищет через мой сайт, на котором установлен PSE?
В патенте указано, что фильтрация особенно важна для исключения контекстных файлов от спам-провайдеров при обработке "прямых пользовательских запросов" (direct user queries) к PSE. Это подразумевает, что фильтрация особенно актуальна, когда пользователь ищет напрямую в PSE, используя контекст провайдера (например, по подписке). Однако технически механизмы доступны в любом случае использования PSE.
Какие уроки должны извлечь SEO-специалисты, работающие с кастомным поиском?
Главный урок — кастомизация не должна противоречить качеству и объективности. При создании Context Files необходимо фокусироваться на добавлении ценности через экспертное курирование качественных ресурсов. Попытки использовать PSE для спама или агрессивной манипуляции выдачей в коммерческих интересах будут алгоритмически ограничены.
Что такое Vertical Content Provider в этом патенте?
Это любая третья сторона — эксперт, владелец специализированного сайта, организация — которая создает и предоставляет Context Files для Программируемой Поисковой Системы. Они используют свою экспертизу (вертикальное знание) для кастомизации поискового опыта пользователей.

SERP

Семантика и интент
SERP
Персонализация

Семантика и интент
SERP
Персонализация

Антиспам
SERP
Техническое SEO

Антиспам
Индексация
Техническое SEO

Семантика и интент
Поведенческие сигналы
Local SEO

Local SEO
Поведенческие сигналы

Персонализация
Поведенческие сигналы
SERP

Семантика и интент
SERP
Поведенческие сигналы

Ссылки
Мультиязычность
Семантика и интент

Мультиязычность
Семантика и интент
Ссылки

Ссылки
SERP
EEAT и качество

EEAT и качество
Антиспам
SERP

Семантика и интент
Local SEO
Персонализация

Персонализация
Поведенческие сигналы
SERP
