Безопасный поиск

Google использует систему для обнаружения аномальной сетевой активности (кликового спама) путем создания статистических моделей ожидаемого поведения сетевых объектов (IP-адресов, cookies, запросов). Система анализирует множество параметров и выявляет объекты, чье поведение …
Механизм защиты пользователей, который перехватывает запрос на загрузку веб-страницы. Если страница идентифицирована как низкокачественная (паркинг домена, ферма контента или ссылочная ферма), система показывает предупреждение и предлагает перейти на альтернативный релевантный …
Патент Google описывает систему оценки контента, основанную на делегировании авторитета. Доверенный источник (Primary Authority) передает количественно измеримый авторитет другим экспертам (Contributing Authorities), которые могут делегировать его дальше. Итоговый рейтинг контента …
Google патентует систему для оценки и отображения «Рейтинга Легитимности» источников контента, включая сайты в органической выдаче и рекламодателей. Этот рейтинг основан на объективных данных: как долго источник взаимодействует с Google …
Google может заранее определять "Темы запросов" (Query Themes) и назначать для них списки "Предпочтительных" (Favored) и "Нежелательных" (Non-Favored) источников. Если запрос пользователя соответствует теме, система корректирует ранжирование: повышает предпочтительные источники …
Google применяет систему двойной классификации для защиты пользователей от неуместного или оскорбительного контента. Система оценивает, относится ли запрос к «защищенной группе людей» и содержит ли он деликатные термины. Параллельно анализируется, …
Google анализирует исторические данные о том, какие запросы приводили к кликам по конкретному изображению. Эти запросы используются как автоматические метки (labels) для индексации и как предлагаемые альтернативные запросы при взаимодействии …
Патент описывает инфраструктуру Google для создания высокоточных классификаторов. Он включает метод отбора разнообразных обучающих данных (Bootstrapping/Bucketing) и математическую модель (Monotonic Regression) для объединения оценок от разных классификаторов (например, текста, изображений, …
Google использует механизм для оценки качества контента (например, видео), учитывая не только его собственные характеристики, но и качество связанных с ним родительских сущностей (например, плейлиста или канала). Система комбинирует оценки …
Google анализирует, какие изображения пользователи выбирают последовательно в рамках одной поисковой сессии и одной выдачи. Если пользователи часто взаимодействуют с неизвестным изображением и изображением с известной тематикой (например, «Спорт» или …
Google использует анализ поисковых логов для защиты пользователей от контента с ложной маркировкой (например, взрослого контента, маскирующегося под детский). Система анализирует, на какие результаты (например, "безопасные" или "неприемлемые") пользователи кликают …
Google борется со спамом в локальной выдаче (например, в Google Maps), группируя ранее отклоненные фейковые бизнес-профили в кластеры на основе общих признаков (телефон, адрес, IP-адрес отправителя). Новые заявки или обновления …
Google использует статистический анализ для борьбы со спамом в названиях компаний (например, в Google Maps). Система анализирует корпус легитимных названий, чтобы понять естественные комбинации слов. Затем для проверяемого названия вычисляется …
Google анализирует структуру веб-страницы (HTML-теги, форматирование), разделяя ее на регионы (заголовок, основной текст, списки ссылок). Система определяет локальные концепции для каждого блока, а затем сравнивает их, чтобы выявить общее значение …
Google использует механизм для определения местоположения веб-страницы, даже если на ней нет адреса. Система находит адрес на других страницах того же сайта (например, в разделе «Контакты») и присваивает его связанным …
Google анализирует все известные названия (Titles), связанные с локальным бизнесом. Система сравнивает распределение частотности слов в этих названиях с двумя моделями: равномерным распределением (характерно для легитимных данных из разных источников) …
Google использует механизм для улучшения видимости детского контента (Youth-Oriented, Y) в безопасной выдаче. Поскольку такой контент часто имеет меньше поведенческих данных, чем общий контент (General Audience, G), система вычисляет динамический …
Google использует метод машинного обучения для автоматического понимания и маркировки контента, такого как изображения, видео или текст. Система анализирует обучающий набор данных, выделяет схожие признаки (кластеры) и определяет, какие комбинации …
Google использует механизм для автоматического и безопасного наполнения ограниченных индексов (например, YouTube Kids). Система анализирует, что ищут пользователи в ограниченном индексе, находит соответствующие темы в основном индексе, а затем рассчитывает …
Google сканирует веб на наличие «Scumware» (вредоносное и нежелательное ПО). Патент описывает, как система различает сайты, которые содержат вредоносный код, и сайты, которые на него ссылаются. Обнаружение угрозы может привести …