Автор: Виктор Репин

2011 Краулинг Патенты Google Свежесть контента

Как Google идентифицирует сайты, поддерживающие удаление контента, и ускоряет обновление индекса после запроса на удаление

Google разработал систему для идентификации контент-провайдеров, которые поддерживают стандартизированный процесс удаления контента (например, по DMCA или законам о приватности). Поисковая система обнаруживает эту возможность через Sitemap или проверку URL, помечает такие результаты в выдаче специальным индикатором и может ранжировать их выше. После запроса пользователя на удаление, система ускоряет повторное сканирование сайта и обновление индекса.

2006 Ashutosh Garg Google Shopping Патенты Google Техническое SEO

Как Google автоматически создает и таргетирует рекламные объявления (PPC) на основе контента страниц сайта

Патент Google, описывающий систему автоматического создания рекламных объявлений (креативов и ставок) путем сканирования сайта рекламодателя (например, страниц товаров). Система создает специальный индекс (Page-Ad Index), используя контент страниц как таргетинговые ключевые слова. Также описаны методы автоматического управления ставками на основе иерархии сайта или формул. Это механизм, лежащий в основе Dynamic Search Ads (DSA).

2003 Патенты Google Персонализация

Как Google управляет агрегацией, персонализацией и синдикацией новостного контента (Google News)

Патент Google, описывающий архитектуру Google News. Система агрегирует новости и позволяет пользователям или внешним сайтам создавать кастомизированные новостные ленты на основе запросов и предпочтений (включая источники, авторов и жанры). Также описан механизм динамической генерации связанного контента на основе взаимодействия пользователя с новостями.

2011 Мультимедиа Патенты Google

Как Google использует сегментацию изображений для быстрого распознавания и локализации объектов

Google использует метод обнаружения объектов, основанный на сегментации изображений. Система обучается связывать визуальные фрагменты (сегменты) с расположением всего объекта (Bounding Box). При анализе нового изображения система быстро определяет, какие объекты присутствуют и где они расположены, комбинируя прогнозы от разных сегментов. Это позволяет эффективно понимать содержание изображений для Поиска по картинкам и Google Lens.

2008 Shumeet Baluja Индексация Патенты Google

Как Google улучшает Min-Hash сигнатуры для более точного обнаружения почти дубликатов контента

Google использует усовершенствованный алгоритм Min-Hash для создания цифровых сигнатур контента (веб-страниц, изображений, медиа). Условно используя вторичные перестановки, когда первичный хеш дает мало информации, Google генерирует более надежные и информативные сигнатуры. Это позволяет быстрее и точнее обнаруживать почти дублирующийся контент в процессе индексирования.

2008 Knowledge Graph Индексация Мультимедиа Патенты Google

Как Google идентифицирует и отображает изображения лиц людей рядом с результатами поиска

Google использует систему для улучшения поисковой выдачи по запросам, содержащим имена людей. Система анализирует релевантные веб-страницы, обнаруживает наличие лиц (Face Detection) и определяет личность человека на фото, используя текстовые сигналы (alt-text, имя файла, окружающий текст). Наиболее качественное изображение лица затем отображается в сниппете.

2012 Индексация Мультимедиа Патенты Google

Как Google объединяет дубликаты изображений в кластеры и индексирует их как единое целое для улучшения визуального поиска

Google оптимизирует визуальный поиск, группируя почти идентичные изображения (измененный размер, обрезка) в единый кластер. Система индексирует не отдельные картинки, а совокупность всех визуальных признаков («визуальных слов») из всех вариантов в кластере. Это повышает эффективность индекса и гарантирует согласованность результатов при поиске по изображению.

2006 Антиспам Патенты Google

Как Google сжимает и индексирует дубликаты и шаблонный контент для экономии места в индексе (Compressed Tokenspace)

Google использует инфраструктурный механизм для эффективного хранения похожих документов. Система группирует документы (часто с одного хоста, используя реверсированные URL) в кластеры и сжимает их, удаляя повторяющиеся последовательности токенов внутри кластера. Индекс строится поверх этого сжатого пространства (Compressed Tokenspace), что экономит ресурсы, сохраняя при этом доступ ко всем версиям документов.

2012 Индексация Мультиязычность Патенты Google

Как Google использует кросс-языковой поиск для добавления локальных перспектив в международные новости

Google автоматически определяет географические регионы, связанные с новостным событием. Если язык региона отличается от языка пользователя, система переводит ключевые слова сюжета, ищет релевантные локальные статьи и интегрирует их в выдачу через машинный перевод, предоставляя локальную точку зрения на международные события.

2012 Патенты Google Персонализация Семантика и интент

Как Google использует анализ тем и тональности для предсказания кликабельности контента (рекомендаций или рекламы)

Google использует систему для выбора дополнительного контента (например, рекламы или рекомендаций), который будет показан пользователю на просматриваемой странице. Система анализирует темы документа и тональность (sentiment) по отношению к этим темам. Затем она сравнивает этот контекст с историческими данными о кликах в похожих ситуациях, чтобы предсказать вероятность взаимодействия пользователя (Predicted Acceptance Score) и выбрать наиболее подходящий контент.

2007 Индексация Краулинг Патенты Google

Как Google анализирует веб-формы и фильтры для эффективного сканирования «Глубокого интернета» (Deep Web)

Google использует метод для эффективного сканирования контента, скрытого за веб-формами (Deep Web). Вместо перебора всех возможных комбинаций полей ввода система определяет, какие поля являются «информативными» — то есть, изменение каких полей приводит к генерации страниц с существенно различным контентом. Это позволяет индексировать уникальный контент, избегая дубликатов и экономя ресурсы сканирования.

2003 Индексация Краулинг Патенты Google

Как Google управляет лимитом скорости сканирования (Crawl Rate Limit) и распределяет нагрузку между своими краулерами, чтобы не перегрузить сервер

Google использует централизованную систему (Host Load Server) для управления скоростью сканирования. Система динамически распределяет максимальную пропускную способность веб-хоста между конкурирующими краулерами (например, Новости, Картинки, Основной поиск) на основе их приоритетов. Используется механизм «аренды» (Lease) и группировка хостов по IP-адресу для предотвращения перегрузки серверов и оптимизации бюджета сканирования.

2015 Мультимедиа Патенты Google Персонализация

Как Google использует фоновую музыку и историю просмотра для изменения поисковых подсказок (Autocomplete) в реальном времени

Google использует историю потребления медиаконтента пользователем (музыка, фильмы, шоу) и фоновое аудио, захваченное микрофоном устройства во время ввода запроса, для персонализации поисковых подсказок (Autocomplete). Система идентифицирует сущности из недавно потребленного или воспроизводимого в данный момент контента и активно предлагает их в подсказках, направляя поисковое поведение пользователя.

2011 Мультимедиа Патенты Google

Как Google использует векторы визуальных признаков и блочные суммы для эффективного анализа и сравнения изображений

Google использует высокоэффективный метод для сравнения и выравнивания изображений. Система выбирает ключевые участки (Tiles) с высокой детализацией, быстро вычисляет суммы пикселей в различных областях (Block Sums) с помощью технологии Summed Area Table (SAT) и создает компактные векторы признаков (Feature Vectors). Это позволяет Google масштабно и точно распознавать объекты, находить дубликаты и выполнять визуальный поиск.

2003 EEAT и качество SERP Патенты Google Персонализация

Как Google оптимизирует передачу данных при использовании нескольких алгоритмов ранжирования одновременно

Анализ инфраструктурного патента Google, описывающего метод повышения эффективности метапоиска. Система консолидирует результаты от разных алгоритмов, отправляя уникальные URL только один раз вместе с компактными «векторами позиций». Это позволяет пользователю переключать или смешивать разные варианты выдачи локально в браузере, экономя трафик и снижая нагрузку на сервер.

2011 Мультиязычность Патенты Google

Как Google использует частоту употребления слов в поиске и на сайтах для локализованного перевода ключевых слов

Google использует систему для автоматического перевода ключевых слов (например, для рекламы или тегирования контента), учитывая локальные особенности языка. Система переводит исходное слово, находит синонимы и проверяет, какие варианты чаще всего используются носителями языка в поисковых запросах, на сайтах и в социальных сетях. Наиболее частотный вариант выбирается как лучший локализованный перевод.

2010 Индексация Краулинг Патенты Google Техническое SEO

Как Google использует итеративный офлайн-рендеринг для сбора всех ресурсов страницы перед индексацией

Патент описывает инфраструктуру Google для эффективного рендеринга веб-страниц в масштабах интернета. Система использует итеративный подход: если во время рендеринга обнаруживается отсутствующий ресурс (например, CSS или JS), процесс останавливается, ресурс ставится в очередь на сканирование, а рендеринг страницы перезапускается позже. Это позволяет индексировать контент, не перегружая внешние серверы запросами в реальном времени.

2012 Мультимедиа Патенты Google

Как Google использует визуальные подсказки и интерактивные превью для уточнения запросов в Image Search

Google использует механизм визуальных уточнений в поиске по изображениям. Когда пользователь вводит общий запрос, система предлагает связанные уточненные запросы, сопровождая их репрезентативным изображением. Это позволяет пользователю предварительно оценить результаты уточнения в оверлейном окне, не покидая текущую выдачу, и направляет трафик на более релевантные изображения.

2011 Local SEO Патенты Google

Как Google группирует подсказки в Google Картах и адаптирует их в зависимости от масштаба карты

Google использует систему группировки поисковых подсказок (автозаполнения) в интерфейсах карт. Система определяет основной термин запроса (например, «отели») и группирует связанные уточнения (например, «рядом с Oakland» или «люкс»). Ключевая особенность — выбор типа уточнений (географические или качественные) динамически зависит от текущего масштаба и местоположения, отображаемого на карте.

2012 Мультимедиа Патенты Google

Как Google вычисляет оценку качества продакшена (Production Quality Score) для видео и мультимедиа

Google автоматически оценивает техническое качество мультимедиа (видео, аудио, изображений) с помощью Production Quality Score. Система обучается на основе относительных сравнений асессоров и анализирует технические признаки (визуальные, аудио, метаданные, качество текста). Этот скор используется для ранжирования в поиске и определения стоимости рекламы.