Индексация

Как Google использует распознавание лиц, одежды и текста внутри изображений для индексации и визуального поиска

2005 • SERP • Индексация • Мультимедиа

US7809722B2 2010-10-05 2005-10-07

Патент описывает комплексную систему для анализа содержимого изображений. Google может распознавать лица, текст на объектах (OCR) и характеристики одежды/аксессуаров. Эта информация индексируется, позволяя пользователям искать изображения не только по тексту, …

Как Google ранжирует и выбирает фотографии для локальных объектов, анализируя 3D-контекст, качество и популярность

2011 • Local SEO • Индексация • Мультимедиа

US9460160B1 2016-10-04 2011-11-29

Google использует технологию Structure from Motion (SfM) для создания 3D-моделей местности и точного определения ракурса каждой фотографии. Это позволяет системе ранжировать изображения для точек интереса (POI). При выборе учитывается контекст …

Как Google распознает людей, текст и объекты на изображениях для индексации и визуального поиска

2005 • SERP • Индексация • Мультимедиа

US7809192B2 2010-10-05 2005-10-07

Анализ патента, описывающего комплексный подход к пониманию изображений. Система обнаруживает и распознает лица, одежду, текст на объектах (OCR) и другие объекты. Для повышения точности используются комбинации признаков (лицо + одежда) …

Как Google группирует локальные результаты поиска вокруг физических адресов и динамически определяет радиус поиска

2003 • Local SEO • Индексация • Персонализация

US8346770B2 2013-01-01 2003-09-22

Google использует систему для организации локальной выдачи, кластеризуя веб-документы вокруг конкретного физического адреса или номера телефона. Система определяет «область интереса», используя динамический радиус поиска, который меняется в зависимости от типа …

Как Google комбинирует разные алгоритмы (Shingling и SimHash) для точного определения дубликатов контента

2006 • Индексация • Краулинг

US20120290597A1 2012-11-15 2006-08-04

Патент Google описывает методы повышения точности обнаружения почти дубликатов контента. Система может использовать двухэтапный подход, комбинируя алгоритмы: один чувствителен к порядку слов (например, Shingling/Broder), а другой учитывает частоту слов, но …

Как Google использует «Белые списки» для определения локального интента и подмешивания локальных результатов, если город в запросе не указан

2007 • Local SEO • Индексация • Персонализация

US8359300B1 2013-01-22 2007-04-03

Google применяет систему для выявления неявного локального интента в запросах без указания местоположения (например, "пицца"). Система проверяет запрос по двум разным "Белым спискам" (Whitelists). В зависимости от того, известно ли …

Как Google ускоряет загрузку страниц и индексацию, пропуская выполнение JavaScript, который не влияет на контент

2014 • Google Shopping • SERP • Индексация

US10713330B2 2020-07-14 2014-06-26

Google использует систему для определения веб-страниц, где выполнение скриптов (например, JavaScript) не меняет основной контент, ссылки или структуру. Такие страницы помечаются как «контентно-нейтральные». Это позволяет браузерам (и системам индексации Google) …

Как Google автоматически классифицирует события в видео, комбинируя NLP-анализ метаданных и анализ контента

2011 • SERP • Индексация • Мультимедиа

US9183296B1 2015-11-10 2011-11-02

Google использует систему для автоматического определения событий в видео (например, "езда на велосипеде"). Она анализирует заголовки и описания с помощью NLP (POS-анализ), чтобы найти комбинации "глагол+существительное", и фильтрует их через …

Как Google кластеризует и ранжирует изображения с помощью двухуровневой системы оценок для визуального поиска

2012 • SERP • Индексация • Мультимедиа

US9654654B1 2017-05-16 2012-02-17

Патент Google, описывающий систему организации результатов поиска по картинкам. Google группирует похожие изображения в кластеры на основе визуальных и семантических признаков. Система использует двухуровневый скоринг: Image Score определяет позицию изображения …

Как Google определяет самые качественные и репрезентативные изображения с помощью анализа визуального сходства и центрирования объектов

2006 • SERP • Shumeet Baluja • Индексация • Мультимедиа

US9268795B2 2016-02-23 2006-11-15

Google использует механизм для улучшения результатов поиска по картинкам. Система анализирует набор изображений, найденных по запросу, и сравнивает их визуальные характеристики (цвет, текстуру, формы). Изображения, которые визуально похожи на большинство …

Как Google индексирует, оценивает и ранжирует цитаты, связывая их с сущностями Knowledge Graph

2014 • Gal Chechik • Knowledge Graph • Индексация

US11250052B1 2022-02-15 2014-03-10

Google использует систему для создания структурированной базы данных цитат. Система извлекает цитаты из веба, идентифицирует автора и сущность, о которой идет речь. Цитаты оцениваются на основе авторитетности источника, релевантности сущности, …

Как Google использует временное партиционирование для диверсификации результатов поиска событий

2006 • SERP • Индексация • Свежесть контента

US8676819B2 2014-03-18 2006-11-14

Анализ патента Google, описывающего систему поиска событий. Чтобы избежать доминирования популярных событий в выдаче, система разделяет запрашиваемый временной интервал на более мелкие части (например, неделю на дни). Затем она находит …

Как Google ускоряет сканирование и рендеринг, пропуская загрузку ресурсов, не влияющих на контент

2014 • Google Shopping • SERP • Индексация

US10284623B2 2019-05-07 2014-06-26

Google использует систему для определения «необязательных ресурсов» (например, скриптов аналитики, трекеров), которые не влияют на видимый контент или структуру страницы. Анализируя шаблоны URL и сравнивая результаты рендеринга с ресурсом и …

Как Google позволяет разработчикам и SEO-специалистам мгновенно увидеть превью сниппета в выдаче до индексации

2016 • SERP • Индексация • Краулинг

US11170014B2 2021-11-09 2016-12-29

Google предоставляет инструмент, который использует актуальную логику обработки контента поисковой системы для генерации «предсказанного результата поиска» (сниппета) в изолированной среде. Это позволяет мгновенно увидеть, как страница будет выглядеть в выдаче …

Как Google использует декларативные шаблоны и анализ области видимости (Scope) для извлечения структурированных данных из HTML

2011 • Knowledge Graph • Индексация

US8793273B1 2014-07-29 2011-06-29

Google использует фреймворк для быстрого создания парсеров, извлекающих точные отношения "Субъект-Предикат-Объект" (S-P-O) из HTML/XML. Ключевым механизмом является определение "области видимости" (Scope) в DOM-дереве, что гарантирует структурную близость и точность связей …

Как Google автоматически распознает лица в видео для аннотирования контента и улучшения поиска

2008 • Knowledge Graph • Индексация • Мультимедиа

US8213689B2 2012-07-03 2008-07-14

Google использует систему автоматического распознавания лиц для идентификации людей в видео. Система самостоятельно создает базу данных моделей лиц, анализируя изображения и тексты из интернета. Затем она отслеживает лица в видеопотоке, …

Как Google использует распознавание лиц для индексирования видео и понимания связей между людьми

2006 • Knowledge Graph • Индексация • Мультимедиа

US8401252B2 2013-03-19 2006-09-29

Google использует систему для автоматического обнаружения, отслеживания и распознавания лиц в видеоконтенте. Это позволяет индексировать видео не только по метаданным, но и по конкретным людям, присутствующим в кадре. Система может …

Как Google автоматически сопоставляет десктопные и мобильные URL с помощью распознавания паттернов и анализа контента

2012 • Индексация • Краулинг • Техническое SEO

US8631097B1 2014-01-14 2012-10-11

Google использует систему для автоматического обнаружения взаимосвязи между десктопными (non-mobile) и мобильными (mobile) версиями страниц, когда используются разные URL. Система анализирует структуру URL, находит общие токены и проверяет схожесть контента. …

Как Google индексирует динамический JavaScript-контент (AJAX/SPA), используя рендеринг и анализ URL-фрагментов

2011 • Индексация • Краулинг • Техническое SEO

US8468145B2 2013-06-18 2011-11-10

Патент Google, описывающий фундаментальный механизм индексирования динамического контента, генерируемого на стороне клиента (JavaScript/AJAX). Система идентифицирует «индексируемые фрагменты» в URL (часть после '#'), выполняет клиентский код для генерации финального состояния страницы …

Как Google использует продвинутые методы OCR и контекстные языковые модели для распознавания текста на изображениях низкого качества

2006 • Ashutosh Garg • Индексация • Мультимедиа • Мультиязычность

US8897579B2 2014-11-25 2006-11-29

Google использует передовые технологии OCR для точного извлечения текста из изображений, включая низкокачественные фото с мобильных устройств. Система применяет масштабирование (Super-resolution), многоуровневый анализ (Multi-scale OCR) и контекстно-зависимые языковые модели (например, …