SEO HARDCORE
  • Разборы патентов
    • Патенты Google
  • Скоро SEO инструменты
  • Скоро SEO аналитика
  • seohardcore
SEO HARDCORE

Разборы патентов Google для SEO

Разобрано 1 300 из ~2 500
  • Ссылки
  • Поведенческие сигналы
  • Антиспам
  • Семантика и интент
  • EEAT и качество
  • SERP
  • Персонализация
  • Индексация
  • Мультимедиа
  • Local SEO
  • Техническое SEO
  • Knowledge Graph
  • Свежесть контента
  • Краулинг
  • Структура сайта
  • Мультиязычность
  • Безопасный поиск
  • Google Shopping
Как Google использует машинное обучение для обнаружения дубликатов, анализируя контент до и после рендеринга
Google использует комплексную систему для обнаружения дубликатов, которая сравнивает как исходный HTML-код (Fetched Body), так и финальную версию страницы после выполнения JavaScript (Synthetic Body). Система вычисляет множество сигналов сравнения, включая основанные на контексте запроса (сниппеты), и использует модель машинного обучения для определения вероятности того, что страницы являются дубликатами.
  • US20140188919A1
  • 2007-02-14
  • Индексация

  • SERP

  • Краулинг

Как Google обнаруживает спам, использующий подмену символов из разных алфавитов (Homograph Attacks)
Google использует метод обнаружения спама, основанный на анализе переходов между различными наборами символов (например, с латиницы на кириллицу и обратно). Этот метод выявляет попытки спамеров заменить буквы визуально похожими символами (гомоглифами) из других алфавитов, чтобы обойти текстовые фильтры. Высокая частота таких переходов сигнализирует о спаме, в то время как легитимный многоязычный контент игнорируется.
  • US9465789B1
  • 2013-03-27
  • Антиспам

Как Google использует метаданные для поиска дубликатов, объединения версий документов и консолидации сигналов ранжирования
Патент описывает, как Google идентифицирует различные версии одного и того же документа (например, научных статей) путем генерации, нормализации и сравнения нескольких идентификаторов на основе метаданных (автор, название, дата). Это позволяет Google объединять дубликаты в кластеры и консолидировать сигналы ранжирования, такие как общее количество цитирований.
  • US8316292B1
  • 2005-11-18
  • Индексация

  • Техническое SEO

Как Google автоматически генерирует правила нормализации слов и поиска вариантов с помощью суффиксных деревьев
Google использует статистические методы и структуру данных «суффиксное дерево» для автоматического создания правил изменения окончаний слов (стемминга и генерации вариантов). Система анализирует наблюдаемые пары слов, обобщает их до правил и использует алгоритмы оптимизации, чтобы определить, когда эти правила применимы, а когда нет. Это обеспечивает точность обработки языка даже для редких слов.
  • US8352247B2
  • 2012-04-23
  • Индексация

Как Google сегментирует глобальный индекс на региональные части для повышения эффективности и локальной релевантности
Google оптимизирует поисковую инфраструктуру, разделяя индекс на две части. Основной индекс («Replicated Content») содержит глобально важные документы и копируется во все дата-центры. Дополнительно каждый дата-центр получает уникальный «Regional Content» — документы, соответствующие локальному языку и шаблонам запросов. Это повышает эффективность и релевантность для международных пользователей.
  • US8131712B1
  • 2007-10-15
  • Индексация

  • Local SEO

  • Мультиязычность

Как Google рассчитывает оценку качества и количества видео на домене (Domain Video Score) для приоритизации индексирования и ранжирования
Google использует систему для оценки доменов, размещающих видеоконтент, рассчитывая метрику Domain Video Score. Эта оценка учитывает как количество видео на сайте (известных и прогнозируемых), так и их качество (на основе метрик вовлеченности, таких как Long Clicks). Этот балл используется для определения приоритета индексирования видео и служит сигналом ранжирования, особенно для нового контента.
  • US8407207B1
  • 2011-05-12
  • Индексация

  • Техническое SEO

  • Краулинг

Как Google определяет галереи изображений на странице, анализируя равномерность их расположения в HTML-структуре
Google анализирует логическую структуру веб-страницы для идентификации галерей изображений. Система вычисляет расстояния между изображениями в макете документа. Если изображения распределены равномерно (имеют одинаковые интервалы), система классифицирует их как галерею. Эта классификация используется для применения особых правил ранжирования в поиске по картинкам.
  • US7788258B1
  • 2004-06-21
  • Индексация

  • Структура сайта

  • Мультимедиа

Как Google извлекает даты и локации из контента для отображения результатов на карте и временной шкале
Google извлекает даты и географические локации непосредственно из контента веб-страниц. Это позволяет системе визуализировать результаты поиска на интерактивной временной шкале и на карте, даже если запрос не содержал явных указаний на время или место. Пользователи могут использовать эти визуализации для навигации и уточнения запросов, а сниппеты могут фокусироваться вокруг извлеченных фактов.
  • US10509817B2
  • 2017-02-06 (Продолжение заявки от 2006-09-29)
  • Индексация

  • Краулинг

  • SERP

Как Google использует прямые фиды данных от издателей для создания обогащенных результатов поиска (Rich Results) в реальном времени
Google использует систему, позволяющую «зарегистрированным издателям» предоставлять структурированные данные (например, цены, расписания, статус рейсов) отдельно от основного контента. Эта информация обновляется значительно чаще, чем стандартный веб-индекс, и используется для создания обогащенных результатов (Rich Results) с актуальными, «живыми» данными прямо в выдаче, минуя задержки стандартного сканирования.
  • US9208230B2
  • 2011-05-27
  • Свежесть контента

  • SERP

Как Google использует компактные дескрипторы и пространственное кодирование для выявления и удаления почти дубликатов изображений из поиска
Google использует систему для эффективного обнаружения изображений-почти дубликатов (измененный размер, обрезка, сжатие). Система анализирует локальные особенности контента ("визуальные слова") и их точное пространственное расположение ("тайлы"), чтобы создать компактные дескрипторы. Сравнивая эти дескрипторы, Google быстро идентифицирует и удаляет дубликаты из результатов поиска для повышения разнообразия выдачи.
  • US9063954B2
  • 2013-03-15
  • Мультимедиа

  • SERP

Как Google объединяет разрозненные данные о сущностях (Entity Resolution) с помощью хеширования и нечеткого сравнения
Google использует этот механизм для определения того, относятся ли разные записи данных к одной и той же сущности (Entity Resolution). Система находит потенциальные совпадения через общие идентификаторы (например, телефон или email), а затем применяет нечеткое сравнение строк (Fuzzy Matching) и анализ конфликтов, чтобы объединить записи. Это критически важно для Knowledge Graph и Local SEO.
  • US8832041B1
  • 2011-09-16
  • Knowledge Graph

  • Local SEO

Как Google использует сравнение DOM и Render Tree для обнаружения и девальвации скрытого текста при генерации сниппетов и ранжировании
Google использует механизм для точного определения, какой текст на веб-странице виден пользователю при загрузке, а какой скрыт. Система сравнивает весь код страницы (DOM Tree) с тем, что фактически отображается (Render Tree). Обнаруженный скрытый текст (например, в меню, скрытый через CSS или цветом фона) получает понижающий коэффициент (Weighting Factor), что снижает вероятность его попадания в сниппет и может влиять на оценку страницы.
  • US8639680B1
  • 2012-05-07
  • Техническое SEO

  • Индексация

  • SERP

Как Google использует MinHash и кластеризацию для определения и каноникализации дубликатов вакансий в Google Jobs
Google применяет систему для эффективной дедупликации вакансий из разных источников. Используя алгоритмы MinHash и Jaccard Similarity, система создает цифровые отпечатки объявлений и группирует похожие версии в кластеры. Внутри кластера выбирается каноническая «главная вакансия» (Master Job Posting), которая и показывается пользователю, устраняя дублирование в выдаче.
  • US20180181609A1
  • 2016-12-28
  • SERP

Как Google улучшает Min-Hash сигнатуры для более точного обнаружения почти дубликатов контента
Google использует усовершенствованный алгоритм Min-Hash для создания цифровых сигнатур контента (веб-страниц, изображений, медиа). Условно используя вторичные перестановки, когда первичный хеш дает мало информации, Google генерирует более надежные и информативные сигнатуры. Это позволяет быстрее и точнее обнаруживать почти дублирующийся контент в процессе индексирования.
  • US8447032B1
  • 2008-03-04
  • Индексация

  • Техническое SEO

Как Google индексирует контент, который не может прочитать, получая метаданные напрямую от сторонних приложений и серверов
Google использует механизм для индексации данных, хранящихся на сторонних серверах или в проприетарных форматах, которые поисковая система не может обработать напрямую. Вместо сканирования исходных данных система получает от третьей стороны готовый для индексации текст или HTML-метаданные, представляющие этот контент. Это позволяет сделать данные доступными для поиска через систему Google, соблюдая при этом контроль доступа и ограничения на размер метаданных.
  • US9262420B1
  • 2012-04-23
  • Индексация

  • Техническое SEO

Как Google анализирует структуру URL и сигналы качества для выбора Sitelinks (Primary Resources)
Google использует алгоритм для идентификации наиболее важных страниц сайта (Primary Resources), которые затем отображаются как Sitelinks в поисковой выдаче. Система строит иерархическую модель сайта на основе структуры URL (а не ссылок) и оценивает каждую страницу по нескольким критериям: глубина в иерархии, количество дочерних страниц, количество внешних и внутренних ссылок, PageRank и качество контента. Этот метод позволяет выбирать Sitelinks даже без данных о трафике.
  • US20150199357A1
  • 2011-04-14
  • Структура сайта

  • Техническое SEO

  • SERP

Как Google встраивает ленту социальных обсуждений в реальном времени прямо в результаты поиска по трендовым запросам
Google использует механизм для идентификации трендовых запросов ("active keywords"), связанных с текущими событиями. Если пользователь ищет по такому запросу, система отбирает релевантные посты из социальных сетей, созданные во время события, и отображает их в виде специальной встроенной ленты ("discussion stream") прямо на странице результатов поиска, отделяя их от более старых социальных постов.
  • US9984155B2
  • 2012-06-07
  • SERP

  • Свежесть контента

  • Персонализация

Как Google использует камеру, микрофон и GPS смартфона для понимания контекстуальных запросов типа «Что это?»
Google использует данные с датчиков мобильного устройства (камера, микрофон, GPS) для понимания неоднозначных запросов пользователя, таких как «Что я вижу?» или «Что это за песня?». Система распознает объекты или звуки в окружении пользователя и использует эту информацию для преобразования контекстуального вопроса в конкретный поисковый запрос, обеспечивая релевантные результаты на основе реального мира.
  • US20130311506A1
  • 2012-01-09
  • Семантика и интент

  • Мультимедиа

Как Google индексирует, ищет и отображает интерактивные 3D-модели в результатах поиска
Google разработал систему для индексации и поиска 3D-моделей. Система может автоматически аннотировать части объектов (например, определять «объектив» на камере), изучая их форму и расположение. Это позволяет искать 3D-объекты, используя изображения или другие 3D-модели в качестве запроса. Результаты поиска включают интерактивные 3D-модели, которые можно вращать прямо в выдаче (moveable inline).
  • US9916345B1
  • 2015-02-11
  • Индексация

  • Мультимедиа

  • SERP

Как Google разбирает изображения на части для визуального поиска товаров (e.g., Google Lens)
Система Google для визуального поиска товаров, которая анализирует изображения, извлекая глобальные и локальные признаки (цвет, форма, текстура). Патент описывает, как это позволяет пользователям искать похожие товары, выделяя конкретные части объекта (например, узор на сумке или форму каблука), используя технологию, лежащую в основе Google Lens.
  • US9008435B2
  • 2012-09-14
  • Мультимедиа

  • Индексация

  • Google Shopping

Как Google персонализирует, локализует и ранжирует новостной контент для Google News и Discover
Google использует систему для персонализации новостного контента, анализируя темы (используя Knowledge Graph), местоположения и даты публикации статей. Система создает динамические профили пользователей на основе истории чтения, применяя механизм «затухания» для устаревших интересов. Ранжирование учитывает релевантность, качество источника, популярность (количество просмотров) и свежесть контента.
  • US9569547B2
  • 2013-12-31
  • Персонализация

  • Свежесть контента

  • Knowledge Graph

Как Google находит, извлекает и объединяет отзывы о товарах из интернета для создания агрегированных рейтингов и выявления частых фраз
Патент описывает систему Google для сбора отзывов о товарах из интернета. Система использует селективное сканирование сайтов, извлекает текст отзывов, рейтинги и авторов. Затем она автоматически определяет, к какому именно продукту относится отзыв (даже при разных названиях), и создает сводную информацию: общий рейтинг, распределение оценок и список часто упоминаемых фраз. Эта система позволяет пользователям искать информацию внутри отзывов о конкретном товаре.
  • US7962461B2
  • 2004-12-14
  • Краулинг

Как Google стандартизирует словоформы в индексе для ускорения поиска и повышения полноты выдачи
Google повышает эффективность поиска, обрабатывая словоформы (например, «голосовать» и «голосование») на этапе индексирования, а не во время выполнения запроса. Система определяет корень слова (стемму), выбирает наиболее частотную «репрезентативную» форму и сохраняет в индексе как исходное слово, так и этот вариант. Это позволяет быстрее находить все релевантные документы без необходимости перебирать варианты слов в момент поиска.
  • US11423029B1
  • 2019-12-11 (Продолжение заявки от 2010-11-09)
  • Индексация

Как Google автоматически уточняет запросы, используя характеристики топовых результатов из общей выдачи
Google использует механизм для улучшения качества результатов при использовании фильтров или поиске в специализированных коллекциях (например, по дате или типу документа). Система анализирует, какие характеристики объединяют лучшие результаты в общей (неограниченной) выдаче по этому запросу. Затем эти характеристики автоматически добавляются как скрытые ограничения к исходному запросу пользователя, чтобы гарантировать, что отфильтрованные результаты соответствуют шаблону качества общей выдачи.
  • US8819000B1
  • 2012-05-01
  • SERP

Как Google использует попарные сравнения (Side-by-Side тесты) для агрегации оценок качества и создания эталонного рейтинга
Патент описывает математический метод, который Google использует для оценки качества поиска на основе попарных сравнений результатов людьми (асессорами). Система собирает данные о предпочтениях (Side-by-Side тесты) и использует модель, аналогичную PageRank (основанную на Марковских процессах), для агрегации этих оценок в единый, устойчивый к шуму рейтинг качества (Preference Ranking). Эти данные служат эталоном для обучения и валидации алгоритмов ранжирования.
  • US7587391B1
  • 2006-06-13
  • SERP

Как Google оптимизирует проверку орфографии в длинных запросах, приоритизируя исправление наиболее вероятных ошибок
Google использует систему для эффективной проверки орфографии в длинных запросах, чтобы избежать задержек (latency). Вместо детальной проверки каждого слова система быстро оценивает вероятность ошибки для всех терминов, используя языковые и N-граммные модели. Затем она выбирает только ограниченное подмножество наиболее подозрительных терминов для ресурсоемкой коррекции, обеспечивая баланс скорости и точности.
  • US9317606B1
  • 2013-02-01
Как Google определяет «идеальное изображение» (Canonical View) объектов для улучшения точности визуального поиска
Google анализирует массивы изображений, чтобы определить стандартный способ фотографирования объекта (например, обуви) — так называемый «Canonical View». Затем система создает шаблоны (оверлеи) на основе этих видов, чтобы помочь пользователям делать снимки для визуального поиска (например, Google Lens). Это гарантирует, что поисковая система получит четкие входные данные, и помогает SEO-специалистам понять, как оптимизировать свои изображения для лучшего распознавания.
  • US9087269B2
  • 2012-10-24
  • Мультимедиа

Как Google использует распознавание объектов (например, в Google Lens) для проактивного поиска в персональных данных пользователя
Патент описывает механизм персонализированного поиска. Google (через Assistant или Lens) сохраняет факты, связанные с типами объектов, на основе ввода пользователя. Когда система распознает объект этого типа в изображении (например, через камеру), она автоматически инициирует поиск в личном корпусе данных пользователя и проактивно предлагает сохраненную информацию. Это технология, основанная на визуальном контексте.
  • US10691747B2
  • 2017-12-15
  • Персонализация

  • Мультимедиа

  • Семантика и интент

Как Google предлагает использовать номера версий контента для генерации в Sitemap, если реальная дата изменения недоступна
Патент описывает метод для генерации Sitemaps на сайтах, где фактическое время последнего изменения контента недоступно (например, для данных в БД). Система сравнивает текущий номер версии контента с версией на момент прошлой генерации Sitemap. Если версия изменилась, в тег устанавливается текущее время, что гарантирует повторное сканирование обновленного контента краулером.
  • US7865497B1
  • 2008-02-21
  • Краулинг

  • Техническое SEO

  • Индексация

Как Google адаптирует формат выдачи (аудио или визуальный) в зависимости от контекста использования устройства
Google использует состояние устройства (например, телефон в автомобильном держателе или подключен к гарнитуре), чтобы определить формат ответа на запрос. Если система сформировала прямой ответ (Summarized Query Response) и устройство находится в «режиме прослушивания» (Audible State), ответ будет автоматически зачитан вслух. Этот механизм подчеркивает критическую важность оптимизации под Featured Snippets для голосового поиска.
  • US10496714B2
  • 2010-08-06
  • Мультимедиа

  • SERP

  • Безопасный поиск

  • 1
  • …
  • 34
  • 35
  • 36
  • 37
  • 38
  • …
  • 44
seohardcore