SEO HARDCORE
  • Разборы патентов
    • Патенты Google
  • Скоро SEO инструменты
  • Скоро SEO аналитика
  • seohardcore
SEO HARDCORE

Техническое SEO в Google: разборы патентов

Детальные разборы патентов Google, связанные с техничкой
  • Ссылки
  • Поведенческие сигналы
  • Антиспам
  • Семантика и интент
  • EEAT и качество
  • SERP
  • Персонализация
  • Индексация
  • Мультимедиа
  • Local SEO
  • Техническое SEO
  • Knowledge Graph
  • Свежесть контента
  • Краулинг
  • Структура сайта
  • Мультиязычность
  • Безопасный поиск
  • Google Shopping
Как Google использует «Фразовую модель» (Phrase Model) для прогнозирования качества сайта на основе статистики использования N-грамм
Google прогнозирует оценку качества сайта, анализируя, какие фразы (N-граммы) используются и как часто они распределены по страницам сайта. Система создает «Фразовую модель», изучая известные высококачественные и низкокачественные сайты, а затем применяет эту модель для оценки новых сайтов по их лингвистическим паттернам.
  • US9767157B2
  • 2013-03-15
  • Семантика и интент

  • Техническое SEO

  • EEAT и качество

Как Google использует время взаимодействия пользователя с сайтом (Dwell Time) для расчета оценки качества всего сайта
Google использует агрегированные данные о продолжительности визитов пользователей на сайт для расчета метрики качества этого сайта (Site Quality Score). Система измеряет время взаимодействия (включая Dwell Time — время от клика в выдаче до возврата обратно), фильтрует аномальные визиты и нормализует данные по типам контента. Итоговая оценка используется как независимый от запроса сигнал для ранжирования и принятия решений об индексировании.
  • US9195944B1
  • 2013-02-25
  • Поведенческие сигналы

  • Индексация

  • SERP

Как Google вычисляет важность сущностей внутри документа, используя контекст, ссылки и поведение пользователей, для улучшения ранжирования
Google использует систему для определения относительной важности сущностей (люди, места, даты) внутри документа (книги или веб-страницы) независимо от поискового запроса. Важность рассчитывается на основе того, где сущность упомянута (контекст, структура), насколько точно она определена, ссылаются ли на этот раздел внешние источники и как часто его просматривают пользователи. Эти оценки важности сущностей затем используются как сигнал для ранжирования самого документа в результатах поиска.
  • US7783644B1
  • 2006-12-13
  • Поведенческие сигналы

  • Индексация

  • Семантика и интент

Как Google использует внутреннюю структуру сайта и авторитетность для корректировки ранжирования
Google использует механизм для уточнения позиций в поиске, анализируя как внешние сигналы (авторитетность сайта), так и внутренние сигналы (структура сайта, внутренние ссылки). Система вычисляет «Внутрисайтовую оценку ранжирования» для определения важности страницы внутри сайта и использует её для корректировки «Глобальной оценки ранжирования». Однако влияние внутренних факторов ограничивается уровнем доверия к сайту.
  • US8843477B1
  • 2011-10-31
  • Структура сайта

  • Техническое SEO

  • EEAT и качество

Как Google использует социальные связи для обнаружения ссылочного спама и накрутки кликов
Google может анализировать связи между владельцами сайтов в социальных сетях, чтобы оценить независимость ссылок между их ресурсами. Если владельцы тесно связаны (например, друзья), ссылки между их сайтами могут получить меньший вес в ранжировании, а клики по рекламе могут быть классифицированы как спам (накрутка).
  • US8060405B1
  • 2004-12-31
  • Антиспам

  • Ссылки

  • SERP

Как Google вычисляет «Proxy Pad Score» для обнаружения сайтов, копирующих чужой контент, и пессимизирует их при каноникализации
Google использует механизм для борьбы с сайтами, которые массово копируют контент (Proxy Pads). Система анализирует, как часто контент сайта проигрывает дубликатам с других сайтов по метрикам качества. На основе этого вычисляется «Proxy Pad Score». Если оценка плохая, сайт пессимизируется на этапе индексации при выборе канонической версии, снижая вероятность попадания скопированного контента в индекс.
  • US8874565B1
  • 2008-12-29
  • Антиспам

  • Индексация

  • Техническое SEO

Как Google идентифицирует и игнорирует шаблонный контент (Boilerplate) для фокусировки на основном содержании страницы
Google использует методы для отделения основного содержания страницы от повторяющихся элементов (навигация, футеры, копирайты). Анализируя частоту повторений на сайте, пространственное расположение блоков, окружающий код и цели ссылок, система классифицирует контент как шаблонный (boilerplate) и исключает его из индексации или значительно понижает его вес.
  • US8041713B2
  • 2004-03-31
  • Индексация

  • Техническое SEO

  • Структура сайта

Как Google использует структурированные данные для борьбы с дублированием страниц с одинаковыми сущностями (например, фасеты и сортировки)
Google анализирует структурированные данные (например, Schema.org) на веб-страницах, чтобы определить, какие сущности (товары, объекты) на них представлены. Если несколько страниц, особенно с одного сайта, содержат одинаковый набор сущностей (например, листинги с разной сортировкой), Google идентифицирует их как дубликаты. Система понижает или удаляет эти дубликаты из выдачи для повышения разнообразия результатов.
  • US20140280084A1
  • 2013-03-15
  • Семантика и интент

  • SERP

  • Индексация

Как Google использует семантическую структуру HTML (списки и заголовки) для расчета расстояния между ключевыми словами
Google анализирует структуру веб-страницы, включая списки и заголовки, чтобы определить семантическое расстояние между ключевыми словами. Система выявляет семантические блоки, даже если они не размечены явными HTML-тегами, путем анализа повторяющихся паттернов форматирования. Расстояние между терминами рассчитывается на основе этой структуры: слова внутри одного элемента списка считаются близкими, а слова в разных элементах — далекими, независимо от физического расстояния.
  • US7716216B1
  • 2004-03-31
  • Семантика и интент

  • Структура сайта

  • Техническое SEO

Как Google создает поисковый индекс для NFT и интегрирует блокчейн (Web3) в результаты поиска
Google разрабатывает инфраструктуру для индексации данных напрямую из блокчейнов, фокусируясь на NFT. Система извлекает описания, историю транзакций и сами цифровые активы, следуя по ссылкам в блокчейне. Она оценивает качество и подлинность NFT, дедуплицирует контент и интегрирует проверенные NFT в поисковую выдачу как специализированные результаты.
  • US20240305482A1
  • 2022-07-18
  • Индексация

  • Краулинг

  • Техническое SEO

Как Google стандартизирует и расширяет географическую релевантность сайтов на соседние локации
Google использует систему Семантических Геотокенов для стандартизации упоминаний местоположений на веб-страницах. Система не только определяет точное местоположение, но и ассоциирует ресурс с соседними географическими областями. Это позволяет сайту ранжироваться по запросам в близлежащих локациях, даже если они явно не упомянуты на странице.
  • US8949277B1
  • 2010-12-30
  • Семантика и интент

  • Local SEO

  • Индексация

Как Google использует семантические сигнатуры на основе фраз для выявления и удаления дубликатов контента
Google использует механизм для обнаружения дубликатов и почти дубликатов контента. Система анализирует, какие семантически связанные фразы (related phrases) содержатся в документе. Затем она выбирает несколько ключевых предложений с наибольшей концентрацией этих фраз для создания уникальной сигнатуры документа. Если сигнатуры двух документов совпадают, они считаются дубликатами и удаляются из индекса или поисковой выдачи.
  • US7711679B2
  • 2004-07-26
  • Семантика и интент

  • Индексация

  • SERP

Как Google классифицирует коммерческие запросы, чтобы изменить алгоритм ранжирования и нейтрализовать манипуляции
Google использует систему для определения коммерческого намерения пользователя в реальном времени. Система использует предварительно созданный список коммерческих шаблонов, основанный на данных рекламодателей, анализе логов и выявлении манипулятивных техник (например, доменов с множеством дефисов). Если запрос классифицируется как коммерческий, Google применяет измененный алгоритм ранжирования, например, снижая вес ключевых слов в доменном имени, чтобы обеспечить непредвзятые результаты.
  • US8046350B1
  • 2003-09-24
  • Семантика и интент

  • SERP

  • Техническое SEO

Как Google индексирует, верифицирует и ранжирует действия (Actions) на сайтах и в приложениях для выполнения задач пользователя
Google индексирует не только контент, но и действия (Actions), которые можно выполнить на сайте или в приложении (например, «Слушать», «Забронировать»). Система определяет тип действия и необходимые параметры, проверяет (Verification) работоспособность действия и использует эту информацию (Action Score) для ранжирования, чтобы отвечать на запросы, подразумевающие выполнение задачи.
  • US10013496B2
  • 2015-06-18
  • Индексация

  • Семантика и интент

  • Техническое SEO

Как Google определяет главные темы сайта ("Top Phrases") и позволяет вебмастерам уточнять их для улучшения индексации
Google использует систему фразовой индексации для определения "Топ Фраз" сайта на основе анализа совместного употребления связанных словосочетаний. Патент описывает механизм, позволяющий вебмастерам корректировать эти Топ Фразы. Система интегрирует эту обратную связь, обновляя семантические связи между фразами в индексе и улучшая понимание контента сайта.
  • US8117223B2
  • 2007-09-07
  • Индексация

  • Семантика и интент

  • Техническое SEO

Как Google сегментирует веб-страницы на семантические блоки (хедер, футер, контент) с помощью анализа геометрии рендеринга
Google использует механизм "псевдо-рендеринга" для анализа геометрической структуры веб-страницы и её разделения на семантически различные области (чанки), такие как основное содержимое, навигация, футер и реклама. Это позволяет системе определять важность контента и ссылок в зависимости от их расположения на странице.
  • US7913163B1
  • 2004-09-22
  • Семантика и интент

  • Структура сайта

  • Техническое SEO

Как Google идентифицирует и игнорирует навигацию, футеры и рекламу на странице для понимания основного контента
Google использует технологию анализа структуры документа (DOM-дерева) для отделения основного содержания страницы от шаблонных элементов (boilerplate) — таких как навигационные меню, футеры, списки ссылок и рекламные блоки. Система анализирует геометрические, структурные и иерархические признаки элементов (например, размер, форму, количество дочерних ссылок, расположение), чтобы классифицировать контент как шаблонный и исключить его при анализе тематики страницы.
  • US8898296B2
  • 2012-08-01
  • Структура сайта

  • Семантика и интент

  • Техническое SEO

Как Google использует данные аналитики в реальном времени и контролируемый трафик для установления оригинального авторства контента
Google патентует метод для точной идентификации автора контента до того, как его обнаружит веб-краулер. Система использует уникальные идентификаторы (например, код веб-аналитики) и отслеживает первую активность автора с неопубликованным контентом (например, переходы по скрытым ссылкам между черновиками). Это позволяет зафиксировать временную метку в реальном времени, защищая от плагиата и обеспечивая корректную атрибуцию в поиске.
  • US9372927B1
  • 2013-03-15
  • EEAT и качество

  • Индексация

  • Краулинг

Как Google использует теорию информации (энтропию) для автоматического определения канонических URL и игнорирования нерелевантных параметров
Google применяет статистический анализ на основе теории информации для определения, какие параметры URL влияют на уникальность контента. Система вычисляет условную энтропию между значениями параметров и отпечатками контента (fingerprints). Это позволяет автоматически игнорировать нерелевантные параметры (например, session ID, трекинг-коды), определять канонический URL и оптимизировать краулинговый бюджет.
  • US9081861B2
  • 2008-07-21
  • Техническое SEO

  • Краулинг

  • Индексация

Как Google автоматически определяет и удаляет неважные URL-параметры для каноникализации и эффективного сканирования
Google использует систему для автоматического определения канонической формы URL. Система активно тестирует различные комбинации параметров в URL, чтобы определить, какие из них влияют на контент, а какие нет (например, tracking-коды или session ID). Неважные параметры удаляются с помощью правил перезаписи, что позволяет свести множество дублирующихся URL к единой канонической версии, экономя краулинговый бюджет.
  • US7827254B1
  • 2003-12-31
  • Краулинг

  • Техническое SEO

  • Индексация

Как Google рассчитывает и использует оценки Mobile-Friendliness для ранжирования результатов и маркировки сайтов
Google рассчитывает Mobile-Friendliness Score, рендеря страницы как мобильное устройство и оценивая такие сигналы, как размер кликабельных элементов, читаемость текста, настройки области просмотра (viewport) и скорость загрузки. Эта оценка используется для повышения позиций удобных для мобильных страниц в мобильном поиске и для добавления метки «Mobile-Friendly» в поисковой выдаче.
  • US20160314215A1
  • 2016-04-20
  • Техническое SEO

  • Индексация

Как Google определяет, какие параметры URL влияют на контент, чтобы выбрать канонический URL и оптимизировать краулинг
Google использует систему для статистического анализа динамических URL-адресов и определения того, какие параметры являются значимыми для контента (content-relevant), а какие нет (content-irrelevant). Система группирует URL-адреса, ведущие на одинаковый контент, в «Классы эквивалентности» и выбирает один «Представительский URL» для сканирования и индексации, экономя краулинговый бюджет и решая проблемы дублированного контента.
  • US7680773B1
  • 2005-03-31
  • Техническое SEO

  • Краулинг

  • Индексация

Как Google индексирует динамический JavaScript-контент (AJAX/SPA), используя рендеринг и анализ URL-фрагментов
Патент Google, описывающий фундаментальный механизм индексирования динамического контента, генерируемого на стороне клиента (JavaScript/AJAX). Система идентифицирует «индексируемые фрагменты» в URL (часть после '#'), выполняет клиентский код для генерации финального состояния страницы (DOM) и преобразует его в статический HTML для индексации. Это основа работы современного сервиса рендеринга (WRS).
  • US8468145B2
  • 2011-11-10
  • Индексация

  • Техническое SEO

  • Краулинг

Как Google использует метаданные XML Sitemap (lastmod, changefreq, priority) для планирования и приоритизации сканирования
Патент Google, описывающий фундаментальные механизмы протокола Sitemaps. Планировщик сканирования использует метаданные, предоставленные веб-сайтами: lastmod для предотвращения сканирования неизмененного контента, changefreq для прогнозирования обновлений и priority в качестве повышающего коэффициента (boost factor) в очереди сканирования, оптимизируя краулинговый бюджет.
  • US7769742B1
  • 2005-06-30
  • Краулинг

  • Техническое SEO

  • Свежесть контента

Как Google использует NLP, Proximity Score и Query Score для извлечения сущностей и приоритизации контента на основе структуры текста и контекста пользователя
Патент детально описывает, как Google анализирует текстовые описания, извлекает ключевые именные группы (Noun Phrases/сущности) и превращает их в поисковые запросы. Система ранжирует результаты, используя «Proximity Score» (порядок появления в тексте) и «Query Score» (контекст пользователя), что дает критическое понимание влияния структуры текста на интерпретацию контента.
  • US9788055B2
  • 2013-03-14
  • Семантика и интент

  • SERP

  • Техническое SEO

Как Google автоматически сопоставляет десктопные и мобильные URL с помощью распознавания паттернов и анализа контента
Google использует систему для автоматического обнаружения взаимосвязи между десктопными (non-mobile) и мобильными (mobile) версиями страниц, когда используются разные URL. Система анализирует структуру URL, находит общие токены и проверяет схожесть контента. На основе найденных пар генерируются правила (Regular Expressions) для предсказания мобильного URL по десктопному, что улучшает индексацию мобильного контента и корректность выдачи.
  • US8631097B1
  • 2012-10-11
  • Индексация

  • Техническое SEO

  • Структура сайта

Как Google позволяет владельцам сайтов выбирать предпочтительный (канонический) домен для индексации и управлять скоростью сканирования
Патент описывает механизмы Google для решения проблемы дублирования контента, возникающей из-за нескольких эквивалентных доменных имен (например, с WWW и без). Верифицированные владельцы могут указать предпочтительный домен, который Google будет использовать для перезаписи URL-адресов перед индексацией, консолидируя сигналы ранжирования. Патент также описывает интерфейсы для управления верификацией владельцев и контроля скорости сканирования (Crawl Rate).
  • US7930400B1
  • 2006-12-27
  • Индексация

  • Краулинг

  • Техническое SEO

Как Google использует структуру URL для прогнозирования качества, популярности и поведения пользователей для новых страниц
Google анализирует исторические данные о поведении пользователей (например, долгие клики) и атрибуты документов, агрегируя их по схожим шаблонам URL. Если страница новая и не имеет собственных данных, система прогнозирует ее ценность, основываясь на показателях других страниц с аналогичной структурой URL. Это влияет на приоритеты сканирования, индексирования и начальное ранжирование.
  • US8645367B1
  • 2010-03-08
  • Структура сайта

  • Техническое SEO

  • Индексация

Как Google идентифицирует сайты-трамплины (Bounce Pads/Дорвеи) и исключает их из индекса при выборе канонической версии
Google использует механизм для обнаружения «Bounce Pads» — сайтов, основная цель которых — перенаправление пользователей на другие ресурсы. Система анализирует долю редиректов на сайте (Redirect Score) и разнообразие внешних целей перенаправления (Spam Score). Обнаруженные сайты-трамплины помечаются и исключаются из рассмотрения при выборе канонической (главной) версии страницы среди дубликатов, что предотвращает их попадание в поисковую выдачу.
  • US8037073B1
  • 2008-12-29
  • Индексация

  • Антиспам

  • Техническое SEO

Как Google использует редиректы, анализ URL и оценку качества для объединения дубликатов и выбора канонической версии
Google использует итеративный процесс для борьбы с дубликатами при индексировании. Система кластеризует похожие документы, выбирает лучшего представителя из каждого кластера на основе качества и определяет конечную цель его редиректов. Если цели редиректов из разных кластеров оказываются дубликатами (например, на основе анализа паттернов URL), исходные кластеры объединяются. Это позволяет консолидировать сигналы и выбрать единую каноническую версию для индекса.
  • US8661069B1
  • 2008-03-31
  • Индексация

  • Техническое SEO

  • Структура сайта

  • 1
  • 2
  • 3
  • 4
  • 5
seohardcore