SEO HARDCORE
  • Разборы патентов
    • Патенты Google
  • Скоро SEO инструменты
  • Скоро SEO аналитика
  • seohardcore
SEO HARDCORE
назад

Как Google определяет ключевые слова, которые сильно связаны с конкретными категориями, для улучшения ранжирования

KEYWORDS ASSOCIATED WITH DOCUMENT CATEGORIES (Ключевые слова, связанные с категориями документов)
  • US7996393B1
  • Google LLC
  • 2007-09-28
  • 2011-08-09
  • Семантика и интент
  • SERP
  • Описание
  • Разбор
  • Выводы
  • Практика
  • FAQ
  • Похожие

Google использует статистический анализ частоты запросов и их связи с категориями документов для выявления сильных ассоциаций (например, запрос «суши-бар» и категория «Японский ресторан»). Если пользователь вводит запрос, который является таким ключевым словом, документы, принадлежащие к соответствующей категории, получают повышение в ранжировании.

Описание

Какую проблему решает

Патент решает задачу повышения релевантности поисковой выдачи путем использования категоризации документов. На момент подачи заявки существующие методы категоризации считались недостаточно полезными для поисковых систем. Изобретение предлагает механизм для автоматического определения того, какие поисковые запросы (ключевые слова) статистически сильно связаны с определенными категориями документов, и использования этих связей для улучшения ранжирования.

Что запатентовано

Запатентована система автоматической генерации ключевых слов, ассоциированных с категориями документов. Система анализирует корпус документов и логи поисковых запросов для выявления пар (Keyword, Category), которые имеют сильную статистическую корреляцию (высокий F-measure). Эта корреляция рассчитывается на основе частоты использования ключевого слова в запросах и частоты его появления в документах определенной категории.

Как это работает

Система работает в два этапа: генерация ключевых слов (офлайн) и применение в ранжировании (онлайн).

  • Генерация: Система извлекает кандидатов в ключевые слова из логов запросов и документов. Для каждого кандидата и категории рассчитывается статистическая оценка (например, F-measure), которая учитывает, насколько часто слово используется в запросах и насколько оно специфично для данной категории (сильная корреляция внутри категории и слабая корреляция между категориями).
  • Применение: Когда поступает поисковый запрос, система проверяет, содержит ли он одно из сгенерированных ключевых слов. Если да, документы, принадлежащие к соответствующей категории, получают повышение в ранжировании.

Актуальность для SEO

Высокая. Описанный механизм является фундаментальным для понимания того, как Google интерпретирует интент запроса через призму категорий. Это особенно актуально для локального поиска (Local SEO), электронной коммерции и любых ниш, где существует четкая таксономия. Понимание связи между запросами и категориями сущностей является ключевым элементом современного поиска.

Важность для SEO

Патент имеет высокое значение для SEO, особенно в стратегиях, связанных с Local SEO и E-commerce. Он демонстрирует механизм, при котором правильная категоризация документа может привести к значительному повышению ранжирования по специфическим запросам, которые Google статистически связал с этой категорией. Это подчеркивает важность обеспечения четких сигналов, позволяющих Google корректно классифицировать контент и сущности (например, бизнес или продукт).

Детальный разбор

Термины и определения

Category (Категория)
Класс, к которому принадлежит документ или концепция. Примеры включают бизнес-категории (например, «Японский ресторан», «Авторемонт»), тематические (например, «Наука», «Спорт») или языковые категории.
Document Information (Информация о документе)
Текстовая или метаинформация в документе, используемая для его категоризации. В контексте патента часто подразумеваются данные бизнес-листингов (название, адрес, телефон).
F-measure (F-мера)
Статистическая оценка, используемая для измерения силы связи между ключевым словом и категорией. Рассчитывается на основе вероятностей P(keyword), P(category) и P(keyword, category).
Keyword (Ключевое слово)
Слово или фраза из поисковых запросов, которое было идентифицировано системой как имеющее сильную статистическую связь с определенной категорией.
Keyword Candidate (Кандидат в ключевые слова)
Слово или фраза, извлеченное из документов и логов поисковых запросов, которое анализируется на предмет связи с категориями.
Strong "within" category correlation (Сильная корреляция «внутри» категории)
Показатель того, что ключевое слово часто встречается в документах, принадлежащих к данной категории.
Weak "between" category correlation (Слабая корреляция «между» категориями)
Показатель того, что ключевое слово редко встречается в документах, не принадлежащих к данной категории (специфичность).

Ключевые утверждения (Анализ Claims)

Claim 1 (Независимый пункт): Описывает метод идентификации и использования ключевых слов на основе категорий для приоритезации результатов поиска.

  1. Извлечение Keyword Candidate из документа. Кандидат должен присутствовать как в документе, так и в предыдущих поисковых запросах.
  2. Расчет частоты появления кандидата в каждой из множества категорий.
  3. Ассоциация кандидата как Keyword с документом, если выполняются условия:
    • Частота в категории(ях), к которой принадлежит документ, превышает порог (сильная корреляция «внутри»).
    • Частота в других категориях, к которым документ НЕ принадлежит, не превышает порог (слабая корреляция «между»).
  4. Приоритезация (повышение ранжирования) этого документа в результатах поиска в ответ на запрос, связанный с этим Keyword и категорией.

Claim 6 и 7 (Зависимые): Детализируют механизм оценки связи с помощью расчета Score.

  1. Расчет Score для Keyword Candidate на основе рассчитанных частот.
  2. Определение кандидата как Keyword, если Score превышает пороговое значение.
  3. Claim 7 определяет формулу расчета Score (F-measure): Score=P(keyword,category)(a⋅P(keyword)+(1−a)⋅P(category)) , где 'a' — константа между 0 и 1, P(keyword) — вероятность появления кандидата в предыдущих запросах, P(category) — вероятность появления кандидата в документах категории, и P(keyword, category) — совместная вероятность.

Claim 20 (Независимый пункт): Описывает метод применения сгенерированных данных в процессе ранжирования.

  1. Получение поискового запроса и идентификация релевантных документов.
  2. Маппинг (соотнесение) каждого документа с одной или несколькими категориями на основе контекстной информации документа.
  3. Расчет частоты появления Keyword Candidate в каждой категории.
  4. Ассоциация кандидата как Keyword с категорией на основе рассчитанных частот.
  5. Определение рангов документов на основе Keyword. Это включает повышение рангов документов, которые принадлежат к категории, ассоциированной с Keyword, по сравнению с документами, не принадлежащими к этой категории.
  6. Сортировка документов и генерация выдачи.

Где и как применяется

Изобретение охватывает несколько этапов поисковой архитектуры, разделяя процесс на офлайн-подготовку данных и онлайн-применение в ранжировании.

INDEXING – Индексирование и извлечение признаков
На этом этапе система должна извлечь Document Information (например, данные бизнес-листинга) и определить или присвоить категории документам. Эта информация сохраняется для последующего анализа.

QUNDERSTANDING – Понимание Запросов (Офлайн-анализ)
Основная часть работы по генерации ключевых слов происходит офлайн. Система анализирует логи поисковых запросов (user behavior data) и корпус проиндексированных документов для выявления статистических связей между запросами и категориями. Результатом является база данных пар (Keyword, Category) с рассчитанными оценками (Scores).

RANKING – Ранжирование (Онлайн-применение)
Механизм применяется во время выполнения запроса для корректировки ранжирования.

  1. Система определяет, содержит ли запрос пользователя Keyword, для которого существует сильная связь с Category.
  2. Система идентифицирует документы-кандидаты и определяет их категории.
  3. Если запрос содержит Keyword, документы, принадлежащие к соответствующей Category, получают повышение в ранжировании (Prioritizing/Rank documents based on Keyword/Category).

Входные данные:

  • Корпус документов с ассоциированной информацией (Document Information).
  • Логи поисковых запросов (Search Queries/User behavior data).
  • Маппинг между Document Information и Categories.

Выходные данные:

  • База данных ключевых слов, ассоциированных с категориями, и их оценки (Scores).
  • Скорректированные ранги документов при выполнении запроса, содержащего эти ключевые слова.

На что влияет

  • Конкретные ниши или тематики: Наибольшее влияние оказывается на ниши с четкой таксономией. Патент приводит множество примеров из локального поиска (рестораны, авторемонт, юристы, врачи) и E-commerce (Hardware).
  • Специфические запросы: Влияет на запросы, которые имеют сильную категориальную направленность, даже если сама категория в запросе не указана (например, запрос «суши-бар» подразумевает категорию «Японский ресторан»).
  • Конкретные типы контента: Влияет на ранжирование страниц сущностей, которые могут быть четко категоризированы (листинги бизнесов, карточки товаров, страницы услуг).

Когда применяется

  • Условия работы алгоритма (Генерация): Применяется периодически в офлайн-режиме для анализа накопленных данных о документах и поведении пользователей (запросах).
  • Триггеры активации (Ранжирование): Активируется, когда поисковый запрос содержит Keyword, который был предварительно идентифицирован как статистически значимый для определенной Category (т.е. имеет высокий Score/F-measure).
  • Пороговые значения: Алгоритм генерации использует пороги для определения сильной корреляции «внутри» категории, слабой корреляции «между» категориями и значимости термина в поисковых запросах. Также используется пороговое значение для Score.

Пошаговый алгоритм

Процесс А: Генерация ключевых слов, связанных с категориями (Офлайн)

  1. Извлечение кандидатов: Извлечение Keyword Candidates из корпуса документов и логов поисковых запросов. Кандидаты часто берутся из документов, содержащих специфическую информацию (например, бизнес-листинги).
  2. Создание пар (Кандидат/Информация): Создание пар, включающих Keyword Candidate и связанную с ним Document Information.
  3. Расчет частоты запросов: Вычисление частоты появления каждого Keyword Candidate в логах поисковых запросов.
  4. Расчет частоты пар в документах: Вычисление частоты появления пар (Кандидат/Информация) в корпусе документов.
  5. Маппинг информации в категории: Соотнесение Document Information с определенными Categories (например, название бизнеса соотносится с бизнес-категорией). Создание пар (Кандидат/Категория).
  6. Аккумуляция данных: Расчет частоты совместного появления пар (Кандидат/Категория) в документах.
  7. Определение ключевых слов для категорий: Выполнение статистического анализа для определения силы связи.
    • Рассчитывается Score (например, F-measure) для каждой пары (Кандидат/Категория).
    • Анализируется сильная корреляция «внутри» категории и слабая корреляция «между» категориями.
    • Кандидаты, чьи оценки превышают пороговые значения, определяются как Keywords для данной категории.
  8. Ассоциация ключевых слов с документами: Сохранение идентифицированных Keywords и их связи с категориями и документами.

Процесс Б: Применение в ранжировании (Онлайн)

  1. Получение запроса: Система получает поисковый запрос от пользователя.
  2. Идентификация документов: Определяется набор документов, релевантных запросу.
  3. Проверка наличия ключевого слова: Определяется, содержит ли запрос одно из предварительно сгенерированных Keywords.
  4. Проверка ассоциации документов с категорией: Определяется, ассоциированы ли найденные документы с Category, соответствующей Keyword.
  5. Ранжирование на основе Keyword/Category: Документы, которые ассоциированы с соответствующей категорией, получают повышение в ранжировании.
  6. Сортировка: Документы сортируются на основе итоговых рангов (которые могут учитывать и другие факторы ранжирования).
  7. Генерация выдачи: Формирование страницы результатов поиска.

Какие данные и как использует

Данные на входе

  • Поведенческие факторы (Критически важно): Логи поисковых запросов (Search Queries). Они используются для определения Keyword Candidates и расчета частоты их использования (P(keyword)). Также упоминаются User behavior data, включающие навигационные действия (клики, выбранные ссылки/категории), язык пользователя, интересы.
  • Контентные факторы: Document Information — текст или метаданные в документе. В патенте особо выделяются бизнес-листинги (название, адрес, телефон).
  • Структурные факторы (Категоризация): Данные о принадлежности документов к Categories. Они могут быть получены из самих документов, определены на основе Document Information или получены от третьих сторон.

Какие метрики используются и как они считаются

  • Частота запросов (Query Frequency): Количество появлений Keyword Candidate в логах запросов.
  • Частота в документах (Document Frequency): Количество появлений пары (Кандидат/Информация) или (Кандидат/Категория) в корпусе документов.
  • P(keyword): Вероятность появления ключевого слова в поисковых запросах.
  • P(category): Вероятность появления категории в ассоциированной информации документов.
  • P(keyword, category): Совместная вероятность появления пары ключевого слова и категории.
  • P(category|keyword) (Recall/Полнота): Условная вероятность категории при заданном ключевом слове.
  • P(keyword|category) (Precision/Точность): Условная вероятность ключевого слова при заданной категории.
  • F-measure (Score): Основная метрика для оценки силы связи. Рассчитывается по формуле: P(keyword,category)(a⋅P(keyword)+(1−a)⋅P(category)) . Параметр 'a' используется для балансировки между точностью и полнотой.
  • Пороговые значения: Используются пороги для F-measure, а также пороги для определения сильной корреляции «внутри» и слабой «между» категориями.

Выводы

  1. Автоматическое определение интента через категории: Патент описывает механизм, позволяющий Google статистически определять, какие запросы сильно связаны с конкретными категориями, даже если категория не указана в запросе явно. Это позволяет системе лучше понимать интент пользователя.
  2. Важность статистической значимости (F-measure): Для того чтобы связь была учтена, она должна быть статистически сильной. Система использует F-measure для балансировки популярности запроса и его специфичности для категории. Недостаточно просто часто встречаться в категории; нужно также редко встречаться вне ее (слабая корреляция «между» категориями).
  3. Данные из реальных запросов: Система полагается на анализ реальных поисковых запросов (User behavior data) для определения кандидатов и их популярности. Это означает, что система адаптируется к тому, как пользователи ищут информацию в разных категориях.
  4. Категоризация как фактор ранжирования: Если запрос идентифицирован как Keyword для определенной Category, то принадлежность документа к этой категории становится сильным сигналом ранжирования для данного запроса.
  5. Фундамент для Local SEO и E-commerce: Механизм критически важен для локального поиска и электронной коммерции, где категоризация объектов (бизнесов, товаров) играет ключевую роль в обеспечении релевантности.

Практика

Best practices (это мы делаем)

  • Обеспечение корректной категоризации: Критически важно предоставить Google четкие и последовательные сигналы о категории вашего контента или бизнеса. В Local SEO это означает правильный выбор основной и дополнительных категорий в Google Business Profile. В E-commerce — использование структурированной навигации, хлебных крошек и микроразметки (Product с категорией).
  • Анализ лексикона целевой аудитории: Изучайте, какие именно запросы пользователи используют для поиска в вашей категории. Убедитесь, что ваш контент естественно включает эти термины. Если Google статистически свяжет эти популярные запросы с вашей категорией (высокий F-measure), вы получите преимущество.
  • Использование консистентной информации (NAP): Для локального бизнеса критично использовать последовательную информацию (Name, Address, Phone) на сайте и в листингах. Патент явно указывает на использование Document Information (бизнес-листингов) для маппинга документов в категории.
  • Построение Topical Authority в рамках категории: Создавайте контент, который подтверждает вашу принадлежность к категории. Чем больше качественных документов вашего сайта будет ассоциировано с категорией, тем выше вероятность того, что система будет использовать эту связь при ранжировании.

Worst practices (это делать не надо)

  • Неправильная или слишком широкая категоризация: Выбор неверной категории в попытке охватить больше запросов может привести к потере релевантности. Система ищет сильную и специфичную связь между запросом и категорией. Если ваш контент не соответствует ожиданиям пользователей в данной категории, это не принесет пользы.
  • Игнорирование категориального интента: Попытка ранжироваться по запросу с сильным категориальным интентом без принадлежности к этой категории будет затруднена. Например, ранжирование информационного блога по запросу «замена масла» будет сложным, так как этот запрос сильно связан с категорией «Авторемонт».
  • Манипуляции с ключевыми словами без учета контекста категории: Насыщение текста ключевыми словами не поможет, если система не может четко классифицировать документ или если эти слова не являются статистически значимыми для вашей категории.

Стратегическое значение

Этот патент подтверждает стратегическую важность entity-based SEO и корректной классификации контента. Google стремится понять не только текст на странице, но и то, к какому классу объектов этот текст относится. В долгосрочной стратегии необходимо фокусироваться на том, чтобы сайт или бизнес однозначно и авторитетно представлял свою категорию. Это обеспечивает устойчивое ранжирование по запросам, которые подразумевают эту категорию.

Практические примеры

Сценарий: Оптимизация сайта автомастерской (Local SEO)

  1. Анализ данных (Имитация Google): Google анализирует логи и определяет, что запрос «замена масла» (Keyword) очень часто приводит к кликам на сайты в категории «Авторемонт» (Category) и редко на другие (высокий F-measure).
  2. Действия SEO-специалиста: Специалист убеждается, что Google Business Profile компании корректно настроен с основной категорией «Авторемонт». На сайте создается страница услуги «Замена масла», содержащая консистентную информацию (NAP) и четко описывающая услугу.
  3. Выполнение запроса: Пользователь вводит запрос «замена масла».
  4. Результат: Поисковая система идентифицирует «замена масла» как Keyword, связанный с категорией «Авторемонт». Сайт автомастерской, корректно классифицированный в этой категории, получает повышение в ранжировании по сравнению с информационным сайтом, пишущим о замене масла.

Сценарий: Оптимизация интернет-магазина (E-commerce)

  1. Анализ данных (Имитация Google): Google определяет, что запрос «Ace Hardware» (Keyword) сильно коррелирует с категорией «Hardware Stores» (Category).
  2. Действия SEO-специалиста: Специалист крупного DIY-магазина убеждается, что структура сайта и микроразметка четко определяют его как магазин строительных материалов (Hardware Store).
  3. Результат: При запросах, связанных с конкретными брендами или типами товаров, которые статистически связаны с категорией «Hardware Stores», сайт магазина получает преимущество перед сайтами общей тематики или новостными ресурсами.

Вопросы и ответы

Как система определяет категорию документа?

Патент указывает несколько способов. Категория может быть предоставлена самим документом, определена из информации, содержащейся в документе (Document Information), или получена от третьих сторон. В примерах патента часто используется информация из бизнес-листингов (название, адрес) для определения бизнес-категории.

Что такое F-measure и почему это важно?

F-measure — это статистическая оценка, которая определяет силу связи между ключевым словом и категорией. Она важна, потому что учитывает баланс между точностью (Precision) и полнотой (Recall). Высокий F-measure означает, что ключевое слово часто встречается в этой категории И редко встречается в других, что делает его надежным индикатором интента пользователя.

Что важнее: популярность запроса или его специфичность для категории?

Важны оба фактора. Система рассчитывает P(keyword) (популярность в запросах) и анализирует корреляцию внутри/между категориями (специфичность). Ключевое слово должно быть достаточно популярным, чтобы его стоило оптимизировать, и достаточно специфичным, чтобы надежно указывать на категорию.

Как этот патент влияет на Local SEO?

Он имеет критическое значение для Local SEO. Патент описывает, как Google связывает общие запросы услуг (например, «стрижка», «замена масла», «доставка цветов») с конкретными бизнес-категориями («Салон красоты», «Авторемонт», «Цветочный магазин»). Корректная настройка категорий в GBP напрямую влияет на ранжирование по этим запросам.

Может ли этот механизм понизить мой сайт в выдаче?

Да, косвенно. Если ваш сайт не принадлежит к категории, с которой сильно связан запрос, он будет ранжироваться ниже, чем сайты, которые к ней принадлежат. Например, если вы пишете информационную статью о суши, она, скорее всего, уступит в ранжировании локальным ресторанам по запросу «суши-бар», так как этот запрос имеет сильный категориальный интент.

Как я могу узнать, какие ключевые слова Google связал с моей категорией?

Патент не предоставляет интерфейса для этого, но вы можете провести анализ выдачи. Изучите, какие типы сайтов ранжируются по вашим целевым запросам. Если в топе доминируют сайты определенной категории, это сильный индикатор того, что Google установил связь между этим запросом и категорией.

Откуда берутся кандидаты в ключевые слова?

Кандидаты извлекаются из реальных поисковых запросов пользователей (Search Queries/User behavior data), которые также встречаются в проиндексированных документах. Это гарантирует, что система оптимизирует выдачу под реальное поведение пользователей.

Влияет ли этот патент на ранжирование информационных сайтов?

Да, хотя примеры в патенте фокусируются на бизнесе, механизм применим к любым категориям (например, Наука, Искусство, Новости). Если информационный сайт четко позиционируется в определенной тематической категории, он может получать преимущество по запросам, связанным с этой категорией.

Что означает параметр 'a' в формуле F-measure?

Параметр 'a' (константа от 0 до 1) используется для настройки баланса между Precision и Recall. Если a=1, используется чистый Recall (P(category|keyword)). Если a=0, используется чистая Precision (P(keyword|category)). Патент предполагает, что 'a' выбирается для наилучшей эмпирической производительности, часто близко к 1 (приоритет Recall).

Как часто обновляются эти ассоциации между ключевыми словами и категориями?

Патент указывает, что процесс генерации ключевых слов выполняется периодически в офлайн-режиме, так как поведение пользователей постоянно меняется. Система может учитывать возраст поисковых запросов при определении кандидатов, что позволяет адаптироваться к изменениям в языке и трендах.

Похожие патенты

Как Google использует категоризацию контента и запросов для уточнения релевантности и ранжирования результатов
Google использует систему для улучшения ранжирования, комбинируя стандартную текстовую релевантность с оценкой соответствия категории. Система определяет, насколько сильно документ принадлежит к определенным категориям и насколько сильно запрос соответствует этим же категориям. Если и документ, и запрос сильно совпадают по категории, результат получает повышение в ранжировании. Это особенно важно для E-commerce и контента с четкой структурой.
  • US7814085B1
  • 2010-10-12
  • Семантика и интент

  • SERP

Как Google определяет "Связанные запросы", сравнивая различия в топе выдачи и сходства в нижних результатах
Google использует двухэтапный анализ для генерации блока "Связанные запросы" (Related Searches). Система ищет запросы, у которых ТОП выдачи сильно отличается от исходного запроса (чтобы показать новое), но результаты на низких позициях сильно пересекаются (чтобы сохранить тематическую связь). Это позволяет предлагать пользователю смежные темы, не повторяя уже увиденные результаты.
  • US9122727B1
  • 2015-09-01
  • Семантика и интент

  • SERP

Как Google предлагает категории для уточнения запроса на основе анализа топа выдачи (особенно в локальном поиске)
Google анализирует категории (например, из бизнес-справочников), к которым принадлежат топовые результаты по запросу пользователя. Наиболее релевантные или часто встречающиеся категории предлагаются пользователю для уточнения или сужения поиска, что особенно актуально для локальных запросов и поиска организаций.
  • US7523099B1
  • 2009-04-21
  • Local SEO

  • Семантика и интент

  • SERP

Как Google использует фразы и тематические кластеры из истории пользователя для персонализации результатов поиска
Google может строить модель интересов пользователя, анализируя семантически значимые фразы и тематические кластеры в контенте, который пользователь потребляет (просматривает, сохраняет, печатает). При последующих запросах система повышает в ранжировании те документы, которые содержат фразы, одновременно релевантные запросу и присутствующие в профиле интересов пользователя.
  • US7580929B2
  • 2009-08-25
  • Персонализация

  • Семантика и интент

  • Поведенческие сигналы

Как Google автоматически создает и ранжирует шаблоны запросов с сущностями для улучшения поисковых подсказок (Autocomplete)
Google использует систему для автоматического обнаружения паттернов в поисковых запросах, которые включают фиксированные термины и сущности из определенной категории (например, «рестораны в [городе]»). Система генерирует шаблоны запросов, оценивает их качество на основе частоты использования, разнообразия сущностей и их распределения, а затем использует эти шаблоны для формирования более точных и структурированных поисковых подсказок в реальном времени.
  • US9529856B2
  • 2016-12-27
  • Knowledge Graph

  • Семантика и интент

  • Поведенческие сигналы

Популярные патенты

Как Google динамически фильтрует и изменяет подсказки Autocomplete в реальном времени при вводе навигационного запроса
Google использует систему для оптимизации функции автозаполнения (Autocomplete). При вводе частичного запроса система определяет широкий набор потенциальных навигационных ссылок (Superset) и фильтрует его до узкого подмножества (Subset) на основе сигналов, таких как история поиска, популярность и тип документа. Интерфейс может динамически изменять отображаемые подсказки, если пользователь делает паузу при вводе.
  • US9454621B2
  • 2016-09-27
  • Семантика и интент

  • SERP

  • Поведенческие сигналы

Как Google снижает ценность кликов по результатам, полученным из слишком общих запросов
Google использует механизм для корректировки показателей популярности (например, кликов) документа. Если документ получил клик в ответ на очень общий (широкий) запрос, ценность этого клика снижается. Это предотвращает искусственное завышение популярности документов, которые часто показываются по высокочастотным общим запросам, и повышает значимость кликов, полученных по более специфическим запросам.
  • US7925657B1
  • 2011-04-12
  • Поведенческие сигналы

Как Google использует машинное обучение для оптимизации обхода Knowledge Graph и поиска связанных концепций
Google оптимизирует обход Knowledge Graph для эффективного поиска семантически связанных фраз. Вместо анализа всех связей сущности система использует ML-модели для выбора только тех отношений (свойств), которые вероятнее всего приведут к ценным результатам. Этот выбор основан на истории поисковых запросов и контексте пользователя, что позволяет экономить вычислительные ресурсы и повышать релевантность предложений.
  • US10140286B2
  • 2018-11-27
  • Knowledge Graph

  • Семантика и интент

  • Персонализация

Как Google использует историю запросов в текущей сессии и статистические паттерны для переранжирования результатов
Google анализирует миллионы прошлых поисковых сессий, выявляя статистически значимые последовательности запросов («Пути Запросов»), которые заканчиваются кликом на определенный URL («Конечная Точка Контента»). Когда текущая сессия пользователя совпадает с историческим путем, Google переранжирует результаты, повышая те URL, которые исторически удовлетворяли пользователей в аналогичном контексте, пропорционально вероятности их выбора.
  • US7610282B1
  • 2009-10-27
  • Поведенческие сигналы

  • SERP

  • Семантика и интент

Как Google использует социальные связи для выявления предвзятых ссылок и борьбы со ссылочными схемами и кликфродом
Google анализирует взаимоотношения между администраторами веб-сайтов (используя данные социальных сетей), чтобы определить независимость ссылок или кликов по рекламе. Если обнаружена тесная связь, это интерпретируется как предвзятость (Bias). В результате вес ссылки для ранжирования может быть снижен (борьба с Search Spamming), или клик по рекламе может быть дисконтирован (борьба с Ad Spamming).
  • US10402457B1
  • 2019-09-03
  • Ссылки

  • Антиспам

  • Краулинг

Как Google определяет синонимы и варианты слов, анализируя категории выбранных пользователями результатов
Google использует метод стемминга, основанный на поведении пользователей и категориях сущностей. Если пользователи ищут разные слова (например, «пицца» и «пиццерия») и выбирают результаты одной категории («ресторан»), система идентифицирует эти слова как варианты одной основы (Stem Variants). Это происходит, если слова похожи по написанию ИЛИ если объем кликов статистически значим.
  • US9104759B1
  • 2015-08-11
  • Семантика и интент

  • Поведенческие сигналы

  • Персонализация

Как Google рассчитывает оценку авторитетности сайта, используя соотношение Независимых Ссылок и Брендовых Запросов
Google рассчитывает метрику авторитетности для веб-сайтов на основе соотношения количества независимых входящих ссылок к количеству брендовых (референсных) запросов. Сайты, имеющие много независимых ссылок относительно их поисковой популярности, получают преимущество. Напротив, популярные сайты с недостаточным количеством внешних ссылок могут быть понижены в ранжировании по общим запросам.
  • US8682892B1
  • 2014-03-25
  • Ссылки

  • EEAT и качество

  • SERP

Как Google определяет скрытый интент сессии, используя универсальные уточняющие слова, и переранжирует выдачу
Google идентифицирует универсальные слова-модификаторы (например, «фото», «отзывы», «pdf»), которые пользователи часто добавляют к разным запросам. Если такое слово появляется в сессии, система определяет скрытый интент пользователя. Затем Google переранжирует выдачу, основываясь на том, какие документы исторически предпочитали пользователи с таким же интентом, адаптируя результаты под контекст сессии.
  • US8868548B2
  • 2014-10-21
  • Семантика и интент

  • Поведенческие сигналы

  • Персонализация

Как Google интегрирует поиск в инструменты создания контента и использует распространение ссылок для расчета репутации автора
Google разработал систему (UDS), интегрирующую поиск в инструменты создания контента (Email, блоги, форумы). Система автоматически уточняет запросы на основе контекста и профилей пользователей. Если автор вставляет ссылку, а читатель кликает по ней, Google использует это взаимодействие для расчета «оценки репутации» автора и как поведенческий сигнал качества контента.
  • US7844603B2
  • 2010-11-30
  • Ссылки

  • Поведенческие сигналы

  • EEAT и качество

Как Google автоматически дополняет запросы пользователя терминами из его недавней истории поиска для уточнения интента
Google использует механизм для улучшения релевантности результатов путем анализа недавней истории поиска пользователя. Если текущий запрос похож на предыдущие, система определяет ключевые контекстные термины, которые часто повторялись в истории (устойчивый интент), но отсутствуют в текущем запросе. Эти термины автоматически добавляются к запросу, чтобы предоставить более точные и персонализированные результаты.
  • US9449095B1
  • 2016-09-20
  • Семантика и интент

  • Персонализация

  • Поведенческие сигналы

seohardcore