SEO HARDCORE
  • Разборы патентов
    • Патенты Google
  • Скоро SEO инструменты
  • Скоро SEO аналитика
  • seohardcore
SEO HARDCORE
назад

Как Google использует анализ контента для распределения пользовательских вопросов на тематически релевантные сайты

SEEKING ANSWERS TO QUESTIONS (Поиск ответов на вопросы)
  • US20080160490A1
  • Google LLC
  • 2007-03-22
  • 2008-07-03
  • Краулинг
  • Семантика и интент
  • Описание
  • Разбор
  • Выводы
  • Практика
  • FAQ
  • Похожие

Патент описывает систему, функционирующую подобно рекламной сети (типа AdSense), но для Q&A. Google анализирует содержание веб-сайтов (издателей) и пользовательские вопросы для определения тематической релевантности. Затем система размещает релевантные вопросы на этих сайтах, чтобы эксперты, посещающие их, могли дать ответ. Это демонстрирует базовые механизмы Google для определения тематики контента.

Описание

Какую проблему решает

Патент решает проблему «коммуникационного разрыва» между пользователями, ищущими ответы, и экспертами, обладающими знаниями. Централизованные Q&A платформы требуют от экспертов активного посещения и поиска вопросов по своей тематике, что снижает вероятность ответа. Изобретение призвано автоматически доставлять вопросы в те сетевые локации (например, тематические веб-сайты), которые эксперты уже посещают.

Что запатентовано

Запатентована система и метод для стратегического размещения вопросов на тематически релевантных сетевых ресурсах. Центральный сервер (QA Server) поддерживает инвентарь вопросов (Question Inventory). Когда сторонний ресурс (Network Location, сайт издателя) запрашивает контент, система анализирует тематику этого ресурса и выбирает из инвентаря подходящий вопрос. Это функционирует аналогично сети контекстной рекламы, но вместо рекламы отображаются вопросы.

Как это работает

Система работает как посредник:

  • Сбор вопросов: Пользователи задают вопросы через интерфейс (Question Entering Location), которые сохраняются в Question Inventory.
  • Анализ ресурсов: Система использует Web Crawler для анализа контента участвующих сайтов издателей и определения их тематики.
  • Запрос контента: Сайт издателя отправляет запрос на QA Server для получения вопроса для отображения.
  • Сопоставление (Matching): Система сравнивает тематику сайта с вопросами в инвентаре. Это делается путем сравнения ключевых слов и кластеров слов (word clusters), извлеченных из вопроса и контента сайта, используя также статистические ассоциации.
  • Доставка и ответ: Релевантный вопрос отображается на сайте издателя. Посетители сайта отвечают. Ответы сохраняются в Answer Inventory и передаются автору вопроса.

Актуальность для SEO

Низкая для описанного применения. Конкретная реализация — активное распространение вопросов на сторонние сайты по модели AdSense — не наблюдается как распространенная практика Google в 2025 году. Однако актуальность базовой технологии — автоматического анализа контента для определения тематической релевантности — остается критически высокой, поскольку она лежит в основе рекламных систем и алгоритмов поиска.

Важность для SEO

(3/10). Патент не описывает алгоритмы ранжирования основного веб-поиска. Прямое влияние минимально. Однако он имеет стратегическое значение, поскольку раскрывает конкретные методы, используемые Google для анализа контента веб-сайтов и определения их тематической релевантности (Topical Relevance). Понимание этих механизмов (анализ текста, структуры, визуальных элементов) важно для построения Тематического Авторитета (Topical Authority).

Детальный разбор

Термины и определения

Answer Inventory (Инвентарь ответов)
База данных, хранящая полученные ответы, атрибуты сетевых локаций, откуда они были получены, и рейтинги. Содержит связь (map) между ответами и вопросами.
Network Location (Сетевая локация / Сайт издателя)
Второй ресурс (например, веб-страница), на котором отображается вопрос для получения ответа. Выбирается на основе тематической релевантности контента.
QA Server (Q&A Сервер)
Центральный компонент системы, который управляет инвентарями, анализирует контент сайтов издателей и обеспечивает логику сопоставления вопросов и сайтов.
Question Entering Location (Локация ввода вопроса)
Первый ресурс или интерфейс, через который пользователь изначально задает вопрос.
Question Inventory (Инвентарь вопросов)
База данных вопросов, ожидающих ответа. Включает сами вопросы и извлеченные из них слова или кластеры слов (words or word clusters).
Statistical Associations between Key Words (Статистические ассоциации между ключевыми словами)
Данные, используемые для определения тематики контента. Помогают связать термины, которые часто встречаются вместе или семантически связаны (например, связь между "string theory" и "physics").
Web Crawler (Веб-краулер)
Компонент, используемый QA Server для обхода и анализа содержимого Network Locations с целью определения их тематики.

Ключевые утверждения (Анализ Claims)

Claim 1 (Независимый пункт): Описывает основной метод поиска ответов.

  1. Система получает вопрос от пользователя в первой сетевой локации.
  2. Поддерживается инвентарь вопросов (Question Inventory), ожидающих ответа.
  3. Вопрос из инвентаря представляется во второй сетевой локации.
  4. Ключевое условие: вопрос определяется как тематически релевантный (topically relevant) второй локации на основе анализа ее контента.

Claim 5 и 6 (Зависимые): Детализируют механизм взаимодействия (модель типа AdSense).

  1. Вопрос представляется второй локации в ответ на запрос (request) от этой локации (Claim 5). Это означает, что издатель должен активно запросить контент.
  2. Процесс включает: получение запроса от второй локации, выбор релевантного вопроса из инвентаря и передачу вопроса в эту локацию (Claim 6).

Claim 10, 11 и 12 (Зависимые): Детализируют механизм определения релевантности.

  1. Выбор вопроса основан на сравнении вопросов в инвентаре с контентом второй локации (Claim 10).
  2. Инвентарь содержит слова или кластеры слов (word clusters), извлеченные из вопроса (Claim 11).
  3. Сравнение включает идентификацию слов/кластеров в контенте второй локации и поиск совпадающих слов/кластеров в инвентаре вопросов (Claim 12).

Claim 13 (Зависимый): Описывает обработку ответов.

Система получает ответ, генерирует отклик (response), включающий ответ, атрибуты локации-источника и рейтинг вопроса, и сохраняет его в инвентаре ответов (Answer Inventory).

Где и как применяется

Патент описывает инфраструктуру для специализированной системы Q&A, а не алгоритмы основного веб-поиска. Однако он задействует базовые технологии поисковой архитектуры.

CRAWLING – Сканирование и Сбор данных
QA Server использует Web Crawler для сканирования участвующих сайтов издателей (Network Locations). Цель — собрать контент для последующего определения тематики сайта.

INDEXING – Индексирование и извлечение признаков
На этом этапе обрабатываются два потока данных:

  1. Анализ Вопросов: Система анализирует входящие вопросы, извлекает ключевые слова и word clusters (игнорируя стоп-слова) и сохраняет их в Question Inventory.
  2. Анализ Контента Сайтов: Система анализирует данные, полученные краулером, для определения тематики сайта. Извлекаются признаки (включая текст, структуру, визуальные элементы) и генерируются Statistical Associations between Key Words.

RANKING / MATCHING (Сопоставление)
Когда сайт издателя делает запрос на получение вопроса, система выполняет процесс сопоставления. Она должна выбрать (и ранжировать) наиболее тематически релевантный вопрос из Question Inventory для отображения на этом сайте, сравнивая профиль сайта и профили вопросов.

Входные данные:

  • Вопросы пользователей.
  • Контент сайтов издателей (полученный через краулер).
  • Запросы от серверов сайтов издателей на отображение вопроса.
  • Ответы и рейтинги от пользователей.

Выходные данные:

  • Тематически релевантный вопрос, отображаемый на сайте издателя.
  • Ответ, доставленный автору вопроса.

На что влияет

Патент не описывает влияние на ранжирование в основном веб-поиске.

  • Конкретные типы контента: Влияет на веб-сайты с четко выраженной тематикой (блоги, форумы, специализированные ресурсы), которые участвуют в программе дистрибуции и могут быть классифицированы как источники экспертизы.

Когда применяется

  • Триггеры активации:
    1. Когда пользователь задает новый вопрос, и система определяет, что на него нет готового ответа в Answer Inventory (после проверки на схожесть).
    2. Когда сайт издатель (Network Location) отправляет запрос (Request) к QA Server для получения контента (вопроса) для отображения на своей странице.

Пошаговый алгоритм

Процесс А: Обработка нового вопроса и проверка дубликатов

  1. Получение вопроса: Система получает новый вопрос от пользователя.
  2. Сохранение: Новый вопрос сохраняется в Question Inventory.
  3. Сравнение: Новый вопрос сравнивается с существующими вопросами в инвентаре путем анализа извлеченных ключевых слов и word clusters.
  4. Проверка схожести: Определяется, присутствует ли похожий вопрос в инвентаре.
    • Если ДА: Система извлекает существующие ответы из Answer Inventory и передает их пользователю. Процесс может завершиться.
    • Если НЕТ: Вопрос остается в статусе ожидания для дистрибуции.

Процесс Б: Распределение вопроса и получение ответа

  1. Получение запроса от сайта: QA Server получает запрос на контент от сайта издателя.
  2. Анализ и сравнение: Система сравнивает контент (тематику) сайта с вопросами в Question Inventory.
  3. Идентификация релевантного вопроса: Система идентифицирует вопрос, который тематически соответствует контенту сайта, используя совпадения ключевых слов, word clusters и Statistical Associations.
  4. Передача вопроса: Идентифицированный вопрос передается на сайт издателя для отображения.
  5. Получение ответа: Система получает ответ, введенный пользователем на сайте издателя.
  6. Фильтрация (Опционально): Ответ может быть отфильтрован на предмет неприемлемого контента (improper content), такого как спам или нерелевантный ответ.
  7. Сохранение ответа: Ответ сохраняется в Answer Inventory.
  8. Передача ответа автору: Ответ передается пользователю, который задал исходный вопрос.

Какие данные и как использует

Данные на входе

Система использует следующие данные для определения тематики сайтов и релевантности вопросов. В патенте явно указаны следующие факторы, используемые краулером для определения тематики сайта:

  • Контентные факторы: Текст на веб-странице, ключевые слова (метаданные), частота встречаемости слов (frequencies of words) на странице.
  • Структурные и Визуальные факторы: Размер шрифта текста (font size of text) на странице и структура гиперссылок (hyperlink structure) внутри веб-страницы.
  • Поведенческие факторы (в рамках Q&A): Рейтинги для вопросов (Question Ratings) и рейтинги для ответов (Answer Ratings). Эти рейтинги используются в будущих определениях релевантности.
  • Технические факторы: Атрибуты сетевого ресурса, с которого был получен ответ (например, URL).

Какие метрики используются и как они считаются

  • Извлечение признаков из вопросов: Вопросы обрабатываются путем разделения на слова, игнорирования общих слов (стоп-слов) и группировки оставшихся слов в один или несколько word clusters.
  • Определение тематики сайта: Вычисляется на основе анализа контентных, структурных и визуальных факторов, собранных краулером (текст, шрифт, ссылки и т.д.).
  • Тематическая релевантность (Topical Relevance): Основная метрика сопоставления. Определяется путем сравнения слов/кластеров из контента сайта со словами/кластерами из вопросов в инвентаре.
  • Статистические ассоциации (Statistical Associations): Используются для расширения матчинга за пределы прямого совпадения ключевых слов. Позволяют связать специфический термин в вопросе с более широкой темой сайта.

Выводы

  1. Патент инфраструктурный, не о ранжировании в поиске: Это изобретение описывает отдельную систему дистрибуции контента (Q&A), работающую по модели, схожей с AdSense, а не алгоритмы ранжирования основного веб-поиска.
  2. Автоматический анализ тематической релевантности: Патент детально описывает, как Google автоматизировано анализирует контент веб-страниц для определения их тематики (Topical Relevance).
  3. Детализация факторов анализа контента: Ключевой инсайт для SEO — для определения тематики система анализирует не только текст и ключевые слова, но и структурные/визуальные элементы: частотность слов, размер шрифта (font size) и структуру гиперссылок (hyperlink structure).
  4. Использование семантических связей: Система использует Statistical Associations between Key Words для понимания связей между терминами и темами, что позволяет выходить за рамки простого совпадения ключевых слов.
  5. Распределенный сбор экспертизы: Философия патента — искать экспертизу там, где она находится (на тематических сайтах), а не принуждать экспертов посещать централизованную платформу.

Практика

Best practices (это мы делаем)

Хотя патент не дает прямых рекомендаций по ранжированию в поиске, он дает ценное понимание того, как Google анализирует тематику сайтов, что критически важно для построения Тематического Авторитета (Topical Authority).

  • Усиление тематической четкости контента: Создавайте контент с ясной тематической направленностью. Механизмы анализа контента, описанные в патенте, полагаются на способность однозначно определить основную тему страницы/сайта.
  • Использование релевантной терминологии и семантики: Насыщайте контент ключевыми словами и связанными терминами (word clusters). Использование Statistical Associations подчеркивает важность использования естественного языка, синонимов и LSI-терминов, которые Google ассоциирует с основной темой.
  • Оптимизация структуры и визуальной иерархии: Патент явно упоминает анализ размера шрифта и структуры гиперссылок как факторы для определения тематики. Это подтверждает важность использования логичной иерархии заголовков (H1-H6) для выделения ключевых тем (которые обычно имеют больший шрифт) и продуманной внутренней перелинковки для усиления тематических сигналов.

Worst practices (это делать не надо)

  • Размытие тематики (Topic Dilution): Создание контента на слишком разные темы на одном сайте может затруднить для системы определение основной тематической релевантности и снизить точность классификации ресурса.
  • Игнорирование внутренней структуры: Отсутствие четкой структуры ссылок и визуальной иерархии (например, весь текст одним размером шрифта без заголовков) может ослабить сигналы, используемые краулером для определения контекста и тематики.
  • Поверхностный контент: Контент, который не содержит достаточной глубины или связанных понятий, не позволит системе установить сильные Statistical Associations, необходимые для точного тематического анализа.

Стратегическое значение

Стратегическое значение этого патента заключается в подтверждении того, что автоматический анализ тематической релевантности является фундаментальной технологией Google, применяемой кросс-продуктово. Для SEO это означает, что долгосрочная стратегия должна фокусироваться на создании глубокого, хорошо структурированного контента, который посылает четкие и последовательные сигналы о своей тематике, используя все доступные средства (текст, структуру, выделение).

Практические примеры

Сценарий: Определение тематики сайта на основе анализа контента (по мотивам патента)

Этот пример иллюстрирует, как принципы анализа контента из патента могут применяться Google для определения Topical Authority.

  1. Сайт: Блог, посвященный скалолазанию (например, "climbing-expert.com").
  2. Анализ контента (Crawling/Indexing): Краулер Google анализирует сайт. Он фиксирует:
    • Высокую частотность слов: "climbing", "bouldering", "harness", "rope".
    • Использование этих слов в заголовках (анализ размера шрифта помогает определить важность терминов).
    • Наличие структуры гиперссылок, связывающей страницы об экипировке (harness reviews) со страницами о технике безопасности (safety techniques).
  3. Определение тематики: Система классифицирует сайт как высокорелевантный теме "Rock Climbing".
  4. Установление ассоциаций: Используя Statistical Associations, система связывает сайт с запросами типа "Какая страховочная система лучше?" (Best harness?), даже если на анализируемой странице нет точного совпадения этой фразы.
  5. Результат (для SEO): Четкие сигналы помогают сайту лучше ранжироваться по запросам, связанным со скалолазанием, и демонстрировать Тематический Авторитет.

Вопросы и ответы

Описывает ли этот патент, как Google ранжирует сайты в основном поиске?

Нет, этот патент не описывает алгоритмы ранжирования веб-поиска. Он посвящен инфраструктуре отдельной системы Q&A, работающей по принципу рекламной сети (как AdSense). Она предназначена для размещения вопросов пользователей на тематически релевантных сторонних сайтах.

Какая практическая польза от этого патента для SEO-специалиста?

Основная польза — это понимание того, как Google анализирует контент для определения тематической релевантности (Topical Relevance). Патент подтверждает, что для понимания тематики страницы анализируются текст, частотность слов, метаданные, структура ссылок и даже визуальные элементы (размер шрифта). Это важно для построения Topical Authority.

Патент упоминает анализ размера шрифта и структуры ссылок. Насколько это важно для SEO?

В патенте они указаны как признаки для определения тематики контента. Логично, что более крупный текст (заголовки) и структура внутренних ссылок помогают системе понять, какие темы являются основными на странице. Это косвенно подтверждает важность хорошей структуры контента, иерархии заголовков и перелинковки в SEO.

Что означают "Statistical Associations between Key Words"?

Это данные, позволяющие системе понимать семантические связи между словами и темами. Например, система знает, что вопрос о "теории струн" релевантен сайту о "физике", даже если слова не совпадают напрямую. Это подчеркивает важность использования синонимов и связанной терминологии (LSI) в контенте.

Что такое "Word Clusters" (кластеры слов)?

Это ключевые концепции вопроса, представленные в виде групп слов, извлеченных из текста после удаления стоп-слов. Система сравнивает эти кластеры с контентом веб-сайта, чтобы найти тематическое соответствие и определить релевантность.

Используется ли описанная система Google сейчас?

В описанном виде (сеть дистрибуции Q&A по модели AdSense) эта система не наблюдается. Однако базовая технология анализа контента и определения тематической релевантности активно используется в Google Поиске и рекламных системах (Google AdSense/AdManager).

Как система определяет, что сайт является экспертным (E-E-A-T)?

Патент не фокусируется на оценке экспертизы (E-E-A-T). Он фокусируется на Topical Relevance. Система предполагает, что если контент сайта тематически соответствует вопросу, то посетители этого сайта с большей вероятностью будут обладать необходимыми знаниями для ответа.

Как система обрабатывает дубликаты вопросов?

Патент описывает механизм проверки схожести. При поступлении нового вопроса система сравнивает его ключевые слова и word clusters с существующими вопросами в инвентаре. Если найден похожий вопрос, система может немедленно предоставить ранее полученные ответы из Answer Inventory.

Влияет ли этот патент на стратегию создания контента?

Да, он подтверждает стратегическую необходимость создания четко сфокусированного, тематического контента. Чтобы системы Google корректно интерпретировали тематику вашего сайта, необходимо использовать ясный язык, релевантную терминологию, логичную структуру и правильное форматирование.

Как система борется со спамом или некачественными ответами?

В патенте упоминается два механизма. Первый — это фильтрация ответов на предмет "неподобающего контента" (improper content), который включает нерелевантные или бессмысленные ответы. Второй — это система рейтингов (Answer Ratings), позволяющая пользователям оценивать качество полученных ответов.

Похожие патенты

Как Google создает и использует базу «идеальных» ответов (Canonical Content Items) для ответов на вопросы пользователей
Google использует систему для идентификации и создания «канонических элементов контента» — образцовых объяснений тем, часто в формате вопрос-ответ. Система анализирует огромные массивы существующего контента, кластеризует похожие вопросы и ответы и выбирает или синтезирует идеальную версию. Когда пользователь задает вопрос, система сопоставляет его с этой базой данных, чтобы мгновенно предоставить высококачественный, модельный ответ.
  • US9396263B1
  • 2016-07-19
  • Семантика и интент

  • EEAT и качество

Как Google выявляет темы с недостаточным контентом ("content gaps") и стимулирует его создание
Google использует систему для анализа поисковой статистики, чтобы найти популярные темы, по которым мало качественных результатов ("underserved topics"). Система сравнивает спрос (объем запросов) с предложением (качеством существующего контента). Затем Google может передавать эту информацию создателям контента (издателям, пользователям), чтобы стимулировать создание нового контента, улучшая общее качество веб-корпуса и поисковой выдачи.
  • US7668823B2
  • 2010-02-23
  • EEAT и качество

  • Семантика и интент

Как Google запоминает вопросы без авторитетного ответа и автономно сообщает его позже через Ассистента
Патент Google описывает механизм для обработки запросов, на которые в момент поиска нет качественного или авторитетного ответа. Система запоминает информационную потребность и продолжает мониторинг. Когда появляется информация, удовлетворяющая критериям качества (например, в Knowledge Graph), Google автономно доставляет ответ пользователю, часто встраивая его в следующий диалог с Google Assistant, даже если этот диалог не связан с исходным вопросом.
  • US11238116B2
  • 2022-02-01
  • Knowledge Graph

  • Семантика и интент

  • EEAT и качество

Как Google использует связанные фразы и Information Gain для автоматической кластеризации и организации поисковой выдачи
Патент описывает комплексную систему перехода от индексации слов к индексации фраз. Google определяет статистическую связь между фразами с помощью меры Information Gain. Эти данные используются для автоматической организации поисковой выдачи в тематические кластеры (таксономию), группируя результаты по наиболее частым связанным фразам.
  • US7426507B1
  • 2008-09-16
  • Индексация

  • SERP

  • Семантика и интент

Как Google автоматически категоризирует локальный контент и историю пользователя для контекстного поиска по неявным запросам
Патент Google, описывающий технологию для локального (Desktop) или персонализированного поиска. Система отслеживает взаимодействие пользователя с контентом (события) и использует «схемы событий» для автоматической категоризации файлов, электронных писем и истории просмотров. Эти категории затем используются для предоставления релевантных результатов в ответ на неявные запросы, генерируемые системой на основе текущего контекста пользователя.
  • US7788274B1
  • 2010-08-31
  • Персонализация

  • Поведенческие сигналы

  • Local SEO

Популярные патенты

Как Google использует околоссылочный текст и заголовки (Web Quotes) для индексирования страниц и генерации сниппетов
Google анализирует текст на страницах, ссылающихся на целевой документ, извлекая «Web Quotes». Это не только текст абзаца, окружающего ссылку, но и текст из ближайших заголовков. Эти цитаты ранжируются по качеству ссылающегося источника (например, PageRank) и используются для индексирования целевой страницы (даже если этих слов на ней нет) и для формирования сниппета в результатах поиска.
  • US8495483B1
  • 2013-07-23
  • Индексация

  • Ссылки

  • SERP

Как Google использует историю поиска и браузинга для персонализации выдачи и определения предпочтений пользователя
Google записывает и анализирует историю действий пользователя: запросы, клики по результатам и рекламе, посещенные страницы. Система группирует связанные действия в сессии, определяет "Предпочитаемые локации" на основе частоты и времени визитов (stay-time), и использует эту историю для изменения порядка ранжирования, повышая позиции ранее посещенных сайтов в персональной выдаче.
  • US20060224583A1
  • 2006-10-05
  • Персонализация

  • Поведенческие сигналы

Как Google определяет структурно похожие запросы (sibling queries) для автоматического обучения NLP-моделей
Google использует метод для идентификации "родственных запросов" (sibling queries) — запросов с одинаковой структурой интента, но разными переменными (например, "погода в Москве" и "погода в Париже"). Система сравнивает шаблоны использования этих запросов в логах, основываясь на поведении пользователей, чтобы понять их взаимосвязь без традиционного NLP. Это позволяет автоматически генерировать масштабные наборы данных для обучения ИИ.
  • US11379527B2
  • 2022-07-05
  • Семантика и интент

  • Поведенческие сигналы

Как Google создает мгновенные интерактивные результаты на SERP, предварительно загружая и персонализируя скрытый контент
Google использует механизм для создания интерактивных блоков ответов (Answer Boxes), таких как Погода или Панели Знаний. Система отправляет пользователю не только видимый результат, но и дополнительный скрытый контент («карточки»), выбранный на основе истории взаимодействий пользователя. При взаимодействии с блоком (свайп или клик) дополнительный контент отображается мгновенно, без отправки нового запроса на сервер.
  • US9274683B2
  • 2016-03-01
  • SERP

  • Персонализация

  • Поведенческие сигналы

Как Google ранжирует и рекомендует источники контента (каналы, профили) на основе внутренних ссылок, аннотаций и кликов по ним
Google использует механизм для ранжирования и рекомендации источников контента (например, YouTube-каналов или профилей) внутри платформ. Система анализирует, как часто источник упоминается в аннотациях, описаниях и комментариях к контенту, который просматривал пользователь. Ключевым фактором ранжирования является не только количество упоминаний, но и общее число кликов (активаций) по этим ссылкам.
  • US9235625B2
  • 2016-01-12
  • Ссылки

  • Поведенческие сигналы

  • Мультимедиа

Как Google использует связанные запросы и временный «бустинг» для обнаружения и тестирования релевантных документов, которые ранжируются низко
Патент описывает механизм улучшения поиска путем перемещения документов на более высокие позиции. Google идентифицирует документы, которые высоко ранжируются по связанным запросам (например, с синонимами, уточнениями или исправленными ошибками), но низко по исходному запросу, и повышает их. Цель — протестировать истинную релевантность этих документов и собрать пользовательский отклик (клики) для улучшения будущего ранжирования.
  • US8521725B1
  • 2013-08-27
  • Поведенческие сигналы

  • SERP

  • Семантика и интент

Как Google использует паттерны просмотра пользователей (Co-Visitation) и временную близость для определения тематики нетекстового контента (изображений и видео)
Google использует механизм для понимания контента без текста (изображения, видео), анализируя, какие другие (текстовые) страницы пользователи посещают в рамках той же сессии. Ключевые слова с этих текстовых страниц заимствуются и присваиваются нетекстовому ресурсу. Критически важным фактором является время перехода: чем быстрее пользователь перешел между ресурсами, тем больший вес получают ключевые слова.
  • US8572096B1
  • 2013-10-29
  • Поведенческие сигналы

  • Семантика и интент

  • Мультимедиа

Как Google использует историю физических перемещений пользователя для фильтрации и персонализации результатов поиска
Google может собирать и хранить историю физических перемещений пользователя (Location History). Патент описывает интерфейс, позволяющий пользователю осознанно включать свои прошлые местоположения (например, «места, где я был на прошлой неделе») в качестве фильтра для нового поискового запроса, чтобы сделать результаты более релевантными личному опыту.
  • US8874594B2
  • 2014-10-28
  • Персонализация

  • Поведенческие сигналы

  • Local SEO

Как Google использует данные о кликах пользователей (CTR и Click Ratio) для определения официального сайта по навигационным запросам
Google анализирует журналы запросов, чтобы определить, какой результат пользователи подавляюще предпочитают по конкретному запросу. Если результат демонстрирует исключительно высокий CTR и/или Click Ratio по популярному запросу, система помечает его как «авторитетную страницу». Затем этот результат может отображаться на выдаче с особым выделением, потенциально переопределяя стандартное ранжирование.
  • US8788477B1
  • 2014-07-22
  • Поведенческие сигналы

  • EEAT и качество

  • SERP

Как Google в Автоподсказках (Suggest) предлагает искать запрос в разных вертикалях поиска (Картинки, Новости, Карты)
Патент описывает механизм "разветвления" (forking) автоподсказок Google Suggest. Система анализирует введенные символы и определяет, в каких вертикалях поиска (Корпусах) — таких как Картинки, Новости или Карты — пользователи чаще всего ищут предложенный запрос. Если корреляция с конкретной вертикалью высока (на основе Corpus Score), система предлагает пользователю искать сразу в ней, наряду со стандартным универсальным поиском.
  • US9317605B1
  • 2016-04-19
  • Семантика и интент

  • SERP

  • Поведенческие сигналы

seohardcore