Как Google использует иерархические таксономии для понимания связей между соседними словами в запросе

INTERPRETING ADJACENT SEARCH TERMS BASED ON A HIERARCHICAL RELATIONSHIP (Интерпретация смежных поисковых терминов на основе иерархических отношений)

US8745028B1
Google LLC
2012-04-20
2014-06-03

Google использует механизм для интерпретации поисковых запросов путем анализа соседних слов на предмет иерархических связей (например, «Город, Страна» или «Род, Вид»). Система сопоставляет комбинации слов с известными таксономиями (география, биология, бизнес) и оценивает вероятность того, что пользователь имел в виду именно эту иерархическую связь. Это позволяет точнее определить интент запроса, особенно в локальном поиске и при категоризации.

Какую проблему решает

Патент решает проблему неточной интерпретации поисковых запросов, когда поисковая система рассматривает термины изолированно, игнорируя их потенциальные иерархические связи. Многие пользователи вводят термины, имеющие иерархические отношения, рядом друг с другом (например, «Цюрих Швейцария»). Изобретение направлено на распознавание этих отношений (город, страна) для более глубокого понимания интента пользователя, вместо того чтобы просто искать страницы, содержащие оба термина.

Что запатентовано

Запатентована система интерпретации запросов, которая идентифицирует иерархические отношения между смежными (adjacent) терминами в запросе. Система использует предварительно определенные иерархические таксономии (hierarchical taxonomy data), такие как географические данные, бизнес-категории или биологические классификации. Запрос разбивается на комбинации смежных терминов, которые затем сопоставляются с таксономией для выявления иерархических связей (например, родитель-потомок). На основе этих связей генерируются и оцениваются интерпретации запроса.

Как это работает

Система функционирует следующим образом:

Парсинг запроса: Входящий запрос разбивается на все возможные комбинации смежных терминов (хранящиеся, например, в Triangular Array).
Поиск в таксономии: Каждая комбинация проверяется на наличие в индексе (Name Table), который ссылается на узлы в иерархической структуре данных (Tree).
Подтверждение иерархии: Если смежные термины найдены в таксономии, система проверяет наличие между ними иерархической связи (например, используя механизм walk-up для поиска общего предка или отношения родитель-потомок).
Генерация интерпретаций: Успешные совпадения формируют интерпретации запроса (Hit List).
Оценка (Scoring): Интерпретации оцениваются с использованием шаблонов (Templates), соответствующих типичным пользовательским паттернам (например, «город, штат»), и атрибутов сущностей (например, важность или популярность локации).
Выполнение поиска: Поиск выполняется на основе наиболее высоко оцененной интерпретации.

Актуальность для SEO

Высокая. Понимание запросов (Query Understanding) и распознавание сущностей и их взаимосвязей являются центральными элементами современного поиска. Способность Google интерпретировать запросы в контексте иерархий (особенно географических, продуктовых и тематических) критически важна для точности результатов, локального поиска и E-commerce. Описанные механизмы лежат в основе того, как Google переходит от ключевых слов к сущностям и их отношениям.

Важность для SEO

Патент имеет высокое значение (8/10). Он напрямую влияет на то, как Google интерпретирует запросы, связанные с локациями, категориями продуктов или любыми другими иерархическими данными. Понимание этого механизма критично для локального SEO и E-commerce, поскольку он подчеркивает важность соответствия контента и структуры сайта общепринятым таксономиям и пользовательским паттернам ввода запросов. Неправильная или неоднозначная иерархическая структура может привести к неверной интерпретации контента системой.

Термины и определения

Adjacent Search Terms (Смежные поисковые термины): Термины, следующие друг за другом в поисковом запросе. Система анализирует именно комбинации смежных терминов на предмет иерархических связей.
Attribute Information (Информация об атрибутах): Данные, связанные с узлами в иерархической таксономии. Используются для оценки интерпретаций. Включают тип узла (например, страна, город), Stand-alone value, Country stand-alone value, Relational value и географические данные.
Bloom Filter: Структура данных, используемая для хранения префиксов или соединительных слов (например, «the», «new»), которые сами по себе не являются сущностями, но важны в контексте смежных терминов.
Country stand-alone value: Атрибут, представляющий важность локации в контексте конкретной страны. Используется для разрешения неоднозначностей (например, «Валенсия, Испания» важнее, чем «Валенсия, Канада»).
Hierarchical Relationship (Иерархическое отношение): Связь между терминами, основанная на ранге, классе или категории (например, родитель-потомок, класс-подкласс, род-вид).
Hierarchical Taxonomy Data (Данные иерархической таксономии): Структурированные данные, организованные в иерархию. Примеры: географические данные, бизнес-листинги, биологические классификации.
Hit List: Список сгенерированных интерпретаций запроса, которые нашли соответствие в таксономических данных.
Name Table: Индекс имен сущностей (например, «Париж»). Каждое имя содержит указатели на соответствующие узлы в Tree (например, Париж во Франции и Париж в Техасе).
Relational value: Атрибут, указывающий на тип имени: основное (primary), официальное (official) или разговорное (colloquial).
Stand-alone value: Атрибут, представляющий глобальную важность локации (например, на основе населения, количества веб-страниц, поисковых запросов). «Нью-Йорк» имеет высокое значение.
Templates (Шаблоны): Предопределенные паттерны иерархических терминов, соответствующие типичному порядку ввода запросов пользователем (например, «город, штат» или «штат, страна»). Используются для оценки интерпретаций.
Tree (Дерево): Основная структура данных для хранения Hierarchical Taxonomy Data (например, Земля -> Континент -> Страна).
Triangular Array: Структура данных для хранения всех комбинаций смежных поисковых терминов, полученных при парсинге запроса.
Walk-up: Процесс перемещения вверх по иерархии Tree от конкретного узла для определения наличия иерархической связи между двумя терминами (например, проверка, является ли один узел предком другого).

Ключевые утверждения (Анализ Claims)

Claim 1 (Независимый пункт): Описывает основной метод интерпретации запроса.

Система получает запрос с несколькими терминами.
Запрос парсится для определения комбинаций терминов (каждая комбинация — это подмножество терминов запроса).
Определяется, что как минимум одна комбинация существует в иерархическом отношении. Это делается путем сопоставления (matching) подмножества терминов в комбинации с паттерном терминов на разных иерархических уровнях в таксономии.
Процесс сопоставления включает:
- Сопоставление первого термина комбинации с термином на первом иерархическом уровне.
- Сопоставление второго термина комбинации с термином на втором иерархическом уровне (отличном от первого).
- Первый и второй термины в комбинации должны быть смежными (adjacent).
Генерируется оценка (score) для этой комбинации на основе сопоставления с паттерном.
Комбинация интерпретируется на основе этого сопоставления, если оценка превышает порог.
Выполняется поиск документов на основе этой интерпретации.

Ядро изобретения — это строгий метод подтверждения иерархии: смежные термины в запросе должны соответствовать разным уровням в таксономическом паттерне.

Claim 5 и 6 (Зависимые): Детализируют механизм оценки.

Оценка комбинации основывается на атрибуте (attribute), связанном как минимум с одним термином в паттерне. Атрибут может представлять важность (importance) термина или его иерархический уровень в таксономии.

Claim 7 (Зависимый): Детализирует другой механизм оценки.

Оценка комбинации основывается на оценке, связанной с шаблоном (template), который соответствует паттерну терминов.

Где и как применяется

Изобретение применяется в основном на этапе понимания запроса, используя данные, структурированные на этапе индексирования.

INDEXING – Индексирование и извлечение признаков
На этом этапе формируются иерархические таксономии. Данные индексируются и сохраняются в структурах, таких как Tree и Name Table. Сущностям присваиваются атрибуты (Attribute Information), такие как Stand-alone value.

QUNDERSTANDING – Понимание Запросов
Это основной этап применения патента. Система получает запрос и активирует процесс интерпретации:

Парсинг: Запрос разбивается на смежные комбинации.
Интерпретация: Комбинации анализируются с использованием Hierarchical Taxonomy Data для выявления связей.
Оценка: Интерпретации оцениваются с помощью Templates и Attribute Information для определения наиболее вероятного интента пользователя.

RANKING – Ранжирование
Результаты этапа QUNDERSTANDING (т.е. интерпретированный запрос с выявленными иерархическими связями) используются на этапе ранжирования для поиска и сортировки релевантных документов.

Входные данные:

Исходный поисковый запрос.
Hierarchical Taxonomy Data (Tree, Name Table).
Templates (Паттерны запросов).
Attribute Information (Важность сущностей).
Информация о пользователе (например, местоположение для адаптации шаблонов).

Выходные данные:

Набор оцененных интерпретаций запроса, где термины связаны с конкретными сущностями и иерархическими уровнями.

На что влияет

Конкретные ниши или тематики: Наибольшее влияние оказывается на ниши с четкими иерархиями:
- Локальный поиск (Local SEO): Критическое влияние. Интерпретация запросов типа «[Бизнес] [Город] [Страна]».
- E-commerce: Интерпретация категорий и подкатегорий товаров (например, «[Бренд] [Линейка] [Модель]»).
- Научные и образовательные домены: Биология, химия, где таксономии играют ключевую роль.
Специфические запросы: Влияет на запросы, содержащие названия сущностей, которые могут быть неоднозначными без иерархического контекста (например, «Париж» может быть городом во Франции или в Техасе; смежный термин «Франция» разрешает неоднозначность).

Когда применяется

Условия работы: Алгоритм применяется при обработке многословных запросов, когда есть подозрение на наличие иерархических связей.
Триггеры активации: Наличие в запросе терминов, которые присутствуют в Name Table иерархической таксономии.
Пороговые значения: Интерпретация принимается, только если её оценка (score) превышает определенный порог (Claim 1).

Пошаговый алгоритм

Процесс интерпретации запроса

Получение запроса: Система получает поисковый запрос от пользователя.
Парсинг и генерация комбинаций: Запрос разбирается на все возможные комбинации смежных терминов. Комбинации сохраняются (например, в Triangular Array).
Поиск в таксономии: Для каждой комбинации выполняется поиск терминов в Name Table.
- При обнаружении совпадения система получает указатели на соответствующие узлы в Tree.
- Параллельно проверяется Bloom Filter на наличие префиксов или соединительных слов.
Проверка иерархических отношений: Если несколько смежных терминов в комбинации найдены в таксономии, система проверяет связь между соответствующими узлами в Tree.
- Используется механизм walk-up: система перемещается вверх по иерархии от каждого узла, чтобы определить, является ли один узел предком другого или имеют ли они тесную связь.
Генерация интерпретаций: Комбинации, для которых подтверждена иерархическая связь, формируют интерпретации запроса и добавляются в Hit List.
Оценка интерпретаций (Scoring): Каждая интерпретация оценивается на основе нескольких факторов:
- Шаблоны (Templates): Соответствие интерпретации ожидаемым паттернам (например, «Город, Страна»). Шаблоны могут зависеть от местоположения пользователя.
- Атрибуты (Attribute Information): Использование Stand-alone value (глобальная важность), Country stand-alone value (локальная важность) и Relational value (тип имени) для разрешения неоднозначностей и повышения оценки более значимых сущностей.
Выбор интерпретации: Отбираются интерпретации, чья оценка превышает установленный порог. Может быть выбрана одна лучшая или несколько.
Выполнение поиска: Поиск выполняется на основе выбранной интерпретации (т.е. с учетом иерархического значения терминов).

Какие данные и как использует

Данные на входе

Патент фокусируется на использовании структуры запроса и предварительно определенных таксономических данных.

Структурные факторы (запроса): Порядок и смежность (adjacency) терминов в запросе критически важны.
Таксономические данные: Hierarchical Taxonomy Data (география, бизнес, биология и т.д.), хранящиеся в Tree и индексированные через Name Table.
Данные о сущностях (Entity Attributes): Предварительно вычисленные атрибуты, связанные с узлами таксономии (Attribute Information).
Пользовательские факторы: Местоположение пользователя упоминается как фактор, влияющий на выбор и вес шаблонов (Templates) при оценке интерпретаций.

Какие метрики используются и как они считаются

Система вычисляет оценку (score) для каждой интерпретации. Патент не приводит конкретных формул, но определяет источники для расчета оценки:

Оценка на основе Шаблонов (Template-based Score): Метрика, основанная на том, насколько хорошо интерпретация соответствует предопределенному Template (например, «Город, Штат»). Шаблоны с более высокой вероятностью использования получают больший вес.
Оценка на основе Атрибутов (Attribute-based Score): Метрики, основанные на характеристиках задействованных сущностей:
- Stand-alone value: Глобальная важность. Повышает оценку интерпретаций, включающих глобально значимые сущности.
- Country stand-alone value: Важность в контексте страны. Используется для локальной оптимизации оценки.
- Relational value: Предпочтение может отдаваться основным или официальным названиям перед разговорными.
Пороговые значения: Используется порог для фильтрации интерпретаций с низкой оценкой. Только интерпретации, превышающие порог, используются для поиска.

Иерархический контекст критичен для понимания запроса: Google активно пытается сопоставить группы слов в запросе с известными иерархическими структурами (таксономиями). Система не просто ищет ключевые слова, она ищет отношения типа родитель-потомок между смежными терминами.
Смежность как сигнал иерархии: Основная предпосылка патента заключается в том, что пользователи склонны располагать иерархически связанные термины рядом друг с другом. Система использует эту смежность (adjacency) как триггер для поиска иерархических связей.
Использование шаблонов для интерпретации интента: Система использует Templates (например, «Город, Страна»), чтобы оценить вероятность того, что пользователь имел в виду конкретную иерархическую структуру. Это формализованный подход к распознаванию паттернов в запросах.
Важность сущностей влияет на интерпретацию: Атрибуты сущностей, такие как их глобальная или локальная важность (Stand-alone values), используются для оценки и разрешения неоднозначностей. Более «важная» интерпретация (например, Париж, Франция) получит более высокую оценку, чем менее важная (Париж, Техас), при прочих равных условиях.
Локализация интерпретации: Местоположение пользователя влияет на процесс интерпретации. Шаблоны и веса атрибутов могут адаптироваться в зависимости от региональных особенностей языка и таксономий.

Best practices (это мы делаем)

Соблюдение общепринятых таксономий: При структурировании контента (категории товаров, географические страницы) необходимо придерживаться четких и общепринятых иерархий. Это облегчает системе сопоставление вашего контента с запросами, интерпретированными через эти таксономии. Например, в E-commerce: Электроника > Компьютеры > Ноутбуки.
Оптимизация иерархической навигации и URL: Структура URL и хлебные крошки должны отражать иерархию контента. Это усиливает сигналы о таксономической структуре сайта (например, /locations/switzerland/zurich/).
Локальное SEO: Использование консистентных NAP и иерархических идентификаторов: Убедитесь, что адреса и названия локаций используются в консистентном иерархическом формате (Улица, Город, Штат/Регион, Страна). Это помогает системе точно сопоставить бизнес с географической таксономией при обработке запросов типа «[Бизнес] рядом с [Локация]».
Повышение «Важности» (Importance) сущностей: Работайте над повышением авторитетности и популярности ключевых сущностей вашего сайта (бренда, локаций, продуктов). Патент указывает, что атрибуты важности (аналогичные Stand-alone value) используются при оценке интерпретаций. Более авторитетные сущности имеют приоритет при разрешении неоднозначностей.
Использование структурированных данных (Schema.org): Применяйте разметку для явного указания иерархических отношений (например, breadcrumbs, Organization с subOrganization, Place с containedInPlace). Это напрямую предоставляет данные для таксономического анализа.

Worst practices (это делать не надо)

Неоднозначная или плоская структура категорий: Создание запутанной структуры сайта, где иерархические отношения не ясны. Это затрудняет системе понимание того, как контент связан друг с другом и с внешними таксономиями.
Использование нестандартных или разговорных названий без контекста: Опора исключительно на разговорные названия (colloquial names) для локаций или категорий может снизить оценку интерпретации, если система предпочитает официальные названия (на основе Relational value). Используйте их, но всегда подкрепляйте основными названиями.
Игнорирование региональных особенностей: Применение единого подхода к таксономии для разных регионов. Патент учитывает, что пользователи в разных странах используют разные паттерны запросов. Необходимо адаптировать структуру и контент под локальные стандарты.

Стратегическое значение

Этот патент подчеркивает стратегическую важность перехода от SEO, основанного на ключевых словах, к SEO, основанному на сущностях и их взаимосвязях (Entity-based SEO). Понимание того, как Google интерпретирует иерархические отношения, является ключом к успеху в локальном поиске и E-commerce. Долгосрочная стратегия должна включать построение четкой, логичной и авторитетной таксономической структуры на сайте, которая соответствует реальным мировым иерархиям и ожиданиям пользователей.

Практические примеры

Сценарий 1: Оптимизация для E-commerce (Таксономия товаров)

Запрос пользователя: «Nike Air Max 90»
Интерпретация системой: Система парсит запрос и ищет иерархию. «Nike» (Бренд), «Air Max» (Линейка/Подбренд), «90» (Модель). Система распознает это как иерархический паттерн «Бренд, Линейка, Модель».
Действия SEO-специалиста: Убедиться, что структура сайта и страницы продукта четко отражают эту иерархию в URL (/nike/air-max/90/), хлебных крошках и заголовках. Использовать разметку Product с указанием бренда и модели.
Результат: Система точнее сопоставляет страницу продукта с интерпретированным запросом, повышая релевантность.

Сценарий 2: Локальное SEO (Географическая таксономия)

Запрос пользователя: «Рестораны Амстердам Нидерланды»
Интерпретация системой: Система идентифицирует «Амстердам» и «Нидерланды». Механизм walk-up подтверждает иерархию (Город, Страна). Интерпретация оценивается высоко из-за соответствия шаблону и высокой важности (Stand-alone value) Амстердама.
Действия SEO-специалиста: Создать целевые страницы для ресторанов в Амстердаме. В контенте, мета-тегах и разметке LocalBusiness явно указывать полную иерархию локации (Амстердам, Северная Голландия, Нидерланды).
Результат: Повышение видимости в локальном поиске за счет точного соответствия географической интерпретации запроса.

Что такое «Hierarchical Relationship» в контексте этого патента?

Это связь между двумя или более терминами, основанная на их положении в определенной таксономии (системе классификации). Типичные примеры включают отношения родитель-потомок, такие как «Страна, Город» (например, «Швейцария, Цюрих») или «Категория, Подкатегория» (например, «Электроника, Смартфоны»). Система ищет такие связи именно между соседними (adjacent) словами в запросе.

Как система определяет, что между соседними словами есть иерархическая связь?

Система использует механизм, называемый walk-up. Сначала она находит оба термина в индексе (Name Table) и определяет их узлы в иерархическом дереве (Tree). Затем она «идет вверх» по дереву от каждого узла. Если один узел является предком другого или они тесно связаны в иерархии, система подтверждает наличие иерархического отношения.

Что такое «Templates» и как они используются?

Templates (Шаблоны) — это предопределенные паттерны, отражающие типичные способы ввода иерархических запросов пользователями, например, «Город, Штат» или «Бренд, Модель». Когда система находит потенциальную иерархическую интерпретацию запроса, она сравнивает её с этими шаблонами. Соответствие шаблону увеличивает оценку (score) интерпретации, подтверждая, что она соответствует ожидаемому поведению пользователя.

Как Google разрешает неоднозначность, например, если город есть в нескольких странах (Париж во Франции и в Техасе)?

Патент описывает использование атрибутов (Attribute Information) для оценки интерпретаций. Ключевыми являются Stand-alone value (глобальная важность) и Country stand-alone value (важность внутри страны). Интерпретация, включающая более «важную» сущность (Париж, Франция имеет более высокий Stand-alone value, чем Париж, Техас), получит более высокую оценку. Также учитывается местоположение пользователя.

Какое значение этот патент имеет для E-commerce сайтов?

Значение очень высоко. Он напрямую влияет на то, как Google понимает запросы, связанные с категориями товаров. Если структура категорий и подкатегорий на сайте соответствует общепринятым таксономиям и пользовательским паттернам запросов (например, «Одежда Обувь Кроссовки»), система сможет корректно интерпретировать интент и ранжировать соответствующие страницы категорий или товаров.

Как этот патент влияет на локальное SEO?

Это один из фундаментальных патентов для локального поиска. Он описывает механизм, с помощью которого Google понимает географические запросы. Для локального SEO критически важно использовать четкие и консистентные иерархические идентификаторы (Город, Регион, Страна) в контенте, разметке и профилях бизнеса, чтобы соответствовать географической таксономии Google.

Учитывает ли система порядок слов в запросе?

Да, порядок слов критически важен. Система анализирует только смежные (adjacent) термины. Кроме того, порядок терминов сравнивается с ожидаемым порядком в шаблонах (Templates). Например, шаблон «Город, Страна» ожидает определенный порядок слов.

Что такое «Triangular Array» в этом патенте?

Это структура данных, используемая для эффективного хранения всех возможных комбинаций смежных терминов после парсинга запроса. Например, для запроса «A B C» она будет хранить комбинации: «A», «B», «C», «A B», «B C», «A B C». Это позволяет системе быстро проверить все подстроки запроса на наличие иерархических связей.

Может ли этот механизм работать с негеографическими данными?

Да. Хотя большинство примеров в патенте связаны с географией, текст явно указывает, что система может использовать любые Hierarchical Taxonomy Data, включая бизнес-листинги (категории услуг), биологические классификации (род, вид) и другие структурированные иерархии.

Как SEO-специалисту использовать знание об атрибуте «Relational value»?

Relational value указывает, является ли имя основным, официальным или разговорным. Это означает, что система может отдавать предпочтение определенным типам имен. SEO-специалистам следует убедиться, что они используют основные и официальные названия для локаций и категорий, хотя оптимизация под разговорные варианты также важна, но они должны быть подкреплены официальным контекстом.

Как Google использует иерархическую популярность связанных сущностей и данные веб-поиска для ранжирования в вертикальном поиске

Google использует механизм иерархического скоринга для ранжирования сущностей (например, брендов или исполнителей) в вертикальных поисках (non-WWW corpus). Популярность родительской сущности рассчитывается на основе агрегированной популярности дочерних (например, товаров или треков). Система использует данные о запросах и CTR из основного веб-поиска (WWW corpus) для определения популярности и применяет геолокацию и язык для устранения неоднозначности.

US9626435B2
2017-04-18

Google Shopping

Как Google фильтрует географические синонимы, чтобы предотвратить подмену местоположений в поиске

Google использует структурированную иерархическую базу географических данных для валидации синонимов. Если исходный термин и предложенный синоним являются разными, но связанными географическими объектами (например, соседние города или город и штат), система помечает их как «Проблемные синонимы». Это предотвращает автоматическую замену одного местоположения другим при обработке запроса, повышая точность локальной выдачи и избегая географического «дрейфа темы».

US8041730B1
2011-10-18

Local SEO
Семантика и интент

Как Google использует географическое положение и историю поведения пользователей для разрешения неоднозначных запросов

Google применяет механизм для интерпретации неоднозначных поисковых запросов, которые имеют несколько географических или категориальных значений. Система определяет доминирующий интент, анализируя, как пользователи в том же регионе ранее уточняли похожие запросы и насколько они были удовлетворены результатами. На основе этих локализованных данных (гистограмм и метрик неудовлетворенности) выбирается наиболее вероятная интерпретация, и выдача фильтруется соответственно.

US8478773B1
2013-07-02

Семантика и интент
Персонализация
Поведенческие сигналы

Как Google использует персональное дерево интересов пользователя для определения важности слов в запросе и его переписывания

Google использует иерархический профиль интересов пользователя (Profile Tree), построенный на основе истории поиска и поведения, чтобы определить, какие слова в запросе наиболее важны для конкретного человека. Специфичные интересы (глубокие узлы в дереве) получают больший вес. Это позволяет системе отфильтровать шум в длинных запросах и сгенерировать более точный альтернативный запрос.

US8326861B1
2012-12-04

Персонализация
Семантика и интент
Поведенческие сигналы

Как Google использует семантические связи внутри контента для переранжирования и повышения разнообразия выдачи

Google использует метод для переоценки и переранжирования поисковой выдачи путем анализа семантических взаимодействий между терминами внутри документов. Система строит графы локальных и глобальных связей, а затем определяет взаимосвязи между самими документами на основе их семантического вклада (даже без гиперссылок). Это позволяет повысить разнообразие выдачи, особенно по неоднозначным запросам.

US7996379B1
2011-08-09

Семантика и интент
Ссылки
SERP

Как Google использует машинное обучение и поведение пользователей для понимания скрытого намерения в коммерческих запросах

Google использует систему машинного обучения для анализа того, какие товары пользователи выбирают после ввода широких или неоднозначных запросов. Изучая скрытые атрибуты (метаданные) этих выбранных товаров, система определяет «скрытое намерение» запроса. Это позволяет автоматически переписывать будущие неоднозначные запросы в структурированный формат, ориентированный на атрибуты товара, а не только на ключевые слова.

US20180113919A1
2018-04-26

Семантика и интент
SERP
Поведенческие сигналы

Как Google обучает ИИ-модели для автоматической оценки качества сайтов на основе данных асессоров и предвзятой выборки

Патент Google, описывающий фундаментальную методологию создания систем оценки качества сайтов. Google использует машинное обучение (например, SVM), чтобы найти корреляции между оценками асессоров и измеримыми сигналами сайта (PageRank, клики). Для повышения точности применяется метод «предвзятой выборки» (Biased Sampling): система намеренно собирает больше оценок для сайтов среднего качества («сложных случаев»), чем для очевидно плохих или хороших.

US8442984B1
2013-05-14

SERP
EEAT и качество
Поведенческие сигналы

Как Google динамически меняет формулы ранжирования, адаптируя веса факторов под контекст запроса и пользователя

Google не использует единую модель ранжирования. Система использует машинное обучение для создания множества специализированных моделей (Predicted Performance Functions), обученных на исторических данных о кликах для разных контекстов (Search Contexts). При получении запроса система определяет контекст (тип запроса, язык, локация пользователя) и применяет ту модель, которая лучше всего предсказывает CTR в этой ситуации, динамически изменяя значимость различных сигналов ранжирования.

US8645390B1
2014-02-04

Персонализация
Поведенческие сигналы
SERP

Как Google ранжирует сущности (книги, фильмы, людей), анализируя тематичность и авторитетность их упоминаний в вебе

Google использует механизм для оценки значимости конкретных сущностей (например, изданий книг или фильмов). Система анализирует, как эти сущности упоминаются на релевантных веб-страницах, учитывая уверенность распознавания (Confidence) и то, насколько страница посвящена именно этой сущности (Topicality). Эти сигналы агрегируются с учетом авторитетности и релевантности страниц для расчета итоговой оценки сущности, которая затем корректирует ее ранжирование в поиске.

US20150161127A1
2015-06-11

Семантика и интент
EEAT и качество
SERP

Как Google предсказывает, какие сайты будут интересны пользователю на основе его контекста (местоположение, время, интересы) без поискового запроса

Google использует агрегированные данные о поведении пользователей для прогнозирования контента. Система анализирует контекст пользователя (местоположение, время, интересы, историю) и определяет, какие сайты посещают похожие пользователи в аналогичном контексте значительно чаще, чем пользователи в целом. Этот механизм позволяет предлагать релевантный контент без явного запроса (например, в Google Discover).

US9195703B1
2015-11-24

Персонализация
Поведенческие сигналы
Семантика и интент

Как Google выбирает сущность для Панели Знаний и решает, когда ее показывать, основываясь на топикальности SERP и CTR

Google использует этот механизм для решения двух задач: выбора наиболее релевантной сущности для Панели Знаний при неоднозначном запросе и определения необходимости показа самой панели. Система анализирует, насколько сущности соответствуют контенту топовых результатов поиска (Topicality Score). Показ панели активируется, если у органических результатов низкий CTR (что указывает на неудовлетворенность пользователей) или если у Google достаточно данных для ее заполнения.

US10922326B2
2021-02-16

Knowledge Graph
SERP
Семантика и интент

Как Google группирует похожие запросы и поисковые подсказки, определяя интент пользователя через анализ сессий и кликов

Google использует графовую модель (Марковскую цепь) для кластеризации поисковых подсказок и связанных запросов. Система анализирует, какие запросы пользователи вводят в одной сессии и на какие документы они кликают. Это позволяет сгруппировать запросы, ведущие к схожему контенту, и предложить пользователю разнообразный набор подсказок, отражающих разные интенты.

US8423538B1
2013-04-16

Семантика и интент
Поведенческие сигналы
SERP

Как Google использует нормализованные сигналы удовлетворенности пользователей для переранжирования выдачи и управления краулингом/индексацией

Google анализирует вовлеченность пользователей (полезность), сравнивая фактическую удовлетворенность (Good Utilization Events) с ожидаемой вовлеченностью для данной позиции ранжирования. На основе этого рассчитывается Correction Factor для повышения документов, превосходящих ожидания, и понижения тех, которые им не соответствуют. Эта система также влияет на приоритеты сканирования и решения об индексации.

US9223897B1
2015-12-29

Поведенческие сигналы
Индексация
Техническое SEO

Как Google автоматически определяет связанные домены (например, международные версии сайта) и переранжирует их для повышения локальной релевантности и разнообразия выдачи

Google использует автоматическую систему для идентификации доменов, принадлежащих одной организации (аффилированных доменов), анализируя ссылки между ними и сходство их имен (SLD). Когда в результатах поиска появляется несколько таких доменов, система может понизить или поменять местами их позиции. Это делается для того, чтобы показать пользователю наиболее локально релевантную версию сайта и увеличить разнообразие организаций в топе выдачи.

US9178848B1
2015-11-03

Local SEO
SERP
Ссылки

Как Google использует визуальный анализ кликов по картинкам для понимания интента запроса и переранжирования выдачи

Google анализирует визуальное содержимое изображений, которые пользователи чаще всего выбирают в ответ на определенный запрос. На основе этого анализа (наличие лиц, текста, графиков, доминирующих цветов) система определяет категорию запроса (например, «запрос о конкретном человеке» или «запрос на определенный цвет»). Эти категории затем используются для переранжирования будущих результатов поиска, повышая изображения, которые визуально соответствуют выявленному интенту.

US9836482B2
2017-12-05

Семантика и интент
Поведенческие сигналы
SERP