SEO HARDCORE
  • Разборы патентов
    • Патенты Google
  • Скоро SEO инструменты
  • Скоро SEO аналитика
  • seohardcore
SEO HARDCORE
назад

Как Google использует анализ параллельных анкорных текстов и кликов пользователей для перевода запросов и кросс-язычного поиска

SYSTEMS AND METHODS FOR SEARCHING USING QUERIES WRITTEN IN A DIFFERENT CHARACTER-SET AND/OR LANGUAGE FROM THE TARGET PAGES (Системы и методы поиска по запросам, написанным с использованием набора символов и/или языка, отличного от целевых страниц)
  • US8706747B2
  • Google LLC
  • 2003-09-30
  • 2014-04-22
  • Мультиязычность
  • Семантика и интент
  • Ссылки
  • Индексация
  • Описание
  • Разбор
  • Выводы
  • Практика
  • FAQ
  • Похожие

Google использует механизм для автоматического перевода запросов с одного языка или набора символов на другой. Система создает вероятностный словарь, анализируя, как анкорные тексты на разных языках ссылаются на одни и те же страницы (параллельные анкоры). Вероятности перевода затем уточняются на основе того, на какие результаты кликают пользователи. Это позволяет осуществлять кросс-язычный поиск (CLIR).

Описание

Какую проблему решает

Патент решает проблему кросс-язычного информационного поиска (Cross-Lingual Information Retrieval, CLIR). Основная задача — позволить пользователю искать контент на одном языке (или в одном наборе символов, например, Кандзи), используя запрос на другом языке (или наборе символов, например, Ромадзи). Система направлена на автоматическое обнаружение переводов и синонимов, включая сленг и имена собственные, для которых может не быть записей в стандартных словарях, и преодоление ограничений традиционных словарей.

Второстепенная задача — обработка неоднозначных запросов (ambiguous search queries), например, введенных с цифровой клавиатуры телефона.

Что запатентовано

Запатентована система перевода запросов с использованием Probabilistic Dictionary (вероятностного словаря). Ключевая особенность изобретения заключается в методах автоматического создания и уточнения этого словаря. Словарь генерируется путем анализа aligned text (выровненного/параллельного текста), в частности anchor text (анкорных текстов) на разных языках, указывающих на одну и ту же страницу. Вероятности перевода в словаре уточняются с использованием обратной связи от пользователей (click data).

Как это работает

Система работает в двух основных режимах:

  1. Создание словаря (Офлайн): Система анализирует индекс анкорных текстов. Она ищет ситуации, когда на одну и ту же целевую страницу ссылаются анкоры на разных языках (aligned anchor text). Анализируя частоту терминов в этих параллельных анкорах, система вычисляет вероятность того, что Термин А на Языке 1 является переводом Термина Б на Языке 2.
  2. Обработка запроса и уточнение (Онлайн): Пользователь вводит запрос на Языке 1. Система использует Probabilistic Dictionary для генерации одного или нескольких вероятных переводов на Язык 2 (часто через расширение запроса). Поиск выполняется по этим переводам. Система отслеживает, на какие результаты кликает пользователь (click data). Если пользователи предпочитают результаты, соответствующие определенному варианту перевода, вероятность этого перевода в словаре увеличивается.

Актуальность для SEO

Высокая. Кросс-язычный поиск (CLIR) и автоматическое понимание синонимов и переводов являются фундаментальными аспектами современного глобального поиска. Использование анкорного текста как источника семантических данных остается критически важным механизмом. Кроме того, использование поведенческих данных (кликов) для валидации и уточнения алгоритмических моделей является стандартом в поиске, основанном на машинном обучении.

Важность для SEO

Патент имеет высокое значение для SEO (8/10), особенно в международном продвижении. Он раскрывает конкретный механизм, с помощью которого Google использует анкорный текст не только для оценки авторитетности, но и для глубокого семантического анализа и автоматического обнаружения переводов. Это подчеркивает критическую важность глобальной ссылочной стратегии: качество и точность анкор-текстов на целевом языке напрямую влияют на способность сайта ранжироваться в международном поиске.

Детальный разбор

Термины и определения

Aligned Text (Выровненный/Параллельный текст)
Два фрагмента текста на разных языках или в разных наборах символов, которые считаются эквивалентными. Примером могут служить параллельные статьи или анкоры, указывающие на одну и ту же страницу.
Ambiguous Search Query (Неоднозначный поисковый запрос)
Запрос, который может иметь несколько интерпретаций. Например, из-за ограничений устройства ввода (цифровая клавиатура) или из-за многозначности самого термина.
Anchor Text (Анкорный текст)
Видимый кликабельный текст гиперссылки. В патенте отмечается, что анкорный текст часто дает более точное описание целевой страницы, чем сама страница, и является основным источником данных для словаря.
Click Data (Данные о кликах)
Информация о том, какие результаты поиска выбирает пользователь. Используется как механизм обратной связи для уточнения вероятностей перевода.
Cross-Lingual Information Retrieval (CLIR) (Кросс-язычный информационный поиск)
Область информационного поиска, занимающаяся получением документов на одном языке в ответ на запрос на другом языке.
Parallel Anchor Text (Параллельные анкорные тексты)
Частный случай Aligned Text. Это анкорные тексты на разных языках, которые указывают на одну и ту же целевую страницу.
Probabilistic Dictionary (Вероятностный словарь)
Структура данных, которая сопоставляет термины из одного формата (Язык А) с терминами в другом формате (Язык Б) и присваивает вероятность каждому сопоставлению.

Ключевые утверждения (Анализ Claims)

Анализ сфокусирован на механизме кросс-язычного поиска (CLIR), описанном в Claims 1-18.

Claim 1 (Независимый пункт): Описывает процесс использования и уточнения вероятностного словаря через взаимодействие с пользователем.

  1. Система получает поисковый запрос в первом формате.
  2. Запрос переводится с помощью Probabilistic Dictionary в группу переведенных запросов во втором формате. Словарь содержит сопоставления терминов с расчетными вероятностями (calculated probability).
  3. Поисковая система идентифицирует документы во втором формате, релевантные переведенным запросам.
  4. Результаты поиска во втором формате предоставляются пользователю.
  5. Система получает click data, указывающие на выбор пользователем одного или нескольких результатов.
  6. Probabilistic Dictionary модифицируется на основе полученных click data, и происходит корректировка как минимум одной вероятности, связанной с сопоставлениями в словаре.

Ядром изобретения является механизм обратной связи. Google алгоритмически проверяет точность своих автоматических переводов, используя реальное поведение пользователей. Если система не уверена в переводе, она тестирует варианты в выдаче и корректирует модель на основе того, какой вариант пользователи выбирают чаще.

Claims 2-6 (Зависимые пункты): Уточняют механизм перевода (Шаг 2 в Claim 1).

  • Перевод включает расширение запроса (expanding the search query) для создания расширенного запроса (expanded search query).
  • Расширенный запрос может включать альтернативные кодировки (alternative encodings), альтернативные языковые переводы (alternative language translations) и синонимы (synonyms) терминов запроса.

Где и как применяется

Изобретение затрагивает несколько ключевых этапов поиска, связывая данные индексирования с пониманием запросов и используя поведенческие данные для улучшения моделей.

CRAWLING и INDEXING – Сканирование и Индексирование
На этих этапах собираются и индексируются данные, необходимые для работы системы: веб-страницы и, что критически важно, anchor text ссылок, ведущих на них, с указанием языка/набора символов анкоров.

(Офлайн/Фоновые процессы)
Происходит построение и обновление Probabilistic Dictionary. Это включает анализ параллельных анкоров (aligned anchor text) для расчета исходных вероятностей перевода. Также анализируются логи click data для уточнения этих вероятностей в соответствии с Claim 1.

QUNDERSTANDING – Понимание Запросов
Основное применение патента в реальном времени. При получении запроса система использует Probabilistic Dictionary для его перевода в потенциальные запросы на целевом языке. Также происходит расширение запроса (Query Expansion) с добавлением высоковероятных переводов и синонимов.

RANKING – Ранжирование
Поисковая система выполняет поиск по расширенным и/или переведенным запросам.

RERANKING / Feedback Loop (Обратная связь)
После показа результатов система собирает click data для валидации качества перевода и последующего обновления Probabilistic Dictionary.

Входные данные:

  • Индекс анкорных текстов и целевых страниц (для построения словаря).
  • Запрос пользователя в исходном формате.
  • Probabilistic Dictionary (для перевода).
  • Логи кликов (Click Data) (для уточнения словаря).
  • История сессии пользователя (для разрешения неоднозначности).

Выходные данные:

  • Переведенный и/или расширенный запрос для системы ранжирования.
  • Обновленный Probabilistic Dictionary с уточненными вероятностями.

На что влияет

  • Специфические запросы: Наибольшее влияние на кросс-язычные запросы (например, поиск на английском языке контента на японском). Также влияет на запросы, содержащие термины с несколькими значениями или переводами.
  • Мультиязычные сайты: Влияет на то, как Google понимает связь между различными языковыми версиями контента и как он интерпретирует терминологию на основе ссылочного профиля.
  • Конкретные ниши: Ниши со специфической терминологией, сленгом или новыми терминами. Система может автоматически обнаруживать переводы для них, анализируя использование в анкорах.
  • Языковые и географические ограничения: Патент направлен на преодоление этих ограничений, обеспечивая CLIR. Примеры: перевод с английского на испанский, с Romaji на Kanji.

Когда применяется

  • Условия активации: Когда язык или набор символов запроса отличается от языка целевого контента. Когда система обнаруживает потенциальные переводы или синонимы с высокой вероятностью в Probabilistic Dictionary.
  • Разрешение неоднозначности: Когда исходный запрос неоднозначен, система генерирует несколько вариантов интерпретации и использует индекс или пользовательские данные для выбора наилучшего.

Пошаговый алгоритм

Процесс А: Построение Вероятностного Словаря (Офлайн)

  1. Получение термина для перевода: Выбирается термин на Исходном Языке (A).
  2. Идентификация исходных анкоров: Находятся все анкор-тексты на Языке A, содержащие этот термин.
  3. Идентификация целевых страниц: Определяются страницы, на которые указывают эти анкоры.
  4. Идентификация параллельных анкоров: Находятся анкор-тексты на Целевом Языке (B), которые указывают на те же самые страницы (aligned anchor text).
  5. Анализ частотности: Анализируется частота встречаемости различных терминов в параллельных анкорах на Языке B.
  6. Расчет вероятностей: Вычисляются вероятности того, что конкретный термин на Языке B является переводом исходного термина на Языке A. (Например, деление количества вхождений термина B на общее количество терминов в параллельных анкорах).
  7. Применение весов (Опционально): Вероятности могут быть скорректированы. Например, предпочтение отдается анкорам, длина которых схожа с длиной исходного термина или других параллельных анкоров.
  8. Сохранение: Сопоставление и его вероятность сохраняются в Probabilistic Dictionary.

Процесс Б: Обработка запроса и обратная связь (Онлайн)

  1. Получение запроса: Система получает запрос на Языке A.
  2. Перевод и Расширение: Система использует Probabilistic Dictionary для генерации одного или нескольких вариантов перевода запроса на Язык B. Запрос расширяется (Query Expansion).
  3. Поиск: Выполняется поиск документов на Языке B, релевантных расширенному запросу.
  4. Предоставление результатов: Результаты, соответствующие разным вариантам перевода, могут быть смешаны в выдаче.
  5. Сбор обратной связи: Система отслеживает click data – какие результаты выбирает пользователь.
  6. Уточнение словаря: На основе click data система корректирует вероятности в Probabilistic Dictionary. Если пользователи часто кликают на результаты, соответствующие переводу X, и редко на результаты, соответствующие переводу Y, вероятность перевода X увеличивается.

Какие данные и как использует

Данные на входе

Патент фокусируется на использовании ссылочных и поведенческих данных для понимания языка.

  • Ссылочные факторы: Anchor text является критически важным. Система анализирует текст анкоров и URL, на которые они указывают. Ключевым элементом является обнаружение aligned anchor text — сравнение анкоров на разных языках, ведущих на один и тот же URL.
  • Поведенческие факторы: Click data используется для уточнения и валидации автоматических переводов. Также упоминается использование истории поисковой сессии пользователя (query session history) для разрешения неоднозначности запросов.
  • Контентные факторы: Помимо анкоров, система может использовать другой aligned text, например, параллельные корпусы текстов (статьи, переведенные на несколько языков).

Какие метрики используются и как они считаются

  • Translation Probability (Вероятность перевода): Основная метрика. Рассчитывается на основе частоты совместной встречаемости терминов в aligned text. Если термин TB встречается N раз в анкорах на языке B, которые ссылаются на те же страницы, что и анкоры с термином TA на языке A, а общее количество терминов в этих анкорах на языке B равно M, то базовая вероятность P(TA=TB) может быть рассчитана как N/M.
  • Probability Adjustment (Корректировка вероятности): Пересчет вероятностей на основе соотношения кликов пользователей по результатам, соответствующим различным потенциальным переводам. Если результаты для Перевода А получают значительно больше кликов, чем для Перевода Б, вероятность Перевода А увеличивается.
  • Weighting (Взвешивание анкоров): Упоминается возможность взвешивания. Например, предпочтение может отдаваться анкорам, количество терминов в которых схоже с количеством терминов в исходном запросе или в других выровненных анкорах.

Выводы

  1. Анкорный текст как источник перевода и семантики: Патент подтверждает, что Google использует anchor text не только как сигнал ранжирования (авторитетности), но и как ключевой источник данных для семантического понимания, обнаружения синонимов и автоматического перевода. Анализ параллельных анкоров позволяет строить языковые модели без ручного создания словарей.
  2. Автоматизация CLIR и обнаружение новых терминов: Система способна автоматически реализовать кросс-язычный поиск и обнаруживать переводы для новых слов, сленга и имен собственных, анализируя структуру веба (ссылки и их анкоры).
  3. Click Data как механизм валидации (Самообучение): Google активно использует поведенческие данные (click data) в качестве механизма обратной связи для валидации и корректировки своих алгоритмических предположений. Это позволяет словарю адаптироваться к изменениям в языке и поведении пользователей.
  4. Вероятностный подход и Расширение запросов: Вместо поиска единственного перевода система использует Probabilistic Dictionary и часто реализует перевод через расширение запроса (Query Expansion) путем добавления вероятных переводов и синонимов для увеличения полноты выдачи (Recall).

Практика

Best practices (это мы делаем)

  • Локализация анкор-текстов для международного SEO: Критически важно стимулировать появление естественных обратных ссылок с точными и описательными анкор-текстами на целевом языке. Это напрямую влияет на то, как Google поймет и классифицирует ваш контент на этом языке и как он свяжет его с эквивалентами на других языках.
  • Когерентная мультиязычная стратегия перелинковки: Обеспечьте последовательность во внутренних анкорных текстах на разных языках. Если английская версия ссылается на страницу X с анкором "Red Shoes", испанская версия должна ссылаться на эквивалент страницы X с анкором "Zapatos Rojos". Это предоставляет системе четкие сигналы для построения Probabilistic Dictionary.
  • Привлечение международных ссылок (Линкбилдинг): Получение ссылок с описательными анкорами из источников на разных языках, указывающих на ваш контент, помогает Google понять его глобальную релевантность и обнаружить точную отраслевую терминологию.
  • Оптимизация под интент пользователя (для получения кликов): Поскольку click data используется для уточнения вероятностей перевода, крайне важно, чтобы ваш контент и сниппеты точно соответствовали интенту. Удовлетворенность пользователя валидирует правильность перевода для Google.

Worst practices (это делать не надо)

  • Непоследовательное международное связывание: Использование несогласованных или противоречивых анкоров на разных языках, указывающих на один и тот же контент, может запутать процесс генерации Probabilistic Dictionary и привести к неверным ассоциациям терминов.
  • Игнорирование локального линкбилдинга: Полагаться только на авторитет домена без поддержки локальными ссылками неэффективно. Без локальных анкор-текстов у системы будет недостаточно данных для точного сопоставления терминов.
  • Манипулятивный или некачественный анкор-текст: Использование спамных, переоптимизированных или неинформативных анкоров (например, сгенерированных некачественным машинным переводом) предоставляет системе данные низкого качества для семантического анализа и перевода.

Стратегическое значение

Этот патент подтверждает стратегическую важность анкор-текста как одного из самых сильных сигналов для понимания контента поисковой системой. Он демонстрирует, что линкбилдинг — это не только передача авторитета, но и обучение Google терминологии вашей ниши. Для успешного международного SEO необходимо интегрировать сайт в лингвистическую экосистему целевого региона. Локализованный линкбилдинг является необходимым условием для того, чтобы Google смог точно интерпретировать и "перевести" ключевые концепции вашего бизнеса.

Практические примеры

Сценарий: Обучение Google переводу названия продукта через международный линкбилдинг

  1. Ситуация: Компания запускает новый продукт с уникальным названием "AquaGlove" и хочет, чтобы Google распознавал его эквивалент в Испании ("GuanteAcuatico").
  2. Действия:
    • Внутренняя перелинковка: На сайте компании все ссылки на страницу продукта используют точное название в качестве анкора на соответствующем языке.
    • Внешний линкбилдинг: Компания проводит PR-кампанию. Англоязычные СМИ ссылаются на продукт с анкором "AquaGlove review". Испанские СМИ ссылаются на ту же (или эквивалентную, связанную hreflang) страницу с анкором "GuanteAcuatico revision".
  3. Механизм Google (согласно патенту): Google обнаруживает aligned anchor text. Он видит, что анкоры "AquaGlove review" и "GuanteAcuatico revision" часто указывают на один и тот же контент.
  4. Результат: Google добавляет в Probabilistic Dictionary запись о том, что "AquaGlove" с высокой вероятностью переводится как "GuanteAcuatico". Теперь, если пользователь ищет "AquaGlove" в Испании, Google может расширить запрос, включив "GuanteAcuatico", улучшая качество поиска.

Вопросы и ответы

Что такое "параллельные анкорные тексты" (Aligned/Parallel Anchor Text) и почему они важны?

Параллельные анкорные тексты — это анкоры на разных языках (или в разных наборах символов), которые указывают на одну и ту же целевую страницу. Они критически важны, так как Google использует их для автоматического построения словаря переводов. Анализируя частоту терминов в этих параллельных анкорах, система может определить, как слова переводятся с одного языка на другой, не прибегая к ручному труду.

Как именно Google использует клики пользователей (Click Data) для уточнения переводов?

Патент описывает механизм обратной связи. Если система не уверена в переводе (например, есть два варианта с вероятностью 50/50), она может показать результаты для обоих вариантов. Если пользователи систематически кликают на результаты, соответствующие Варианту А, и игнорируют Вариант Б, система увеличивает вероятность Варианта А в своем Probabilistic Dictionary. Клики служат механизмом валидации алгоритмических предположений.

Насколько важен анкор-текст для международного SEO в свете этого патента?

Его важность критически высока. Патент показывает, что анкор-текст является основным источником данных для понимания и перевода терминов между языками. Для успешного продвижения на международном рынке необходимо иметь качественные обратные ссылки с точными и релевантными анкор-текстами на целевом языке.

Может ли мой сайт ранжироваться по запросам на языке, на котором у меня нет контента?

Да, это возможно благодаря механизму CLIR, описанному в патенте. Если Google с высокой вероятностью определил перевод ключевых терминов вашего контента на другой язык (через анализ анкоров), он может перевести запрос пользователя на ваш язык, найти релевантный контент на вашем сайте и показать его в выдаче. Однако для стабильного ранжирования рекомендуется иметь локализованный контент.

Может ли эта система переводить сленг, идиомы или новые слова?

Да, это одно из ключевых преимуществ. Поскольку система строит словарь автоматически на основе анализа реального использования терминов в анкорных текстах в интернете, она может обнаруживать переводы для сленга, новых терминов или имен собственных, которых нет в стандартных словарях. Если термин начинает активно использоваться в анкорах, система его изучит.

Использует ли Google этот механизм для перевода внутри одного языка (например, синонимы)?

Да, патент упоминает, что механизм может использоваться не только для перевода между языками или наборами символов, но и для идентификации синонимов (Claim 4). Если два разных анкора на одном языке часто указывают на одну и ту же страницу, система может сделать вывод, что термины в этих анкорах являются синонимами, и использовать это для расширения запроса.

Что делать, если Google неправильно переводит ключевые термины моего бизнеса?

Это указывает на недостаток или неточность данных в Probabilistic Dictionary для вашей ниши. Необходимо активизировать работу по получению качественных обратных ссылок с авторитетных сайтов на целевом языке, используя в анкорах правильную терминологию. Консистентность и частота правильных анкоров помогут системе скорректировать вероятности перевода.

Учитывает ли система длину анкора при переводе?

Да, патент упоминает возможность взвешивания анкоров. Система может отдавать предпочтение (больший вес) тем анкорам, длина которых (количество слов) схожа с длиной исходного термина или других параллельных анкоров. Это помогает отсеивать шум и повышать точность перевода.

Заменяет ли этот патент необходимость в hreflang?

Нет, не заменяет. Hreflang предоставляет явные сигналы о языковых и региональных версиях страниц. Механизм, описанный в патенте, работает на уровне перевода терминов и запросов, используя статистический анализ ссылок. Hreflang помогает системе лучше понять структуру многоязычного сайта, что может улучшить качество идентификации aligned text.

Актуален ли этот патент, учитывая современные технологии нейронного машинного перевода (NMT)?

Патент актуален концептуально. Хотя современные системы NMT используют более сложные модели, идея использования параллельных данных (включая анкор-тексты) для обучения и механизм обратной связи через поведение пользователей остаются фундаментальными принципами работы поисковых систем в многоязычной среде.

Похожие патенты

Как Google автоматически определяет, на каких языках искать ответ на запрос пользователя (CLIR)
Google использует механизм для автоматического определения наиболее релевантных языков для поиска по запросу пользователя. Система анализирует термины, связанные с запросом, и их привязку к различным языкам на основе структурированных данных (например, Википедии). Если система определяет, что ценный контент существует на других языках, она переводит запрос, выполняет поиск и подмешивает переведенные результаты в выдачу.
  • US8862595B1
  • 2014-10-14
  • Мультиязычность

Как Google алгоритмически определяет и верифицирует языковые версии страниц, анализируя ссылки, контент и частоту обновлений
Google использует систему для автоматической идентификации связанных версий контента (например, переводов). Система анализирует ссылки между страницами и ищет «индикаторы связи» (названия языков в анкорах или флаги). Обнаруженная связь затем верифицируется с помощью машинного перевода и сравнения контента, а также анализа частоты обновлений. Это позволяет Google показывать пользователю наиболее подходящую языковую или региональную версию в поиске.
  • US8892596B1
  • 2014-11-18
  • Мультиязычность

  • Ссылки

  • SERP

Как Google решает, когда переводить запрос пользователя на другие языки, а когда уважать его языковой выбор
Google использует систему фильтрации для управления межъязыковым поиском (CLIR). Система анализирует язык запроса, язык интерфейса пользователя и его местоположение. Если пользователь вводит запрос на языке, отличном от языка интерфейса, Google предполагает мультиязычность и не переводит запрос, экономя ресурсы. Перевод активируется, если язык запроса совпадает с языком интерфейса, особенно если локальных результатов мало.
  • US9824147B1
  • 2017-11-21
  • Мультиязычность

  • Персонализация

  • Семантика и интент

Как Google решает, когда переводить запрос пользователя и показывать результаты на другом языке, сравнивая релевантность и распознавая сущности
Google анализирует запрос пользователя, переводит его на другой язык (например, английский) и сравнивает релевантность результатов в обоих языках. Если контент на иностранном языке значительно релевантнее, система подмешивает его в выдачу. При этом учитываются локальные и иностранные сущности в запросе, а также качество автоматического перевода.
  • US20090083243A1
  • 2009-03-26
  • Мультиязычность

  • Семантика и интент

  • SERP

Как Google использует машинный перевод для поиска контента на иностранных языках (Cross-Language Information Retrieval)
Google использует механизмы Cross-Language Information Retrieval (CLIR) для поиска релевантного контента независимо от языка запроса. Система может перевести запрос пользователя на другие языки и искать в индексах этих языков (Query Translation), либо заранее перевести контент сайтов на язык пользователя (Document Translation). Это позволяет предоставлять пользователю лучшие результаты, даже если они изначально опубликованы на иностранном языке.
  • US7890493B2
  • 2011-02-15
  • Мультиязычность

  • Индексация

Популярные патенты

Как Google собирает и структурирует данные о поведении пользователей в Поиске по картинкам (включая ховеры, клики и 2D-позицию)
Патент Google описывает инфраструктуру для детального сбора данных в Поиске по картинкам. Система фильтрует общие логи, фиксируя не только клики, но и наведение курсора (ховеры), длительность взаимодействия и точное 2D-расположение (строка/столбец) изображения на выдаче. Эти данные агрегируются в Модель Запросов Изображений для оценки релевантности.
  • US8898150B1
  • 2014-11-25
  • Поведенческие сигналы

  • SERP

  • Мультимедиа

Как Google использует семантические связи внутри контента для переранжирования и повышения разнообразия выдачи
Google использует метод для переоценки и переранжирования поисковой выдачи путем анализа семантических взаимодействий между терминами внутри документов. Система строит графы локальных и глобальных связей, а затем определяет взаимосвязи между самими документами на основе их семантического вклада (даже без гиперссылок). Это позволяет повысить разнообразие выдачи, особенно по неоднозначным запросам.
  • US7996379B1
  • 2011-08-09
  • Семантика и интент

  • Ссылки

  • SERP

Как Google использует структуру сайта и анкорные тексты для извлечения Сущностей из шумных заголовков (Title)
Google использует метод для точного определения основного объекта (Сущности) веб-страницы, когда заголовок (Title) содержит лишнюю информацию (брендинг, рубрики). Система анализирует заголовки похожих страниц на том же сайте (Peer Documents) и анкорные тексты, ссылающиеся на них. Выявляя повторяющиеся шаблоны (префиксы и суффиксы) в заголовках, Google отделяет название Сущности от шума.
  • US7590628B2
  • 2009-09-15
  • Семантика и интент

  • Структура сайта

  • Ссылки

Как Google использует офлайн-сигналы и авторитетность сущностей для ранжирования контента
Google использует реальные, офлайн-сигналы авторитетности для ранжирования документов, у которых отсутствует естественная ссылочная структура (например, оцифрованные книги). Система оценивает коммерческий успех документа (данные о продажах, списки бестселлеров), репутацию связанных сущностей (автора и издателя) и может переносить ссылочный авторитет с официальных сайтов этих сущностей на сам документ для улучшения его позиций в поиске.
  • US8799107B1
  • 2014-08-05
  • EEAT и качество

  • SERP

  • Поведенческие сигналы

Как Google динамически повышает порог качества для результатов поиска по «рискованным» запросам
Google оценивает «риск» поискового запроса, анализируя общее качество топовых результатов. Если запрос часто привлекает спам, кликбейт или нежелательный контент (особенно видео), система динамически повышает минимальный порог качества. Контент, не соответствующий этому повышенному стандарту, понижается в выдаче, при этом учитываются такие сигналы, как показатель просмотров (Watch Rate).
  • US11609949B2
  • 2023-03-21
  • Антиспам

  • SERP

  • Поведенческие сигналы

Как Google использует данные о поведении пользователей и длительность кликов для улучшения и переписывания поисковых запросов
Google использует систему для автоматического переписывания запросов пользователей. Система анализирует миллионы прошлых поисковых сессий, чтобы определить, как пользователи уточняли свои запросы и насколько они были удовлетворены результатами (измеряя длительность кликов). На основе этого рассчитывается «Ожидаемая полезность» (Expected Utility) для предложенных вариантов запросов, что позволяет Google предлагать пользователю те формулировки, которые с наибольшей вероятностью приведут к качественному ответу.
  • US7617205B2
  • 2009-11-10
  • Поведенческие сигналы

  • Семантика и интент

  • SERP

Как Google использует анализ сущностей в результатах поиска для подтверждения интента и продвижения авторитетного контента
Google анализирует сущности (Topics/Entities) и их типы, общие для топовых результатов поиска, чтобы определить истинный интент запроса. Если интент подтверждается этим тематическим консенсусом выдачи, система продвигает "авторитетные кандидаты" (например, полные фильмы). Если консенсуса нет, продвижение блокируется для предотвращения показа нерелевантных результатов.
  • US9213745B1
  • 2015-12-15
  • Семантика и интент

  • EEAT и качество

  • SERP

Как Google использует генеративный ИИ для создания чата с конкретным сайтом прямо в поисковой выдаче и предоставления глубинных ссылок
Google патентует механизм, позволяющий пользователям взаимодействовать с конкретным результатом поиска через интерфейс чата (prompt input interface) прямо на странице выдачи. Искусственный интеллект анализирует запрос пользователя и его последующий промпт, определяет намерение (поиск информации, действие или навигация) и предоставляет глубинные ссылки (deep links) на конкретные внутренние страницы этого же домена в виде conversational response.
  • US12353458B2
  • 2025-07-08
  • Ссылки

  • Семантика и интент

  • SERP

Как Google использует данные о поведении пользователей внутри документов (время чтения разделов, закладки) для улучшения ранжирования
Google может собирать и анализировать данные о том, как пользователи взаимодействуют с электронными документами (например, PDF, DOC, HTML). Система отслеживает, какие разделы или страницы просматриваются дольше всего или добавляются в закладки. Эта агрегированная информация используется для повышения в ранжировании документов, чьи ключевые слова находятся в наиболее используемых (и, следовательно, ценных) разделах.
  • US8005811B2
  • 2011-08-23
  • Поведенческие сигналы

  • SERP

Как Google определяет связанность документов с использованием Co-citation, анализа текста вокруг ссылок и паттернов пользовательского доступа
Google использует методы для ограничения результатов поиска на основе заданного контекста (например, набора URL-адресов или категории). Патент детализирует, как система определяет «связанность» между документами, используя такие методы, как анализ совместного цитирования (co-citation), анализ текста, окружающего ссылки в цитирующих документах, и анализ корреляции паттернов доступа пользователей.
  • US7305380B1
  • 2007-12-04
  • Ссылки

  • SERP

  • Поведенческие сигналы

seohardcore