SEO HARDCORE
  • Разборы патентов
    • Патенты Google
  • Скоро SEO инструменты
  • Скоро SEO аналитика
  • seohardcore
SEO HARDCORE
назад

Как Google использует удаленный контекст в запросе ("Floating Context") для точного подбора синонимов

SYNONYM IDENTIFICATION BASED ON CO-OCCURRING TERMS (Идентификация синонимов на основе совместно встречающихся терминов)
  • US8538984B1
  • Google LLC
  • 2012-04-03
  • 2013-09-17
  • Семантика и интент
  • Описание
  • Разбор
  • Выводы
  • Практика
  • FAQ
  • Похожие

Google использует механизм для валидации синонимов, анализируя не только соседние слова в запросе (Adjacent Context), но и слова, расположенные далеко от исходного термина (Floating Context). Это позволяет точнее определять уместность синонима, опираясь на весь контекст запроса, и избегать неверных замен, если контекст их исключает.

Описание

Какую проблему решает

Патент решает проблему повышения точности при автоматическом подборе синонимов для переписывания запроса. Традиционные системы часто полагаются только на Adjacent Context (непосредственно соседние слова). Это может приводить к ошибкам, когда ключевой контекст, определяющий значение термина, находится в другой части запроса. Изобретение позволяет системе учитывать Floating Context (не-смежные термины) для более точной валидации синонимов и предотвращения неуместных замен.

Что запатентовано

Запатентована система идентификации синонимов, которая использует контекст не-смежных терминов (Floating Context) для определения уместности замены термина в запросе. Система обращается к базе данных предварительно рассчитанных оценок уверенности (Confidence Values) для пар термин/синоним в контексте других слов запроса. Если контекст, предоставленный не-смежным термином, дает высокую оценку уверенности, синоним используется для переписывания запроса.

Как это работает

Система работает на этапе понимания запроса:

  • Парсинг запроса: Исходный запрос разбирается, определяются термины, игнорируются стоп-слова (Skip Words).
  • Генерация кандидатов: Для терминов подбираются потенциальные синонимы (Candidate Synonym).
  • Оценка контекста: Система оценивает кандидатов, используя как Adjacent Context (соседние слова), так и Floating Context (не-смежные слова).
  • Проверка уверенности: Для каждой пары термин/синоним система проверяет Confidence Value в контексте других слов запроса по предварительно созданным базам данных.
  • Принятие решения: Если Confidence Value превышает пороговое значение (Threshold), синоним принимается. Система также может определить Definitive Non-Synonym (когда контекст строго исключает синоним).
  • Переписывание запроса: Генерируются пересмотренные запросы с использованием валидированных синонимов.

Актуальность для SEO

Высокая. Точное понимание запросов (Query Understanding) и определение синонимичности являются фундаментальными задачами поиска. По мере усложнения запросов и развития голосового поиска способность системы улавливать контекст из разных частей длинного запроса становится критически важной для обеспечения релевантности. Принципы, заложенные в патенте, актуальны для современных семантических моделей.

Важность для SEO

Патент имеет значительное влияние на SEO. Он описывает ключевой механизм этапа Query Understanding и подчеркивает, что Google анализирует запрос холистически, а не как набор изолированных слов. Это подтверждает важность создания контента с четкими и всесторонними контекстуальными сигналами, чтобы поисковая система могла корректно интерпретировать сложные запросы пользователей и сопоставлять их с тематикой сайта.

Детальный разбор

Термины и определения

Adjacent Context (Смежный контекст)
Термины в запросе, которые находятся непосредственно рядом с оцениваемым термином (слева или справа). Система может игнорировать Skip Words при определении смежности.
Candidate Synonym (Кандидат в синонимы)
Потенциальный замещающий термин для термина в исходном запросе.
Candidate Term/Synonym Pair (Пара Термин/Синоним)
Структура данных, объединяющая исходный термин запроса и его кандидата в синонимы для оценки.
Compound Phrase (Составная фраза)
Два или более термина запроса, которые система идентифицирует как единое целое (например, n-грамма или название).
Confidence Value / Confidence Score (Оценка уверенности)
Числовая метрика, хранящаяся в базах данных контекстов. Она указывает на вероятность того, что кандидат является подходящим синонимом для термина в контексте третьего слова.
Definitive Non-Synonym (Окончательный не-синоним)
Статус, присваиваемый кандидату, если контекст (смежный или плавающий) строго указывает на то, что замена неуместна в данном запросе.
Floating Context (Плавающий контекст / Не-смежный контекст)
Термины в запросе, которые не являются смежными с оцениваемым термином (отделены от него хотя бы одним другим значимым термином).
Query Reviser Engine (Механизм пересмотра запросов)
Компонент системы, отвечающий за генерацию пересмотренных запросов на основе синонимов.
Skip Words (Пропускаемые слова / Стоп-слова)
Слова в запросе, которые игнорируются при определении контекста (например, предлоги, артикли).
Synonym Engine (Механизм обработки синонимов)
Компонент, отвечающий за идентификацию и оценку кандидатов в синонимы, используя контекстные базы данных и Query Logs.

Ключевые утверждения (Анализ Claims)

Claim 1 (Независимый пункт): Описывает основной механизм использования не-смежного контекста.

  1. Идентификация термина в исходном запросе.
  2. Идентификация кандидата в синонимы.
  3. Доступ к хранимым данным (stored data), которые определяют Confidence Value для пары (термин/синоним) в контексте не-смежного термина (non-adjacent query term).
  4. Определение того, что Confidence Value для этого не-смежного термина удовлетворяет пороговому значению (threshold).
  5. Принятие решения о пересмотре исходного запроса с включением синонима на основании выполнения порога.

Ядро изобретения заключается в том, что для принятия синонима может быть достаточно высокой уверенности, основанной только на не-смежном контексте.

Claim 3 (Зависимый от 1): Добавляет условие, связанное со смежным контекстом.

  1. Система также проверяет контекст смежного термина (adjacent query term).
  2. Определяется, что Confidence Value для смежного термина *не* удовлетворяет пороговому значению.

Это описывает сценарий, когда смежный контекст не дает достаточной уверенности для принятия синонима, и система обращается к не-смежному контексту (описанному в Claim 1).

Claim 4 (Зависимый от 3): Вводит понятие окончательного не-синонима на основе смежного контекста.

  1. Определение, что в контексте смежного термина кандидат является Definitive Non-Synonym.
  2. Принятие решения *не* пересматривать исходный запрос на этом основании.

Если смежный контекст строго исключает синоним, он не будет применен.

Claim 7 (Зависимый от 1): Вводит понятие окончательного не-синонима на основе не-смежного контекста.

  1. Определение, что в контексте второго не-смежного термина кандидат является Definitive Non-Synonym.
  2. Принятие решения *не* пересматривать исходный запрос на этом основании.

Даже не-смежный контекст может строго исключить использование синонима.

Где и как применяется

Изобретение полностью относится к этапу обработки и понимания запроса.

QUNDERSTANDING – Понимание Запросов

Это основной этап применения патента. Система (в частности, Synonym Engine и Query Reviser Engine) анализирует исходный запрос для определения интента и возможности его расширения или уточнения с помощью синонимов.

  1. Парсинг и Нормализация: Запрос разбирается, идентифицируются Skip Words и составные фразы (Compound Phrase).
  2. Идентификация и Валидация Синонимов: Система использует описанный механизм для проверки уместности синонимов, обращаясь к базам Adjacent Context и Floating Context.
  3. Переписывание Запроса: Генерируются пересмотренные запросы (Revised Queries).

INDEXING – Индексирование (Офлайн-процессы)

Механизм полагается на данные, созданные офлайн. Базы данных Adjacent Context и Floating Context, содержащие Confidence Values, предварительно рассчитываются, в том числе путем анализа Query Logs.

Входные данные:

  • Исходный запрос пользователя (Original Query).
  • База данных смежного контекста (Adjacent Context Database).
  • База данных плавающего контекста (Floating Context Database).
  • Правила синонимов (Synonym Rules).

Выходные данные:

  • Набор пересмотренных запросов (Revised Queries), которые вместе с исходным запросом направляются в Search Engine.

На что влияет

  • Специфические запросы: Наибольшее влияние оказывается на длинные, сложные или неоднозначные запросы. В коротких запросах роль Floating Context минимальна. В длинных запросах (например, голосовых или детализированных информационных) контекст часто распределен по всей длине запроса.
  • Неоднозначные термины: Влияет на запросы с терминами, имеющими несколько значений (полисемия). Контекст (смежный или плавающий) используется для выбора правильного синонима или исключения неправильного.

Когда применяется

  • Триггеры активации: Механизм активируется, когда для термина в запросе существуют потенциальные кандидаты в синонимы, требующие контекстной валидации.
  • Условия работы алгоритма: Система может сначала проверить Adjacent Context. Если результат неубедителен (не подтверждает синоним с достаточной уверенностью, но и не является Definitive Non-Synonym), система переходит к оценке Floating Context.

Пошаговый алгоритм

Процесс оценки кандидата в синонимы для конкретного термина запроса:

  1. Получение и парсинг запроса: Система получает исходный запрос, идентифицирует значимые термины, Skip Words и составные фразы.
  2. Идентификация кандидатов: Для целевого термина генерируется список кандидатов в синонимы.
  3. Оценка смежного контекста (Adjacent Context Evaluation):
    • Идентифицируются смежные термины (слева и справа).
    • Для каждого смежного термина извлекается Confidence Value для пары термин/синоним из базы данных Adjacent Context.
    • Значения сравниваются с порогом (Threshold).
  4. Принятие решения по смежному контексту:
    • Если уверенность высока (превышает порог): Синоним принимается.
    • Если определен Definitive Non-Synonym: Синоним отклоняется.
    • Если уверенность низкая, но не Definitive Non-Synonym (неубедительно): Переход к следующему этапу.
  5. Оценка плавающего контекста (Floating Context Evaluation):
    • Идентифицируются не-смежные термины в запросе.
    • Для каждого не-смежного термина извлекается Confidence Value для пары термин/синоним из базы данных Floating Context.
    • Значения сравниваются с порогом.
  6. Принятие решения по плавающему контексту:
    • Если уверенность высока (превышает порог хотя бы для одного не-смежного термина): Синоним принимается.
    • Если определен Definitive Non-Synonym (на основе не-смежного контекста) или уверенность низкая: Синоним отклоняется.
  7. Генерация пересмотренных запросов: Исходный запрос переписывается с использованием всех принятых синонимов.

Какие данные и как использует

Данные на входе

Патент фокусируется на обработке запроса и не детализирует факторы ранжирования. Он использует следующие типы данных:

  • Пользовательские данные: Текст исходного запроса (Original Query).
  • Системные данные (Предварительно рассчитанные):
    • Adjacent Context Database: Хранит Confidence Values для пар термин/синоним в контексте смежных слов.
    • Floating Context Database: Хранит Confidence Values для пар термин/синоним в контексте не-смежных слов.
    • Synonym Rules: Общие правила замены терминов.
    • Compound Words Database: Данные для идентификации составных фраз (n-грамм) в запросе.
  • Поведенческие факторы (Офлайн): Query Logs упоминаются как источник данных для идентификации синонимов и используются для офлайн-расчета Confidence Values.

Какие метрики используются и как они считаются

  • Confidence Value (Оценка уверенности): Ключевая метрика патента. Это предварительно рассчитанная оценка того, насколько уместен синоним в определенном контексте. Патент не описывает формулу ее расчета, но указывает, что она хранится в базах данных.
  • Threshold (Пороговое значение): Фиксированное значение, с которым сравнивается Confidence Value для принятия решения. В патенте упоминается возможность использования разных порогов для Adjacent Context и Floating Context.
  • Агрегация оценок: Если проверяется несколько контекстных слов, система может использовать различные методы агрегации Confidence Values:
    • Максимум: Использование наибольшего значения среди всех контекстных слов (если хотя бы один контекст подтверждает синоним, он принимается).
    • Минимум или Среднее: В патенте также упоминаются возможности использования среднего или минимального значения в качестве итоговой оценки.

Выводы

  1. Холистический подход к пониманию запроса: Google не ограничивается анализом ближайшего окружения слова для определения его значения и подбора синонимов. Система анализирует весь запрос целиком, используя как Adjacent Context, так и Floating Context.
  2. Плавающий контекст может быть решающим: Ключевая идея патента в том, что слово, расположенное далеко от целевого термина, может предоставить более сильный контекстуальный сигнал, чем соседние слова. Floating Context может подтвердить синоним, даже если Adjacent Context был неубедительным.
  3. Контекстная валидация синонимов: Система не применяет синонимы универсально. Каждый потенциальный синоним проходит валидацию на основе контекста конкретного запроса с использованием Confidence Values и порогов.
  4. Идентификация "Окончательных Не-синонимов": Механизм позволяет не только подтверждать синонимы, но и активно исключать неуместные замены (Definitive Non-Synonym), если контекст запроса противоречит замене. Это защитный механизм от искажения интента.
  5. Зависимость от исторических данных: Эффективность системы зависит от качества предварительно рассчитанных Confidence Values, которые основаны на анализе больших объемов данных (Query Logs).

Практика

Best practices (это мы делаем)

  • Обеспечение сильного контекста на странице: Создавайте контент, в котором ключевые термины окружены сильными и однозначными контекстуальными сигналами. Убедитесь, что связанные сущности, подтемы и релевантные термины естественно сосуществуют на странице. Это помогает поисковой системе лучше понять семантику контента, что коррелирует с логикой патента по определению уместности терминов на основе контекста.
  • Работа над Topical Authority и полнотой раскрытия темы: Чем полнее раскрыта тема, тем больше контекстуальных связей создается внутри контента. Это повышает вероятность того, что ваш контент будет признан релевантным для запросов, где Google применяет сложную логику подбора синонимов, учитывающую широкий контекст.
  • Использование точного и недвусмысленного языка: Если вы используете термины, которые могут быть неоднозначными, предоставьте достаточный контекст (в любом месте релевантного блока текста), чтобы уточнить их значение. Это поможет избежать неверной интерпретации контента.
  • Анализ структуры запросов в нише: Изучайте, как пользователи формулируют длинные и сложные запросы. Понимание того, какие слова часто сопутствуют основным терминам (формируя Floating Context), поможет оптимизировать контент под эти контекстуальные паттерны.

Worst practices (это делать не надо)

  • Изолированное использование ключевых слов: Размещение ключевых слов без поддерживающего контекста. Система может не понять точное значение термина или не сможет валидировать его синонимы при сопоставлении с запросом.
  • Манипуляции с совместной встречаемостью (Co-occurrence manipulation): Искусственное насыщение текста несвязанными или слабо связанными терминами в попытке повлиять на контекст. Это может привести к размытию тематики и снижению качества контента.
  • Игнорирование семантической связи между терминами: Создание контента, где термины используются в неестественном или противоречивом контексте. Это может привести к тому, что система неверно интерпретирует интент запроса, соответствующего вашему контенту.

Стратегическое значение

Патент подтверждает стратегический приоритет Google на глубокое семантическое понимание языка, а не простое сопоставление ключевых слов. Система стремится понять точное значение каждого слова, основываясь на его окружении, даже если это окружение находится далеко. Для SEO это означает, что долгосрочная стратегия должна фокусироваться на построении сильных семантических связей внутри контента и развитии авторитетности в теме (Topical Authority), что обеспечивает необходимый контекст для интерпретации запросов.

Практические примеры

Сценарий: Разрешение неоднозначности аббревиатуры (на основе примера из патента)

Анализ запроса, где плавающий контекст определяет значение термина.

  1. Исходный запрос: "AA pet flight guidelines" (Правила перелета с животными AA).
  2. Целевой термин: "AA".
  3. Кандидаты в синонимы: "American Airlines" и "Alcoholics Anonymous".
  4. Анализ Adjacent Context: Соседний термин — "pet" (животное). Система определяет, что связь слабая. Confidence Value для обоих кандидатов не превышает порог.
  5. Анализ Floating Context: Не соседний термин — "flight" (полет).
  6. Оценка (American Airlines): Система проверяет пару "AA -> American Airlines" в контексте "flight". Confidence Value высокая (например, 0.9). Порог превышен.
  7. Оценка (Alcoholics Anonymous): Система проверяет пару "AA -> Alcoholics Anonymous" в контексте "flight". Confidence Value низкая (например, 0.1). Кандидат может быть классифицирован как Definitive Non-Synonym.
  8. Результат: Система валидирует "American Airlines" как синоним для "AA" в этом запросе и генерирует пересмотренный запрос: "American Airlines pet flight guidelines".

Вопросы и ответы

Что такое Floating Context и чем он отличается от Adjacent Context?

Adjacent Context (Смежный контекст) — это слова, стоящие непосредственно рядом с целевым термином в запросе (слева или справа), возможно, игнорируя стоп-слова. Floating Context (Плавающий контекст) — это слова, которые находятся в том же запросе, но не рядом с целевым термином. Ключевое отличие в том, что Floating Context позволяет учитывать влияние слов, расположенных далеко в запросе, для определения значения целевого термина.

Может ли Floating Context отменить решение, принятое на основе Adjacent Context?

Согласно описанному алгоритму, если Adjacent Context неубедителен (не дает высокой уверенности для синонима, но и не исключает его), система переходит к анализу Floating Context. Если Floating Context предоставляет сильный сигнал (высокий Confidence Value), который превышает порог, синоним будет принят. Таким образом, он может подтвердить синоним, который не был подтвержден ранее.

Что такое Definitive Non-Synonym?

Это ситуация, когда контекст запроса (смежный или плавающий) строго указывает на то, что определенный кандидат в синонимы не подходит для замены в данном конкретном случае. Например, если запрос содержит "AA meeting", контекстное слово "meeting" делает "American Airlines" окончательным не-синонимом (Definitive Non-Synonym) для термина "AA" в этом запросе.

Откуда берутся Confidence Values?

Патент не детализирует методику расчета Confidence Values, но указывает, что они хранятся в предварительно созданных базах данных. Эти значения рассчитываются офлайн путем статистического анализа больших объемов данных, таких как логи запросов (Query Logs), для определения частоты совместной встречаемости терминов в определенных контекстах.

Как этот патент влияет на оптимизацию под длинные (long-tail) запросы?

Влияние значительно. Длинные запросы содержат больше слов, что увеличивает вероятность наличия сильного Floating Context, который система использует для валидации интента. Для успешного ранжирования по таким запросам важно, чтобы контент страницы семантически соответствовал не только основному термину, но и всем контекстуальным словам в запросе.

Как SEO-специалист может оптимизировать контент с учетом этого патента?

Необходимо фокусироваться на создании семантически богатого контента, который обеспечивает сильный и однозначный контекст для основных терминов. Это достигается за счет естественного включения связанных сущностей, LSI-терминов и релевантных подтем по всему тексту. Чем четче контекст на странице, тем лучше Google сможет сопоставить его с контекстом в запросе пользователя.

Влияет ли этот механизм на обработку неоднозначных запросов?

Да, это одно из основных применений. Для неоднозначных терминов (например, "Apple", "Java", "Ягуар") именно контекст (часто плавающий) позволяет системе выбрать правильную интерпретацию и соответствующие синонимы. Например, слово "iPhone" в запросе обеспечит правильный контекст для "Apple", даже если эти слова стоят далеко друг от друга.

Использует ли система разные пороги уверенности для Adjacent и Floating Context?

Патент упоминает, что система может использовать разные пороговые значения (Thresholds) при оценке Confidence Values из базы данных Adjacent Context и базы данных Floating Context. Это позволяет более гибко настраивать чувствительность системы к разным типам контекстуальных сигналов.

Что происходит, если ни один контекст не дает высокой уверенности?

Если ни Adjacent Context, ни Floating Context не предоставляют Confidence Value выше порогового значения для кандидата в синонимы, этот кандидат не будет использоваться для переписывания запроса. Система будет использовать исходный термин запроса без расширения синонимами.

Актуален ли этот патент в эпоху нейронных сетей (BERT, MUM)?

Да, принцип абсолютно актуален. Хотя современные модели (BERT, MUM) используют более сложные механизмы внимания для анализа контекста всего предложения одновременно, фундаментальная идея, описанная в патенте, остается той же: значение слова определяется всем его окружением (контекстом), а не только ближайшими соседями.

Похожие патенты

Как Google использует контекст топ-результатов для валидации синонимов и расширения запросов
Google использует механизм для предотвращения ошибок при расширении запросов синонимами или однокоренными словами. Система генерирует потенциальные альтернативные термины, но добавляет их к запросу только если они подтверждаются контекстом. Контекст определяется анализом терминов, найденных в топовых результатах поиска по исходному запросу. Это гарантирует, что расширение запроса остается семантически релевантным.
  • US8055669B1
  • 2011-11-08
  • Семантика и интент

Как Google ограничивает использование синонимов, требуя сохранения исходного контекста фразы
Google классифицирует синонимы по степени надежности. Если синоним считается ненадежным или узкоконтекстным (Phrase-Restricted Substitute Term), он должен появиться в документе рядом с теми же соседними словами, что и в исходном запросе. Если это условие не выполняется, документ может быть исключен из ранжирования еще на этапе отбора кандидатов.
  • US20150205866A1
  • 2015-07-23
  • Семантика и интент

Как Google использует анализ совместной встречаемости слов для проверки синонимов и определения значимых контекстов запроса
Google анализирует, какие слова часто появляются вместе в поисковых запросах (совместная встречаемость), чтобы определить, является ли один термин хорошей заменой для другого (синонимом). Кроме того, система оценивает, насколько конкретный контекст (соседние слова) уточняет смысл запроса, и отфильтровывает неинформативные контексты для повышения точности понимания запросов.
  • US8682907B1
  • 2014-03-25
  • Семантика и интент

Как Google обучается распознавать синонимы, анализируя текст сниппетов в результатах поиска
Google использует текст сниппетов для улучшения систем понимания запросов. Анализируя, какие слова часто появляются в сниппетах релевантных или кликабельных результатов, система выявляет потенциальные синонимы для исходных ключевых слов. Это позволяет автоматически расширять будущие запросы, включая эти синонимы для повышения полноты выдачи.
  • US20140358904A1
  • 2014-12-04
  • Семантика и интент

  • SERP

Как Google динамически изменяет вес синонимов в ранжировании на основе поведения пользователей
Google не присваивает фиксированный вес синонимам (замещающим терминам) при ранжировании. Вес синонима динамически корректируется для каждого документа в зависимости от того, насколько релевантен исходный термин запроса этому документу. Эта релевантность определяется на основе поведенческих данных (клики, время просмотра), что позволяет точнее интерпретировать значение синонимов в контексте конкретной страницы.
  • US9116957B1
  • 2015-08-25
  • Поведенческие сигналы

  • Семантика и интент

  • SERP

Популярные патенты

Как Google использует контекст внешних страниц для понимания и идентификации видео и аудио контента
Google анализирует внешние веб-страницы, которые ссылаются на медиафайлы или встраивают их (например, видео YouTube). Система извлекает метаданные из контекста этих страниц — заголовков, окружающего текста, URL. Надежность данных проверяется частотой их повторения на разных сайтах. Эта информация используется для улучшения понимания содержания медиафайла и повышения эффективности систем идентификации контента (Content ID).
  • US10318543B1
  • 2019-06-11
  • Ссылки

  • Индексация

  • Мультимедиа

Как Google консолидирует сигналы ранжирования между мобильными и десктопными версиями страниц, используя десктопный авторитет для мобильного поиска
Патент Google описывает механизм для решения проблемы недостатка сигналов ранжирования в мобильном вебе. Система идентифицирует корреляцию между мобильной страницей и её десктопным аналогом. Если мобильная версия недостаточно популярна сама по себе, она наследует сигналы ранжирования (например, обратные ссылки и PageRank) от авторитетной десктопной версии, улучшая её позиции в мобильном поиске.
  • US8996514B1
  • 2015-03-31
  • Техническое SEO

  • Ссылки

Как Google комбинирует поведенческие сигналы из разных поисковых систем для улучшения ранжирования
Google использует механизм для улучшения ранжирования путем объединения данных о поведении пользователей (клики и время взаимодействия) из разных поисковых систем (например, Веб-поиск и Поиск по Видео). Если в основной системе данных недостаточно, система заимствует данные из другой, применяя весовой коэффициент и фактор сглаживания для контроля смещения и обеспечения релевантности.
  • US8832083B1
  • 2014-09-09
  • Поведенческие сигналы

  • SERP

Как Google определяет язык поискового запроса, используя язык интерфейса, статистику слов и поведение пользователей
Google использует вероятностную модель для точной идентификации языка поискового запроса. Система комбинирует три ключевых фактора: статистику частотности слов в разных языках, язык интерфейса пользователя (например, Google.fr) и исторические данные о том, на какие результаты пользователи кликали ранее. Это позволяет корректно обрабатывать многоязычные и неоднозначные запросы для применения правильных синонимов и стемминга.
  • US8442965B2
  • 2013-05-14
  • Мультиязычность

  • Поведенческие сигналы

Как Google использует внешние сигналы (соцсети, новости, блоги) для верификации реальной популярности контента и фильтрации накруток
Google верифицирует популярность контента (например, видео) проверяя, упоминается ли он на внешних источниках: блогах, новостных сайтах и в социальных сетях. Это позволяет формировать списки "популярного", отражающие подлинный широкий интерес, отфильтровывая контент с искусственно завышенными просмотрами или узконишевой популярностью. Система также учитывает географическую релевантность внешних упоминаний.
  • US9465871B1
  • 2016-10-11
  • Антиспам

  • SERP

  • Ссылки

Как Google анализирует распределение качества входящих ссылок для классификации и понижения сайтов в выдаче
Google использует систему для оценки качества ссылочного профиля сайта. Система фильтрует входящие ссылки (удаляя шаблонные и дублирующиеся с одного домена), группирует оставшиеся по качеству источника (например, Vital, Good, Bad) и вычисляет взвешенный «Link Quality Score». Если доля низкокачественных ссылок слишком велика, сайт классифицируется как низкокачественный и понижается в результатах поиска.
  • US9002832B1
  • 2015-04-07
  • Ссылки

  • Антиспам

  • SERP

Как Google использует социальные связи для обнаружения ссылочного спама и накрутки кликов
Google может анализировать связи между владельцами сайтов в социальных сетях, чтобы оценить независимость ссылок между их ресурсами. Если владельцы тесно связаны (например, друзья), ссылки между их сайтами могут получить меньший вес в ранжировании, а клики по рекламе могут быть классифицированы как спам (накрутка).
  • US8060405B1
  • 2011-11-15
  • Антиспам

  • Ссылки

  • SERP

Как Google использует модель D-Q-D и поведение пользователей для предложения разнообразных запросов, связанных с конкретными результатами поиска
Google использует модель "Документ-Запрос-Документ" (D-Q-D), построенную на основе данных о поведении пользователей (клики, время просмотра), для генерации связанных поисковых подсказок. Система предлагает альтернативные запросы, привязанные к конкретному результату, только если эти запросы ведут к новому, разнообразному набору документов, облегчая исследование смежных тем.
  • US8583675B1
  • 2013-11-12
  • Поведенческие сигналы

  • SERP

  • Семантика и интент

Как Google использует данные о поведении пользователей по похожим запросам для ранжирования новых или редких запросов
Google использует механизм для улучшения ранжирования запросов, по которым недостаточно данных о поведении пользователей (например, кликов). Система находит исторические запросы, семантически похожие на исходный, и «заимствует» их поведенческие данные. Степень сходства рассчитывается с учетом важности терминов, синонимов и порядка слов. Эти заимствованные данные используются для корректировки рейтинга документов по исходному запросу.
  • US9009146B1
  • 2015-04-14
  • Поведенческие сигналы

  • Семантика и интент

  • SERP

Как Google использует анализ сопутствующих ссылок (co-citation) и нормализацию веса для определения связанных сайтов и конкурентов
Google анализирует структуру ссылок для поиска сайтов, связанных с выбранным документом и находящихся на том же уровне обобщения (например, конкурентов). Система определяет, на какие еще сайты ссылаются источники, цитирующие исходный документ (co-citation). Для повышения точности вес ссылок нормализуется: снижается влияние множественных ссылок с одного хоста и ссылок со страниц-каталогов (хабов).
  • US6754873B1
  • 2004-06-22
  • Ссылки

  • SERP

  • Техническое SEO

seohardcore