SEO HARDCORE
  • Разборы патентов
    • Патенты Google
  • Скоро SEO инструменты
  • Скоро SEO аналитика
  • seohardcore
SEO HARDCORE
назад

Как Google обучается распознавать синонимы, анализируя текст сниппетов в результатах поиска

SYNONYM IDENTIFICATION BASED ON SELECTED SEARCH RESULT (Идентификация синонимов на основе выбранного результата поиска)
  • US20140358904A1
  • Google LLC
  • 2012-08-02
  • 2014-12-04
  • Семантика и интент
  • SERP
  • Описание
  • Разбор
  • Выводы
  • Практика
  • FAQ
  • Похожие

Google использует текст сниппетов для улучшения систем понимания запросов. Анализируя, какие слова часто появляются в сниппетах релевантных или кликабельных результатов, система выявляет потенциальные синонимы для исходных ключевых слов. Это позволяет автоматически расширять будущие запросы, включая эти синонимы для повышения полноты выдачи.

Описание

Какую проблему решает

Патент решает проблему точной идентификации релевантных синонимов (substitute terms) для терминов поискового запроса. Поскольку пользователи часто испытывают трудности с формулированием оптимальных запросов, системы поиска используют автоматическое расширение или переписывание запросов. Цель изобретения — улучшить качество этого процесса, используя анализ контента успешных результатов поиска для выявления и валидации потенциальных синонимов.

Что запатентовано

Запатентована система и метод для оценки терминов-кандидатов в качестве синонимов путем анализа текста, связанного с результатами поиска (в частности, сниппетов). Система идентифицирует термины, которые отсутствуют в исходном запросе, но присутствуют в сниппетах "выбранных" результатов. На основе этой информации система увеличивает association score (оценку ассоциации) между исходным термином запроса и найденным термином-кандидатом. Высокий association score позволяет использовать термин в качестве синонима при обработке будущих запросов.

Как это работает

Система анализирует результаты поиска постфактум (вероятно, в офлайн-режиме):

  • Выборка результатов: Определяется набор "выбранных" результатов для анализа. Это могут быть Топ-N результатов, результат, на который кликнул пользователь, или комбинация кликнутого результата и результатов выше него.
  • Идентификация терминов: В тексте сниппетов выбранных результатов система ищет термины, которых не было в исходном запросе.
  • Оценка и скоринг: Система использует различные эвристики для оценки значимости найденного термина:
    • Пропорциональный метод: Если термин встречается в значительном проценте сниппетов Топ-N результатов.
    • Сравнительный метод: Если термин есть в сниппете кликнутого результата, но отсутствует в сниппетах результатов, ранжирующихся выше (предполагая, что этот термин сделал результат более релевантным для пользователя).
  • Обновление оценки: Если условия выполнены, association score между термином запроса и термином-кандидатом увеличивается.
  • Применение: Накопленные association scores используются для создания правил синонимов (Synonym Rules), которые применяются Query Reviser Engine для переписывания будущих запросов.

Актуальность для SEO

Высокая. Понимание запросов и семантическое расширение являются ядром современного поиска. Методы, позволяющие Google автоматически изучать взаимосвязи между терминами на основе анализа контента и поведения пользователей, крайне актуальны. Этот патент описывает конкретный механизм обратной связи между качеством выдачи и пониманием запросов.

Важность для SEO

Патент имеет высокое значение для SEO. Он показывает, что контент, который Google выбирает для отображения в сниппете, используется не только для информирования пользователя (и влияния на CTR), но и как источник данных для обучения систем идентификации синонимов. Это подчеркивает важность семантической насыщенности текста и оптимизации сниппетов для включения релевантных связанных терминов.

Детальный разбор

Термины и определения

Association Score (Оценка ассоциации)
Числовая метрика, отражающая силу связи между исходным термином запроса и термином-кандидатом в синонимы. Чем выше оценка, тем вероятнее термин будет использован для расширения запроса.
Candidate Substitute Term (Термин-кандидат в синонимы)
Термин, найденный в тексте результата поиска (например, в сниппете), который потенциально может заменить или дополнить исходный термин запроса.
Query Logs (Журналы запросов)
База данных, хранящая историю поисковых запросов и информацию о взаимодействии пользователей с результатами.
Query Reviser Engine (Механизм пересмотра запросов)
Компонент поисковой системы, который генерирует пересмотренные (расширенные или измененные) запросы на основе исходного запроса и правил синонимов.
Selected Search Result (Выбранный результат поиска)
Результат поиска, выбранный для анализа. В патенте описаны разные критерии выбора: результат, выбранный пользователем (кликнутый); Топ-N ранжированных результатов; кликнутый результат и результаты, ранжирующиеся выше него.
Snippet (Сниппет)
Фрагмент текста, извлеченный из ресурса и отображаемый в результатах поиска. Является основным источником данных для анализа в этом патенте.
Synonym Engine (Механизм определения синонимов)
Компонент, который определяет синонимы для терминов запроса, используя Synonym Rules.
Synonym Rules (Правила синонимов)
База данных правил, определяющих, какие термины являются синонимами, часто с учетом контекста запроса. Эти правила могут основываться на накопленных association scores.

Ключевые утверждения (Анализ Claims)

Claim 1 (Независимый пункт): Описывает базовый метод работы системы.

  1. Система выбирает один или несколько результатов поиска из множества результатов, возвращенных в ответ на запрос.
  2. Идентифицирует термин, который (i) встречается в тексте, связанном с выбранными результатами, и (ii) отсутствует в исходном запросе.
  3. Увеличивает association score для этого термина как синонима (substitute term) для термина, присутствующего в исходном запросе.

Claim 2 (Зависимый): Уточняет, что анализируемый текст — это сниппет.

Claims 3, 4, 5 (Зависимые): Определяют три различных способа выбора результатов для анализа (selecting one or more search results):

  • Claim 3: Выбирается результат, на который кликнул пользователь (user-selected search result).
  • Claim 4: Выбираются Топ-N ранжированных результатов.
  • Claim 5: Выбирается результат, на который кликнул пользователь, И один или несколько результатов, ранжирующихся выше него.

Claim 6 (Зависимый от 5): Описывает логику увеличения оценки на основе пропорции (применительно к выборке из Claim 5).

  1. Определяется, включает ли сниппет каждого выбранного результата идентифицированный термин.
  2. Вычисляется пропорция выбранных результатов, сниппеты которых содержат этот термин.
  3. Association score увеличивается, если эта пропорция удовлетворяет пороговому значению.

Claim 7 (Зависимый от 5): Описывает логику увеличения оценки на основе сравнения кликнутого результата с вышестоящими (применительно к выборке из Claim 5).

  • Association score увеличивается в ответ на определение того, что идентифицированный термин встречается в кликнутом результате, НО не встречается в одном или нескольких результатах, ранжирующихся выше.

Claim 10 (Зависимый): Описывает цель всего процесса.

  • В ответ на будущий запрос, включающий исходный термин, система генерирует пересмотренный запрос (revised query), включающий идентифицированный термин (синоним), основываясь на увеличенном association score.

Где и как применяется

Изобретение описывает механизм обратной связи, который соединяет анализ результатов поиска с процессом понимания запросов. Это преимущественно офлайн-процесс анализа логов.

INDEXING – Индексирование (Анализ данных)
На этом этапе (в контексте анализа логов, а не сканирования веба) система обрабатывает сохраненные данные о поисковых сессиях. Она анализирует, какие результаты были показаны, какие сниппеты были сгенерированы, и как пользователи взаимодействовали с выдачей.

QUNDERSTANDING – Понимание Запросов (Обучение и Применение)

  1. Обучение (Офлайн): Система использует данные анализа логов для вычисления и обновления association scores между терминами. Эти оценки агрегируются и используются для генерации или обновления Synonym Rules.
  2. Применение (Онлайн): Когда пользователь вводит запрос, Synonym Engine и Query Reviser Engine используют эти правила для идентификации синонимов и генерации пересмотренных запросов (revised queries) в реальном времени.

RANKING – Ранжирование
Search Engine выполняет как исходный запрос, так и пересмотренные запросы для поиска кандидатов в результаты.

Входные данные:

  • Журналы запросов (Query Logs), включающие:
    • Исходные запросы.
    • Списки показанных результатов и их позиции.
    • Текст сниппетов, сгенерированных для этих результатов.
    • Данные о поведении пользователей (какие результаты были выбраны/кликнуты).

Выходные данные:

  • Обновленные association scores для пар терминов (запрос-синоним).
  • Обновленные Synonym Rules, используемые Synonym Engine.

На что влияет

  • Специфические запросы: Наибольшее влияние на запросы, где существует множество способов выражения одного и того же интента (информационные, некоторые коммерческие). Система учится связывать эти вариации.
  • Языковые особенности: Механизм позволяет системе адаптироваться к эволюции языка и сленга, автоматически выявляя новые синонимы по мере их появления в контенте и сниппетах.

Когда применяется

Алгоритм вычисления association scores применяется периодически в рамках офлайн-обработки журналов запросов.

Триггеры активации и пороговые значения: В патенте описаны несколько сценариев активации обновления оценки:

  1. Сценарий "Пропорция в Топе" (Claims 4, 6): Активируется, если термин появляется в сниппетах Топ-N результатов, и пропорция этих результатов превышает порог (например, 0.4 в патенте).
  2. Сценарий "Клик" (Claim 3): Активируется при наличии клика на результат, сниппет которого содержит термин-кандидат.
  3. Сценарий "Сравнение с вышестоящими" (Claims 5, 7): Активируется при клике на результат, если термин-кандидат присутствует в его сниппете, но отсутствует (или присутствует реже порогового значения, например, 0.3) в сниппетах результатов, ранжирующихся выше.

Пошаговый алгоритм

Процесс: Офлайн-анализ логов для обновления Association Scores

  1. Сбор данных: Система получает данные из Query Logs, включающие запрос, список результатов с их сниппетами и ранжированием, а также данные о кликах пользователей.
  2. Выбор стратегии анализа: Система применяет одну или несколько стратегий для анализа сессии (в патенте описаны варианты, которые могут использоваться параллельно или по отдельности).
    • Стратегия А (Топ-N): Выбираются Топ-N результатов.
    • Стратегия Б (Клик): Выбирается кликнутый результат.
    • Стратегия В (Клик и Выше): Выбирается кликнутый результат и все результаты выше него.
  3. Идентификация кандидатов: Для выбранных результатов система анализирует текст сниппетов. Идентифицируются термины, которые отсутствуют в исходном запросе (и не являются стоп-словами/blacklist).
  4. Применение логики скоринга: К идентифицированным терминам применяется логика для определения необходимости обновления оценки.
    • Для Стратегии А: Вычисляется пропорция результатов в Топ-N, содержащих термин. Если пропорция выше порога (например, >0.4), оценка увеличивается.
    • Для Стратегии Б: Если термин присутствует в сниппете кликнутого результата, оценка увеличивается.
    • Для Стратегии В: Оценка увеличивается, если термин присутствует в кликнутом результате, НО отсутствует или редко встречается (ниже порога, например, <0.3) в результатах выше него.
  5. Обновление Association Score: Для валидированных кандидатов система увеличивает association score между ними и терминами исходного запроса. Величина увеличения может зависеть от различных факторов (например, надежность пользователя, частота термина).
  6. Агрегация и генерация правил: Обновленные оценки агрегируются по множеству сессий. На их основе генерируются или обновляются Synonym Rules.

Какие данные и как использует

Данные на входе

  • Контентные факторы: Текст сниппетов (Snippet). Это ключевой элемент анализа. Также косвенно используется текст заголовков (title), хотя сниппеты упоминаются как основной источник.
  • Поведенческие факторы: Выбор пользователя (user-selected search result) или клик. Используется для определения релевантности результата и для сравнительного анализа (Claim 5).
  • Технические факторы: Ранжирование результатов. Позиция результата используется для определения Топ-N (Claim 4) и для идентификации результатов, ранжирующихся выше кликнутого (Claim 5).
  • Системные данные: Исходный поисковый запрос (search query). Журналы запросов (Query Logs). Существующие association scores и Synonym Rules. Списки исключений (blacklist/стоп-слова).

Какие метрики используются и как они считаются

  • Association Score: Основная метрика, которая инкрементально обновляется по результатам анализа.
  • Пропорция присутствия (Proportion): Доля результатов в анализируемой выборке (например, Топ-N или результаты выше клика), сниппеты которых содержат термин-кандидат. Proportion=Кол-во результатов с термином в сниппетеОбщее кол-во анализируемых результатовProportion = \frac{\text{Кол-во результатов с термином в сниппете}}{\text{Общее кол-во анализируемых результатов}}
  • Пороговые значения (Thresholds): Используются для принятия решения об увеличении оценки. В патенте приведены примеры порогов:
    • Порог для Стратегии А (Топ-N): > 0.4.
    • Порог для Стратегии В (Сравнение): < 0.3 (термин должен редко встречаться выше клика).

Выводы

  1. Сниппеты как обучающие данные: Патент четко демонстрирует, что текст, отображаемый в сниппетах, используется Google как источник данных для обучения систем понимания языка (NLP), в частности, для идентификации синонимов. Качество генерации сниппетов напрямую влияет на обучение системы.
  2. Автоматическое изучение семантики: Система способна автоматически выявлять семантические связи между терминами без ручного вмешательства, основываясь на том, как эти термины совместно встречаются в релевантном контенте.
  3. Важность поведения пользователей: Поведение пользователей (клики) используется для валидации синонимов. Особенно интересен сравнительный метод (Claim 7): если пользователь пропустил верхние результаты и кликнул на нижний, термины в сниппете нижнего результата, которых не было выше, получают сильный сигнал подтверждения как релевантные синонимы.
  4. Множественность подходов к идентификации: Google не полагается на один метод. Патент описывает как минимум три разных подхода к анализу (Топ-N, Клик, Сравнение клика с вышестоящими), что обеспечивает более надежное и разностороннее выявление синонимов.
  5. Контекстуальность синонимов: Хотя это не является ядром Claims 1-7, в описании упоминается, что Synonym Rules могут зависеть от контекста запроса (например, "cats" как животные vs. "cats musical"). Association scores могут агрегироваться для конкретных контекстов (например, только для запросов, где термин сопровождается определенными словами).

Практика

Best practices (это мы делаем)

  • Оптимизация сниппетов через контент: Обеспечьте, чтобы текст на странице (особенно в начале документа или в ключевых блоках, откуда часто формируются сниппеты) был семантически насыщен. Включайте естественные синонимы, связанные термины (LSI/related entities) и релевантные определения рядом с основными ключевыми словами. Это повышает вероятность их попадания в сниппет и, как следствие, их распознавания системой как substitute terms.
  • Анализ сниппетов конкурентов: Изучайте, какие сниппеты генерирует Google для Топ-N результатов по вашим целевым запросам. Определяйте термины, которые часто встречаются в этих сниппетах, но которые вы не используете активно. Это потенциальные синонимы, которые Google уже ассоциирует с запросом.
  • Фокус на релевантности и полноте ответа: Создавайте контент, который полностью отвечает на интент запроса. Если ваш результат более полно отвечает на запрос, чем вышестоящие конкуренты, и это отражено в сниппете, клик пользователя на ваш результат поможет системе связать новые термины из вашего сниппета с исходным запросом (Сценарий В).
  • Использование структурированных данных и определений: Четкие определения и структурированные списки часто попадают в сниппеты. Используйте их для внедрения ключевых связанных понятий, которые могут быть идентифицированы как синонимы.

Worst practices (это делать не надо)

  • "Вода" и неинформативный текст: Если текст на странице размыт и не содержит конкретики, это приведет к формированию некачественных сниппетов, которые не содержат полезных терминов-кандидатов. Система не сможет извлечь из них данные для обучения.
  • Манипуляция сниппетами (Cloaking/Скрытый текст): Попытки искусственно насытить текст терминами, которые нерелевантны содержанию страницы, могут привести к санкциям и не дадут долгосрочного эффекта, так как система валидирует синонимы через агрегацию данных и поведение пользователей.
  • Игнорирование семантического окружения: Оптимизация только под точное вхождение ключевого слова без учета синонимов и связанных понятий. Это ограничивает потенциал страницы для ранжирования по расширенным запросам и снижает её ценность как источника данных для Synonym Engine.

Стратегическое значение

Патент подтверждает стратегическую важность семантического поиска и автоматизированного понимания языка. Для SEO это означает, что работа над контентом должна выходить за рамки подбора ключевых слов и фокусироваться на темах, сущностях и их взаимосвязях. Качество и информативность сниппета приобретают дополнительное измерение: это не только инструмент привлечения трафика, но и способ коммуникации с алгоритмами машинного обучения Google, показывающий семантическое поле вашего контента.

Практические примеры

Сценарий 1: Идентификация синонима через анализ Топ-N (Стратегия А)

  1. Запрос: "питание для собак"
  2. Анализ Топ-3: Google анализирует сниппеты.
    • Сниппет 1 содержит: "корм", "рацион", "витамины".
    • Сниппет 2 содержит: "корм", "диета", "здоровье".
    • Сниппет 3 содержит: "корм", "рацион", "ингредиенты".
  3. Идентификация: Термин "корм" встречается в 3/3 сниппетов (100%). Термин "рацион" в 2/3 (67%).
  4. Действие системы: Поскольку пропорция для "корм" и "рацион" превышает порог (например, 0.4), Google увеличивает association score для пар ("питание"-"корм") и ("питание"-"рацион").
  5. Результат для SEO: Если ваш сайт оптимизирован под "корм для собак", он получает больше шансов ранжироваться по запросу "питание для собак", и наоборот. Необходимо убедиться, что оба термина присутствуют в вашем контенте и могут попасть в сниппет.

Сценарий 2: Идентификация синонима через сравнительный анализ (Стратегия В)

  1. Запрос: "как настроить роутер"
  2. Анализ выдачи:
    • Результаты 1 и 2 (Высокоранжированные): Сниппеты содержат общие фразы о подключении к сети.
    • Результат 3 (Клик пользователя): Сниппет содержит термины "SSID", "пароль администратора", "DHCP".
  3. Идентификация: Пользователь пропустил результаты 1 и 2 и кликнул на 3. Термины "SSID" и "DHCP" присутствуют в кликнутом результате, но отсутствуют в вышестоящих.
  4. Действие системы: Google увеличивает association score для пар ("настроить роутер"-"SSID") и ("настроить роутер"-"DHCP").
  5. Результат для SEO: Страницы, содержащие конкретные технические термины, релевантные задаче, обучают систему тому, что эти термины являются важными синонимами или компонентами интента. Необходимо включать такую специфику в контент.

Вопросы и ответы

Что такое Association Score в контексте этого патента?

Это метрика, которая показывает, насколько сильно Google ассоциирует два термина: один из исходного запроса и другой, найденный в сниппетах. Чем выше этот балл, тем вероятнее, что второй термин будет считаться синонимом первого. Эта оценка обновляется инкрементально на основе анализа множества поисковых сессий.

Какие именно части результатов поиска анализирует система?

Патент акцентирует внимание на анализе сниппетов (snippets) как основном источнике данных. Однако упоминается, что может использоваться и другой связанный текст (associated text), такой как заголовки (titles) или даже текст самого ресурса, но фокус сделан именно на сниппетах.

Как система решает, какие результаты анализировать?

Патент описывает три основных метода выборки: анализ Топ-N лучших результатов; анализ результата, на который кликнул пользователь; и анализ кликнутого результата вместе со всеми результатами, которые ранжировались выше него. Эти методы могут использоваться для разных целей при идентификации синонимов.

Чем отличается метод анализа Топ-N от метода анализа кликов?

Метод Топ-N ищет термины, которые часто встречаются в сниппетах высокоранжированных результатов (консенсус качества). Метод анализа кликов, особенно сравнительный (Claim 7), ищет термины, которые присутствовали в кликнутом результате, но отсутствовали выше. Это помогает выявить "недостающие" термины, которые сделали результат более релевантным для пользователя, несмотря на более низкий ранг.

Как это влияет на мою SEO-стратегию по работе с контентом?

Это подчеркивает критическую важность семантической насыщенности текста. Ваш контент должен содержать не только основные ключевые слова, но и релевантные синонимы, связанные понятия и сущности. Это увеличивает вероятность их попадания в сниппет, что, в свою очередь, помогает Google понять семантический охват вашей страницы и обучает его системы синонимов.

Нужно ли мне специально оптимизировать Meta Description, чтобы повлиять на эту систему?

Хотя Meta Description может использоваться как сниппет, Google часто генерирует сниппеты динамически из контента страницы. Поэтому более надежная стратегия — оптимизировать сам контент страницы, особенно те его части, которые с наибольшей вероятностью будут выбраны для сниппета (первые абзацы, списки, определения). Убедитесь, что они информативны и содержат релевантные термины.

Может ли эта система ошибочно принять случайное слово за синоним?

Теоретически может, но система использует механизмы защиты. Во-первых, используются списки исключений (стоп-слова, общие фразы). Во-вторых, association score накапливается агрегированно по множеству запросов и пользователей. Случайные совпадения не достигнут высокого кумулятивного балла, необходимого для формирования правила синонима (Synonym Rule).

Происходит ли этот анализ в реальном времени при моем запросе?

Нет. Анализ сниппетов и обновление association scores — это офлайн-процесс обработки журналов запросов. В реальном времени система использует уже готовые правила синонимов (Synonym Rules), которые были сформированы на основе этого анализа ранее, чтобы переписать ваш запрос.

Как система определяет, к какому именно слову в запросе относится найденный синоним?

Патент не детализирует этот механизм глубоко, но упоминает использование существующих оценок ассоциации, частей речи и контекста. Например, если в сниппете присутствуют все слова запроса, кроме одного, а вместо него присутствует новый термин, система может ассоциировать новый термин именно с отсутствующим словом запроса.

Что означают пороговые значения 0.4 и 0.3, упомянутые в патенте?

Это примеры порогов для принятия решений. Например, 0.4 может означать, что термин должен появиться в более чем 40% сниппетов Топ-N, чтобы считаться синонимом (Стратегия А). А 0.3 может означать, что если термин встречается менее чем в 30% сниппетов выше кликнутого результата, но есть в самом кликнутом, он также считается важным (Стратегия В). Эти числа являются примерами и могут настраиваться.

Похожие патенты

Как Google использует данные о кликах и пропусках для валидации и удаления неэффективных синонимов в поиске
Google постоянно тестирует правила подстановки (синонимы) для расширения запросов. Этот патент описывает механизм оценки эффективности этих правил с помощью анализа поведения пользователей (клики и пропуски результатов). Если пользователи часто пропускают результаты, содержащие подставленный термин, система автоматически удаляет это правило, очищая понимание запросов от нерелевантных синонимов.
  • US8965875B1
  • 2015-02-24
  • Поведенческие сигналы

  • Семантика и интент

  • EEAT и качество

Как Google автоматически оценивает и удаляет неэффективные синонимы и правила расширения запросов
Google использует механизм для оценки эффективности правил подстановки (синонимов). Если подставленный термин редко встречается в топовых результатах поиска или если пользователи не кликают на результаты, содержащие этот термин, система автоматически удаляет или понижает уверенность в этом правиле. Это позволяет поддерживать качество и точность понимания запросов.
  • US8600973B1
  • 2013-12-03
  • Семантика и интент

  • Поведенческие сигналы

  • SERP

Как Google использует анализ контента в топе выдачи для активации "слабых" синонимов и уточнения запроса
Google анализирует термины, которые необычно часто встречаются в первоначальных результатах поиска (сверхпредставленные термины). Если такой термин является потенциальным, но слабым синонимом для слова из запроса, система активирует эту связь и перезапускает поиск с уточненным запросом. Это позволяет контекстуально улучшать запрос на лету, используя специализированную лексику, доминирующую в нише.
  • US9152698B1
  • 2015-10-06
  • Семантика и интент

  • SERP

Как Google идентифицирует лексические синонимы (стемминг, акронимы, аббревиатуры) и агрессивно использует их для расширения запросов
Патент описывает гибридную систему Google для генерации синонимов, комбинирующую статистический анализ логов запросов и лингвистический анализ. Ключевая особенность — механизм повышенного доверия к лексическим вариантам (например, словам с общим корнем, акронимам, разному написанию). Если система обнаруживает лексическую связь, она снижает статистические пороги, необходимые для валидации синонима, что позволяет агрессивнее расширять запрос пользователя.
  • US9183297B1
  • 2015-11-10
  • Семантика и интент

Как Google может генерировать альтернативные запросы из контента страниц и встраивать их в сниппеты
Google использует механизм для помощи пользователям в уточнении их поискового намерения. Система анализирует текст веб-страниц в результатах поиска и находит фразы, похожие на исходный запрос или характеризующие документ. Эти фразы затем встраиваются непосредственно в сниппеты как кликабельные предложения для нового поиска, облегчая навигацию и уточнение запроса.
  • US9183323B1
  • 2015-11-10
  • Семантика и интент

  • SERP

Популярные патенты

Как Google использует цитирования на веб-страницах для ранжирования книг в основной выдаче
Google использует механизм для определения релевантных книг по общим информационным запросам, даже если пользователь не искал книгу специально. Система анализирует, какие книги цитируются на топовых веб-страницах в выдаче. Книги получают оценку, основанную на авторитетности цитирующих страниц и контексте цитирования, и затем подмешиваются в результаты поиска.
  • US8392429B1
  • 2013-03-05
  • Ссылки

  • SERP

  • EEAT и качество

Как Google использует историю запросов в текущей сессии и статистические паттерны для переранжирования результатов
Google анализирует миллионы прошлых поисковых сессий, выявляя статистически значимые последовательности запросов («Пути Запросов»), которые заканчиваются кликом на определенный URL («Конечная Точка Контента»). Когда текущая сессия пользователя совпадает с историческим путем, Google переранжирует результаты, повышая те URL, которые исторически удовлетворяли пользователей в аналогичном контексте, пропорционально вероятности их выбора.
  • US7610282B1
  • 2009-10-27
  • Поведенческие сигналы

  • SERP

  • Семантика и интент

Как Google использует время пребывания на странице (Dwell Time) для оценки качества и корректировки ранжирования
Google анализирует продолжительность визитов пользователей на страницы из результатов поиска (Dwell Time). Система рассчитывает метрику, сравнивающую количество «длинных кликов» (длительных визитов) с общим количеством кликов для конкретного документа по конкретному запросу. Этот показатель используется как сигнал качества, независимый от позиции в выдаче, для повышения или понижения документа в ранжировании.
  • US8661029B1
  • 2014-02-25
  • Поведенческие сигналы

  • SERP

Как Google использует клики и пропуски пользователей для оценки и корректировки правил близости терминов (Proximity Rules)
Google анализирует поведение пользователей для оценки эффективности правил близости (Proximity Rules), которые влияют на ранжирование в зависимости от расстояния между ключевыми словами на странице. Система отслеживает, кликают ли пользователи на результаты, где термины расположены далеко друг от друга, или пропускают их. На основе этих данных (Click Count, Skip Count) вычисляется оценка качества правила, что позволяет Google динамически адаптировать важность фактора близости.
  • US9146966B1
  • 2015-09-29
  • Поведенческие сигналы

  • SERP

Как Google использует "ложные пропуски" (Fake Skips) для точной оценки качества своих правил синонимов
Google анализирует поведение пользователей для оценки качества синонимов, используемых при переписывании запросов. Патент вводит метрику "Fake Skip" (Ложный пропуск). Она фиксируется, если пользователь пропустил результат с синонимом, но кликнул на результат ниже, который также содержит этот синоним и исходный термин. Это позволяет точнее калибровать систему синонимов и не пессимизировать хорошие правила из-за неоднозначного поведения пользователей.
  • US8909627B1
  • 2014-12-09
  • Поведенческие сигналы

  • Семантика и интент

  • SERP

Как Google выбирает каноническую (основную) версию документа, основываясь на авторитетности источника и полноте контента
Google использует систему для выбора канонической (основной) версии документа среди его дубликатов. Система присваивает «приоритет авторитетности» каждой версии, основываясь на источнике (например, официальный издатель) и праве публикации. Основной версией выбирается та, которая имеет высокий авторитет и является полной. При отсутствии идеального варианта выбирается версия с наибольшим объемом информации (например, самая длинная или с наибольшим PageRank).
  • US8095876B1
  • 2012-01-10
  • EEAT и качество

  • Техническое SEO

  • Ссылки

Как Google использует длительность кликов, Pogo-Sticking и уточнение запросов для оценки качества поиска (Click Profiles)
Google анализирует поведение пользователей после клика для оценки удовлетворенности. Система создает «Профили взаимодействия» (Click Profiles), учитывая длительность клика (Dwell Time), возврат к выдаче (Pogo-Sticking) и последующее уточнение запроса. Эти данные используются для сравнения эффективности алгоритмов ранжирования и выявления спама или кликбейта.
  • US9223868B2
  • 2015-12-29
  • Поведенческие сигналы

  • SERP

  • Антиспам

Как Google использует контекст текущей сессии и поведение похожих пользователей для персонализации и переранжирования выдачи
Google анализирует недавнюю активность пользователя (запросы и клики в рамках сессии), чтобы определить его краткосрочный интерес. Система сравнивает, как другие пользователи с таким же интересом взаимодействовали с результатами по текущему запросу, по сравнению с общим поведением. Если предпочтения статистически значимо различаются, Google переранжирует выдачу, повышая результаты, предпочитаемые «похожей» аудиторией, учитывая при этом время взаимодействия с контентом (Dwell Time).
  • US8972391B1
  • 2015-03-03
  • Персонализация

  • Поведенческие сигналы

  • SERP

Как Google использует внешние сигналы (соцсети, новости, блоги) для верификации реальной популярности контента и фильтрации накруток
Google верифицирует популярность контента (например, видео) проверяя, упоминается ли он на внешних источниках: блогах, новостных сайтах и в социальных сетях. Это позволяет формировать списки "популярного", отражающие подлинный широкий интерес, отфильтровывая контент с искусственно завышенными просмотрами или узконишевой популярностью. Система также учитывает географическую релевантность внешних упоминаний.
  • US9465871B1
  • 2016-10-11
  • Антиспам

  • SERP

  • Ссылки

Как Google интегрирует поиск в инструменты создания контента и использует распространение ссылок для расчета репутации автора
Google разработал систему (UDS), интегрирующую поиск в инструменты создания контента (Email, блоги, форумы). Система автоматически уточняет запросы на основе контекста и профилей пользователей. Если автор вставляет ссылку, а читатель кликает по ней, Google использует это взаимодействие для расчета «оценки репутации» автора и как поведенческий сигнал качества контента.
  • US7844603B2
  • 2010-11-30
  • Ссылки

  • Поведенческие сигналы

  • EEAT и качество

seohardcore