SEO HARDCORE
  • Разборы патентов
    • Патенты Google
  • Скоро SEO инструменты
  • Скоро SEO аналитика
  • seohardcore
SEO HARDCORE
назад

Как Google использует анализ окончаний запросов (суффиксов) для улучшения работы Автокомплита, игнорируя начало запроса

GENERATING WORD COMPLETIONS BASED ON SHARED SUFFIX ANALYSIS (Генерация вариантов завершения слов на основе анализа общих суффиксов)
  • US8417718B1
  • Google LLC
  • 2011-09-21
  • 2013-04-09
  • Описание
  • Разбор
  • Выводы
  • Практика
  • FAQ
  • Похожие

Google использует механизм для улучшения подсказок Автокомплита (Search Suggest), фокусируясь на окончании (суффиксе) запроса. Если начало запроса редкое или неоднозначное, система ищет популярные прошлые запросы с похожими окончаниями, но разными началами. Это позволяет предлагать релевантные подсказки, основываясь на том, как пользователи обычно заканчивают схожие по структуре запросы.

Описание

Какую проблему решает

Патент решает проблему неэффективности традиционных систем автозаполнения (Autocomplete/Search Suggest) в ситуациях, когда начало вводимого пользователем запроса (префикс) является редким, неоднозначным или содержит ошибки. Традиционные системы ищут прошлые запросы, которые начинаются точно так же, как введенный префикс. Если таких запросов мало, система не может предложить качественные подсказки. Изобретение улучшает пользовательский опыт, предлагая варианты завершения, основываясь на анализе окончания запроса (суффикса), даже если начало запроса нестандартное.

Что запатентовано

Запатентована система генерации подсказок для автозаполнения, которая анализирует схожесть суффиксов (окончаний) между текущим частичным запросом (partial query) и прошлыми уникальными запросами из логов. Ключевая особенность — система специально ищет прошлые запросы, чьи префиксы не совпадают с префиксом текущего запроса, но чьи суффиксы похожи. Это позволяет системе предлагать завершения, основываясь на популярных паттернах в конце запросов, игнорируя нестандартное начало.

Как это работает

Механизм работает следующим образом:

  • Разделение запроса: Частичный запрос пользователя разделяется на префикс (начало) и суффикс (конец).
  • Фильтрация по префиксу: Система отбирает из логов прошлые уникальные запросы, чьи префиксы не включают префикс текущего запроса.
  • Оценка схожести суффиксов: Рассчитываются Suffix Similarity Scores для определения степени схожести окончаний отобранных запросов с текущим суффиксом.
  • Выбор кандидатов: Отбираются Candidate Queries с наивысшими оценками схожести (например, имеющие 2 или 3 общих термина).
  • Расчет оценок завершения: Для уникальных вариантов суффиксов (Unique Suffixes) рассчитываются Completion Scores, основанные на популярности (Query Popularity Score) соответствующих запросов-кандидатов в логах.
  • Выбор подсказки: Суффиксы с наивысшими Completion Scores выбираются в качестве подсказок для автозаполнения.

Актуальность для SEO

Высокая. Автозаполнение является критически важной функцией поисковых систем, особенно на мобильных устройствах. Обработка сложных, длинных или нестандартно сформулированных запросов остается актуальной задачей. Описанный механизм, позволяющий игнорировать начало запроса и фокусироваться на его окончании для определения интента, вероятно, является частью современного комплекса алгоритмов Google Autocomplete для обработки сложных случаев.

Важность для SEO

Влияние на SEO умеренное (4/10). Патент не описывает алгоритмы ранжирования документов. Он полностью сосредоточен на функциональности поисковых подсказок (Autocomplete). Для SEO-стратегии это имеет значение в контексте исследования ключевых слов и оптимизации под автозаполнение (ACO – Autocomplete Optimization). Патент показывает, как формируются пользовательские запросы, и подчеркивает важность понимания популярных шаблонов запросов (особенно суффиксов) в различных нишах.

Детальный разбор

Термины и определения

Partial Query (Частичный запрос)
Запрос, вводимый пользователем до момента его отправки в поисковую систему. Может содержать незавершенный последний термин (Incomplete Term).
Prefix (Префикс)
Последовательность одного или нескольких терминов в начале запроса.
Suffix (Суффикс)
Последовательность одного или нескольких терминов в конце запроса. Префикс предшествует суффиксу.
Unique Query (Уникальный запрос)
Запрос из логов прошлых поисковых сессий (Log Files), используемый как источник данных для генерации подсказок.
Suffix Similarity Score (Оценка схожести суффиксов)
Метрика, определяющая степень сходства между суффиксом частичного запроса и суффиксом уникального запроса. Может рассчитываться на основе количества общих терминов или сравнения канонических форм.
Candidate Queries (Запросы-кандидаты)
Уникальные запросы, отобранные на основе высоких Suffix Similarity Scores, чьи префиксы не содержат префикс частичного запроса.
Unique Suffixes (Уникальные суффиксы)
Сгруппированные и нормализованные суффиксы из списка Candidate Queries.
Query Popularity Score (Оценка популярности запроса)
Метрика, указывающая на частоту использования уникального запроса в логах.
Completion Score (Оценка завершения)
Итоговая метрика для Unique Suffixes, представляющая вероятность того, что данный суффикс является подходящим завершением для частичного запроса. Рассчитывается как агрегация Query Popularity Scores соответствующих Candidate Queries.

Ключевые утверждения (Анализ Claims)

Claim 1 (Независимый пункт): Описывает основной метод генерации подсказок.

  1. Определяются префикс и суффикс частичного запроса.
  2. Рассчитываются Suffix Similarity Scores для уникальных запросов (из логов). Ключевое условие: рассматриваются только те запросы, чьи префиксы не включают префикс частичного запроса как подстроку.
  3. На основе этих оценок отбираются Candidate Queries.
  4. Рассчитываются Completion Scores для Unique Suffixes среди отобранных кандидатов.
  5. На основе Completion Scores выбираются термины из уникальных суффиксов в качестве предлагаемых подсказок.

Ядро изобретения — это целенаправленный поиск подсказок среди запросов, которые не начинаются так же, как текущий запрос, но имеют схожее окончание. Это отличает данный метод от стандартного автозаполнения на основе префиксов.

Claim 6 (Зависимый): Детализирует процесс выбора Candidate Queries, описывая механизм с пороговыми значениями и фолбэком (резервным вариантом).

  1. Идентифицируется первый набор кандидатов, чьи суффиксы имеют как минимум три общих термина с суффиксом частичного запроса.
  2. Идентифицируется второй набор кандидатов, чьи суффиксы имеют как минимум два общих термина.
  3. Если первый набор (3 совпадения) не пуст, он используется для генерации подсказок. Если он пуст, используется второй набор (2 совпадения).

Этот механизм позволяет системе сначала искать наиболее точные совпадения по суффиксу, но при их отсутствии снижать требования к точности, чтобы все равно предложить подсказки.

Claim 7 (Зависимый): Определяет способ расчета Completion Scores.

  1. Для Candidate Queries рассчитываются Query Popularity Scores, отражающие их частоту в логах прошлых запросов.
  2. Completion Scores для Unique Suffixes рассчитываются с использованием этих оценок популярности.

Это означает, что предпочтение отдается тем вариантам завершения, которые основаны на более популярных запросах в прошлом.

Где и как применяется

Изобретение применяется на этапе взаимодействия пользователя с поисковой строкой, до выполнения основного поиска.

QUNDERSTANDING – Понимание Запросов (Этап формирования запроса / Autocomplete)

Это основная область применения патента, конкретно в компонентах Autocompletion Engine и Query Completion Engine.

  • Взаимодействие: Система работает в реальном времени, когда пользователь вводит partial query. Она взаимодействует с хранилищем логов запросов (Log Files) для поиска кандидатов.
  • Процесс: Система использует описанный алгоритм анализа суффиксов для генерации альтернативных вариантов завершения, когда стандартные методы (основанные на совпадении префиксов) могут не давать хороших результатов (например, из-за редкости префикса).

Входные данные:

  • Частичный запрос (Partial Query) пользователя.
  • База данных прошлых уникальных запросов (Log Files) с их оценками популярности (Query Popularity Scores).

Выходные данные:

  • Список предлагаемых вариантов завершения запроса (Suggested Query Completions), отсортированный по Completion Score.

На что влияет

  • Специфические запросы: Наибольшее влияние оказывается на длинные (long-tail) или сложные запросы, где начало запроса может быть уникальным, редким или содержать ошибки, но окончание соответствует распространенному шаблону (например, запрос о редком объекте с типичным намерением: "[редкое название лекарства] побочные эффекты").
  • Пользовательский опыт: Ускоряет ввод запросов и помогает пользователям формулировать свои потребности, особенно в темах, с которыми они плохо знакомы.

Когда применяется

  • Условия работы: Алгоритм работает в реальном времени по мере ввода пользователем частичного запроса.
  • Триггеры активации: Он может работать параллельно со стандартными механизмами префиксного совпадения или активироваться, когда стандартные методы не дают хороших результатов. Ключевое условие активации этого конкретного алгоритма — поиск кандидатов, чей префикс не совпадает с текущим.
  • Пороговые значения: Используются пороги для определения схожести суффиксов (минимум 2 или 3 общих термина, как описано в Claim 6).

Пошаговый алгоритм

Процесс генерации подсказок на основе анализа суффиксов:

  1. Получение и разделение: Система получает частичный запрос. Определяются его префикс и суффикс. (Например, суффикс может быть определен как последние N слов).
  2. Фильтрация уникальных запросов: Система обращается к логам и ищет уникальные прошлые запросы, чей префикс не содержит префикс частичного запроса как подстроку.
  3. Расчет схожести суффиксов: Для отфильтрованных запросов рассчитываются Suffix Similarity Scores. Это может включать канонизацию суффиксов (стемминг, удаление стоп-слов, синонимы) перед сравнением.
  4. Выбор кандидатов (Иерархический подход с фолбэком):
    1. Система пытается найти первый набор Candidate Queries, чьи суффиксы имеют минимум 3 общих термина с суффиксом частичного запроса.
    2. Если первый набор найден, он используется далее.
    3. Если первый набор пуст, система ищет второй набор Candidate Queries с минимум 2 общими терминами.
  5. Группировка суффиксов: Суффиксы отобранных Candidate Queries нормализуются и группируются для формирования списка Unique Suffixes.
  6. Расчет оценок завершения: Для каждого Unique Suffix рассчитывается Completion Score. Это делается путем агрегации Query Popularity Scores всех Candidate Queries, которые содержат этот уникальный суффикс.
  7. Ранжирование и выбор: Unique Suffixes ранжируются по Completion Score. Один или несколько лучших суффиксов выбираются в качестве подсказок. Может применяться порог уверенности (например, упоминается z-test), чтобы убедиться, что лучший результат значительно превосходит остальные.
  8. Предоставление подсказок: Выбранные термины отправляются пользователю для отображения в интерфейсе Автокомплита.

Какие данные и как использует

Данные на входе

Патент фокусируется на обработке запросов и не использует стандартные факторы ранжирования контента.

  • Поведенческие факторы: Критически важные данные. Система использует логи прошлых запросов (Log Files) для идентификации Unique Queries и определения их частоты (Query Popularity Score).
  • Пользовательские данные (Ввод): Частичный запрос (Partial Query), вводимый пользователем в реальном времени.

Информация о контентных, технических, ссылочных, временных или географических факторах ранжирования в патенте отсутствует.

Какие метрики используются и как они считаются

  • Suffix Similarity Score: Метрика схожести окончаний запросов. Рассчитывается путем сравнения терминов в суффиксах. Учитывает количество общих терминов (2 или 3) и их порядок. Использует NLP-техники (канонизация, стемминг, удаление стоп-слов) для нормализации перед сравнением.
  • Query Popularity Score (PS): Частота уникального запроса в логах.
  • Completion Score (CS): Оценка вероятности завершения. Рассчитывается для каждого Unique Suffix (S). В примере, приведенном в патенте, используется формула нормализации в вероятность: CS(S) — это сумма PS всех запросов-кандидатов, содержащих суффикс S, деленная на сумму PS всех запросов-кандидатов. CS(S)=∑Q∈Candidates(S)PS(Q)∑Q∈AllCandidatesPS(Q)CS(S) = \frac{\sum_{Q \in Candidates(S)} PS(Q)}{\sum_{Q \in AllCandidates} PS(Q)}
  • Пороговые значения схожести: Минимальное количество общих терминов в суффиксах (2 или 3 термина).

Выводы

  1. Autocomplete не ограничивается префиксным совпадением: Google использует сложные механизмы для генерации подсказок. Данный патент описывает конкретный метод, основанный на анализе суффиксов, который дополняет стандартное автозаполнение.
  2. Обработка редких и неоднозначных префиксов: Основная цель этого механизма — предоставить полезные подсказки, когда начало запроса (префикс) является редким или необычным. Система может эффективно игнорировать префикс и фокусироваться на намерении, выраженном в суффиксе.
  3. Активное исключение совпадений по префиксу: Ключевой особенностью является то, что система ищет только те прошлые запросы, чьи префиксы не совпадают с текущим. Это направлено на поиск альтернативных, но релевантных по окончанию вариантов.
  4. Популярность как решающий фактор: При наличии нескольких подходящих вариантов завершения выбор делается на основе Query Popularity Score (частоты использования в прошлом). Чем популярнее шаблон запроса, тем выше вероятность его появления в подсказках.
  5. Иерархическое совпадение суффиксов (Фолбэк): Система предпочитает более длинные совпадения суффиксов (например, 3 термина), но имеет резервный механизм для использования более коротких совпадений (например, 2 термина), если длинных недостаточно. Это обеспечивает баланс между точностью и охватом.

Практика

Best practices (это мы делаем)

Хотя патент не влияет на ранжирование, он критически важен для исследования ключевых слов и Autocomplete Optimization (ACO).

  • Анализ популярных суффиксов в нише (ACO): SEO-специалистам следует изучать, как пользователи обычно заканчивают свои запросы. Определите общие суффиксы, связанные с намерением (например, "...цена", "...отзывы", "...инструкция", "...своими руками"). Понимание этих шаблонов критично для понимания интента.
  • Исследование ключевых слов на основе шаблонов: Используйте знание популярных суффиксов для расширения семантического ядра. Если суффикс (интент) популярен, убедитесь, что у вас есть контент, охватывающий различные темы (префиксы) в сочетании с этим суффиксом.
  • Оптимизация под естественные формулировки запросов: Создавайте контент, который соответствует популярным шаблонам запросов, выявленным через анализ Autocomplete. Это увеличивает вероятность того, что ваш контент будет релевантен запросам, которые пользователи в конечном итоге отправят, сформировав их с помощью подсказок.

Worst practices (это делать не надо)

  • Игнорирование Long-Tail запросов и их структуры: Сосредоточение только на высокочастотных "головных" терминах (префиксах) и игнорирование модификаторов (суффиксов) приведет к потере видимости по естественным запросам.
  • Предположение о простоте Autocomplete: Нельзя считать, что Autocomplete работает только по принципу "запрос должен начинаться с...". Понимание суффиксного анализа позволяет глубже понять логику подсказок.
  • Манипуляции с Автокомплитом: Попытки искусственно накрутить Query Popularity Score для попадания в подсказки не являются надежной стратегией и могут быть расценены как спам.

Стратегическое значение

Патент подтверждает важность понимания естественных языковых шаблонов и поведения пользователей при поиске. Он влияет на ландшафт трафика, формируя то, какие именно запросы пользователи отправляют в поисковую систему. Система Автокомплита стремится направить пользователя к наиболее часто используемым формулировкам, и стратегически важно оптимизировать контент именно под эти популярные интенты и формулировки.

Практические примеры

Сценарий: Подсказка для редкого объекта с общим интентом

  1. Вводимый запрос (Partial Query): Пользователь ищет информацию о редкой модели принтера и вводит: "принтер Xerxes 9910Z как заправить к"
  2. Проблема: Префикс "принтер Xerxes 9910Z" встречается очень редко. Стандартный автокомплит может не найти популярных запросов, начинающихся с этих слов.
  3. Применение патента: Система анализирует суффикс: "как заправить к". Она ищет популярные запросы с другими префиксами, но схожими суффиксами.
  4. Поиск кандидатов:
    • "принтер HP Laserjet как заправить картридж" (Высокая популярность)
    • "принтер Canon Pixma как заправить краску" (Средняя популярность)
  5. Расчет Completion Score: Суффикс "как заправить картридж" имеет значительно более высокую совокупную популярность.
  6. Результат (Подсказка): Система предлагает завершение "картридж". Итоговая подсказка: "принтер Xerxes 9910Z как заправить картридж".

Пример из патента:

  • Пользователь вводит: large houses for sale in scotland with l
  • Система анализирует суффикс: sale in scotland with l
  • Система находит прошлые запросы с похожим суффиксом, но другим префиксом, например: property for sale in scotland with land (Префикс "property for" отличается от "large houses for").
  • Система определяет, что land является самым популярным завершением для этого суффикса.
  • Пользователю предлагается подсказка: large houses for sale in scotland with land.

Вопросы и ответы

Влияет ли этот патент на алгоритмы ранжирования сайтов?

Нет, этот патент не описывает, как Google ранжирует веб-страницы. Он полностью посвящен работе системы автозаполнения (Google Autocomplete), которая помогает пользователям сформулировать запрос до того, как он будет отправлен в поисковую систему. Он влияет на то, какие запросы пользователи в итоге отправят.

В чем ключевое отличие этого метода от стандартного Автокомплита?

Стандартный Автокомплит ищет популярные запросы, которые начинаются так же, как введенный пользователем текст (совпадение префикса). Описанный метод делает обратное: он ищет запросы, чьи префиксы не совпадают, но чьи окончания (суффиксы) похожи. Это позволяет давать подсказки, когда начало запроса редкое или неоднозначно.

Как система определяет, что суффиксы похожи?

Патент предлагает конкретную эвристику (Claim 6): суффиксы считаются похожими, если они содержат определенное количество общих терминов в том же порядке. Приоритет отдается совпадению 3 и более терминов. Если таких совпадений нет, система использует резервный вариант и ищет совпадения 2 терминов.

Как система выбирает, какую подсказку показать, если найдено несколько вариантов?

Выбор основан на популярности (Query Popularity Score). Система анализирует логи прошлых запросов и определяет, как часто встречался тот или иной вариант завершения. Чем чаще запрос использовался в прошлом, тем выше его Completion Score и тем вероятнее он будет показан в качестве подсказки.

Как SEO-специалисты могут использовать информацию из этого патента?

Информация полезна для исследования ключевых слов и оптимизации под автозаполнение (ACO). Специалисты должны анализировать популярные суффиксы в своей нише, чтобы понять общие намерения пользователей (например, "...обзор", "...цена"). Это позволяет создавать контент, соответствующий популярным шаблонам запросов, к которым Google направляет пользователей.

Работает ли этот механизм, если пользователь еще не закончил вводить последнее слово?

Да. Патент учитывает, что суффикс частичного запроса может заканчиваться неполным термином (incomplete term). Система ищет кандидатов, чей суффикс содержит термин, начинающийся с этого неполного термина, и предлагает его завершение (как в примере с "...with l" и "land").

Учитывает ли система синонимы или ошибки при сравнении суффиксов?

Да, в патенте упоминается возможность использования правил канонизации (canonicalization rules) при расчете Suffix Similarity Score. Канонизация может включать стемминг, удаление стоп-слов, перестановку слов и замену терминов синонимами, что позволяет системе распознавать похожие по смыслу суффиксы.

Как этот патент влияет на стратегию продвижения по Long-Tail запросам?

Он подчеркивает важность общих модифицирующих шаблонов, которые часто находятся в конце длинных запросов. Для успешного продвижения по Long-Tail необходимо понимать эти популярные суффиксы и интегрировать их в контент-стратегию, так как они отражают конкретные намерения пользователей.

Что такое "Query Popularity Score"?

Это оценка популярности запроса, которая определяется путем подсчета количества раз, когда этот запрос появлялся в логах поисковой системы. Это показатель частотности запроса, используемый для определения важности потенциальной подсказки.

Стоит ли пытаться манипулировать этими подсказками?

Попытки манипулировать Автокомплитом путем искусственного повышения Query Popularity Score не рекомендуются. Это неэффективно в долгосрочной перспективе и может быть расценено Google как спам. Лучшая стратегия — фокусироваться на создании качественного контента, отвечающего на реальные популярные запросы.

Похожие патенты

Как Google находит и предлагает более эффективные формулировки запросов через каноникализацию и оценку полезности
Google использует механизм для улучшения поисковых подсказок (Autocomplete). Система определяет запросы, которые имеют идентичную каноническую форму (тот же базовый интент после нормализации), но структурно отличаются от вводимого текста. Среди этих альтернатив выбираются те, которые исторически приводили к более высокой удовлетворенности пользователей (Query Utility Score), и предлагаются для повышения качества поиска.
  • US8868591B1
  • 2014-10-21
  • Семантика и интент

Как Google переписывает частичные запросы для улучшения подсказок Autocomplete, если стандартных вариантов недостаточно
Патент описывает механизм работы Google Autocomplete для сложных или редких запросов. Если система не находит достаточно качественных или популярных подсказок для введенного текста, она переписывает частичный запрос. Это включает классификацию терминов на обязательные и опциональные, удаление менее важных слов или замену слов на синонимы. Это позволяет предложить пользователю релевантные и популярные полные запросы, даже если они не идеально соответствуют тому, что было введено изначально.
  • US9235654B1
  • 2016-01-12
  • Семантика и интент

Как Google консолидирует оценки популярности и фильтрует подсказки в Autocomplete для оптимизации выдачи
Google использует механизм консолидации оценок в Autocomplete: популярность длинных запросов суммируется с популярностью их коротких префиксов. Это позволяет точнее определить реальный спрос. Затем система фильтрует список, предпочитая более длинные и информативные подсказки коротким, если длинная подсказка составляет значительную часть популярности короткой, оптимизируя интерфейс пользователя.
  • US8713042B1
  • 2014-04-29
  • SERP

Как Google Autocomplete обрезает начало длинных фраз, чтобы показать популярные подсказки
Google использует механизм для улучшения подсказок в Autocomplete. Если пользователь вводит длинную или редкую фразу, которая не дает хороших подсказок, система удаляет начальные слова (префикс) и ищет подсказки для оставшейся части (суффикса). Это гарантирует показ популярных запросов, основанных на логах поиска, даже если пользователь начал ввод нетипичным образом.
  • US9031970B1
  • 2015-05-12
Как Google использует префиксный индекс для формирования подсказок URL и запросов в Autocomplete
Google использует систему интерактивных подсказок (Autocomplete), которая предлагает как завершение запроса, так и прямые URL-адреса по мере ввода пользователем префикса. Система заранее создает индекс, анализируя популярные сайты и связывая префиксы с наиболее релевантными URL на основе анкорных текстов, заголовков, доменных имен и поисковых запросов пользователей.
  • US10592573B1
  • 2020-03-17
  • Индексация

  • SERP

Популярные патенты

Как Google предсказывает, какие сайты будут интересны пользователю на основе его контекста (местоположение, время, интересы) без поискового запроса
Google использует агрегированные данные о поведении пользователей для прогнозирования контента. Система анализирует контекст пользователя (местоположение, время, интересы, историю) и определяет, какие сайты посещают похожие пользователи в аналогичном контексте значительно чаще, чем пользователи в целом. Этот механизм позволяет предлагать релевантный контент без явного запроса (например, в Google Discover).
  • US9195703B1
  • 2015-11-24
  • Персонализация

  • Поведенческие сигналы

  • Семантика и интент

Как Google использует социальный граф и активность друзей для персонализации и переранжирования результатов поиска
Google использует данные из социального графа пользователя и активность его контактов (лайки, шеры, комментарии, плейлисты) для изменения ранжирования результатов поиска. Контент, одобренный социальным окружением, повышается в выдаче и сопровождается аннотациями, объясняющими причину повышения и указывающими на свежесть социального действия.
  • US8959083B1
  • 2015-02-17
  • Персонализация

  • Поведенческие сигналы

  • SERP

Как Google определяет географическую зону релевантности бизнеса на основе реального поведения пользователей (Catchment Areas)
Google определяет уникальную "зону охвата" (Catchment Area) для локального бизнеса, анализируя, из каких географических точек пользователи кликали на его результаты в поиске. Эта динамическая зона заменяет фиксированный радиус и используется для фильтрации кандидатов при локальном поиске, учитывая известность бренда, категорию бизнеса и физические препятствия.
  • US8775434B1
  • 2014-07-08
  • Local SEO

  • Поведенческие сигналы

Как Google обучает ИИ-модели для автоматической оценки качества сайтов на основе данных асессоров и предвзятой выборки
Патент Google, описывающий фундаментальную методологию создания систем оценки качества сайтов. Google использует машинное обучение (например, SVM), чтобы найти корреляции между оценками асессоров и измеримыми сигналами сайта (PageRank, клики). Для повышения точности применяется метод «предвзятой выборки» (Biased Sampling): система намеренно собирает больше оценок для сайтов среднего качества («сложных случаев»), чем для очевидно плохих или хороших.
  • US8442984B1
  • 2013-05-14
  • SERP

  • EEAT и качество

  • Поведенческие сигналы

Как Google использует историю запросов, сделанных на Картах, для ранжирования локальных результатов и рекламы
Google анализирует, что пользователи ищут, когда просматривают определенную географическую область на карте (Viewport). Эта агрегированная история запросов используется для определения популярности локальных бизнесов и контента в этом конкретном районе. Результаты, которые часто запрашивались в этой области, особенно недавно, получают значительное повышение в ранжировании.
  • US9129029B1
  • 2015-09-08
  • Local SEO

  • Поведенческие сигналы

  • Свежесть контента

Как Google вычисляет оценку качества сайта на основе соотношения брендового интереса и общего поискового трафика
Google использует поведенческие данные для расчета оценки качества сайта (Site Quality Score). Метрика основана на соотношении количества уникальных запросов, направленных конкретно на сайт (брендовый/навигационный интерес), к общему количеству уникальных запросов, которые привели пользователей на этот сайт. Высокий показатель этого соотношения свидетельствует о высоком качестве и авторитетности сайта.
  • US9031929B1
  • 2015-05-12
  • Поведенческие сигналы

  • EEAT и качество

Как Google A/B тестирует и оптимизирует сниппеты (заголовки, описания, изображения) для повышения CTR
Google использует механизм для оптимизации отображения контента (сниппетов). Система показывает разные варианты заголовков, описаний или изображений для одной и той же ссылки разным пользователям или на разных платформах. Затем она измеряет кликабельность (CTR) каждого варианта и выбирает наиболее эффективный для дальнейшего использования, учитывая также тип устройства пользователя.
  • US9569432B1
  • 2017-02-14
  • SERP

  • Поведенческие сигналы

  • Персонализация

Как Google предсказывает следующий запрос пользователя на основе контента текущей страницы и исторических данных
Google использует машинное обучение для анализа логов поведения пользователей, чтобы понять, что они ищут после посещения определенного контента. Система создает совместное векторное пространство (joint embedding) для документов и запросов, где близость отражает семантическую связь и вероятность совместной встречаемости. Это позволяет предлагать релевантные последующие запросы (query suggestions) в реальном времени, даже если ключевые слова для этих запросов на странице отсутствуют.
  • US9594851B1
  • 2017-03-14
  • Семантика и интент

  • Поведенческие сигналы

  • Персонализация

Как Google автоматически генерирует блоки "Связанные ссылки" и "Похожие запросы", анализируя контент страницы при загрузке
Патент описывает систему для динамической генерации виджетов связанных ссылок. При загрузке страницы система извлекает текст (заголовок, контент, запрос из реферера), определяет наиболее важные ключевые слова с помощью глобального репозитория (Keyword Repository), выполняет поиск по этим словам (часто в пределах того же домена) и отображает топовые результаты для улучшения навигации.
  • US9129009B2
  • 2015-09-08
  • Ссылки

  • Семантика и интент

  • Техническое SEO

Как Google вычисляет тематический авторитет автора (Author Rank) на основе его вклада в контент
Google патентует систему для количественной оценки экспертности авторов по конкретным темам. Система анализирует документы, определяет их тематику (Topic) и вес этой тематики (Weight), а затем учитывает долю вклада (Authorship Percentage) каждого автора в раскрытие этой темы. На основе этих данных формируется кумулятивный «Сигнал Авторитета» (Authority Signature) автора, позволяющий идентифицировать экспертов в различных областях.
  • US8458196B1
  • 2013-06-04
  • EEAT и качество

  • Семантика и интент

seohardcore