Как Google автоматически дополняет запросы пользователя терминами из его недавней истории поиска для уточнения интента

REVISING SEARCH QUERIES (Пересмотр поисковых запросов)

US9449095B1
Google LLC
2012-12-31
2016-09-20

Google использует механизм для улучшения релевантности результатов путем анализа недавней истории поиска пользователя. Если текущий запрос похож на предыдущие, система определяет ключевые контекстные термины, которые часто повторялись в истории (устойчивый интент), но отсутствуют в текущем запросе. Эти термины автоматически добавляются к запросу, чтобы предоставить более точные и персонализированные результаты.

Какую проблему решает

Патент решает проблему неоднозначных, неполных или слишком общих запросов, которые пользователи часто вводят в процессе исследования темы (поисковой сессии). Текущий запрос может не содержать важного контекста (например, бренда или местоположения), который присутствовал в предыдущих запросах этого же пользователя. Система стремится улучшить релевантность поисковой выдачи, автоматически специализируя текущий запрос пользователя, используя этот неявный контекст.

Что запатентовано

Запатентована система пересмотра запросов (Query Revision Engine), которая анализирует текущий запрос в контексте недавней истории поиска того же пользователя. Суть изобретения заключается в методе идентификации устойчивого интента: система добавляет к текущему запросу только те термины из истории, которые отсутствуют в текущем запросе И появляются в пороговом количестве (threshold number) других различных запросов в этой истории.

Как это работает

Система работает следующим образом:

Получение контекста: Анализируется текущий запрос и недавняя история поиска пользователя (идентифицированного по Cookie или Login ID).
Определение схожести: Система определяет, похож ли текущий запрос на один из предыдущих (по совпадению терминов, пересечению результатов или совместным кликам).
Идентификация контекстных терминов: Находятся термины, присутствующие в похожем предыдущем запросе, но отсутствующие в текущем.
Проверка устойчивости (Threshold Check): Ключевой шаг — проверка, появляются ли эти термины в достаточном количестве (threshold number) других различных (distinct) запросов в истории пользователя.
Пересмотр запроса: Если порог достигнут, термины добавляются к текущему запросу. Они часто получают пониженный вес (lower weight) или помечаются как необязательные (optional term).
Выполнение поиска: Поиск осуществляется по пересмотренному, более точному запросу.

Актуальность для SEO

Высокая. Понимание контекста поисковой сессии (session-based context), намерений пользователя и персонализация выдачи являются центральными задачами современных поисковых систем. Этот механизм описывает конкретный способ использования ближайшей истории поиска для повышения релевантности в реальном времени.

Важность для SEO

Патент имеет значительное влияние на SEO (7.5/10). Он демонстрирует, как Google автоматически специализирует общие запросы на основе немедленного контекста пользователя, изменяя фактический запрос, по которому происходит ранжирование. Это означает, что персонализированная выдача может сильно отличаться от "чистой". Для SEO-специалистов это подчеркивает критическую важность понимания и оптимизации под весь путь пользователя (User Journey) и смежные интенты, а не только под изолированные ключевые слова.

Термины и определения

Current/Original Search Query (Текущий/Исходный поисковый запрос): Запрос, введенный пользователем в данный момент, который потенциально будет пересмотрен.
Distinct Search Queries (Различные поисковые запросы): Запросы в истории пользователя, которые отличаются друг от друга хотя бы одним термином (не являющимся стоп-словом).
Optional Term (Необязательный термин): Термин, добавленный к запросу, присутствие которого в документе не является обязательным для соответствия запросу.
Previously Submitted Search Queries (Ранее отправленные поисковые запросы / История поиска): Набор запросов, отправленных тем же пользователем, часто в пределах недавнего временного окна (recent time window) или сессии.
Query Revision Engine (Система пересмотра запросов): Компонент поисковой системы, отвечающий за модификацию входящих запросов до их обработки основным поисковым движком.
Revised Search Query (Пересмотренный поисковый запрос): Новый запрос, сгенерированный путем добавления контекстных терминов к исходному запросу.
Similarity (Схожесть запросов): Метрика, определяющая связь между двумя запросами. Может основываться на совпадении терминов, пересечении поисковых результатов (overlap) или совместном выборе одних и тех же ресурсов пользователями (co-selection/co-click).
Threshold Number (Пороговое количество): Минимальное количество других различных (distinct) запросов в истории пользователя, в которых должен появиться термин, чтобы он считался устойчивым контекстом и был добавлен к текущему запросу.
Weight (Вес термина): Значение, присваиваемое термину в запросе. Добавленным терминам может присваиваться меньший вес при ранжировании, чем терминам исходного запроса.

Ключевые утверждения (Анализ Claims)

Claim 1 (Независимый пункт): Описывает основной метод пересмотра запроса на основе истории пользователя.

Система получает текущий запрос (Current Search Query) от пользователя.
Определяется, что текущий запрос похож на первый ранее отправленный запрос из истории того же пользователя. Схожесть определяется как минимум по совпадению хотя бы одного термина.
Идентифицируется второй (контекстный) термин, который удовлетворяет условиям: (i) он появляется в первом ранее отправленном запросе, (ii) он отсутствует в текущем запросе, и (iii) (Ключевое условие) он появляется в пороговом количестве (threshold number) других различных (distinct) запросов в истории этого пользователя.
Генерируется пересмотренный запрос (Revised Search Query) путем добавления второго термина к текущему запросу.
Получаются результаты поиска для пересмотренного запроса и предоставляются пользователю в ответ на исходный запрос.

Claim 3 (Зависимый): Уточняет контекст истории.

История поиска ограничивается запросами, отправленными пользователем в течение недавнего временного окна (recent time window). Это фокусирует механизм на контексте текущей сессии.

Claims 4 и 5 (Зависимые): Расширяют определение схожести запросов.

Помимо совпадения терминов (Claim 1), схожесть может определяться на основе того, что пользователи часто выбирали одни и те же ресурсы в ответ на оба запроса (Claim 4, co-selection/co-click), или на основе пересечения результатов поиска по обоим запросам (Claim 5, overlap).

Claims 6 и 7 (Зависимые): Описывают механизмы "смягчения" добавленного контекста.

Добавленный термин может быть идентифицирован как необязательный (optional term) с помощью оператора (Claim 6). Также ему может быть присвоен пониженный вес (weight), чтобы он имел меньшее значение при расчете оценки ранжирования, чем термины исходного запроса (Claim 7).

Claim 8 (Зависимый): Уточняет метод идентификации пользователя.

Определение того, что запросы принадлежат одному пользователю, основывается на совпадении идентификаторов cookie или login identifier.

Где и как применяется

Изобретение применяется на этапе интерпретации запроса, до основного процесса ранжирования.

QUNDERSTANDING – Понимание Запросов
Это основной этап применения патента. Query Revision Engine перехватывает входящий запрос и анализирует его в контексте данных о пользователе в реальном времени.

Контекстуализация: Система извлекает недавнюю историю поиска пользователя (Previously Submitted Search Queries).
Анализ и Переписывание: Система применяет алгоритм для определения схожести и идентификации устойчивых контекстных терминов. Если условия выполняются, генерируется Revised Search Query. Это процесс персонализации запроса на основе сессии.

RANKING – Ранжирование
На этом этапе используется уже пересмотренный запрос. Если к запросу были добавлены термины с пониженным весом или как необязательные, система ранжирования учитывает эти модификаторы при расчете Scores для ресурсов.

Входные данные:

Текущий поисковый запрос (Original Search Query).
Идентификатор пользователя (Cookie ID, Login ID).
История недавних поисковых запросов пользователя.
(Опционально) Данные о кликах (co-selection data) и пересечении результатов (SERP overlap) для определения схожести запросов.

Выходные данные:

Пересмотренный поисковый запрос (Revised Search Query), потенциально с модифицированными весами терминов, передаваемый в систему ранжирования.

На что влияет

Специфические запросы: Наибольшее влияние оказывается на общие, неоднозначные или неполные запросы, которые следуют за серией уточняющих запросов по определенной теме. Например, после серии запросов о конкретном бренде, общий запрос о продукте может быть автоматически сужен до этого бренда.
Конкретные ниши или тематики: Особенно актуально в E-commerce (поиск продуктов одного бренда или категории) и в нишах, требующих глубокого исследования: планирование путешествий, образование, сложные технические темы.
Пользовательские факторы: Критически зависит от наличия истории поиска у пользователя. Пользователи с богатой недавней историей увидят более персонализированные результаты, чем новые пользователи или пользователи в режиме инкогнито.

Когда применяется

Алгоритм применяется при выполнении строгого набора условий:

Наличие истории: У пользователя есть достаточная недавняя история поиска в рамках recent time window.
Триггер схожести: Текущий запрос похож на один из предыдущих запросов (по терминам, результатам или кликам).
Идентификация контекста: В похожем предыдущем запросе есть термины, отсутствующие в текущем запросе.
Пороговое значение (Threshold): Эти контекстные термины встречаются в пороговом количестве (Threshold Number) других различных (distinct) запросов в истории пользователя. Это подтверждает устойчивый интент.

Пошаговый алгоритм

Процесс обработки запроса в реальном времени:

Получение данных: Система получает текущий запрос, идентифицирует пользователя и извлекает его недавнюю историю поиска.
Определение схожести: Текущий запрос сравнивается с запросами в истории. Проверяется совпадение терминов и, опционально, данные co-click или SERP overlap.
Проверка наличия схожих запросов: Если схожих запросов нет, обработать исходный запрос стандартным способом. Если есть, перейти к следующему шагу.
Идентификация кандидатов: Для схожего запроса из истории определяются термины-кандидаты (те, которые отсутствуют в текущем запросе).
Проверка устойчивости интента (Threshold Check): Для каждого термина-кандидата подсчитывается, в скольких других различных запросах в истории он встречается.
Выбор контекстных терминов: Отбираются термины, которые превысили пороговое количество.
Генерация пересмотренного запроса: Отобранные контекстные термины добавляются к текущему запросу.
Корректировка весов (Опционально): Добавленным терминам присваивается пониженный вес или статус необязательного термина.
Выполнение поиска: Пересмотренный запрос отправляется в систему ранжирования, результаты возвращаются пользователю.

Какие данные и как использует

Данные на входе

Патент фокусируется исключительно на данных, связанных с поведением пользователя и его запросами.

Поведенческие факторы:
- История поисковых запросов (Search History): Критически важные данные. Анализируется текст ранее отправленных запросов для выявления контекста и устойчивого интента.
- Данные о кликах/выборах (Selection Data): Могут использоваться для определения схожести между запросами (co-selection/co-click).
Пользовательские факторы:
- Идентификаторы пользователя (Cookie ID, Login ID): Используются для связывания текущего запроса с историей поиска того же пользователя.
Временные факторы:
- Временное окно (Time Window): История поиска ограничивается недавним периодом (recent time window) для определения контекста текущей сессии.

Какие метрики используются и как они считаются

Threshold Number (Пороговое количество): Ключевая метрика патента. Заданное значение (в патенте приводятся примеры 2, 3 или 4), определяющее минимальное количество различных запросов в истории, в которых должен появиться термин. Определяет "устойчивость" контекста.
Similarity (Схожесть запросов): Рассчитывается на основе одного или нескольких методов:
- Совпадения терминов (Term matching) – требуется как минимум одно совпадение согласно Claim 1.
- Пересечения результатов поиска (SERP Overlap).
- Совместного выбора ресурсов (Co-selection).
Term Weight (Вес термина): Метрика, используемая для снижения влияния добавленного контекстного термина на ранжирование по сравнению с исходными терминами запроса.

Персонализация на уровне сессии: Патент описывает механизм глубокой краткосрочной персонализации. Google активно использует контекст недавних действий пользователя (сессии), чтобы автоматически уточнить и специализировать его текущие запросы.
Идентификация "Устойчивого Интента" (Persistent Intent): Ключевым механизмом является не простое добавление слов из предыдущего запроса, а требование, чтобы контекстный термин повторялся в пороговом количестве (Threshold Number) различных запросов. Это позволяет выявить основную тему или задачу сессии (например, бренд, местоположение).
Схожесть запросов шире, чем совпадение слов: Хотя базовое требование (Claim 1) — это совпадение термина, система также может определять схожесть по поведению пользователей (co-click) и пересечению выдачи (SERP overlap), что указывает на семантическую связь.
Баланс между контекстом и интентом: Система предусматривает "мягкое" включение контекста. Добавленные термины могут быть помечены как необязательные (optional) или иметь пониженный вес (weight), чтобы не исказить основной интент текущего запроса.
Важность User Journey для SEO: Понимание полного пути пользователя и того, как различные запросы связаны в рамках одной сессии, становится критически важным. Оптимизация под изолированные ключевые слова становится менее эффективной.

Best practices (это мы делаем)

Оптимизация под поисковые сессии (User Journey Mapping): Анализируйте не только отдельные ключевые слова, но и последовательности запросов, которые пользователи используют при исследовании темы. Убедитесь, что ваш сайт предоставляет контент, удовлетворяющий смежные и последующие интенты в рамках одной сессии. Это увеличит вероятность релевантности вашего контента автоматически уточненным запросам.
Построение тематического авторитета (Topical Authority): Создавайте кластеры контента, которые широко охватывают тему. Если пользователь исследует вашу нишу, его общие запросы будут автоматически уточняться Google. Авторитетный ресурс с широким охватом имеет больше шансов соответствовать этим специализированным (пересмотренным) запросам.
Усиление и узнаваемость бренда (в E-commerce): Бренды часто выступают в роли устойчивого контекста. Если ваш бренд силен, пользователи будут чаще включать его в запросы. Система идентифицирует этот контекст и сможет автоматически добавлять название вашего бренда к общим запросам пользователя, направляя трафик к вам.
Оптимизация под длиннохвостые запросы: Поскольку система автоматически добавляет контекстные термины, итоговый запрос часто становится более длинным и специфичным. Убедитесь, что ваш контент оптимизирован для соответствия таким специализированным интентам.

Worst practices (это делать не надо)

Изолированная оптимизация под ВЧ запросы: Фокусировка исключительно на высокочастотных общих запросах без учета контекста. Если пользователь находится в определенной сессии, Google перепишет этот общий запрос, и ваш контент может оказаться нерелевантным новому контексту.
Создание поверхностного контента: Контент, отвечающий только на один узкий вопрос и не покрывающий связанные аспекты темы, не сможет удовлетворить пересмотренные запросы, включающие дополнительный контекст из сессии пользователя.
Игнорирование комплексного интента и пути пользователя: Непонимание того, как пользователи итеративно ищут информацию в вашей нише, приведет к созданию контента, который не соответствует реальным потребностям сессии.

Стратегическое значение

Патент подтверждает стратегический фокус Google на понимании контекста за пределами буквальной строки запроса и на глубокой персонализации. Успех в SEO все больше зависит от способности удовлетворить потребности пользователя на протяжении всего цикла исследования темы (User Journey). Системы, подобные описанной, требуют от SEO-специалистов перехода от статического анализа ключевых слов к динамическому анализу интентов и сессий. Стратегия должна быть направлена на создание хабов контента, которые удовлетворяют устойчивый интент пользователя.

Практические примеры

Сценарий 1: Планирование путешествия

История пользователя:
- Запрос 1: "flights to Rome"
- Запрос 2: "best time to visit Rome"
- Запрос 3: "Colosseum tickets Rome"
Текущий запрос: "weather forecast" (общий запрос)
Анализ системы:
- Схожесть: Текущий запрос может быть признан похожим на Запрос 2 (интент планирования, возможно через co-click данные).
- Контекстный термин: "Rome".
- Проверка порога (допустим, порог=2): "Rome" появляется в Запросе 1 и Запросе 3. Порог достигнут.
Пересмотренный запрос: "weather forecast Rome".
Результат: Пользователь видит прогноз погоды для Рима, что соответствует его текущей задаче.

Сценарий 2: Покупка электроники (Строгое соответствие Claim 1)

История пользователя:
- Запрос 1: "best mirrorless cameras for video"
- Запрос 2: "Sony A7S III video specs"
- Запрос 3: "Panasonic Lumix GH6 vs Sony A7S III"
Текущий запрос: "Sony A7S III price"
Анализ системы:
- Схожесть: Текущий запрос похож на Запрос 2 и 3 (совпадение термина "Sony A7S III").
- Контекстный термин: "video".
- Проверка порога (допустим, порог=2): "video" появляется в Запросе 1 и Запросе 2. Порог достигнут.
Пересмотренный запрос: "Sony A7S III price video" (термин video может иметь пониженный вес).
Результат: В выдаче могут быть повышены результаты, которые не только указывают цену, но и упоминают комплектации или аксессуары, полезные для видеосъемки.

Как именно система определяет, что два запроса похожи?

Патент описывает три метода. Основной (согласно Claim 1) — это наличие хотя бы одного общего термина между текущим и предыдущим запросом. Дополнительно система может анализировать поведение пользователей: если они часто кликают на одни и те же результаты в ответ на оба запроса (co-selection/co-click). Третий метод — пересечение результатов поиска (SERP overlap): если выдача по обоим запросам содержит много одинаковых документов.

Что такое "пороговое количество" (Threshold Number) и почему оно важно?

Threshold Number – это минимальное число других различных (distinct) запросов в истории пользователя, в которых должен появиться контекстный термин. Это ключевой элемент патента для выявления устойчивого интента. Он нужен, чтобы система не добавляла случайные слова, а выделяла только те термины, которые отражают основную тему текущей поисковой сессии.

Насколько сильно добавленные термины влияют на выдачу?

Влияние может быть значительным, так как запрос становится более специфичным. Однако патент предусматривает механизмы защиты от искажения основного интента. Добавленные термины могут быть помечены как необязательные (optional term) или им может быть присвоен пониженный вес (weight) по сравнению с терминами, которые ввел пользователь.

Какой период истории поиска анализируется?

Патент упоминает "недавнее временное окно" (recent time window). Это указывает на то, что система фокусируется на контексте текущей поисковой сессии или истории за короткий период (например, часы), а не на всей истории поиска пользователя за длительный период. Это позволяет адаптировать результаты к сиюминутным задачам.

Как этот патент влияет на стратегию сбора семантического ядра?

Он снижает значимость изолированного анализа ключевых слов и повышает важность анализа пути пользователя (User Journey). Необходимо понимать, какие запросы пользователи задают до, во время и после целевого запроса. Исследование должно фокусироваться на выявлении контекста сессии и связанных интентов, а также на длиннохвостых запросах, так как система фактически превращает короткие запросы в длиннохвостые автоматически.

Может ли этот механизм помочь моему сайту, если он авторитетен в нише (Topical Authority)?

Да. Если ваш сайт является авторитетным источником по теме (например, "ремонт iPhone"), и пользователь исследует эту тему, Google может автоматически добавлять "iPhone" к его последующим общим запросам (например, "замена батареи" станет "замена батареи iPhone"). Если ваш сайт хорошо покрывает эту тему, вы получите преимущество в персонализированной выдаче.

Как система определяет, что запросы были отправлены одним и тем же пользователем?

Система использует стандартные методы идентификации пользователя. В патенте четко упоминается сравнение идентификаторов файлов cookie, полученных с устройств, или сравнение идентификаторов входа в систему (login identifiers), если пользователь авторизован.

Влияет ли этот патент на работу в режиме инкогнито?

Влияние будет минимальным, так как в режиме инкогнито система обычно не имеет доступа к долгосрочной истории пользователя и файлы cookie часто удаляются после сессии. Однако, если в рамках одной короткой сессии инкогнито будет накоплена достаточная история, механизм теоретически может быть применен к этой сессии.

Может ли система удалить термин из исходного запроса пользователя?

Да, патент упоминает такую возможность в описании (Detailed Description), хотя она не является фокусом основных Claims. Система может удалить термин, если пересмотренный (укороченный) запрос имеет пересекающиеся результаты с исходным и при этом является более популярным (чаще используется другими пользователями), чем исходный запрос.

Как лучше всего оптимизировать контент с учетом этого патента?

Лучшая стратегия — это создание авторитетного тематического хаба (Topic Hub). Контент должен быть структурирован так, чтобы отвечать на различные, но связанные вопросы в рамках одной темы (покрывать User Journey). Это гарантирует, что когда система автоматически уточнит запрос пользователя на основе его сессии, ваш контент останется релевантным этому уточненному интенту.

Как Google понижает в выдаче результаты, которые пользователь уже видел или проигнорировал в рамках одной поисковой сессии

Google использует механизм для улучшения пользовательского опыта во время длительных поисковых сессий. Если пользователь вводит несколько связанных запросов подряд, система идентифицирует результаты, которые уже появлялись в ответ на предыдущие запросы. Эти повторяющиеся результаты понижаются в ранжировании для текущего запроса, чтобы освободить место для новых, потенциально более полезных страниц. Понижение контролируется порогом релевантности, чтобы не скрывать важный контент.

US8051076B1
2011-11-01

SERP
Поведенческие сигналы

Как Google фильтрует персонализированные предложения запросов на основе контента просматриваемой страницы

Google использует механизм для генерации предложений следующего запроса после того, как пользователь покинул страницу выдачи. Система создает кандидатов на основе истории поиска пользователя, а затем фильтрует их, проверяя релевантность контенту страницы, которую пользователь просматривает в данный момент. Это гарантирует, что предложения соответствуют как интересам пользователя, так и текущему контексту просмотра.

US8392435B1
2013-03-05

Персонализация
Поведенческие сигналы
SERP

Как Google динамически корректирует веса факторов ранжирования для каждого запроса на основе анализа выдачи

Google использует этот механизм для динамической адаптации алгоритма ранжирования к специфике конкретного запроса. Система анализирует, какие факторы оказали наибольшее влияние на формирование первичной выдачи по сравнению с историческими данными. Если влияние факторов отличается от нормы, система корректирует их веса и проводит повторное ранжирование (Re-scoring) для обеспечения оптимального результата.

US10339144B1
2019-07-02

SERP

Как Google переписывает неявные запросы, определяя сущность по местоположению пользователя и истории поиска

Google использует местоположение пользователя для интерпретации запросов, которые явно не упоминают конкретную сущность (например, [часы работы] или [отзывы]). Система идентифицирует ближайшие объекты, анализирует исторические паттерны запросов для этих объектов и переписывает исходный запрос, добавляя в него название наиболее вероятной сущности.

US20170277702A1
2017-09-28

Семантика и интент
Local SEO
Персонализация

Как Google выявляет всплески поискового интереса и определяет тренды в реальном времени

Google использует систему для определения "Исключительных запросов" — тем, интерес к которым резко и неожиданно возрастает в короткий промежуток времени (менее 30 минут). Система сравнивает текущую частоту запроса с прогнозируемой моделью, основанной на исторических данных. Если фактическая активность значительно превышает прогноз, запрос помечается как трендовый. Это позволяет выявлять актуальные события, а не просто самые популярные запросы.

US8140562B1
2012-03-20

Свежесть контента
Поведенческие сигналы

Как Google использует данные из Local Search и Google Maps для распознавания географических названий в основном поиске

Google анализирует поведение пользователей в интерфейсах с отдельными полями ввода "Что?" и "Где?" (например, в Google Maps). На основе этой статистики система определяет, является ли термин однозначным названием местоположения ("Нью-Йорк") или нет ("Пицца"). Это позволяет поиску отличать локальные запросы от общих и формировать "черные списки" для терминов, которые похожи на города, но ими не являются (например, "Орландо Блум").

US8782030B1
2014-07-15

Local SEO
Семантика и интент
Поведенческие сигналы

Как Google генерирует связанные запросы (Related Searches), используя сущности из топовых результатов и сохраняя структуру исходного запроса

Google использует систему для автоматической генерации уточнений запросов (например, «Связанные запросы»). Система анализирует топовые документы в выдаче и извлекает из них ключевые сущности. Затем эти сущности комбинируются с важными терминами исходного запроса, при этом строго сохраняется исходный порядок слов, чтобы создать релевантные и естественно звучащие предложения для дальнейшего поиска.

US8392443B1
2013-03-05

Семантика и интент
Поведенческие сигналы

Как Google определяет, когда показывать обогащенный результат для сущности, и использует консенсус веба для исправления данных

Google использует механизм для определения того, когда запрос явно относится к конкретной сущности (например, книге). Если один результат значительно доминирует над другими по релевантности, система активирует «обогащенный результат». Этот результат агрегирует данные из разных источников (структурированные данные, веб-страницы, каталоги товаров) и использует наиболее популярные варианты данных из интернета для проверки и исправления информации о сущности.

US8577897B2
2013-11-05

SERP
Семантика и интент
EEAT и качество

Как Google использует социальный граф и активность друзей для персонализации и переранжирования результатов поиска

Google использует данные из социального графа пользователя и активность его контактов (лайки, шеры, комментарии, плейлисты) для изменения ранжирования результатов поиска. Контент, одобренный социальным окружением, повышается в выдаче и сопровождается аннотациями, объясняющими причину повышения и указывающими на свежесть социального действия.

US8959083B1
2015-02-17

Персонализация
Поведенческие сигналы
SERP

Как Google вычисляет важность сущностей внутри документа, используя контекст, ссылки и поведение пользователей, для улучшения ранжирования

Google использует систему для определения относительной важности сущностей (люди, места, даты) внутри документа (книги или веб-страницы) независимо от поискового запроса. Важность рассчитывается на основе того, где сущность упомянута (контекст, структура), насколько точно она определена, ссылаются ли на этот раздел внешние источники и как часто его просматривают пользователи. Эти оценки важности сущностей затем используются как сигнал для ранжирования самого документа в результатах поиска.

US7783644B1
2010-08-24

Поведенческие сигналы
Индексация
Семантика и интент

Как Google переносит авторитетность бренда и описательные термины между страницами одного сайта для улучшения ранжирования

Google использует механизмы для улучшения релевантности страниц путем переноса сигналов внутри сайта. Система распространяет "авторитетные" термины (например, бренд) с главной страницы на внутренние разделы и, наоборот, поднимает "высокоописательные" термины (например, адреса, категории, уникальные слова) с внутренних страниц на главную. Это позволяет ранжировать наиболее подходящую страницу сайта, даже если нужные ключевые слова на ней отсутствуют.

US7933890B2
2011-04-26

Структура сайта
Техническое SEO
Индексация

Как Google генерирует "Свежие связанные запросы" на основе анализа трендов и новостного контента

Google анализирует недавние поисковые логи, чтобы выявить запросы, демонстрирующие резкий рост популярности или отклонение от ожидаемой частоты. Эти "свежие" запросы проходят обязательную валидацию: они должны возвращать достаточное количество новостных результатов и иметь хорошие показатели вовлеченности (CTR). Это позволяет Google динамически обновлять блок "Связанные поиски", отражая актуальные события и тренды.

US8412699B1
2013-04-02

Свежесть контента
Поведенческие сигналы
SERP

Как Google переносит поведенческие сигналы через ссылки для повышения в ранжировании первоисточников контента

Google использует механизм для корректного учета поведенческих сигналов (например, времени пребывания). Если пользователь кликает на результат в выдаче, а затем переходит по ссылке на другую страницу, система может перенести позитивные сигналы с исходной страницы на целевую. Это позволяет повышать в рейтинге первоисточники информации, а не страницы-посредники.

US8959093B1
2015-02-17

Поведенческие сигналы
Ссылки
SERP

Как Google корректирует позиционную предвзятость (Position Bias) при обучении моделей ранжирования на кликах пользователей

Google использует механизм для устранения позиционной предвзятости (Position Bias) при обучении моделей ранжирования (Learning to Rank). Система анализирует, на какой позиции находился кликнутый результат, и присваивает этому клику вес важности. Клики по нижним позициям получают больший вес, чем клики по ТОП-1. Это позволяет модели учиться определять истинную релевантность, а не просто копировать существующий порядок выдачи.

US20210125108A1
2021-04-29

Поведенческие сигналы
SERP

Как Google использует социальные связи для обнаружения ссылочного спама и накрутки кликов

Google может анализировать связи между владельцами сайтов в социальных сетях, чтобы оценить независимость ссылок между их ресурсами. Если владельцы тесно связаны (например, друзья), ссылки между их сайтами могут получить меньший вес в ранжировании, а клики по рекламе могут быть классифицированы как спам (накрутка).

US8060405B1
2011-11-15

Антиспам
Ссылки
SERP