Автор: Виктор Репин

Google использует статистические модели (например, распределение Пуассона) для анализа внезапных всплесков запросов или индексации новых документов. Система определяет, является ли всплеск результатом реального мирового события (тренд) или случайным шумом/скоординированным спамом. Это позволяет фильтровать ложные тренды и точно определять темы, заслуживающие приоритета свежего контента (QDF).

2013 Мультимедиа Патенты Google Поведенческие сигналы Семантика и интент

Как Google использует популярность прошлых запросов для понимания местоимений в голосовом поиске

Google использует механизм разрешения неоднозначности в последовательных голосовых запросах. Если пользователь использует местоимение (например, «он», «оно»), которое может относиться к разным сущностям из предыдущего диалога, Google генерирует несколько вариантов запроса и выбирает тот, который чаще всего задавался пользователями в прошлом (на основе исторических логов).

2020 SERP Обучение моделей Патенты Яндекс Ранжирование

Как Яндекс автоматически создает новые факторы ранжирования (мета-признаки) на основе контекста SERP и относительных показателей

Яндекс патентует систему автоматического создания и валидации новых факторов ранжирования (мета-признаков). Эти факторы вычисляются не изолированно для документа, а в контексте всей поисковой выдачи. Значение мета-признака зависит от значения базового фактора (например, CTR или BM25) относительно других документов в SERP (например, через нормализацию) или от предварительного ранга документа.

2011 Shumeet Baluja Патенты Google Персонализация Поведенческие сигналы Семантика и интент

Как Google использует поисковые запросы на этапе «планирования», чтобы понять интересы путешественников в конкретной локации

Google анализирует исторические данные поиска, чтобы выявить запросы, сделанные пользователями, находящимися далеко от интересующей их локации (поведение на этапе планирования). Этот анализ позволяет понять, какие темы, услуги и достопримечательности актуальны для путешественников. Затем Google использует эти данные для таргетинга контента (например, рекламы или персонализированных результатов) на других пользователей, когда они посещают эту локацию или проявляют к ней интерес.

2024 EEAT и качество Патенты Google Семантика и интент Техническое SEO

Как Google проверяет факты в ответах LLM (AI Overviews) с помощью поиска и моделей подтверждения

Google использует систему для валидации контента, сгенерированного большими языковыми моделями (LLM). Система разбивает ответ LLM на отдельные утверждения, ищет подтверждающую или опровергающую информацию в поисковом индексе и использует специальные модели (Entailment Models) для оценки достоверности. Это позволяет выявлять галлюцинации и аннотировать сгенерированный контент ссылками на источники.

2012 EEAT и качество Knowledge Graph Патенты Google Семантика и интент

Как Google находит фактические ответы, начиная с потенциальных ответов и связывая их с запросами пользователей (Reverse Question Answering)

Google использует метод «обратного ответа на вопрос» для эффективного поиска фактов. Вместо глубокого анализа запроса система начинает с идентификации потенциальных ответов (например, дат, измерений) в индексе. Затем она определяет, для каких запросов эти ответы релевантны, анализируя, какие документы высоко ранжируются и получают клики по этим запросам. Это позволяет точно сопоставлять факты с разнообразными формулировками вопросов.

2019 EEAT и качество Knowledge Graph Патенты Google Семантика и интент

Как Google классифицирует локальный интент на уровне кластеров запросов для показа локальных расширений

Google использует механизм для определения локального интента запроса, анализируя не сам запрос, а кластер связанных запросов. Система проверяет, какая доля запросов в кластере вызывает срабатывание локальных функций поиска (например, локальной панели знаний). Если порог достигнут, весь кластер помечается как имеющий высокий локальный интент. Это позволяет системе автоматически добавлять локальные расширения (адрес, телефон) к контенту (например, рекламе), даже если в запросе нет явных локальных маркеров.

2011 EEAT и качество Knowledge Graph Патенты Google Семантика и интент

Как Google определяет сущности по их атрибутам, анализируя и переранжируя результаты веб-поиска

Google использует результаты веб-поиска для идентификации сущностей (например, медицинских состояний), соответствующих атрибутам (например, симптомам), указанным в запросе. Система генерирует и анализирует результаты для комбинированных запросов (атрибуты + имя сущности), чтобы определить наиболее вероятные сущности или полностью перестроить и переранжировать выдачу, повышая контент, связанный с этими сущностями.

2005 SERP Патенты Google Поведенческие сигналы Семантика и интент

Как Google использует данные о поведении пользователей для определения и продвижения наиболее успешных запросов (KHRQ)

Google анализирует частоту запросов и удовлетворенность пользователей (низкий процент уточнений, долгое время клика), чтобы выявить «Known Highly-Ranked Queries» (KHRQ). Система перенаправляет пользователей с менее успешных или неоднозначных запросов (Nearby Queries) на эти KHRQ. Это механизм для каноникализации интента пользователя на основе агрегированных поведенческих данных.

2014 SERP Патенты Google Персонализация Поведенческие сигналы

Как Google отслеживает активность пользователя для прогнозирования его потребностей и проактивного предоставления результатов поиска

Google использует систему для мониторинга действий пользователя (поисковые запросы, просмотры веб-страниц, электронные письма) на разных устройствах. Система выявляет связанные действия, определяет сущность или местоположение, интересующее пользователя, и оценивает вероятность того, что пользователю потребуется дополнительная информация. Затем Google проактивно предоставляет эту информацию или результаты автоматически сгенерированного запроса позже, без необходимости ввода нового запроса пользователем.

2018 Мультимедиа Патенты Google Персонализация Поведенческие сигналы

Как Google использует клики пользователей и визуальное сходство для понимания и таргетинга изображений

Google анализирует, какие изображения пользователи выбирают (кликают) в ответ на конкретные поисковые запросы в Image Search. Система использует эти поведенческие данные для понимания того, что изображено на картинке, и ассоциирует ее с релевантными концепциями. Эти ассоциации также переносятся на визуально похожие изображения и используются для улучшения ранжирования и таргетинга контента.

2017 EEAT и качество Nitin Gupta Индексация Патенты Google Семантика и интент

Как Google использует специализированные нейронные сети (Matching Vector NN) для оценки качества ответов и выбора Featured Snippets

Google использует архитектуру нейронных сетей Encoder-Decoder для оценки того, насколько хорошо фрагмент текста отвечает на вопрос. Система включает отдельный компонент — Matching Vector Neural Network — который генерирует оценку качества ответа. Система обучается в два этапа, чтобы точно различать хорошие, посредственные и плохие ответы, что критично для ранжирования и генерации Featured Snippets.

2005 Local SEO Патенты Google Поведенческие сигналы Семантика и интент

Как Google использует поведенческие сигналы для определения синонимов между запросами пользователей и категориями бизнеса в Локальном поиске

Google анализирует исторические данные поиска и действия пользователей (например, клики на построение маршрута), чтобы понять, когда термин в запросе (например, «забегаловка») является синонимом формальной категории бизнеса (например, «ресторан»). Система использует статистические методы (Name Perplexity и F-Measure) для фильтрации названий брендов и подкатегорий, чтобы точно определить синонимы и улучшить результаты локального поиска.

2008 EEAT и качество Индексация Патенты Google Поведенческие сигналы

Как Google использует совместное посещение сайтов в рамках одной сессии (Co-visitation) для классификации ресурсов по темам

Google анализирует, какие ресурсы пользователи посещают в рамках одной сессии (поисковой или браузерной). Если пользователь посещает известный ресурс по теме А, а затем в той же сессии посещает новый ресурс Б (даже в ответ на другой запрос), система предполагает, что ресурс Б также связан с темой А. Этот механизм позволяет автоматически классифицировать контент на основе реального поведения пользователей.

2004 Патенты Google Персонализация Поведенческие сигналы Семантика и интент

Как Google использует частичные запросы, логи и профили пользователей для формирования подсказок (Autocomplete) и предварительной загрузки результатов

Патент описывает технологию Google Autocomplete (Suggest). Система предсказывает финальный запрос на основе частично введенного текста, используя словари, составленные из популярных запросов сообщества. Предсказания ранжируются по популярности и персонализируются с учетом профиля пользователя. Система также может заранее кэшировать результаты для наиболее вероятных подсказок, чтобы ускорить выдачу.

2013 SERP Патенты Google Персонализация Поведенческие сигналы

Как Google выбирает между веб-сайтом (десктоп/мобайл) и нативным приложением для показа в результатах поиска

Google анализирует различные форматы доступа к контенту (например, десктопный сайт, мобильный сайт, нативное приложение). Система оценивает качество, скорость, стабильность и совместимость каждого варианта с устройством пользователя. В результатах поиска Google покажет ссылку на тот формат, который имеет наивысшую оценку качества для конкретного пользователя и устройства.

2007 Патенты Google Персонализация Поведенческие сигналы Свежесть контента

Как Google использует исторические данные о кликах (CTR) и время запроса для ранжирования сезонного и периодического контента

Google использует систему для разрешения неоднозначности запросов, чье значение меняется со временем. Анализируя исторические показатели кликабельности (CTR), система выявляет временные изменения в интересах пользователей (сезонность, еженедельные тренды). Если текущий запрос совпадает с историческим периодом изменения интереса, Google корректирует ранжирование, отдавая предпочтение контенту, который исторически был более востребован в это время.

Knowledge Graph Патенты Google Семантика и интент Ссылки

Как поисковые системы могут автоматически определять связанные термины и строить тематические иерархии, анализируя аннотации ссылок

Анализ патента IBM (1999 г.), описывающего трехэтапную систему для определения тематически связанных терминов. Система анализирует совместную встречаемость терминов в метаданных гиперссылок (анкорах и окружающем тексте) по всему корпусу документов. Затем она строит иерархию обобщения/специализации (таксономию) для фильтрации ложных связей и подтверждения истинной релевантности.

2013 EEAT и качество Knowledge Graph Патенты Google Семантика и интент

Как Google использует упоминания в интернете для выявления связей между людьми и построения социального графа

Google анализирует неструктурированный контент (веб-страницы, статьи), чтобы найти людей, которые часто упоминаются вместе (co-occurrence). На основе частоты и контекста этих упоминаний система вычисляет метрику связи (relationship metric) и предлагает пользователям подтвердить эту связь в социальной сети, тем самым обогащая социальный граф и улучшая понимание связей между сущностями.

2010 SERP Патенты Google Персонализация Поведенческие сигналы

Как Google показывает прямые ответы, рекламу и ссылки в поисковых подсказках (Autocomplete) до отправки запроса

Google анализирует частичный ввод пользователя (префикс) для прогнозирования полного запроса (завершения). Система идентифицирует релевантный контент, такой как прямые ответы на вопросы (Answer Boxes), рекламные объявления или навигационные ссылки, связанные с наиболее вероятным запросом, и отображает этот контент вместе с подсказками еще до того, как пользователь закончит ввод или отправит запрос.