Анализ патента Google, описывающего систему оценки качества документов на основе исторических данных. Система анализирует, как контент, ссылки и поведение пользователей меняются с течением времени. Патент описывает механизмы определения свежести контента, …
Simon Tong
Google анализирует запросы, введенные в адресную строку браузера. Если система с высокой степенью уверенности определяет один «очень релевантный» результат, основываясь на высоком историческом CTR и значительном отрыве его оценки релевантности …
Google использует модель машинного обучения для определения того, какой тип контента (Новости, Картинки, Товары, Веб-страницы) пользователь хочет видеть в ответ на запрос. Модель анализирует запрос, контекст пользователя и исторические данные …
Google улучшает ранжирование, особенно для редких или новых запросов, используя поведенческие данные (клики) из семантически или сессионно связанных запросов. Если данных по исходному запросу недостаточно, система «заимствует» сигналы о кликах …
Google использует систему машинного обучения для создания модели ранжирования, которая предсказывает вероятность клика пользователя по документу. Модель обучается на огромных массивах данных о прошлых поисках (запросы, документы, клики). Система учитывает …
Google использует механизм для корректировки поисковой выдачи на основе поведения групп пользователей (популяций), к которым принадлежит автор запроса. Система анализирует данные о кликах (clickthrough data) конкретной популяции (например, пользователи из …
Google разработал систему, позволяющую пользователям удалять нежелательные сайты из своей выдачи. Патент описывает, как эти данные агрегируются от «легитимных пользователей» и используются для расчета «Remove List Score» — глобального сигнала …
Google использует механизм для борьбы с кликбейтными или нерелевантными изображениями в поиске. Система анализирует, как часто пользователи кликают на изображение по множеству несвязанных запросов. Если изображение часто выбирают независимо от …
Google динамически определяет предпочитаемую страну пользователя, используя интерфейс поиска (например, google.de) и IP-адрес. Затем система смещает результаты поиска, повышая оценки (Weighting Factor) или позиции (Shifting Factor) контента, связанного с этой …
Google использует данные о наведении курсора (hovers) на изображения как сигнал вовлеченности. Патент описывает, как эти данные улучшают ранжирование: вес hovers увеличивается для редких запросов с малым количеством кликов. Также …
Google анализирует агрегированные данные о поведении пользователей, чтобы определить, какие документы часто просматриваются в течение короткого времени после показа других документов в результатах поиска. Эта модель используется для расчета «Оценок …
Google идентифицирует результаты поиска, в которых система максимально уверена («очень релевантные»). Для этого анализируется комбинация факторов: доминирующий показатель кликабельности (CTR) относительно конкурентов, высокая позиция в ранжировании и значительный отрыв по …
Google анализирует, как долго пользователи остаются на странице после клика (Dwell Time). Сравнивая «длинные просмотры» (признак удовлетворенности) с «короткими просмотрами» (признак неудовлетворенности), Google рассчитывает оценку релевантности (LCIC fraction). Эта оценка …
Google использует механизм для тестирования качества своего ранжирования, перемещая результаты из глубины выдачи (невидимые пользователю) на топовые позиции. Это делается либо случайным образом (Exploration), либо путем подмешивания высокоранжированных результатов из …
Google использует механизм для персонализации поисковых подсказок (Autocomplete). Система анализирует предыдущий запрос пользователя и определяет, какие другие запросы статистически часто встречаются в одной сессии с ним (на основе данных многих …
Google использует механизм для расширения поисковых запросов, добавляя синонимы, связанные концепции и альтернативные написания. Патент описывает, как система определяет эти расширения (включая обработку фраз) и как она может представлять их …
Google использует алгоритм расширения набора сущностей (Set Expansion). Система анализирует списки, в которых исходные сущности (seeds) появляются вместе с другими. Чтобы найти действительно связанные сущности, а не просто популярные, система …
Google использует систему для анализа контекста запроса, чтобы определить, являются ли стоп-слова (или фразы) значимыми. Система сравнивает результаты поиска или релевантные категории для запроса со стоп-словом и без него. Если …
Google использует контекстные слова в запросе (например, профессию, местоположение) для исправления ошибок в написании имен сущностей (людей, брендов, мест). Система создает индекс ассоциаций между сущностями и их контекстом на основе …
Google использует иерархическую систему для определения предпочтительного языка и страны пользователя, анализируя сигналы из запроса, настроек браузера (HTTP-заголовки), IP-адреса и интерфейса поисковой системы. Определив предпочтения, система переранжирует выдачу, повышая соответствующий …