Автор: Виктор Репин

2010 Knowledge Graph Nitin Gupta Патенты Google Поведенческие сигналы Семантика и интент

Как Google анализирует историю поисковых запросов для устранения неоднозначности имен и генерации контекстных подсказок

Google использует систему для устранения неоднозначности имен людей. Анализируя исторические данные о том, какие запросы (как включающие имя, так и нет) приводили пользователей на одни и те же ресурсы, система кластеризует различные контексты имени (например, разные люди с одним именем). Для каждого контекста выбирается лучший уточняющий термин, который затем предлагается пользователю в качестве поисковой подсказки.

2008 EEAT и качество Индексация Патенты Google Ссылки

Как Google определяет значимость цитат и повторяющегося текста, используя авторитетность и разнообразие источников (Энтропия)

Google анализирует, как часто и где текстовые пассажи (например, цитаты или определения) повторяются в корпусе документов. Система рассчитывает оценку значимости пассажа на основе популярности цитирующих авторов, разнообразия источников (diffusion/entropy) и текстуальных характеристик. Эта оценка используется для ранжирования результатов поиска и выбора наиболее важных пассажей для отображения.

2013 Lev Finkelstein Антиспам Патенты Google Поведенческие сигналы Семантика и интент

Как Google выявляет и удаляет подсказки в Autocomplete, которые отвлекают пользователя от его изначальной цели поиска

Google использует механизм для очистки системы автозаполнения (Autocomplete). Система выявляет популярные подсказки, которые развлекают или интересуют пользователей, но не соответствуют их изначальному намерению. Путем экспериментов с временным скрытием этих подсказок Google проверяет, ищут ли пользователи эту информацию самостоятельно. Если нет, подсказка классифицируется как отвлекающая и понижается.

2004 Simon Tong Антиспам Мультимедиа Патенты Google Поведенческие сигналы

Как Google вычисляет «Оценку отвлекательности» (Distractiveness Score) для понижения кликбейта в поиске по картинкам

Google использует механизм для борьбы с кликбейтными или нерелевантными изображениями в поиске. Система анализирует, как часто пользователи кликают на изображение по множеству несвязанных запросов. Если изображение часто выбирают независимо от темы запроса, ему присваивается высокая «Оценка отвлекательности», и оно понижается в выдаче, уступая место более релевантному контенту.

2009 Мультиязычность Патенты Google Поведенческие сигналы Семантика и интент

Как Google использует поведение пользователей для автоматического перевода запросов в поиске по картинкам и видео

Google улучшает поиск по визуальному контенту (картинки, видео), анализируя, как пользователи переформулируют запросы на других языках в рамках одной сессии. Если пользователь ввел запрос на одном языке, а затем его перевод на другом, система запоминает эту связь («двуязычное уточнение»). В дальнейшем система автоматически добавляет самый популярный перевод к исходному запросу, чтобы показать больше релевантных результатов на разных языках.

2013 EEAT и качество Knowledge Graph Патенты Google Семантика и интент

Как Google использует авторитетные ресурсы для идентификации главной сущности запроса и показа связанных сущностей в выдаче

Google анализирует результаты поиска на предмет наличия «авторитетных ресурсов» (например, официальных сайтов или страниц Википедии), чтобы определить главную сущность, которой посвящен запрос. Если сущность точно идентифицирована, система извлекает связанные сущности (например, книги автора или фильмы актера) и отображает их в выдаче. Порядок отображения определяется поведением пользователей и частотой совместного упоминания в вебе.

2007 Knowledge Graph Патенты Google Поведенческие сигналы Семантика и интент

Как Google автоматически определяет ключевые атрибуты сущностей, анализируя логи поисковых запросов

Google анализирует массивы поисковых запросов, используя лингвистические шаблоны (например, «население [Города]»), чтобы автоматически определить, какие атрибуты наиболее важны для разных категорий сущностей. Этот механизм позволяет масштабно наполнять Knowledge Graph фактами, основываясь на том, как пользователи ищут информацию, а затем очищает и ранжирует эти данные по важности.

2011 Shumeet Baluja Патенты Google Персонализация Поведенческие сигналы Семантика и интент

Как Google прогнозирует следующий запрос пользователя, балансируя новизну, последовательность и частоту запросов

Google использует модель машинного обучения для прогнозирования текущих интересов пользователя на основе истории поиска. Эта модель объединяет несколько методов прогнозирования: анализ того, как недавно были отправлены запросы (на основе времени), порядок их отправки (на основе ранга) и как часто появляются определенные темы (на основе категорий). Этот сбалансированный подход помогает Google понять намерения пользователя для персонализации, даже если пользователь ищет нечасто или в разных контекстах.

2012 EEAT и качество Navneet Panda Патенты Google Поведенческие сигналы Техническое SEO

Как Google рассчитывает «Site Quality Score», используя соотношение брендовых запросов к общему трафику сайта

Google использует метрику качества сайта («Site Quality Score»), которая рассчитывается как соотношение количества уникальных запросов, явно направленных на сайт (брендовые, навигационные, с оператором site:), к общему количеству уникальных запросов, по которым пользователи переходят на сайт. Этот показатель используется в ранжировании и отражает авторитетность, востребованность бренда и доверие пользователей.

2005 EEAT и качество Индексация Патенты Google Семантика и интент

Как Google агрегирует экспертные знания из разных источников для понимания контекста запроса и модификации выдачи

Google использует систему для агрегации «контекстных данных» от множества вертикальных сайтов или экспертов по одной теме. Эта система позволяет Google понять истинное намерение пользователя (например, покупка, сравнение или решение проблемы) и модифицировать запрос и результаты поиска, объединяя правила, аннотации и фильтры из всех релевантных источников.

2014 EEAT и качество SERP Патенты Google Поведенческие сигналы

Как Google использует данные опросов пользователей для аннотирования и изменения ранжирования рекламы и органических результатов

Google запатентовал систему сбора данных о репутации брендов, продуктов и сайтов через независимые опросы пользователей. Полученная статистика (например, удовлетворенность клиентов) автоматически преобразуется в «аннотации доверия» (trust annotations), отображаемые в выдаче. Патент также описывает использование этой статистики в качестве фактора, напрямую влияющего на ранжирование контента.

2006 EEAT и качество Патенты Google Персонализация Поведенческие сигналы

Как Google использует сети доверия (Trust Networks) и поведенческие данные для персонализации и ранжирования результатов поиска

Патент Google описывает систему построения персонализированных «сетей доверия». Система определяет, каким источникам (людям или сайтам) доверяет пользователь, анализируя его поведение (web visitation patterns), социальные связи (контакты) и прямые указания («Trust Button»). Рекомендации от этих доверенных источников используются для влияния на сортировку результатов поиска.

2007 Ashutosh Garg EEAT и качество Антиспам Патенты Google Свежесть контента

Как Google использует «Свежесть Ранжирования» и Арбитров для выявления и нейтрализации манипуляций в поиске

Google использует гибридную систему для борьбы с манипуляциями в поиске. Если алгоритм фиксирует аномально быстрый рост позиций результата («Свежесть Ранжирования»), это инициирует проверку Арбитрами (асессорами). Решение о пессимизации (разрыве ассоциации) принимается на основе комбинации автоматической оценки подозрительности и вердиктов асессоров.

2006 EEAT и качество Paul Haahr SERP Патенты Google Ссылки

Как Google перераспределяет авторитетность и тематическую релевантность между страницами одного сайта на основе его структуры

Google использует механизм для переноса важной информации между связанными страницами одного сайта. Авторитетность бренда может передаваться с главной страницы на внутренние (Propagation Down), а специфические термины, адреса или категории товаров с внутренних страниц могут ассоциироваться с главной (Propagation Up). Это позволяет улучшить ранжирование страниц, даже если нужные ключевые слова на них отсутствуют.

2010 EEAT и качество Kumar Mayur Thakur Индексация Патенты Google Поведенческие сигналы

Как Google рассчитывает авторитетность авторов в социальных сетях на основе взвешенного графа взаимодействий (Author Rank)

Google использует публичные взаимодействия в социальных сетях для расчета оценки авторитетности автора (User Score). Система строит граф взаимодействий, присваивая разный вес разным действиям: репосты ценятся выше ответов, а ответы выше подписок. Авторитетность рассчитывается итеративно (подобно PageRank) и используется для ранжирования контента этого автора в поиске.

2016 EEAT и качество Justin Lewis Мультимедиа Патенты Google Поведенческие сигналы

Как Google (YouTube) ранжирует видео, повышая те, которые начинают сессию просмотра и приводят внешний трафик («Lead Video»)

Google использует систему ранжирования для видеоплатформ, которая идентифицирует «ведущее видео» (Lead Video), инициирующее сессию просмотра. Система применяет повышающие коэффициенты (Scaling Factors) ко времени просмотра этого видео. Видео, привлекшие пользователя на платформу из внешних источников (например, из социальных сетей или поиска Google), получают значительно больший коэффициент, чем те, что были найдены через внутренние рекомендации.

2005 EEAT и качество Knowledge Graph Патенты Google Семантика и интент

Как Google извлекает структурированные данные об отзывах и рейтингах, встроенные в код страницы, и использует их для ранжирования

Патент Google, описывающий механизм встраивания структурированных отзывов и рейтингов непосредственно в HTML/XML код документов с помощью специальных тегов (Identifier Tag и Rating Tag). Поисковые роботы извлекают эту информацию, агрегируют ее и используют для корректировки веса (Weight) документа, что напрямую влияет на его ранжирование в поисковой выдаче.

2013 EEAT и качество Knowledge Graph Патенты Google Поведенческие сигналы

Как Google использует краудсорсинг для понимания фактологических запросов и создания шаблонов ответов

Google использует метод масштабирования понимания фактологических запросов. Система показывает пользователям факт (например, «Рост Барака Обамы 6’1″») и просит их предложить запросы, которые ведут к этому факту. Полученные запросы нормализуются, фильтруются и обобщаются в шаблоны (например, «какой рост у [Person]»). Эти шаблоны связываются с базой знаний, позволяя системе отвечать на аналогичные вопросы о других сущностях.

2019 Антикачество Качество контента Патенты Яндекс Ранжирование Рекомендательные системы Яндекс Дзен

Как Яндекс использует машинное обучение для пессимизации кликбейта и нежелательного контента в системах рекомендаций

Яндекс патентует двухэтапный механизм для ранжирования в рекомендательных системах. Сначала определяется персонализированная релевантность контента на основе вовлеченности. Затем независимый алгоритм классификации оценивает качество контента и его источника, генерируя «понижающую оценку» для борьбы с кликбейтом и нарушениями правил. Финальный ранг корректируется этой оценкой, понижая нежелательный контент независимо от его популярности.

2014 Мультиязычность Патенты Google Поведенческие сигналы Семантика и интент

Как Google поддерживает контекст в диалоговом поиске, переписывая неполные запросы на основе предыдущих результатов и грамматических шаблонов

Google использует систему для понимания диалогового поиска. Если пользователь задает последующий неполный запрос (например, «напомни мне за час до этого»), система определяет контекст из предыдущего запроса (например, время рейса). Затем она использует грамматические шаблоны, чтобы переписать неполный запрос в полный и понятный для выполнения действия (например, «установить напоминание на 13:40 для рейса UA 214»).