Автор: Виктор Репин

2016 Google Shopping Патенты Google Поведенческие сигналы Семантика и интент

Как Google использует краудсорсинг для выбора и улучшения группировки результатов поиска (например, в магазинах приложений и маркетплейсах)

Google использует масштабируемую систему для организации результатов поиска (таких как приложения или товары) в логические группы (кластеры). Система генерирует множество вариантов кластеризации для запроса, а затем использует краудсорсинговых работников для оценки и выбора наилучшего варианта. Лучший вариант дополнительно уточняется на основе консенсуса работников и сохраняется для использования при будущих запросах.

2007 SERP Антиспам Краулинг Патенты Google

Как Google использует машинное обучение для обнаружения дубликатов, анализируя контент до и после рендеринга

Google использует комплексную систему для обнаружения дубликатов, которая сравнивает как исходный HTML-код (Fetched Body), так и финальную версию страницы после выполнения JavaScript (Synthetic Body). Система вычисляет множество сигналов сравнения, включая основанные на контексте запроса (сниппеты), и использует модель машинного обучения для определения вероятности того, что страницы являются дубликатами.

2010 Ashutosh Garg Kedar Dhamdhere Мультиязычность Патенты Google Персонализация Поведенческие сигналы

Как Google использует поведенческие сигналы языковых групп для ранжирования контента на других языках

Google анализирует, какой контент популярен среди пользователей с определенными языковыми предпочтениями, независимо от языка самого контента. Если англоязычная страница часто выбирается пользователями, предпочитающими хинди, система повысит эту страницу в выдаче для других пользователей с предпочтением хинди. Это достигается через расчет весового коэффициента (Language Selection Weight), основанного на истории кликов и CTR конкретной языковой группы.

2011 Патенты Google Поведенческие сигналы Семантика и интент

Как Google рассчитывает оценки для связанных запросов (Related Searches) на основе частоты терминов и популярности уточнений

Google анализирует логи поисковых сессий, чтобы понять, как пользователи уточняют свои запросы. Система вычисляет, какие термины чаще всего встречаются в этих уточнениях (Term Occurrence Score) и насколько популярен сам путь уточнения (Refinement Rate). На основе этих метрик формируются релевантные поисковые подсказки и блоки «Связанные запросы».

2015 Индексация Краулинг Патенты Google Ссылки

Как Google индексирует контент приложений, сопоставляя отдельные разделы веб-страницы с экранами в приложении

Патент описывает механизм индексации нативных приложений (App Indexing). Система идентифицирует конкретные разделы на веб-странице и связывает их с «частичными глубокими ссылками» (Partial Deep Links), ведущими на аналогичный контент внутри приложения. Это позволяет Google верифицировать консистентность контента и использовать веб-страницу как прокси для ранжирования приложения.

2006 SERP Патенты Google Ссылки Техническое SEO

Как поисковые системы могут использовать глубину клика (расстояние от главной страницы) для ранжирования результатов

Анализ патента (поданного AT&T), описывающего механизм ранжирования результатов поиска на основе структурного расстояния (глубины клика) между целевой страницей и главной страницей сайта. Поисковые системы могут использовать эту метрику для определения важности страницы: чем ближе страница к главной, тем выше ее потенциальный вес в выдаче. Это подчеркивает важность плоской и логичной архитектуры сайта.

2004 EEAT и качество Google Shopping Knowledge Graph Патенты Google

Как Google использует контекст вокруг ключевых слов для автоматического расширения запросов и многоэтапного ранжирования

Патент Google, описывающий итеративный процесс поиска и инфраструктуру для хранения сжатых документов (Tokenspace Repository). Система анализирует контекст вокруг ключевых слов в предварительных результатах, автоматически расширяет запрос на основе этого контекста (Relevance Feedback) и выполняет повторный поиск. Также описано многоэтапное ранжирование, учитывающее близость слов и атрибуты контента.

2003 EEAT и качество Google Shopping Мультимедиа Патенты Google

Как Google определяет и ранжирует вертикали поиска (Web, Картинки, Новости) для Универсальной выдачи и ответов Ассистента

Google использует систему для выполнения одного запроса сразу по нескольким категориям (вертикалям) поиска, таким как Веб, Новости, Товары или Картинки. Система оценивает релевантность не только отдельных результатов, но и целых категорий. Результаты из разных категорий объединяются в единую выдачу (Universal Search) или ответ Ассистента, при этом наиболее релевантные категории показываются более заметно.

2006 SERP Патенты Google Персонализация Поведенческие сигналы

Как Google использует историю браузера и закладки пользователя для персонализации и изменения ранжирования поисковой выдачи

Google отслеживает активность пользователя в браузере: посещенные сайты, частоту визитов, время пребывания на сайте и использование закладок. Эти данные используются для формирования персональной статистики и, что критически важно, для корректировки ранжирования будущих поисковых результатов (Personalized Search), повышая в выдаче сайты, которые пользователь предпочитает.

2010 Hyung-Jin Kim Патенты Google Персонализация Поведенческие сигналы

Как Google использует поведение пользователей (клики и Dwell Time) для ранжирования подсказок в Autocomplete и динамически меняет критерии

Анализ патента Google, описывающего, как система Autocomplete ранжирует поисковые подсказки, используя данные о поведении пользователей (клики и время пребывания на сайте). Система отдает приоритет запросам, которые ранее приводили к удовлетворению пользователей («длинным кликам»). Также описан механизм предоставления альтернативных наборов подсказок по запросу пользователя с использованием разных критериев (например, персонализированных и общих).

2023 Knowledge Graph Мультимедиа Патенты Google Семантика и интент

Как Google использует мультимодальные модели и парсинг диаграмм для понимания визуальных запросов и решения задач по фото

Google использует передовые методы для интерпретации изображений, содержащих диаграммы (например, задачи по геометрии, физике, химии). Система преобразует визуальную информацию либо в формальное языковое представление, либо в мультимодальный эмбеддинг для генерации текстового запроса. Это позволяет пользователям получать решения, пошаговые инструкции и похожие задачи, просто загрузив фотографию диаграммы.

2005 Индексация Патенты Google Персонализация Поведенческие сигналы

Как Google использует пользовательские аннотации (рейтинги, метки) для персонализации, переранжирования выдачи и расчета рейтинга сайта

Анализ патента Google, описывающего систему сбора явных оценок пользователей (рейтинги, метки, комментарии) для веб-страниц. Эти аннотации используются для глубокой персонализации поиска: они отображаются в выдаче, позволяют фильтровать результаты и напрямую влияют на ранжирование. Патент также детально описывает, как оценки отдельных страниц агрегируются в общий рейтинг сайта (Site Rating), влияющий на ранжирование всего домена.

2011 Lev Finkelstein Патенты Google Поведенческие сигналы Семантика и интент

Как Google генерирует новые поисковые подсказки, комбинируя структуры запросов и семантически схожие термины

Google использует механизм для генерации новых поисковых подсказок (Inferred Queries), которые пользователи ранее не вводили. Система анализирует прошлые запросы, выявляет общие структурные шаблоны (Query Templates) и определяет семантически схожие термины (Infixes). Комбинируя шаблоны и схожие термины из разных запросов, Google создает новые релевантные подсказки, расширяя покрытие за пределы существующих логов запросов.

2006 Патенты Google Персонализация Поведенческие сигналы

Как Google использует агрегированное поведение аудитории сайта для контекстной персонализации результатов поиска

Google создает профиль интересов для веб-сайта (Website Profile), анализируя, какие запросы пользователи вводят на этом сайте и на какие результаты они кликают. Этот агрегированный профиль используется для переранжирования будущих результатов поиска для всех запросов, поступающих с этого же сайта, чтобы лучше соответствовать тематике сайта и коллективным интересам его аудитории.

2004 Knowledge Graph Мультимедиа Патенты Google Семантика и интент

Как Google заложил основу визуального поиска (Google Lens), превращая изображения с камеры в поисковые запросы

Google разработал систему, позволяющую использовать изображения с мобильных устройств в качестве поисковых запросов. Система распознает объекты на изображении (продукты, здания, текст, лица), преобразует их в символьное описание (текстовый запрос) и использует его для поиска релевантной информации в стандартной поисковой системе.

2016 Google Shopping Matthew Sharifi Мультимедиа Патенты Google Семантика и интент

Как Google преобразует изображения в текстовые поисковые запросы, используя сущности и контекст пользователя

Патент Google описывает механизм Визуального поиска (например, Google Lens). Система анализирует входное изображение, распознает объекты и сущности (используя общие и детальные метки). Затем она генерирует список потенциальных текстовых запросов, связанных с этими сущностями, и выбирает лучший из них, учитывая контекст пользователя (местоположение, активность), популярность запроса и качество результирующей выдачи.

2011 Local SEO Патенты Google Поведенческие сигналы

Как Google использует популярность категорий (на основе кликов пользователей) для определения того, какие локальные объекты (POI) отображать на карте по умолчанию

Google решает проблему перегруженности карт, приоритизируя отображение точек интереса (POI). Система анализирует, как часто пользователи взаимодействуют (кликают) с объектами разных категорий, и рассчитывает «Оценку Категории» (Category Score), используя сложный механизм нормализации данных. Объекты из более популярных категорий получают приоритет и отображаются на карте по умолчанию (в виде меток или иконок).

2013 EEAT и качество SERP Патенты Google Семантика и интент

Как Google извлекает, верифицирует и выбирает числовые факты для прямых ответов (Featured Snippets)

Google использует систему для ответов на количественные запросы (например, «Сколько…?»). Система анализирует результаты поиска, извлекает предложения с числами и оценивает их по грамматике, формату и релевантности. Затем она группирует ответы по значению числа (консенсус) и выбирает наиболее достоверный и лучше всего сформулированный ответ для показа пользователю.

2012 EEAT и качество Knowledge Graph Local SEO Патенты Google

Как Google создает и отображает Панели Знаний (Knowledge Panels), агрегируя информацию об сущностях из разных источников

Google использует систему для идентификации сущностей в запросах и генерации Панелей Знаний. Эти панели агрегируют различные типы контента (факты, изображения) из множества разных источников в единый сводный блок на странице результатов поиска. Система использует шаблоны, зависящие от типа сущности, и выбирает контент на основе исторических данных о поисковых запросах пользователей.

2012 EEAT и качество Антиспам Краулинг Патенты Google

Как Google использует Min-Hashing и Shingling для выявления дубликатов и классификации взаимосвязей между документами в большом корпусе

Google применяет техники Shingling и Min-Hashing для эффективного сравнения миллионов документов (например, книг или веб-страниц). Система кластеризует похожие документы, а затем детально анализирует сходство на уровне фрагментов, чтобы классифицировать их взаимосвязь: являются ли они идентичными, переформатированными версиями или содержат перекрывающийся текст.