Автор: Виктор Репин

Google использует механизм для улучшения подсказок в Autocomplete. Если пользователь вводит длинную или редкую фразу, которая не дает хороших подсказок, система удаляет начальные слова (префикс) и ищет подсказки для оставшейся части (суффикса). Это гарантирует показ популярных запросов, основанных на логах поиска, даже если пользователь начал ввод нетипичным образом.

2005 Антиспам Патенты Google Персонализация

Как Google выявляет спам и предвзятость в кастомизированных результатах поиска (Programmable Search Engines)

Google использует систему контроля качества для Программируемых Поисковых Систем (PSE/CSE), где сторонние провайдеры могут влиять на выдачу через контекстные файлы. Система выявляет спам и предвзятость путем офлайн-анализа аннотаций провайдеров и сравнения кастомизированной выдачи с нативной выдачей Google во время запроса. Если результаты слишком отличаются или содержат много спама, они фильтруются.

2015 Local SEO Патенты Google Персонализация Семантика и интент

Как Google переписывает неявные запросы, определяя сущность по местоположению пользователя и истории поиска

Google использует местоположение пользователя для интерпретации запросов, которые явно не упоминают конкретную сущность (например, [часы работы] или [отзывы]). Система идентифицирует ближайшие объекты, анализирует исторические паттерны запросов для этих объектов и переписывает исходный запрос, добавляя в него название наиболее вероятной сущности.

2012 Google Shopping Trystan G. Upstill Индексация Патенты Google Семантика и интент

Как Google использует структурированные базы данных для ответов на запросы, пересмотра поиска и переранжирования органических результатов

Google анализирует неструктурированные запросы для выявления скрытых потребностей в данных (Service Requirements), таких как поиск товаров или бронирование авиабилетов. Система оценивает доступные структурированные базы данных (каталоги товаров, системы бронирования) и использует их возможности для улучшения поисковой выдачи путем прямого внедрения ответов, уточнения запроса с помощью ограничений или повышения в рейтинге сайтов, предоставляющих доступ к релевантным базам данных.

2013 Google Shopping Knowledge Graph Патенты Google Семантика и интент

Как Google использует структурированные данные для борьбы с дублированием страниц с одинаковыми сущностями (например, фасеты и сортировки)

Google анализирует структурированные данные (например, Schema.org) на веб-страницах, чтобы определить, какие сущности (товары, объекты) на них представлены. Если несколько страниц, особенно с одного сайта, содержат одинаковый набор сущностей (например, листинги с разной сортировкой), Google идентифицирует их как дубликаты. Система понижает или удаляет эти дубликаты из выдачи для повышения разнообразия результатов.

2015 Local SEO Патенты Google Персонализация Семантика и интент

Как Google использует местоположение и направление смартфона для понимания неявных локальных запросов

Google использует данные о местоположении и точной ориентации (направление, наклон) мобильного устройства для интерпретации неявных запросов о ближайших объектах (например, «часы работы» или «что это?»). Система определяет расширенную зону поиска в направлении, куда смотрит пользователь, идентифицирует релевантные сущности в этой зоне (используя также данные с камеры) и переписывает исходный запрос, добавляя название наиболее вероятного объекта.

2012 Knowledge Graph Simon Tong Индексация Патенты Google Семантика и интент

Как Google определяет связанные сущности, анализируя их совместное появление в списках и корректируя результат с учетом их глобальной популярности

Google использует алгоритм расширения набора сущностей (Set Expansion). Система анализирует списки, в которых исходные сущности (seeds) появляются вместе с другими. Чтобы найти действительно связанные сущности, а не просто популярные, система корректирует оценку, используя «фоновую вероятность» (глобальную популярность). Это позволяет продвигать нишевые, но тесно связанные сущности.

2007 Knowledge Graph Мультиязычность Патенты Google Семантика и интент

Как Google использует контекстный анализ и кластеризацию для распознавания значимых фраз и определения их семантической близости

Патент Google описывает язык-независимый метод автоматического определения «значимых фраз» (концепций или сущностей). Система анализирует левый и правый контекст n-грамм, вычисляет их семантическую близость, кластеризует похожие фразы и отфильтровывает контекстный шум. Это позволяет Google отличать осмысленные словосочетания от случайных наборов слов, что критически важно для понимания запросов и контента.

2014 Baris Yuksel Патенты Google Персонализация Свежесть контента Семантика и интент

Как Google использует редкость сущностей (IDF) для персонализации и повышения интересности контента

Google использует механизм для персонализации выдачи (например, в Новостях или Рекомендациях), который повышает в ранжировании документы, содержащие сущности, интересующие пользователя, если эти сущности редко встречаются в недавнем корпусе документов. Редкость измеряется с помощью Inverse Document Frequency (IDF). Система продвигает уникальные комбинации тем (группы сущностей), которые могут быть особенно интересны пользователю.

2012 Патенты Google Персонализация Поведенческие сигналы Свежесть контента

Как Google использует активность в социальных сетях (лайки, репосты, комментарии) для систем обнаружения контента (Discovery)

Google анализирует взаимодействия пользователей (лайки, репосты, комментарии и всплески активности вокруг событий) внутри социальной сети для выявления «интересного» контента. Когда пользователь инициирует поиск без ключевых слов (например, открывает ленту Discovery), система использует эти «сигналы социального взаимодействия», чтобы сгенерировать внутренний запрос и предоставить персонализированную ленту популярного контента.

2016 Индексация Патенты Google Персонализация Семантика и интент

Как Google создает цифровые отпечатки авторов (Author Vectors) для оценки стиля, экспертизы и персонализации ранжирования

Google использует нейронные сети (включая LSTM и архитектуру Encoder-Decoder) для создания векторов авторов (Author Vectors) — числовых представлений, характеризующих стиль письма, личность и способ коммуникации автора. Патент описывает, как эти векторы обучаются на текстах автора и затем используются для корректировки ранжирования результатов поиска, основываясь на профиле автора контента или профиле пользователя, выполняющего поиск.

2010 Google Shopping Мультимедиа Патенты Google Семантика и интент

Как Google обрабатывает визуальные запросы (Google Lens), используя параллельные системы распознавания объектов, лиц и текста

Патент Google, описывающий архитектуру системы визуального поиска. Изображение, используемое как запрос, одновременно отправляется в несколько специализированных систем (распознавание текста, лиц, объектов, штрихкодов). Результаты агрегируются и могут быть представлены в виде интерактивного документа, где элементы изображения связаны с конкретными результатами поиска.

2023 Google Shopping Мультимедиа Патенты Google Семантика и интент

Как Google использует генеративный ИИ для создания и модификации визуальных запросов в поиске товаров

Google патентует систему, которая позволяет пользователям создавать изображения желаемых товаров с помощью генеративного ИИ, используя структурированные подсказки или текст. Полученное изображение используется как визуальный запрос для поиска реальных товаров. Система также позволяет модифицировать существующие результаты поиска (например, удаляя детали) для уточнения визуального намерения.

2009 Google Shopping Патенты Google Персонализация Семантика и интент

Как Google использует атрибуты товаров и популярные запросы для показа альтернативных продуктов в результатах поиска

Google использует систему для генерации рекомендаций связанных товаров в поисковой выдаче. Когда пользователь ищет продукт, система определяет его категорию и ключевые атрибуты, а затем находит популярные альтернативные товары с похожими характеристиками. Система опирается на структурированные данные о продуктах и анализ логов запросов для определения популярности и релевантности рекомендаций.

2007 Индексация Мультиязычность Патенты Google Семантика и интент

Как Google обрабатывает акценты, транслитерацию и синонимы, используя статистику и языковой контекст запроса

Google использует вероятностную систему для обработки лингвистических вариаций (акценты, диакритические знаки, транслитерация). Система определяет вероятный язык запроса и использует заранее созданную таблицу синонимов, которая хранит варианты написания и их частотность в разных языках. Это позволяет Google выбирать наиболее релевантные варианты для расширения запроса, учитывая контекст пользователя.

2004 EEAT и качество SERP Мультимедиа Патенты Google

Как Google анализирует структуру страницы (Token Table) для определения галерей изображений и оценки релевантности текста к картинкам

Google использует механизм «Token Table» для анализа логической структуры веб-страницы. Это позволяет системе вычислять логическое расстояние между текстом и изображениями для оценки их релевантности друг другу (Relatedness). Также система определяет, являются ли равномерно расположенные изображения частью организованной галереи, что может влиять на их ранжирование.

2004 Shumeet Baluja Индексация Мультимедиа Патенты Google Семантика и интент

Как Google объединяет текстовые описания с разных сайтов для улучшения поиска по картинкам

Google улучшает поиск по картинкам, находя дубликаты или похожие изображения на разных сайтах. Система собирает все текстовые метки (из alt-текста, заголовков, окружающего текста), связанные с каждой копией изображения, объединяет их в единый набор и присваивает его всем копиям. Это позволяет находить изображение по любому из описаний, использованных в сети.

2015 EEAT и качество SERP Мультимедиа Патенты Google

Как Google оценивает качество изображений, комбинируя визуальные характеристики, распознанный контент и социальные сигналы для ранжирования

Google использует систему для автоматического определения качества изображений, анализируя три класса характеристик: техническое качество (резкость, экспозиция), содержание (объекты, лица, ландшафты) и социальную популярность (просмотры, шеры, рейтинги). Система присваивает баллы этим характеристикам, взвешивает их (учитывая репутацию пользователей, оставивших отзывы) и формирует общий рейтинг для выбора лучших изображений.

2017 Индексация Патенты Яндекс Поведенческие факторы Ранжирование

Как Яндекс индексирует релевантные страницы, не содержащие ключевых слов, на основе анализа поисковых сессий

Яндекс патентует метод создания «Аннотированного Поискового Индекса». Система анализирует исторические поисковые сессии: если пользователь перешел на страницу, которая не содержит слов из исходного запроса, но провел на ней много времени (например, более 30 секунд) после небольшого числа переходов (1-3), эта страница ассоциируется с исходным запросом в индексе. Это позволяет ранжировать документы (например, изображения или схемы) по запросам, для которых они релевантны, даже без текстового соответствия.

2014 Knowledge Graph Мультимедиа Патенты Google Семантика и интент

Как Google автоматически создает визуальные туры для сущностей, объединяя изображения их ключевых подсущностей

Google использует этот механизм для автоматического создания структурированных визуальных туров (например, фототуров) для сложных или географических сущностей. Система анализирует взаимосвязи в Графе Знаний, определяет наиболее важные подсущности (например, достопримечательности в городе), извлекает их предварительно созданные визуальные представления и объединяет их в единый семантический навигационный опыт для родительской сущности.