Автор: Виктор Репин

2015 Индексация Краулинг Патенты Google Ссылки

Как Google индексирует контент внутри мобильных приложений и направляет туда пользователей из поиска (App Indexing)

Google индексирует контент, просмотренный в нативных мобильных приложениях. Система получает от приложения идентификатор контента, его описание и deep link. Это позволяет Google показывать в результатах поиска прямые ссылки на конкретный контент внутри приложения (если оно установлено), повышая вовлеченность пользователей и видимость приложения в поиске.

2016 SERP Патенты Яндекс Поведенческие факторы Яндекс Браузер

Как Яндекс детально отслеживает и синхронизирует поведение пользователей в поиске между устройствами

Яндекс патентует инфраструктуру для детального логирования и синхронизации поисковых сессий пользователя. Система перехватывает контрольные сообщения между браузером и сервером, сохраняя полную историю взаимодействий (запросы, клики по SERP, навигация, возвраты), включая данные, невидимые для локальной истории браузера. Это обеспечивает непрерывность поиска между устройствами и формирует базу поведенческих данных.

2010 Патенты Google Персонализация Поведенческие сигналы Семантика и интент

Как Google определяет скрытый интент сессии, используя универсальные уточняющие слова, и переранжирует выдачу

Google идентифицирует универсальные слова-модификаторы (например, «фото», «отзывы», «pdf»), которые пользователи часто добавляют к разным запросам. Если такое слово появляется в сессии, система определяет скрытый интент пользователя. Затем Google переранжирует выдачу, основываясь на том, какие документы исторически предпочитали пользователи с таким же интентом, адаптируя результаты под контекст сессии.

2007 Антиспам Безопасный поиск Патенты Google Поведенческие сигналы

Как Google фильтрует поведенческие сигналы, моделируя типичное поведение пользователей для выявления и нейтрализации кликового спама

Google использует систему для обнаружения аномальной сетевой активности (кликового спама) путем создания статистических моделей ожидаемого поведения сетевых объектов (IP-адресов, cookies, запросов). Система анализирует множество параметров и выявляет объекты, чье поведение отклоняется от нормы. Активность таких объектов (например, клики по результатам поиска) дисконтируется или полностью игнорируется при ранжировании, что защищает поиск от манипуляций поведенческими факторами.

2013 Kedar Dhamdhere Мультиязычность Патенты Google Поведенческие сигналы Семантика и интент

Как Google определяет значение многозначных слов (Word Sense Disambiguation), анализируя паттерны замен в логах запросов

Google использует статистический анализ текстовых корпусов (преимущественно логов запросов), чтобы определить значение многозначного слова в контексте. Система проверяет, какие альтернативные термины пользователи взаимозаменяют в одинаковых фразах. Если два термина часто заменяют исходное слово в одних и тех же контекстах, они считаются относящимися к одному значению. Это позволяет точнее понимать интент и корректно расширять запрос синонимами.

2004 EEAT и качество Патенты Google Персонализация Поведенческие сигналы

Как Google использует социальные связи, одобрения и идентификацию экспертов для персонализации и переранжирования поиска

Патент Google, описывающий интеграцию поисковой системы с социальной сетью (Member Network). Система позволяет пользователям одобрять (Endorse) контент. При поиске система идентифицирует одобрения от связанных пользователей (друзей) и, что критически важно, от пользователей, признанных экспертами в тематике запроса. Эти сигналы доверия и экспертизы используются для значительного повышения одобренных результатов в персонализированной выдаче.

2013 EEAT и качество Local SEO Патенты Google Поведенческие сигналы

Как Google использует данные о реальном пешеходном трафике (Foot Traffic) для определения качества и характеристик локального бизнеса

Этот патент раскрывает, как Google анализирует анонимизированные данные о местоположении (пешеходный трафик) для понимания физических локаций. Сравнивая фактические посещения с вместимостью заведения и сегментируя визиты по времени и демографии пользователей, Google рассчитывает оценки качества и специфические характеристики (например, «подходит для детей» или «популярно у пожилых людей»). Эти сигналы затем используются для ранжирования и персонализации результатов локального поиска.

2016 EEAT и качество SERP Антиспам Патенты Google

Как Google использует Reinforcement Learning для оптимизации долгосрочной вовлеченности пользователя и подавления кликбейта

Google использует модель машинного обучения (Reinforcement Learning) для прогнозирования, как показ конкретного результата повлияет на будущую активность пользователя. Если контент (даже кликабельный) снижает долгосрочную вовлеченность, система может его не показать, предпочитая контент, который сохраняет лояльность пользователя к платформе.

2013 EEAT и качество Патенты Google Персонализация Поведенческие сигналы

Как Google использует время, дистанцию и известность (Prominence) для определения посещаемых физических локаций и прогнозирования будущих визитов

Google анализирует историю местоположений пользователей для точной идентификации посещаемых бизнесов, даже при неточных данных GPS. Система ранжирует ближайшие локации, учитывая расстояние, известность бизнеса (Prominence Score), его категорию и время суток. Патент также описывает, как Google использует модели Маркова для прогнозирования будущих посещений на основе прошлых поведенческих паттернов, что позволяет проактивно персонализировать выдачу информации.

2013 Knowledge Graph Патенты Google Поведенческие сигналы Семантика и интент

Как Google использует структурированные данные (Schema) для отслеживания вовлеченности пользователей на уровне сущностей, а не только URL

Google может отслеживать поведение пользователей (например, время пребывания на странице и клики) и связывать его с конкретными сущностями (продуктами, людьми, темами), идентифицированными через структурированные данные, а не только с URL-адресом. Это позволяет агрегировать метрики вовлеченности для определенной темы на разных страницах и сравнивать эффективность сайтов.

2013 Индексация Краулинг Патенты Google Ссылки

Как Google сканирует и индексирует контент внутри мобильных приложений с помощью эмуляции и извлечения данных

Google использует виртуальные машины для эмуляции мобильных операционных систем. В этой среде запускаются нативные приложения, и система применяет специализированные экстракторы для извлечения контента (текст, изображения, списки) непосредственно перед его рендерингом. Это позволяет индексировать внутренний контент приложений и показывать его в результатах поиска с функцией глубоких ссылок (Deep Linking).

2013 EEAT и качество Navneet Panda Антиспам Патенты Google Семантика и интент

Как Google использует «Фразовую модель» (Phrase Model) для прогнозирования качества сайта на основе статистики использования N-грамм

Google прогнозирует оценку качества сайта, анализируя, какие фразы (N-граммы) используются и как часто они распределены по страницам сайта. Система создает «Фразовую модель», изучая известные высококачественные и низкокачественные сайты, а затем применяет эту модель для оценки новых сайтов по их лингвистическим паттернам.

Индексация Патенты Google Семантика и интент Ссылки

Как Google использует анализ со-цитирования (Co-citation) для группировки результатов поиска по темам

Google использует механизм кластеризации для организации поисковой выдачи, особенно при неоднозначных запросах. Система анализирует, какие внешние страницы одновременно ссылаются на несколько результатов поиска (со-цитирование). На основе этого вычисляется показатель сходства, который учитывает и нормализует популярность страниц, чтобы точно сгруппировать результаты по конкретным темам (например, отделить «Saturn» как планету от «Saturn» как автомобиль).

2021 Обучение моделей Патенты Яндекс Рекомендательные системы Холодный старт

Как Яндекс создает единое мультимодальное векторное пространство для поведения пользователей, текста и изображений

Яндекс патентует метод создания единого векторного пространства (User Item Space), объединяющего данные о поведении пользователей, текстовый контент и изображения. Система обучается понимать связь между разными типами контента (кросс-модальное отображение) на основе того, как пользователи взаимодействуют с ними в рамках одной сессии. Это позволяет автоматически ассоциировать контент с интересами пользователя без ручной разметки ключевыми словами.

2024 SERP Колдунщики Патенты Яндекс Семантический поиск

Как Яндекс использует каскад нейросетей (Трансформеров) для генерации Быстрых Ответов (Колдунщиков)

Яндекс патентует многоэтапную систему для генерации прямых ответов (Quick Answers) на запросы. Система использует каскад из трех моделей машинного обучения (включая Трансформеры/BERT) для генерации семантических векторов, расчета релевантности источников и точного извлечения фрагмента ответа (Answer Span). Модели обучаются на исторических данных о поведении пользователей.

2013 Knowledge Graph Патенты Google Семантика и интент Ссылки

Как Google использует анкорные тексты ссылок на авторитетные источники (например, Wikipedia) для обучения своих NLP-систем

Google автоматически создает массивный обучающий набор данных для своих систем семантического анализа (NLP). Система анализирует миллионы веб-страниц, которые ссылаются на авторитетные источники (например, Wikipedia). Анкорный текст этих ссылок рассматривается как высокоточное упоминание сущности, которое затем используется для обучения алгоритмов распознавания сущностей (NER), их типизации и разрешения неоднозначностей.

2016 Local SEO Метрики качества поиска Патенты Яндекс Ранжирование Яндекс Карты

Как Яндекс использует количество фотографий и компьютерное зрение для ранжирования локальных объектов и организаций (Фоторейтинг)

Яндекс патентует метод ранжирования точек интереса (POI), таких как организации или достопримечательности, на основе их популярности, измеряемой количеством связанных фотографий («Фоторейтинг»). Система агрегирует фотографии, используя не только метаданные (GPS, описание), но и технологию компьютерного зрения для идентификации фотографий объекта, у которых отсутствуют точные метаданные. Большее количество уникальных фотографий от разных пользователей повышает рейтинг объекта в локальном поиске.

2019 EEAT и качество Мультимедиа Патенты Google Семантика и интент

Как Google использует клики пользователей для обучения ИИ понимать и ранжировать изображения в поиске и Google Lens

Google использует данные о поведении пользователей из логов поиска для обучения моделей эмбеддингов изображений и текста. Система анализирует, какие изображения пользователи кликают по определенным запросам (Query-Image) и какие изображения кликают вместе (Image-Image Co-clicks). Это позволяет ИИ изучить семантическую связь между текстом и визуальным контентом, формируя основу для ранжирования в Google Images и работы визуального поиска Google Lens.

2014 Google Shopping Краулинг Патенты Google Ссылки

Как Google использует внутренние ссылки и структуру DOM для генерации шаблонов сайта и извлечения структурированных сниппетов

Google анализирует повторяющиеся блоки внутренних ссылок (например, списки товаров). Если текст возле ссылки на исходной странице совпадает с текстом на целевой странице, Google определяет DOM-структуру этого текста и создает шаблон домена. Этот шаблон позволяет автоматически извлекать ключевую информацию (например, цену и характеристики) для сниппетов со всех однотипных страниц сайта, даже без микроразметки.

2008 Антиспам Патенты Google Поведенческие сигналы

Как Google использует соотношение шеров к просмотрам (Shares/Views Ratio) для ранжирования результатов поиска

Патент Google, описывающий метод улучшения ранжирования с помощью анализа «социальных сигналов» (Social Reference Data). Система отслеживает, как часто пользователи делятся контентом (через email, соцсети, блоги, закладки) и сколько раз его просматривают. Ключевой метрикой является нормализованный показатель — соотношение количества шеров к количеству просмотров. Этот фактор используется для переранжирования выдачи или объединяется с традиционными факторами ранжирования.