Автор: Виктор Репин

2007 Shumeet Baluja Индексация Мультимедиа Патенты Google Семантика и интент

Как Google использует визуальное сходство для определения и уточнения ключевых слов изображений (VisualRank)

Google анализирует визуальные характеристики изображений и строит граф сходства. Релевантные ключевые слова распространяются от размеченных изображений к похожим, но неразмеченным или плохо размеченным изображениям. Это позволяет поисковой системе понять реальное содержание картинки, основываясь на визуальных данных, и отфильтровать шум в метаданных или окружающем тексте.

2017 Индексация Краулинг Патенты Google Семантика и интент

Как Google обучает ML-модели «на лету» и индексирует их для генерации прогнозов в поисковой выдаче

Анализ патента Google, описывающего систему генерации ответов на предиктивные запросы. Если стандартный поиск неэффективен, Google может обучить модель машинного обучения «на лету» на основе исторических структурированных данных или использовать предобученную модель из индекса. В результате пользователь получает прогнозируемый ответ или интерактивный интерфейс, помеченный как предсказание.

2012 Knowledge Graph Мультимедиа Патенты Google Семантика и интент

Как Google использует контент, который вы смотрите (например, на ТВ), для автоматического уточнения и дополнения ваших поисковых запросов

Google использует механизм, который анализирует медиаконтент (фильмы, шоу), потребляемый пользователем на устройстве (например, телевизоре). Система извлекает контекст (актеры, объекты, сцены, диалоги) в реальном времени и использует его для автоматического дополнения последующих поисковых запросов пользователя. Это позволяет уточнить неоднозначные запросы и предоставить более релевантные результаты, связанные с просматриваемым контентом, даже если поиск выполняется на другом устройстве (например, смартфоне).

2011 Local SEO Патенты Google Семантика и интент

Как Google использует местоположение и поведение пользователей для предсказания запросов до их ввода (Zero-Query Search)

Google предсказывает, что пользователь будет искать, сразу после активации функции поиска, но до ввода запроса (Zero-Query Search). Система анализирует текущее местоположение устройства, историю поиска пользователя, его социальные связи и популярность запросов других людей поблизости, чтобы предложить релевантные результаты, категории и подсказки.

2018 SERP Патенты Google Поведенческие сигналы

Как Google использует агрегированные поведенческие данные для маркировки результатов поиска и подсказок индикаторами ожидаемых действий

Google анализирует агрегированные данные о том, что пользователи делают после клика по результату поиска или подсказке (например, покупка, сохранение, бронирование). Если определенное действие статистически значимо для конкретного результата, Google добавляет к нему визуальный индикатор (значок или бейдж), чтобы помочь другим пользователям понять вероятный исход клика.

2018 Индексация Патенты Яндекс Свежесть контента Ссылки

Как Яндекс определяет дату создания документа, используя вероятностный анализ ссылочного графа и иерархию надежности источников

Яндекс патентует метод определения неизвестной даты создания веб-страницы путем анализа ссылочного графа. Система рассчитывает вероятность существования каждой ссылки на основе разницы в возрасте между страницами, их качества (Q) и скорости устаревания контента (τ). Неизвестные даты подбираются так, чтобы максимизировать общую вероятность наблюдаемой структуры ссылок. Метод также устанавливает иерархию надежности для дат, извлеченных из URL, заголовков и контента.

2017 Knowledge Graph SERP Патенты Google Семантика и интент

Как Google определяет запросы, требующие ответа списком, и генерирует ранжированные списки сущностей для SERP

Google использует систему для определения, когда пользователь ищет список объектов (сущностей). Система анализирует запрос на наличие индикаторов списка («лучшие», «топ»), определяет категорию (например, «фильмы») и извлекает релевантные сущности из топовых веб-документов. Затем эти сущности ранжируются на основе их значимости в документе и релевантности документа запросу, и представляются в виде отдельного структурированного списка на странице результатов поиска.

2016 Патенты Яндекс Ранжирование Свежесть контента Ссылки

Как Яндекс определяет реальный возраст и качество веб-страницы с помощью анализа эволюции ссылочного графа

Яндекс использует вероятностную модель для определения времени создания веб-страницы, анализируя структуру и время появления ссылок в сети. Система находит дату, которая максимизирует вероятность наблюдаемой структуры ссылочного графа. Этот метод позволяет игнорировать поддельные даты и одновременно рассчитывать параметр качества страницы на основе временной динамики ссылок.

2008 Мультимедиа Патенты Google Поведенческие сигналы

Как Google (YouTube) автоматически определяет сегменты видео по временным меткам в комментариях и предзагружает их для мгновенного воспроизведения

Google анализирует временные метки (таймкоды) в комментариях к видео для определения популярных сегментов. Система кластеризует близкие метки, ранжирует сегменты по популярности и выполняет их предварительную загрузку (prefetching). Это позволяет пользователям мгновенно переходить к ключевым моментам видео без буферизации.

2009 Мультиязычность Патенты Google Семантика и интент Техническое SEO

Как Google автоматически определяет язык, страну и тип устройства по структуре URL и переранжирует выдачу под пользователя

Google анализирует шаблоны в структуре URL сайта (например, поддомены или папки) и сопоставляет их с фактическим контентом страниц. Система вычисляет вероятность того, что определенный шаблон указывает на язык, страну или тип устройства. При поиске эти данные используются для расчета оценки соответствия (Alignment Score) и повышения в ранжировании той версии страницы, которая лучше всего подходит пользователю, при одновременном понижении дубликатов.

2013 Local SEO Антиспам Безопасный поиск Патенты Google

Как Google использует закон Ципфа для выявления спама и манипуляций с названиями в локальных листингах

Google анализирует все известные названия (Titles), связанные с локальным бизнесом. Система сравнивает распределение частотности слов в этих названиях с двумя моделями: равномерным распределением (характерно для легитимных данных из разных источников) и распределением по закону Ципфа (характерно для маркетинговых текстов и спама). Если распределение ближе к закону Ципфа, листинг помечается как потенциальный спам и понижается в локальной выдаче.

2016 Local SEO Патенты Google Семантика и интент

Как Google использует иерархические географические модели для точного распознавания локальных сущностей в голосовом поиске

Google использует механизм для улучшения точности распознавания голосовых запросов, содержащих редкие или локально-специфичные термины (например, названия местных бизнесов). Система анализирует местоположение пользователя и применяет иерархические географические модели (район, субрегион, регион), построенные на основе локальной популярности терминов, чтобы скорректировать ошибки стандартного распознавания речи и точно определить, какую локальную сущность ищет пользователь.

2010 Google Shopping Мультимедиа Патенты Google Семантика и интент

Как Google превращает объекты на изображениях в интерактивные элементы для выполнения действий (звонок, покупка, маршрут)

Google анализирует визуальные запросы (изображения) для распознавания сущностей (продукты, логотипы, текст, здания). Система находит связанную информацию в индексе (номера телефонов, адреса, URL) и генерирует «действенные результаты» — интерактивные кнопки, позволяющие пользователю немедленно совершить действие (позвонить, купить, проложить маршрут), запуская соответствующее приложение.

2003 EEAT и качество Google Shopping Knowledge Graph Simon Tong Патенты Google

Как Google предлагает пользователям варианты расширения запроса для улучшения результатов поиска

Google использует механизм для расширения поисковых запросов, добавляя синонимы, связанные концепции и альтернативные написания. Патент описывает, как система определяет эти расширения (включая обработку фраз) и как она может представлять их пользователю через интерфейс для уточнения и выбора вариантов перед выполнением поиска.

2013 Knowledge Graph Патенты Google Семантика и интент

Как Google определяет, когда и о чем уведомлять пользователя на основе его интересов и состояния взаимодействия с сущностями

Google использует двухэтапную систему оценки для проактивной доставки информации (например, в Google Discover). Сначала система определяет уровень интереса пользователя к сущности (First Score). Затем вычисляется уверенность в необходимости уведомления (Second Score) с учетом популярности сущности, обратной связи других пользователей и текущего состояния взаимодействия пользователя с этой сущностью (Interaction State), чтобы доставлять только актуальную информацию в подходящее время.

2007 EEAT и качество Local SEO SERP Патенты Google

Как Google автоматически определяет локальный интент и использует местоположение устройства для локализации результатов поиска

Google использует систему для автоматического определения релевантности местоположения для поисковых запросов, особенно с мобильных устройств. Если запрос имеет локальный интент, система идентифицирует местоположение пользователя (через GPS, сеть или профиль) и добавляет его к запросу. Затем система решает, насколько агрессивно продвигать локальные результаты, используя «черные» и «белые» списки запросов для предотвращения ошибок локализации.

2005 Ashutosh Garg Патенты Google Персонализация Поведенческие сигналы

Как Google использует Minhashing для масштабируемой кластеризации пользователей по поведению и интересам

Google использует технику Minhashing для эффективной кластеризации пользователей на основе схожести их действий (кликов, просмотров, покупок). Этот масштабируемый метод лежит в основе коллаборативной фильтрации и систем рекомендаций (например, Google Discover), позволяя обновлять профиль пользователя независимо от других и в реальном времени.

2006 Knowledge Graph Индексация Патенты Google Семантика и интент

Как Google распознает и объединяет дубликаты сущностей в Knowledge Graph, используя агрессивную нормализацию имен

Google использует многоэтапный процесс для разрешения сущностей (Entity Resolution). Система агрессивно нормализует имена сущностей (удаляя стоп-слова, титулы, знаки препинания и сортируя слова по алфавиту), чтобы сгруппировать потенциальные дубликаты. Затем она сравнивает другие атрибуты (факты) этих сущностей, чтобы принять окончательное решение об их объединении в Knowledge Graph.

2009 Knowledge Graph Индексация Патенты Google Семантика и интент

Как Google использует шаблоны сайтов и структурированные компоненты для извлечения и расширения наборов сущностей (Entity Set Expansion)

Патент описывает, как Google автоматически расширяет наборы данных (например, таблицы или списки). Система анализирует существующие сущности и ищет новые похожие элементы в интернете. Для этого используются два ключевых метода: анализ повторяющихся шаблонов веб-страниц (Template Analysis) и извлечение данных из структурированных компонентов (HTML-таблиц и списков) на сайтах.

2017 Индексация Патенты Яндекс Свежесть контента Ссылки

Как Яндекс определяет возраст документа, используя граф ссылок и вероятностный анализ дат

Яндекс патентует метод оценки времени создания веб-страниц, когда эта дата неизвестна или недостоверна. Система использует известные даты, извлекает даты из текста («временные выражения»), а затем распространяет эту информацию по графу ссылок. Неизвестные даты определяются путем оптимизации (например, градиентным спуском): система ищет такие временные метки, которые максимизируют вероятность существования наблюдаемой структуры ссылок, исходя из разницы в возрасте между страницами.