Автор: Виктор Репин

Google использует технологию транскодирования и разделения веб-страниц для ускорения мобильного поиска. Контент первого экрана (Above-The-Fold, ATF) встраивается прямо в страницу результатов поиска (SERP). При клике на результат ATF-контент отображается мгновенно, пока остальная часть страницы (BTF) загружается в фоновом режиме.

2012 Индексация Мультимедиа Патенты Google Семантика и интент

Как Google идентифицирует и маркирует конкретные объекты и действия внутри видео, используя метаданные всего ролика

Google использует технологию для автоматического определения и маркировки специфических объектов или действий (называемых «объемами») внутри видео. Система анализирует визуальные характеристики, сегментирует видео на пространственно-временные части и использует существующие метаданные всего видео (например, теги или описание) для присвоения высокоточных меток этим конкретным сегментам без ручного вмешательства.

2010 SERP Патенты Google Персонализация Семантика и интент

Как Google показывает прямые ответы (Answer Boxes) в подсказках Autocomplete во время ввода запроса

Google использует систему для интеграции блоков с ответами (Answer Boxes), таких как прогноз погоды или определения, непосредственно в интерфейс поисковых подсказок (Autocomplete). Система прогнозирует вероятный полный запрос пользователя (Dominant Query) или анализирует исторические данные, чтобы показать наиболее релевантный ответ еще до того, как пользователь отправит запрос.

2003 Knowledge Graph Патенты Google Семантика и интент

Как Google структурирует базу знаний (Онтологию): концепции, типы связей и направленная семантическая близость

Фундаментальный патент (Applied Semantics), описывающий структуру и методы создания Онтологии (Knowledge Graph). Система определяет концепции (сущности) через группы синонимов, устанавливает иерархические и латеральные связи между ними и присваивает этим связям количественную оценку силы (вес). Ключевая особенность — вес является направленным (асимметричным), что позволяет точно рассчитывать семантическое расстояние.

2016 EEAT и качество Local SEO Патенты Google Персонализация

Как Google управляет неопределенностью геолокации пользователя по IP-адресу для таргетинга контента

Google использует вероятностную модель для управления неточностью определения местоположения пользователя по IP-адресу. Система рассчитывает и ранжирует вероятности нахождения пользователя в разных локациях. Патент описывает применение настраиваемых порогов (ранга вероятности, уверенности в локации, расстояния) для геотаргетинга контента и механизм обратной связи, который корректирует эти пороги на основе анализа взаимодействий (CTR, конверсии).

2011 Google Shopping Мультимедиа Патенты Google Семантика и интент

Как Google использует изображения пользователей для автоматического обучения и расширения своих возможностей визуального распознавания объектов

Google улучшает свои возможности визуального поиска, анализируя изображения, загружаемые пользователями (query images). Система автоматически добавляет уверенно распознанные пользовательские изображения в свою обучающую базу данных, чтобы лучше распознавать вариации известных объектов. Она также кластеризует нераспознанные изображения для обнаружения совершенно новых объектов и определяет внешние наборы данных, релевантные запросам пользователей, для расширения своей базы знаний.

2013 Knowledge Graph Индексация Патенты Google Семантика и интент

Как Google находит, объединяет и обогащает связанные таблицы, разбросанные по разным веб-страницам

Google использует механизм для идентификации связанных таблиц («stitchable tables») на разных веб-страницах. Система проверяет семантическую эквивалентность заголовков, извлекает скрытые атрибуты из окружающего контекста (текст, URL) и объединяет все данные в единую, обогащенную таблицу («union table») для лучшего понимания структурированных данных в вебе.

2015 Knowledge Graph Мультимедиа Патенты Google Семантика и интент

Как Google использует распознавание объектов, метаданные и расширение меток для глубокого понимания и индексации изображений

Google применяет многоуровневую систему анализа изображений, комбинируя метаданные (GPS, время), первичное распознавание объектов (Primary Annotation) и вторичные метки, полученные через семантическое и иерархическое расширение (Label Expansion). Это позволяет системе строить глубокое понимание визуального контента, присваивать меткам оценки уверенности (Confidence Scores) и понимать сложные запросы на естественном языке.

2021 Local SEO Антиспам Патенты Яндекс Яндекс Карты

Как Яндекс использует графовый анализ для выявления скоординированных накруток рейтингов организаций

Яндекс патентует метод борьбы с манипуляциями рейтингами организаций (например, в Картах или Поиске). Система строит граф связей между организациями на основе общих пользователей, которые их оценивали. Алгоритм ищет плотные группы организаций (полные подграфы), которые массово оцениваются одним и тем же пулом пользователей. Если распределение этих оценок аномально (например, только максимальные или минимальные баллы), система идентифицирует это как скоординированную атаку, помечает пользователей как нарушителей и удаляет их оценки.

2014 Мультимедиа Патенты Google Персонализация Семантика и интент

Как Google использует изображения и видео на экране пользователя для уточнения неоднозначных поисковых запросов

Google может анализировать активные нетекстовые данные (изображения или видео), отображаемые на устройстве пользователя в момент ввода запроса. Если запрос неоднозначен (например, содержит местоимения или общие фразы), система извлекает из визуального контента сущности, текст (через OCR) или структурированные данные (QR-коды) и использует их для автоматической модификации запроса, чтобы лучше понять намерение пользователя и предоставить точные результаты или инициировать действия.

2004 Shumeet Baluja Мультиязычность Патенты Google Персонализация Семантика и интент

Как Google использует логи поисковых запросов и анализ ко-оккурентности (N-грамм) для создания динамических словарей (Google Suggest)

Патент раскрывает методы генерации словарей для предиктивного ввода и автодополнения (Google Suggest). Google анализирует популярность терминов и частоту их совместного использования (ко-оккурентность) в глобальных логах поисковых запросов и веб-документах. На основе этих данных система создает динамические, контекстно-зависимые словари, которые используются для ускорения ввода текста и предсказания запросов.

2009 EEAT и качество Local SEO Мультимедиа Патенты Google

Как Google использует компьютерное зрение для сопоставления изображений, уточнения координат и извлечения данных о бизнесе из Street View

Google повышает точность геолокации, используя систему компьютерного зрения для сравнения изображений с веб-сайтов (например, сайтов недвижимости или бизнеса) с изображениями Street View. Если объекты визуально совпадают, координаты адреса уточняются. Кроме того, система извлекает текст (названия, часы работы) напрямую из Street View с помощью OCR для автоматического обогащения локальных бизнес-листингов.

2015 SERP Патенты Google Персонализация Семантика и интент

Как Google адаптирует понимание запроса, ранжирование и формат выдачи в зависимости от типа устройства пользователя (смартфон vs. часы)

Google определяет тип устройства пользователя (например, смартфон или умные часы) и на основе этого предполагает его намерение (интент). Система модифицирует исходный запрос, изменяет ранжирование и форматирует результаты, чтобы предоставить наиболее релевантный и удобный ответ для конкретного устройства и контекста использования.

2013 Knowledge Graph Мультимедиа Патенты Google Семантика и интент

Как Google использует OCR и анализ текста (NLP) для идентификации ТВ-контента и генерации связанных поисковых запросов

Патент Google описывает систему для интерактивного ТВ, которая идентифицирует просматриваемую программу путем захвата экрана и применения оптического распознавания символов (OCR) к информационным оверлеям (например, ТВ-гиду). Система анализирует извлеченный текст, выделяет ключевые сущности (Noun Phrases) и автоматически генерирует релевантные поисковые запросы, используя метрики приоритета (Proximity Score) для предоставления связанного интернет-контента.

2013 Google Shopping Knowledge Graph Патенты Google Семантика и интент

Как Google проводит аукционы для рекламы на основе пар «Сущность-Действие» и адаптирует ее показ в зависимости от интента пользователя

Патент Google описывает механизм показа спонсируемого контента, основанный не на ключевых словах, а на парах «Сущность-Действие» (например, {Фильм, Смотреть онлайн}). Система проводит отдельные аукционы для каждого действия, связанного с сущностью. Визуальное отображение (заметность и позиция) этого контента динамически меняется в зависимости от того, насколько точно запрос пользователя соответствует этому действию.

2011 Knowledge Graph Индексация Патенты Google Семантика и интент

Как Google определяет главные темы (Центральные Сущности) страницы с помощью графа связей сущностей

Google использует глобальный граф сущностей для определения главных тем (Центральных Сущностей) веб-страницы. Система анализирует, как сущности на странице связаны друг с другом на основе статистики их совместного упоминания в вебе (PMI). Сущности, которые изолированы или не имеют исходящих связей в контексте страницы, отбрасываются как периферийные. Этот механизм позволяет точно понять основные темы документа.

2003 Индексация Мультиязычность Патенты Google Семантика и интент

Как Google использует лингвистический анализ для расширения запросов и индекса с помощью словоформ, составных слов и вариантов написания

Патент Google описывает фундаментальные методы улучшения поиска путем учета лингвистических вариаций. Система автоматически расширяет запросы или индекс, добавляя словоформы (склонения, спряжения), альтернативные написания (орфографические варианты) и различные формы составных слов (слитно, раздельно, через дефис). Это гарантирует, что релевантные документы будут найдены независимо от конкретной формы слова, использованной в запросе или тексте.

2008 EEAT и качество Патенты Google Персонализация Свежесть контента

Как Google решает проблему «холодного старта», присваивая новым авторам начальный рейтинг на основе их атрибутов

Google использует механизм для оценки нового контента от авторов без истории рейтинга. Система идентифицирует атрибуты нового автора (например, email-домен, демографию, членство в группах) и рассчитывает начальный рейтинг на основе существующих оценок других авторов с аналогичными атрибутами. Это позволяет оценить качество контента до получения реальных отзывов пользователей.

2013 Knowledge Graph Индексация Патенты Google Семантика и интент

Как Google использует данные из Поиска (IR) и Knowledge Graph для обучения языковых моделей (NLP) понимать сложные запросы и документы

Патент описывает, как Google улучшает понимание коротких, неоднозначных или грамматически некорректных текстов, таких как поисковые запросы. Для этого модели обработки языка (NLP) обучаются с использованием аннотаций от системы информационного поиска (IR), например, связей с Knowledge Graph. Это позволяет NLP-системам точнее определять структуру и смысл текста, опираясь на внешние знания о сущностях.

2004 Индексация Мультиязычность Патенты Google Семантика и интент

Как Google использует частотность фраз в веб-индексе и логах запросов для разделения слитного текста на слова

Google использует статистический анализ для интерпретации строк без пробелов (например, URL, доменных имен или слипшихся слов в запросах). Система генерирует различные варианты разделения строки на слова и проверяет, какой из вариантов чаще встречается в индексе веб-документов или в истории поисковых запросов. Наиболее частотный вариант признается правильной интерпретацией.