SEO HARDCORE
  • Разборы патентов
    • Патенты Google
  • Скоро SEO инструменты
  • Скоро SEO аналитика
  • seohardcore
SEO HARDCORE

Семантика и интент в Google: разборы патентов

Детальные разборы патентов Google, связанные с семантикой, поисковыми запросами и интентами
  • Ссылки
  • Поведенческие сигналы
  • Антиспам
  • Семантика и интент
  • EEAT и качество
  • SERP
  • Персонализация
  • Индексация
  • Мультимедиа
  • Local SEO
  • Техническое SEO
  • Knowledge Graph
  • Свежесть контента
  • Краулинг
  • Структура сайта
  • Мультиязычность
  • Безопасный поиск
  • Google Shopping
Как Google определяет контекстную значимость слов в запросе, делая неважные термины опциональными при поиске
Google использует систему для определения значимости слов в поисковом запросе в зависимости от их контекста. Анализируя историю запросов, система выявляет, меняется ли выдача при добавлении определенного слова. Если выдача остается схожей, слово признается малозначимым в данном контексте. При обработке запроса такие слова становятся опциональными (необязательными для нахождения в документе) и получают пониженный вес при ранжировании.
  • US8346757B1
  • 2005-03-28
  • Семантика и интент

  • SERP

Как Google передает данные об интересах пользователя сторонним сайтам для персонализации контента после клика
Google анализирует активность пользователя для определения его тематических интересов (например, "тайская еда" или "собаки"). При генерации поисковой выдачи Google может закодировать релевантные интересы прямо в URL ссылки. Это позволяет стороннему сайту немедленно адаптировать контент лендинга под пользователя и потенциально передать данные о его поведении обратно в Google для уточнения профиля.
  • US9754036B1
  • 2014-03-26
  • Персонализация

  • Поведенческие сигналы

  • SERP

Как Google использует машинное обучение для извлечения фактов из текста и перевода вопросов на естественном языке в пути Графа Знаний
Анализ патента Google, описывающего два ключевых механизма: автоматическое расширение Графа Знаний путем анализа текста и ответы на вопросы на естественном языке. Система использует машинное обучение для определения надежных путей (связей) в графе. Эти пути используются как для вывода новых фактов из веб-документов, так и для интерпретации запросов пользователей и поиска прямых ответов.
  • US10810193B1
  • 2013-03-13
  • Knowledge Graph

  • Семантика и интент

Как Google определяет язык запроса, используя язык интерфейса и статистику по словам для добавления правильных диакритических знаков
Google использует механизм для точного определения языка, на котором пользователь вводит запрос, особенно когда слова неоднозначны или не содержат диакритических знаков. Система анализирует язык интерфейса пользователя и статистику использования слов в разных языках. Это позволяет Google понять, какие диакритические знаки (например, акценты) следует добавить к запросу, чтобы найти наиболее релевантные документы на правильном языке.
  • US8762358B2
  • 2006-04-19
  • Мультиязычность

  • Семантика и интент

Как Google ограничивает использование синонимов, требуя сохранения исходного контекста фразы
Google классифицирует синонимы по степени надежности. Если синоним считается ненадежным или узкоконтекстным (Phrase-Restricted Substitute Term), он должен появиться в документе рядом с теми же соседними словами, что и в исходном запросе. Если это условие не выполняется, документ может быть исключен из ранжирования еще на этапе отбора кандидатов.
  • US20150205866A1
  • 2012-05-31
  • Семантика и интент

Как Google использует историю поиска и контекст пользователя для проактивной доставки информации (Основы Google Discover/Assistant)
Google анализирует историю поиска пользователя для выявления повторяющихся интересов (например, спорт, погода, статус рейсов), особенно тех, которые вызывают показ прямых ответов (Inline Search Results). Отслеживая контекст пользователя (местоположение, время) и изменения в информации, Google проактивно отправляет обновленные результаты на устройство без ручного ввода запроса.
  • US20130346396A1
  • 2013-07-12
  • Персонализация

  • Поведенческие сигналы

  • Свежесть контента

Как Google использует точное место клика или касания пользователя для улучшения исправления опечаток и текстовых подсказок
Google использует механизм для повышения релевантности предлагаемых исправлений текста (например, в поисковой строке или редакторе). Система анализирует не только слово целиком, но и точное место, рядом с которым пользователь установил курсор или коснулся экрана. Предложения по исправлению фильтруются в зависимости от того, соответствуют ли они этой указанной пользователем позиции редактирования.
  • US20140280109A1
  • 2013-03-14
  • Семантика и интент

  • Поведенческие сигналы

Как Google использует удаленный контекст в запросе ("Floating Context") для точного подбора синонимов
Google использует механизм для валидации синонимов, анализируя не только соседние слова в запросе (Adjacent Context), но и слова, расположенные далеко от исходного термина (Floating Context). Это позволяет точнее определять уместность синонима, опираясь на весь контекст запроса, и избегать неверных замен, если контекст их исключает.
  • US8538984B1
  • 2012-04-03
  • Семантика и интент

Как Google извлекает факты напрямую из веб-страниц для формирования прямых ответов (Featured Snippets / Answer Boxes)
Google использует систему для динамического извлечения фактов из веб-индекса. Когда поступает фактический запрос, система определяет ожидаемый тип ответа (например, дата, число, имя), анализирует топовые результаты поиска и извлекает соответствующие фразы. Эти фразы нормализуются, оцениваются по частоте, контексту и авторитетности источника, и лучший вариант показывается в виде прямого ответа.
  • US8655866B1
  • 2011-02-10
  • Индексация

  • Семантика и интент

  • SERP

Как Google определяет сущности (например, болезни) по списку признаков (например, симптомов) в запросе пользователя
Google использует различные методы для ответа на запросы, содержащие список признаков (атрибутов), но не называющие саму сущность. Система определяет, какой тип сущности ищет пользователь (например, медицинское состояние по симптомам), и идентифицирует наиболее релевантные сущности. Для этого анализируется частота упоминания сущностей в результатах поиска по исходному запросу или используются специально сгенерированные комбинированные запросы.
  • US8843466B1
  • 2011-09-27
  • Семантика и интент

  • Knowledge Graph

  • Индексация

Как Google использует контент, который вы сейчас просматриваете, для фильтрации и уточнения вашей поисковой выдачи
Google анализирует контекст веб-страницы или документа, который просматривает пользователь, чтобы определить основную тему (топик). Когда пользователь вводит запрос, система фильтрует результаты поиска, отдавая предпочтение тем документам, которые соответствуют этой контекстной теме, тем самым уточняя выдачу для неоднозначных запросов.
  • US8762368B1
  • 2012-04-30
  • Семантика и интент

  • SERP

  • Персонализация

Как Google использует структурированные данные для борьбы с дублированием страниц с одинаковыми сущностями (например, фасеты и сортировки)
Google анализирует структурированные данные (например, Schema.org) на веб-страницах, чтобы определить, какие сущности (товары, объекты) на них представлены. Если несколько страниц, особенно с одного сайта, содержат одинаковый набор сущностей (например, листинги с разной сортировкой), Google идентифицирует их как дубликаты. Система понижает или удаляет эти дубликаты из выдачи для повышения разнообразия результатов.
  • US20140280084A1
  • 2013-03-15
  • Семантика и интент

  • SERP

  • Индексация

Как Google использует результаты веб-поиска для выбора правильного ответа на неоднозначные фактические запросы
Google использует этот механизм для разрешения неоднозначности в запросах (например, «возраст Вашингтона»). Система генерирует несколько потенциальных ответов из Knowledge Graph, а затем проверяет, какой из них лучше всего подтверждается топовыми результатами органического поиска. Оценка кандидата зависит от того, насколько часто и уверенно Сущность (Topic) и Ответ (Answer) упоминаются (аннотируются) на страницах в топе выдачи.
  • US9336269B1
  • 2013-03-14
  • Семантика и интент

  • Knowledge Graph

  • SERP

Как Google делает поиск «сессионным» (stateful), объединяя параметры из последовательных запросов пользователя
Google может определять, когда несколько последовательных запросов пользователя являются частью одного исследования («линии запроса»). Система объединяет параметры из этих запросов, создавая «комбинированный запрос». Это позволяет пользователю постепенно уточнять поиск (особенно голосом), не повторяя предыдущие условия, делая процесс более естественным и контекстуальным.
  • US11468052B2
  • 2020-06-25
  • Семантика и интент

Как Google связывает названия бизнесов с категориями для локального расширения запросов
Google использует систему для анализа названий и категорий бизнесов в конкретных географических регионах. Система определяет, можно ли однозначно связать название бизнеса (или его часть) с определенной категорией услуг. Если связь установлена, Google расширяет запросы, содержащие это название, добавляя соответствующую категорию. Это позволяет обобщать локальный поиск от конкретного бренда к общей услуге в данном регионе.
  • US8983956B1
  • 2013-03-15
  • Local SEO

  • Семантика и интент

Как Google извлекает факты из неструктурированного текста, используя «Контекстные Облака» для наполнения Knowledge Graph
Google использует механизм для понимания фактов и связей, описанных в свободном (неструктурированном) тексте. Система анализирует слова, окружающие сущность («Контекстное Облако»), и сравнивает этот контекст с тем, как эти слова используются в уже известных фактах. Это позволяет системе извлекать новую информацию и автоматически расширять Knowledge Graph, даже если контент не использует строгую разметку или шаблоны.
  • US10102291B1
  • 2015-07-06
  • Knowledge Graph

  • Семантика и интент

Как Google использует семантические сигнатуры на основе фраз для выявления и удаления дубликатов контента
Google использует механизм для обнаружения дубликатов и почти дубликатов контента. Система анализирует, какие семантически связанные фразы (related phrases) содержатся в документе. Затем она выбирает несколько ключевых предложений с наибольшей концентрацией этих фраз для создания уникальной сигнатуры документа. Если сигнатуры двух документов совпадают, они считаются дубликатами и удаляются из индекса или поисковой выдачи.
  • US7711679B2
  • 2004-07-26
  • Семантика и интент

  • Индексация

  • SERP

Как Google вычисляет семантическую схожесть контента с помощью векторов тем и косинусного сходства
Google использует механизм для эффективного определения семантической схожести документов. Система генерирует «Сигнатуру Документа» — вектор, состоящий из абстрактных тем (Topics) и весов (Weights), показывающих значимость каждой темы. Схожесть вычисляется путем сравнения этих векторов с использованием Косинусного Сходства (Cosine Similarity), что позволяет системе понимать тематические взаимосвязи в масштабе.
  • US8886648B1
  • 2012-01-31
  • Семантика и интент

  • Индексация

Как Google использует многоэтапное ранжирование и автоматическое расширение запросов для повышения релевантности выдачи
Google использует многоэтапную систему ранжирования для эффективной оценки сложных сигналов, таких как близость терминов, атрибуты (заголовки, шрифты) и контекст. Система также автоматически анализирует топовые результаты, чтобы найти дополнительные термины для расширения исходного запроса (Relevance Feedback), улучшая релевантность в последующих итерациях поиска.
  • US8407239B2
  • 2004-08-13
  • Семантика и интент

Как Google динамически выбирает текст для сниппета, основываясь на типе запроса и структуре документа
Google использует адаптивную систему для генерации сниппетов в результатах поиска. Система анализирует тип запроса (например, поиск по автору или по содержанию) и местоположение ключевых слов в документе. На основе этого выбирается алгоритм генерации. Параграфы оцениваются по их длине, позиции в документе, качеству текста и форматированию, чтобы выбрать наиболее информативный фрагмент, часто отдавая предпочтение введению или резюме.
  • US8145617B1
  • 2005-11-18
  • SERP

  • Семантика и интент

Как Google переранжирует результаты поиска в реальном времени, скрывая контент, который пользователь уже видел на других сайтах
Google использует механизм оценки новизны информации для динамической корректировки поисковой выдачи во время сессии пользователя. Система вычисляет «Information Gain Score» для непросмотренных документов, определяя, сколько новой информации они содержат по сравнению с уже посещенными сайтами. Результаты с уникальной информацией повышаются, а повторяющийся контент понижается, чтобы уменьшить избыточность.
  • US11354342B2
  • 2018-10-18
  • SERP

  • Семантика и интент

  • Персонализация

Как Google использует сущности, онтологии и векторные представления для кластеризации и организации поисковой выдачи
Google использует этот механизм для структурирования поисковой выдачи по широким запросам. Система группирует результаты в кластеры на основе их связи с сущностями из Базы Знаний. Для объединения кластеров используются онтологические связи (иерархия, синонимы) и векторная близость (embedding similarity). Система параллельно тестирует несколько алгоритмов и выбирает наилучшую структуру SERP на основе метрик качества (покрытие, баланс, пересечение, силуэт).
  • US10496691B1
  • 2015-09-08
  • SERP

  • Семантика и интент

  • Knowledge Graph

Как Google определяет главную тему страницы (Topical Entity), используя графы сущностей и анализ SERP Features
Google анализирует сущности на странице для определения «Topical Entity» (главной темы). Для этого используются графы сущностей, основанные на совместной встречаемости, и анализ результатов поиска. Присутствие сущности в Title/URL и активация специальных SERP features (Shopping, Maps) могут подтвердить главную тему, даже если страница ранжируется низко. Это понимание используется для генерации релевантного дополнительного контента.
  • US10068022B2
  • 2011-06-03
  • Семантика и интент

  • Knowledge Graph

  • SERP

Как Google извлекает, формирует и оценивает контент для Featured Snippets из структурированных и неструктурированных данных
Google использует систему для генерации Featured Snippets (ответных пассажей) в ответ на запросы-вопросы. Система анализирует топовые результаты, разделяя контент на структурированный (таблицы, списки) и неструктурированный (текст). Применяя разные наборы правил для каждого типа контента, система извлекает блоки текста (Passage Units) и формирует из них кандидатов для показа в блоке ответов, после чего оценивает их с помощью комплексного скоринга.
  • US10180964B1
  • 2015-08-12
  • SERP

  • Семантика и интент

Как Google автоматически определяет ключевые характеристики (атрибуты) сущностей, анализируя неструктурированный веб-контент
Google использует этот механизм для автоматического определения схемы (набора атрибутов) для любой сущности. Анализируя, как различные веб-страницы описывают набор схожих объектов (например, список фильмов), система выявляет новые релевантные характеристики (например, «Режиссер», «Время выполнения»), извлекая их из таблиц, списков или шаблонов страниц в интернете.
  • US8615707B2
  • 2009-01-16
  • Knowledge Graph

  • Семантика и интент

Как Google использует шаблоны запросов для выявления скрытых вопросов в неоднозначных поисковых запросах
Google определяет, когда неоднозначный запрос (например, "высота Эвереста") на самом деле ищет конкретный ответ. Система сопоставляет запрос с историческими шаблонами поиска (Query Templates). Если этот шаблон связан с явным, валидированным вопросительным шаблоном (например, "какова высота Эвереста?"), Google классифицирует исходный запрос как поиск ответа, что влияет на SERP и показ Featured Snippets.
  • US9898554B2
  • 2013-11-18
  • Семантика и интент

  • SERP

Как Google создает модель "идеального ответа" (Answer Term Vector) для оценки и выбора Featured Snippets
Google анализирует тысячи существующих пар Вопрос-Ответ в интернете, чтобы понять, какие термины чаще всего используются при ответе на конкретный вопрос. На основе этого анализа создается "Вектор Терминов Ответа" (Answer Term Vector) — эталонная модель ожидаемых слов и их важности. Затем кандидаты в Featured Snippet оцениваются по тому, насколько хорошо их текст совпадает с этим вектором.
  • US10019513B1
  • 2015-08-12
  • SERP

  • Семантика и интент

Как Google находит ответы на фактологические вопросы, анализируя консенсус сущностей в топе поисковой выдачи
Google использует этот механизм для автоматического ответа на фактологические вопросы путем анализа неструктурированного текста топовых результатов поиска. Система определяет, какая сущность (например, человек, место) чаще всего упоминается на авторитетных страницах. Эта наиболее часто упоминаемая сущность, с учетом нормализации частоты и веса источника, выбирается в качестве ответа.
  • US9477759B2
  • 2013-03-15
  • Семантика и интент

  • Индексация

  • Knowledge Graph

Как Google создает семантические векторы (эмбеддинги) для понимания смысла целых документов (Doc2Vec)
Патент описывает нейросетевой метод (известный как Doc2Vec) для преобразования документов любой длины в числовые векторы (эмбеддинги). Эти векторы фиксируют семантику и контекст всего документа, позволяя системе понимать смысл контента, классифицировать его и находить похожие документы, даже если в них используются разные слова.
  • US20150220833A1
  • 2015-01-30
  • Семантика и интент

Как Google использует выделение деталей на изображении для уточнения визуального поиска и комбинирования результатов
Google использует технологию, позволяющую пользователям уточнять визуальные запросы путем произвольного выделения конкретных деталей на изображении (например, обводя или закрашивая элемент). Система интерпретирует это действие для понимания истинного намерения пользователя. Используя визуальные эмбеддинги, система находит результаты, релевантные как выделенному признаку, так и объекту в целом, и предоставляет комбинированную выдачу, сохраняя контекст исходного запроса.
  • US12072925B2
  • 2022-03-18
  • Семантика и интент

  • Мультимедиа

  • SERP

  • 1
  • …
  • 7
  • 8
  • 9
  • 10
  • 11
  • …
  • 21
seohardcore