
Google использует модель идентификации вакансий для преодоления ограничений поиска по ключевым словам в сфере трудоустройства. Система обучается на основе таксономии профессий, генерируя векторы для вакансий с использованием специализированных весовых коэффициентов (Inverse Occupation Frequency и Occupation Derivative). Это позволяет системе понимать, что запросы вроде "Patent Guru" соответствуют профессии "Патентный поверенный", и возвращать релевантные вакансии, даже если ключевые слова не совпадают.
Патент решает проблему ограничений традиционного поиска по ключевым словам в контексте поиска работы (Job Search). Проблема заключается в том, что работодатели часто используют разную терминологию и уникальные названия для одной и той же профессии (например, "Software Guru", "Software Ninja" и "Software Engineer"). Поиск, основанный только на совпадении ключевых слов, не сможет найти релевантные вакансии, если термины в запросе не совпадают с терминами в названии вакансии. Изобретение улучшает качество поиска работы, позволяя системе идентифицировать релевантные вакансии независимо от конкретных ключевых слов.
Запатентована система (Job Identification Model), которая использует машинное обучение и обработку естественного языка для классификации названий вакансий и поисковых запросов в соответствии со стандартизированной таксономией профессий (Occupation Taxonomy). Суть изобретения заключается в методе генерации векторов (Occupation Vectors и Query Vectors) с использованием специфических весовых коэффициентов, таких как Inverse Occupation Frequency (обратная частота по профессиям) и Occupation Derivative (производная по профессиям). Эти векторы используются для определения наиболее подходящей профессии для запроса, что позволяет извлекать релевантные вакансии, проиндексированные по этой профессии.
Система работает в два этапа: обучение и выполнение.
Обучение (Офлайн):
Occupation Vector с использованием специализированных весовых коэффициентов (Inverse Occupation Frequency и Occupation Derivative).Выполнение (Онлайн):
Query Vector.Similarity Engine сравнивает Query Vector с Occupation Vectors в таксономии и рассчитывает Confidence Scores (оценки уверенности) для каждой профессии.Job Posting Index) и предоставляет их пользователю.Высокая. Патент описывает фундаментальные механизмы, лежащие в основе специализированных вертикальных поисковых систем, таких как Google Jobs. Понимание того, как система классифицирует вакансии и интерпретирует запросы за пределами простого совпадения ключевых слов, критически важно для оптимизации контента в этой вертикали. Методы векторизации и классификации на основе таксономии являются стандартом в современном поиске информации.
Влияние на SEO для вертикали поиска работы (Google Jobs) является критическим (8/10). Патент демонстрирует, что релевантность в поиске работы определяется не совпадением ключевых слов, а тем, насколько точно система классифицирует вакансию или запрос в рамках своей Occupation Taxonomy. Для SEO-специалистов, работающих с сайтами вакансий или корпоративными разделами карьеры, понимание этого механизма определяет стратегию создания и оптимизации контента. Успех зависит от того, насколько четко контент вакансии сигнализирует о принадлежности к определенной профессии в таксономии Google.
Similarity Engine, которая указывает на вероятность того, что Query Vector правильно классифицирован в рамках определенной профессии в таксономии.Occupation Taxonomy.Occupation Codes). Используется для классификации обучающих данных и поисковых запросов.Occupation Vector.Query Vector с Occupation Vectors в таксономии для расчета Confidence Scores.Claim 1 (Независимый пункт): Описывает полный цикл работы системы для поиска работы.
Occupation Vector для каждого элемента. Ключевой момент: весовой коэффициент (feature weight) рассчитывается на основе двух значений: (i) Inverse Occupation Frequency (IDF) и (ii) Occupation Derivative (DD).Occupation Vector с профессией в таксономии (обучение).Query Vector (первого вектора) на основе запроса.Confidence Score для каждой профессии в таксономии, указывающего, насколько вектор запроса соответствует профессии.Confidence Score.Ядро изобретения заключается в использовании комбинации IDF и DD для взвешивания признаков при генерации векторов в контексте классификации коротких текстов (вакансий).
Claim 4 (Зависимый от 1): Уточняет формулу расчета весового коэффициента.
Весовой коэффициент основан на сумме (i) значения, представляющего Inverse Occupation Frequency, и (ii) одной трети значения, представляющего Occupation Derivative.
Формула расчета веса признака: FW=IDF+DD/3. Это конкретная реализация, направленная на оптимизацию классификации коротких текстов вакансий.
Этот патент описывает архитектуру специализированной поисковой системы (вертикального поиска), конкретно предназначенной для поиска работы. Он затрагивает несколько этапов стандартной архитектуры поиска.
CRAWLING – Сканирование и Сбор данных
Система собирает данные о вакансиях (Job Posting Data) из множества источников в интернете.
INDEXING – Индексирование и извлечение признаков
Этот этап критически важен и делится на две части: Обучение модели и Индексирование вакансий.
Обучение (Офлайн):
labeled training data items) и их хранение в Text Corpus.Text Normalization Unit для удаления шума.Vector Generation Unit создает Occupation Vectors, используя словарь и специфические веса (IDF+DD/3).Occupation Taxonomy.Индексирование (Офлайн/Около-реалтайм):
Новые вакансии обрабатываются, классифицируются с использованием обученной модели и сохраняются в Job Posting Index, организованном по профессиям.
QUNDERSTANDING – Понимание Запросов
Основное применение патента в реальном времени.
Text Normalization Unit.Vector Generation Unit создает Query Vector.Similarity Engine использует Query Vector и обученную Occupation Taxonomy для определения наиболее вероятной профессии (Occupation) и расчета Confidence Score.RANKING – Ранжирование (Отбор кандидатов)
На этом этапе система использует результат этапа QUNDERSTANDING (выбранную профессию) для быстрого отбора кандидатов из Job Posting Index. Это заменяет традиционный поиск по ключевым словам.
Входные данные:
Выходные данные:
Occupation Taxonomy с ассоциированными Occupation Vectors.Job Postings), резюме (упоминаются как возможный источник обучающих данных) и поисковые запросы о работе.Job Search Query).Процесс А: Обучение модели (Training Phase - Офлайн)
Vector Vocabulary (на основе корпуса текстов) и Occupation Taxonomy (список профессий).labeled training data), где каждая запись содержит название вакансии и код профессии.Text Normalization Unit обрабатывает названия вакансий. Удаляется информация о зарплате, графике, локации, компании, знаки препинания, числа и т.д.Vector Generation Unit создает Occupation Vector для каждой записи. Inverse Occupation Frequency (IDF) для каждого термина.Occupation Derivative (DD) для каждого термина.Occupation Vector связывается с соответствующим кодом профессии в Occupation Taxonomy.Процесс Б: Обработка запроса (Execution Phase - Онлайн)
Text Normalization Unit.Vector Generation Unit создает Query Vector, используя тот же словарь и методы взвешивания, что и при обучении.Similarity Engine сравнивает Query Vector с Occupation Vectors в таксономии. Для каждой профессии рассчитывается Confidence Score (например, на основе векторного расстояния).Confidence Score (или несколько, если они превышают порог).Job Posting Index, используя выбранную профессию, для получения релевантных вакансий.Патент фокусируется на обработке текстовых данных, связанных с вакансиями.
Job Titles) из обучающих данных и текст поискового запроса (Search Query). В патенте также упоминается, что обучающие данные могут включать описания работы из резюме.Occupation Codes), присвоенные обучающим данным вручную или автоматически.Система использует несколько ключевых метрик для генерации векторов и классификации.
1. Term Frequency (TF)
2. Inverse Occupation Frequency (IDF)
3. Occupation Derivative (DD)
4. Feature Weight (Вес признака)
5. Confidence Score
Query Vector и Occupation Vectors в числовом пространстве признаков. Чем меньше расстояние, тем выше оценка уверенности.Job Identification Model) для классификации как запроса, так и контента вакансии в рамках стандартизированной Occupation Taxonomy.Inverse Occupation Frequency (IDF) и Occupation Derivative (DD).Occupation Derivative (DD) играет ключевую роль. Эта метрика измеряет, насколько хорошо термин помогает отличить одну профессию от другой. Термины с высоким DD имеют больший вес в классификации.Occupation Taxonomy. Если вакансия или запрос не могут быть уверенно классифицированы, они могут не появиться в релевантной выдаче.Рекомендации применимы к оптимизации сайтов вакансий (Job Boards) и корпоративных разделов карьеры для вертикали Google Jobs.
Confidence Score). Название должно четко отражать суть профессии.Occupation Derivative – те, которые четко отличают эту роль от смежных. Например, "Патентный поверенный" лучше, чем просто "Юрист".JobPosting) нет посторонней информации. Зарплата, город, тип занятости (Full-time/Part-time), название компании должны быть вынесены в соответствующие поля. Text Normalization Unit удалит их, но лучше предоставить чистые данные изначально.Occupation Taxonomy.JobPosting максимально полно. Это помогает Google корректно извлекать и интерпретировать данные о вакансии, снижая зависимость от текстовой нормализации.Occupation Derivative и могут быть неправильно классифицированы или получат низкий Confidence Score.Патент подтверждает стратегию Google по структурированию данных и использованию машинного обучения для понимания контента в специализированных вертикалях. Для поиска работы ключевым фактором успеха является alignment (соответствие) контента вакансии той таксономии профессий, которую использует Google. Долгосрочная стратегия должна фокусироваться на качестве данных, четкости описаний и использовании структурированных данных (Schema.org) для минимизации неопределенности при классификации вакансий.
Сценарий: Оптимизация названия вакансии для Google for Jobs
Плохой пример названия: "(Срочно!) Ищем Junior/Mid-Level SEO Специалиста в Москве, $1500 (Бонусы)"
Процесс обработки системой:
Text Normalization Unit удаляет шум (пунктуацию, локацию, зарплату, уровень, призывы).Хороший пример названия (в поле title разметки JobPosting): "SEO Специалист (Специалист по поисковой оптимизации)"
Действия SEO-специалиста:
title.jobLocation.baseSalary.Ожидаемый результат: Вакансия точно классифицируется по профессии и содержит всю необходимую информацию для сниппета, не мешая работе Job Identification Model.
Означает ли этот патент, что ключевые слова больше не важны при оптимизации вакансий?
Нет, ключевые слова по-прежнему важны, но изменился механизм их использования. Они важны не для прямого сопоставления с запросом, а как признаки для классификации вакансии в Occupation Taxonomy. Система оценивает, насколько комбинация ключевых слов в названии соответствует определенной профессии, используя веса Inverse Occupation Frequency (IDF) и Occupation Derivative (DD).
Что такое Occupation Derivative (DD) и почему это важно?
Occupation Derivative (DD) – это метрика, которая измеряет, насколько хорошо термин помогает отличить одну профессию от другой. Если термин встречается только в одной профессии (высокий DD), он получает больший вес. Если термин встречается во многих профессиях (например, "специалист"), у него низкий DD. Для SEO это означает, что нужно использовать термины, которые максимально точно специфицируют роль.
Как рассчитывается вес признака (Feature Weight) согласно патенту?
Патент предлагает несколько формул, но конкретно защищает (в Claim 4) формулу: Вес = IDF + DD/3. Это означает, что вес термина складывается из его обратной частоты по профессиям (IDF) плюс одна треть его производной по профессиям (DD). Это специфический гибридный подход для классификации коротких текстов.
Как система обрабатывает информацию о зарплате или локации в названии вакансии?
Система использует Text Normalization Unit для агрессивной очистки названий вакансий и запросов. Информация о зарплате, локации, графике работы, типе занятости и названии компании идентифицируется и удаляется перед генерацией вектора. Эта информация не участвует в классификации профессии.
Применяется ли этот механизм в основном поиске Google или только в Google Jobs?
Патент описывает Job Identification Model, специально разработанный для решения проблем поиска работы. Хотя общие принципы векторизации и классификации используются в основном поиске, специфические методы взвешивания (IDF + DD/3) и использование Occupation Taxonomy разработаны именно для вертикали Jobs.
Как узнать, какие профессии есть в Occupation Taxonomy Google?
Патент не раскрывает сам список профессий. Occupation Taxonomy является внутренним ресурсом Google, который создается и обновляется на основе анализа рынка труда и обучающих данных. SEO-специалистам следует ориентироваться на общепринятые стандарты индустрии и анализировать выдачу Google Jobs, чтобы понять, как группируются вакансии.
Что делать, если моя вакансия неправильно классифицируется в Google Jobs?
Необходимо пересмотреть название и описание вакансии. Убедитесь, что название четкое, не содержит шума и использует термины, которые однозначно идентифицируют профессию (высокий DD). Также проверьте корректность микроразметки JobPosting. Изменение названия на более стандартизированное обычно помогает исправить классификацию.
Влияет ли описание вакансии на классификацию, или только название?
В патенте для обучения модели в первую очередь используются размеченные названия вакансий (Job Titles). Однако упоминается, что обучающие данные могут включать и другие источники, например, описания из резюме. Логично предположить, что полное описание вакансии также анализируется системой для подтверждения классификации, основанной на названии.
Как система обрабатывает новые или только появляющиеся профессии?
Система зависит от обучающих данных и Occupation Taxonomy. Чтобы новые профессии были распознаны, они должны быть добавлены в таксономию, и система должна быть переобучена на новых размеченных данных, включающих эти профессии. До этого момента новые роли могут классифицироваться в ближайшие существующие категории.
Могу ли я использовать креативные названия вакансий, такие как "Гуру" или "Ниндзя"?
Да, можете. Система спроектирована так, чтобы распознавать такие названия, если они присутствовали в обучающих данных и были связаны с конкретной профессией. Однако для повышения уверенности системы (Confidence Score) рекомендуется сочетать креативные термины с четкими идентификаторами профессии (например, "Software Ninja" вместо просто "Ninja").

Индексация
Семантика и интент
Ссылки

Семантика и интент
Индексация
SERP

Семантика и интент
SERP
Поведенческие сигналы

Семантика и интент
SERP

Семантика и интент
Индексация
SERP

Поведенческие сигналы
SERP

Поведенческие сигналы
EEAT и качество
SERP

Поведенческие сигналы
Персонализация
Семантика и интент

SERP
Поведенческие сигналы

Мультиязычность
Поведенческие сигналы
SERP

Поведенческие сигналы
Семантика и интент
SERP

Поведенческие сигналы
SERP

Knowledge Graph
Поведенческие сигналы
Персонализация

Персонализация
Семантика и интент
Поведенческие сигналы

Local SEO
Ссылки
SERP
