SEO HARDCORE
  • Разборы патентов
    • Патенты Google
  • Скоро SEO инструменты
  • Скоро SEO аналитика
  • seohardcore
SEO HARDCORE
назад

Как Google стандартизирует географические названия и их варианты (сленг, сокращения) для точного локального поиска и рекламы

LOCATION BASED CONTENT MATCHING IN A COMPUTER NETWORK (Сопоставление контента на основе местоположения в компьютерной сети)
  • US9183570B2
  • Google LLC
  • 2012-08-31
  • 2015-11-10
  • Local SEO
  • Семантика и интент
  • Описание
  • Разбор
  • Выводы
  • Практика
  • FAQ
  • Похожие

Google использует «Идентификаторы критериев местоположения» (Location Criteria Identifiers), чтобы понять, что разные термины (например, «СПб» и «Санкт-Петербург») относятся к одному и тому же месту. Это позволяет точно сопоставлять контент с таргетингом на местоположение (например, рекламу) с запросами пользователей, даже если они используют сленг, сокращения или допускают ошибки в названиях.

Описание

Какую проблему решает

Патент решает проблему неточного сопоставления локализованного контента (в частности, рекламы) с поисковыми запросами. Проблема возникает, когда поставщик контента (рекламодатель) и пользователь используют разные термины (варианты) для обозначения одного и того же географического местоположения. Например, рекламодатель таргетируется на «Сан-Франциско», а пользователь ищет «Пицца в СФ». Система обеспечивает корректное сопоставление этих запросов.

Что запатентовано

Запатентована система нормализации и сопоставления географических терминов с использованием Location Criteria Identifier (Идентификатор критериев местоположения). Этот идентификатор представляет собой каноническое обозначение географической области, с которым связаны все известные варианты ее названия (сокращения, сленг, альтернативные названия, орфографические ошибки). Это позволяет системе рассматривать разные текстовые строки как эквивалентные с точки зрения местоположения.

Как это работает

Система работает в несколько этапов:

  • Нормализация ввода рекламодателя: Рекламодатель предоставляет ключевые слова (например, «пицца») и географический оператор (например, «Сан-Франциско»). Система преобразует это в Geographically Modified Keyword, связывая ключевое слово с Location Criteria Identifier для Сан-Франциско.
  • Нормализация запроса пользователя: Пользователь вводит запрос (например, «пицца СФ»). Система идентифицирует географический термин («СФ») и определяет соответствующий ему Location Criteria Identifier.
  • Сопоставление: Система сравнивает идентификаторы. Поскольку «Сан-Франциско» и «СФ» имеют одинаковый Location Criteria Identifier, система фиксирует совпадение и может показать релевантную рекламу пользователю.

Актуальность для SEO

Высокая. Точное понимание географических намерений пользователя и нормализация географических названий являются фундаментальными задачами для локального поиска и мобильной рекламы. Механизмы, описанные в патенте, критически важны для эффективной работы современных поисковых и рекламных систем.

Важность для SEO

Патент имеет умеренное влияние (6/10) на SEO. Он в первую очередь описывает инфраструктуру для платного поиска (AdTech/Google Ads), что видно из контекста (например, упоминание Ad extensions), а не алгоритмы органического ранжирования. Однако, описанный механизм понимания географических вариантов (Location Criteria Identifier) крайне важен для Local SEO. Он объясняет, как Google интерпретирует и нормализует локальный интент, и подтверждает необходимость учета региональных синонимов и терминологии в контенте.

Детальный разбор

Термины и определения

Content Keyword (Ключевое слово контента)
Термин, указывающий на продукт или услугу, предлагаемую поставщиком контента (например, «пицца»).
Geographic Location Operator (Оператор географического местоположения)
Термин, предоставленный поставщиком контента (рекламодателем), который указывает целевое географическое местоположение (например, «Сан-Франциско»).
Geographic Location Term (Термин географического местоположения)
Термин в поисковом запросе пользователя или в его настройках местоположения, который указывает на географическое местоположение (например, «СФ»).
Geographically Modified Keyword (Географически модифицированное ключевое слово)
Внутреннее представление, созданное системой. Оно объединяет Content Keyword и Location Criteria Identifier. Используется для сопоставления с запросами.
Location Criteria Identifier (Идентификатор критериев местоположения)
Уникальный идентификатор (например, числовая строка), представляющий конкретную географическую область. Он связывает Geographic Location Operator и все его Variant Terms.
Variant Terms (Вариантные термины)
Различные способы обозначения одного и того же географического местоположения. Включают сокращения (abbreviation), альтернативные написания (alternate spelling), орфографические ошибки (misspelling), сленг или псевдонимы (nickname) (например, «СФ», «San Fran», «Bay Area» для Сан-Франциско).

Ключевые утверждения (Анализ Claims)

Claim 1 (Независимый пункт): Описывает основной метод предоставления информации (рекламы) на основе местоположения.

  1. Система получает рекламу и keyword terms (включая content keyword и geographic term).
  2. Генерируется Location Criteria Identifier, который представляет указанное местоположение. Этот идентификатор включает исходный geographic term и множество variant terms (сокращения, ошибки, псевдонимы и т.д.).
  3. Определяется Geographically Modified Keyword, состоящий из content keyword и Location Criteria Identifier.
  4. Он сохраняется в базе данных в ассоциации с рекламой.
  5. Система получает поисковый запрос от пользователя.
  6. Идентифицируется geographic location term (из запроса или настроек местоположения пользователя - location preference).
  7. Происходит сопоставление (matching) идентифицированного термина пользователя с Geographically Modified Keyword. Сопоставление успешно, если термин пользователя является одним из variant terms, включенных в Location Criteria Identifier.
  8. Контент (реклама) идентифицируется и предоставляется пользователю.

Claim 2 (Зависимый от 1): Уточняет механизм сопоставления.

Система генерирует второй Location Criteria Identifier для термина, полученного от пользователя (в запросе). Сопоставление (matching) происходит на основе сравнения первого (от рекламодателя) и второго (от пользователя) идентификаторов.

Claim 6 (Зависимый от 5): Подчеркивает ключевую особенность изобретения.

Geographic term (от рекламодателя) и geographic location term (от пользователя) могут быть разными текстовыми терминами (first term и second term), но при этом соответствовать одному и тому же географическому местоположению (т.е. иметь одинаковый идентификатор).

Где и как применяется

Изобретение затрагивает несколько этапов поисковой архитектуры, хотя в первую очередь ориентировано на системы контекстной рекламы.

CRAWLING & INDEXING – Сканирование, Индексирование и извлечение признаков
Система использует данные, полученные на этих этапах, для построения индекса географических вариантов. В патенте прямо указано, что система может извлекать информацию о местоположении и вариантах терминов из других источников, таких как контент веб-страниц. Анализируя веб-страницы, система может определить, что «СФ» и «Сан-Франциско» используются взаимозаменяемо, и связать их с одним Location Criteria Identifier. Также на этапе индексации (рекламных кампаний) система формирует Geographically Modified Keywords.

QUNDERSTANDING – Понимание Запросов
На этом этапе система обрабатывает входящий поисковый запрос. Она идентифицирует Geographic Location Term в запросе. Также система может учитывать любые настройки местоположения (location preferences), которые пользователь предоставил системе. Идентифицированный термин нормализуется путем нахождения соответствующего Location Criteria Identifier в географическом индексе.

RANKING / MATCHING (Ранжирование / Сопоставление)
В контексте патента это этап сопоставления рекламы. Система сравнивает Location Criteria Identifier запроса пользователя с Location Criteria Identifier, сохраненным в Geographically Modified Keyword рекламодателя. Если идентификаторы совпадают (и совпадают ключевые слова контента), реклама считается релевантной.

Входные данные:

  • От поставщика контента: Content Keywords, Geographic Location Operators, рекламный контент.
  • От пользователя: Поисковый запрос, User location preferences (если предоставлены).
  • Из индекса: Контент веб-страниц (для обнаружения вариантов), Географический индекс (сопоставление терминов и идентификаторов).

Выходные данные:

  • Внутренние: Location Criteria Identifiers, Geographically Modified Keywords.
  • Внешние: Релевантный контент (реклама), предоставленный пользователю.

На что влияет

  • Специфические запросы: Наибольшее влияние оказывается на локальные запросы (коммерческие и информационные), где пользователь явно указывает местоположение, особенно с использованием сленга, сокращений или неоднозначных названий (например, «NYC» вместо «New York City»).
  • Конкретные типы контента: В первую очередь влияет на контент с географическим таргетингом, такой как контекстная реклама. Косвенно влияет на результаты локального органического поиска (Local Pack), так как использует ту же базовую технологию понимания локаций.
  • Конкретные ниши или тематики: Критически важно для бизнесов, привязанных к физическому местоположению (рестораны, услуги, ритейл).

Когда применяется

Алгоритм применяется при следующих условиях:

  • Условия для контента: Когда поставщик контента указал географический таргетинг (Geographic Location Operator).
  • Условия для запроса: Когда поисковый запрос содержит Geographic Location Term ИЛИ когда у пользователя установлены соответствующие location preferences.
  • Триггер активации: Необходимость сопоставить локализованный контент с локальным интентом пользователя.

Пошаговый алгоритм

Процесс можно разделить на три основные части: фоновое обнаружение вариантов, обработка данных поставщика контента и обработка запроса пользователя.

Процесс А: Обнаружение вариантов (Фоновый процесс)

  1. Анализ контента: Система анализирует контент веб-страниц и другие источники данных.
  2. Идентификация вариантов: Система ищет случаи, когда разные термины используются взаимозаменяемо для обозначения одного местоположения (например, видит «СФ» и «Сан-Франциско» на одной странице в контексте, указывающем на их эквивалентность).
  3. Генерация идентификатора: Система генерирует канонический Location Criteria Identifier для географической сущности.
  4. Обновление индекса: Исходное название и все найденные Variant Terms добавляются в географический индекс и связываются с соответствующим Location Criteria Identifier.

Процесс Б: Обработка данных поставщика контента (Рекламодателя)

  1. Получение данных: Система получает Keyword Terms, включающие Content Keyword (например, «пицца») и Geographic Location Operator (например, «Сан-Франциско»).
  2. Географическая нормализация: Система извлекает соответствующий Location Criteria Identifier из географического индекса для указанного оператора.
  3. Генерация модифицированного ключевого слова: Система создает Geographically Modified Keyword, объединяя Content Keyword и полученный Location Criteria Identifier.
  4. Сохранение: Geographically Modified Keyword сохраняется в базе данных в связи с рекламным контентом.

Процесс В: Обработка запроса пользователя

  1. Получение запроса: Система получает поисковый запрос от пользователя (например, «пицца СФ»).
  2. Идентификация локального интента: Система анализирует запрос и/или настройки местоположения пользователя для идентификации Geographic Location Term («СФ»).
  3. Географическая нормализация: Система определяет Location Criteria Identifier для термина пользователя, используя географический индекс.
  4. Сопоставление контента: Система ищет совпадения между ключевыми словами запроса и Content Keywords рекламодателей.
  5. Сопоставление местоположения: Для найденных совпадений по контенту система сравнивает Location Criteria Identifier пользователя с Location Criteria Identifier в Geographically Modified Keyword рекламодателя.
  6. Идентификация и предоставление контента: Если оба сопоставления успешны (идентификаторы совпадают), соответствующий контент (реклама) выбирается и предоставляется пользователю.

Какие данные и как использует

Данные на входе

Патент фокусируется на обработке географических данных для сопоставления.

  • Контентные факторы: Content Keywords (от поставщиков) и ключевые слова в запросе пользователя. Используются для определения тематики продукта/услуги.
  • Географические факторы:
    • Geographic Location Operator: Термины, предоставленные поставщиками контента для таргетинга.
    • Geographic Location Term: Термины в запросах пользователей.
    • Variant Terms: Сокращения, псевдонимы, ошибки, альтернативные названия, обнаруженные системой.
  • Пользовательские факторы: Location preferences (настройки местоположения), которые пользователь мог явно предоставить системе.
  • Данные из веба: Контент веб-страниц используется как источник для обнаружения и валидации Variant Terms (Процесс А).

Какие метрики используются и как они считаются

Основной механизм не использует сложные метрики ранжирования, а полагается на точное сопоставление нормализованных идентификаторов.

  • Location Criteria Identifier: Это ключевой элемент системы. Он не является метрикой в традиционном смысле (как score), а представляет собой идентификатор сущности (географической области). Он генерируется путем анализа и индексации географических данных и вариантов их написания.
  • Сопоставление (Matching): Процесс бинарного сопоставления. Система проверяет, совпадают ли Location Criteria Identifier пользователя и поставщика контента.

Выводы

  1. Стандартизация географических ссылок: Google использует механизм (Location Criteria Identifier) для нормализации географических названий. Система стремится понять, какая именно географическая сущность имеется в виду, независимо от того, как она написана (сокращение, сленг, ошибка).
  2. Приоритет сущности над ключевым словом для локаций: Для определения местоположения важен не конкретный текст, использованный пользователем или рекламодателем, а лежащая в его основе географическая сущность, представленная идентификатором.
  3. Активное обучение вариантам из веба: Патент явно указывает, что система анализирует контент веб-страниц для обнаружения новых Variant Terms. Это означает, что то, как люди ссылаются на местоположения в интернете, напрямую влияет на способность Google понимать локальные запросы.
  4. Использование контекста пользователя: Система учитывает не только текст запроса, но и явно предоставленные пользователем настройки местоположения (location preferences) для определения локального интента.
  5. Фокус на AdTech, но с импликациями для SEO: Хотя патент описывает систему сопоставления рекламы, технология нормализации географических данных является общей и применима к пониманию запросов в органическом локальном поиске.

Практика

Best practices (это мы делаем)

  • Обеспечение консистентности NAP (Name, Address, Phone): Убедитесь, что каноническое название вашего местоположения (город, район) используется четко и последовательно на вашем сайте и в Google Business Profile. Это помогает связать ваш бизнес с основным Location Criteria Identifier.
  • Естественное использование локальных вариантов: Включайте в контент (блог, описания услуг, отзывы) естественные упоминания локальных терминов, сленга и названий районов, которые используют ваши клиенты. Поскольку Google изучает Variant Terms из веб-контента, это помогает укрепить связь вашего сайта с этими вариантами и соответствующим идентификатором.
  • Создание локализованного контента: Разрабатывайте страницы, ориентированные на конкретные районы или пригороды, используя их общепринятые названия. Это помогает таргетироваться на пользователей, ищущих услуги в этих конкретных областях.
  • Мониторинг локальных запросов: Изучайте, какие термины пользователи реально используют для поиска ваших услуг в вашем регионе (включая сокращения и сленг), и убедитесь, что ваш контент релевантен этим запросам.

Worst practices (это делать не надо)

  • Спам географическими вариантами (Location Keyword Stuffing): Не создавайте неестественные списки всех возможных вариантов написания вашего города в футере или на страницах услуг. Поскольку система нормализует их, это неэффективно и может быть воспринято как спам.
  • Использование только сленга или сокращений: Не полагайтесь исключительно на сленговые названия (например, только «Питер») без упоминания канонического названия («Санкт-Петербург»). Важно поддерживать баланс для обеспечения точности данных и авторитетности.
  • Игнорирование региональной терминологии: Не используйте только официальные административные названия, если местные жители используют другие термины для обозначения района (например, игнорирование названия «Bay Area» при работе в Сан-Франциско).

Стратегическое значение

Патент подтверждает движение Google в сторону понимания сущностей (Entities), в данном случае — географических. Для Local SEO стратегически важно не просто оптимизировать страницы под ключевые слова + город, а гарантировать, что Google четко ассоциирует ваш бизнес с каноническим Location Criteria Identifier вашего региона и понимает релевантность вашего контента различным способам (Variant Terms), которыми пользователи ссылаются на этот регион. Это подчеркивает важность создания аутентичного локального контента.

Практические примеры

Сценарий: Оптимизация страницы ресторана в Нью-Йорке

  1. Задача: Ресторан находится в Манхэттене, Нью-Йорк. Необходимо привлечь трафик по различным вариантам локальных запросов.
  2. Анализ (на основе патента): Google использует Location Criteria Identifier для Нью-Йорка, который включает варианты: «New York City», «NYC», «Manhattan», «The Big Apple».
  3. Действия (Best Practice):
    • На главной странице и странице контактов четко указать полный адрес: [Название], [Улица], Manhattan, New York City, [Индекс].
    • В тексте описания ресторана естественно использовать варианты: «Лучшая пицца в NYC», «Наш ресторан в центре Манхэттена предлагает...», «Посетите нас в Нью-Йорке».
  4. Действия (Worst Practice): Добавить в футер блок: «Мы обслуживаем New York City, NYC, NY, Manhattan, Big Apple, Нью-Йорк».
  5. Ожидаемый результат: Сайт корректно ассоциируется с Location Criteria Identifier Нью-Йорка. Система распознает релевантность сайта запросам, содержащим любой из естественным образом интегрированных вариантов, улучшая видимость в локальном поиске.

Вопросы и ответы

Что такое Location Criteria Identifier и почему он важен?

Это уникальный идентификатор, который Google присваивает конкретной географической области. Он объединяет все известные варианты названия этой области (сленг, сокращения, ошибки) под одним «зонтиком». Это важно, потому что позволяет Google понять, что запрос «кафе в Питере» и «кафе Санкт-Петербург» имеют одинаковый локальный интент, обеспечивая более точные результаты поиска и рекламы.

Как Google узнает о новых вариантах названия города или района?

Патент прямо указывает, что Google анализирует контент веб-страниц для обнаружения новых вариантов (Variant Terms). Если система видит, что два разных термина (например, официальное название и местный сленг) часто используются взаимозаменяемо на веб-страницах для обозначения одного и того же места, она свяжет их с одним Location Criteria Identifier.

Относится ли этот патент к органическому поиску или только к Google Ads?

Патент в первую очередь описывает механизм сопоставления контента в контексте рекламных кампаний (AdTech). Однако технология нормализации географических данных (Location Criteria Identifier) является базовой технологией понимания запросов (Query Understanding). Логично предположить, что аналогичные механизмы используются и в органическом локальном поиске для интерпретации интента пользователя.

Стоит ли добавлять все варианты названия города на мой сайт?

Нет, не стоит заниматься переспамом (keyword stuffing), перечисляя все варианты в футере или метатегах. Вместо этого следует использовать ключевые локальные варианты естественно в контенте. Если местные жители используют определенный сленг или название района, уместно использовать его в блоге или описаниях услуг, чтобы показать локальную релевантность.

Что делать, если мой город имеет такое же название, как и другой город в другой стране (неоднозначность)?

Система использует полный контекст для идентификации правильного Location Criteria Identifier. Это включает не только запрос, но и настройки местоположения пользователя (location preferences), если они доступны. Для SEO важно использовать полные адреса (включая страну и область/штат) на сайте и в микроразметке, чтобы помочь системе разрешить неоднозначность и выбрать правильный идентификатор.

Учитывает ли система орфографические ошибки в названиях городов?

Да, в патенте указано, что Variant Terms включают орфографические ошибки (misspellings). Если пользователь допустил ошибку в названии города, система все равно сможет определить правильный Location Criteria Identifier и сопоставить запрос с релевантным контентом, таргетированным на этот город.

Как этот патент влияет на стратегию Local SEO?

Он подчеркивает важность аутентичности и использования реального местного языка. Стратегия должна включать не только оптимизацию под связку «услуга + официальное название города», но и создание контента, который резонирует с местной аудиторией и использует принятую в регионе терминологию. Это помогает укрепить связь бизнеса с географической сущностью региона.

Что такое Geographically Modified Keyword?

Это внутренний термин системы, который представляет собой комбинацию ключевого слова продукта/услуги (например, «адвокат») и Location Criteria Identifier (например, идентификатор для Москвы). Это нормализованное представление, которое используется для эффективного сопоставления с нормализованными запросами пользователей.

Может ли один Location Criteria Identifier охватывать несколько городов?

Да. Патент указывает, что географическое местоположение не обязательно совпадает с муниципальными границами. Идентификатор может представлять регион, агломерацию (например, «Bay Area», включающую Сан-Франциско, Окленд и т.д.) или даже пользовательскую область, определенную рекламодателем, включающую несколько разных городов (например, Лос-Анджелес и Нью-Йорк).

Влияет ли язык запроса на определение местоположения?

Хотя патент явно не детализирует многоязычную обработку, механизм Variant Terms применим к разным языкам. Например, «London» и «Лондон» должны быть связаны с одним и тем же Location Criteria Identifier. Для SEO важно использовать названия городов на том языке, на котором пользователи ищут ваши услуги в данном регионе.

Похожие патенты

Как Google определяет географическую релевантность документа, анализируя неоднозначные термины и названия мест
Google использует классификатор местоположений для определения географической привязки документа, даже если в нем нет точного адреса. Система анализирует неоднозначные термины (например, названия районов или улиц) и использует профили георелевантности (гистограммы), показывающие, где эти термины чаще всего используются. Перемножая эти профили, Google разрешает неоднозначность и вычисляет наиболее вероятное местоположение контента.
  • US7716162B2
  • 2010-05-11
  • Local SEO

  • Семантика и интент

  • Индексация

Как Google стандартизирует и расширяет географическую релевантность сайтов на соседние локации
Google использует систему Семантических Геотокенов для стандартизации упоминаний местоположений на веб-страницах. Система не только определяет точное местоположение, но и ассоциирует ресурс с соседними географическими областями. Это позволяет сайту ранжироваться по запросам в близлежащих локациях, даже если они явно не упомянуты на странице.
  • US8949277B1
  • 2015-02-03
  • Семантика и интент

  • Local SEO

  • Индексация

Как Google использует данные из Local Search и Google Maps для распознавания географических названий в основном поиске
Google анализирует поведение пользователей в интерфейсах с отдельными полями ввода "Что?" и "Где?" (например, в Google Maps). На основе этой статистики система определяет, является ли термин однозначным названием местоположения ("Нью-Йорк") или нет ("Пицца"). Это позволяет поиску отличать локальные запросы от общих и формировать "черные списки" для терминов, которые похожи на города, но ими не являются (например, "Орландо Блум").
  • US8782030B1
  • 2014-07-15
  • Local SEO

  • Семантика и интент

  • Поведенческие сигналы

Как Google определяет синонимы и варианты слов, анализируя категории выбранных пользователями результатов
Google использует метод стемминга, основанный на поведении пользователей и категориях сущностей. Если пользователи ищут разные слова (например, «пицца» и «пиццерия») и выбирают результаты одной категории («ресторан»), система идентифицирует эти слова как варианты одной основы (Stem Variants). Это происходит, если слова похожи по написанию ИЛИ если объем кликов статистически значим.
  • US9104759B1
  • 2015-08-11
  • Семантика и интент

  • Поведенческие сигналы

  • Персонализация

Как Google определяет скрытый локальный интент в общих запросах на основе региональной популярности и использования Карт
Google анализирует, является ли общий запрос (без указания места) статистически более популярным в конкретном регионе или часто вводится через интерфейс Карт. Если да, система определяет запрос как «локально значимый», автоматически создает его локализованную версию и подмешивает местные результаты в основную выдачу, обеспечивая видимость локального контента.
  • US9348925B2
  • 2016-05-24
  • Local SEO

  • Семантика и интент

  • SERP

Популярные патенты

Как Google генерирует интерактивные и иерархические Sitelinks на основе структуры и популярности разделов сайта
Google анализирует навигационную иерархию сайта (DOM), популярность ссылок и глубину разделов для создания интерактивного представления ресурса (расширенных Sitelinks) в SERP. Это позволяет пользователям просматривать ключевые категории и вложенные ссылки через интерфейс вкладок, не покидая страницу результатов поиска.
  • US9348846B2
  • 2016-05-24
  • Структура сайта

  • SERP

  • Ссылки

Как Google рассчитывает тематический авторитет сайта для кастомизации поиска с помощью Topic-Sensitive PageRank
Патент Google, описывающий механизм кастомизации результатов поиска, инициированного со стороннего сайта (например, Google Custom Search). Система использует «профиль сайта» для повышения результатов, соответствующих его тематике. Ключевая ценность патента — детальное описание расчета тематической авторитетности (Topic Boosts) путем анализа ссылок с эталонных сайтов (Start Sites), что является реализацией Topic-Sensitive PageRank.
  • US7565630B1
  • 2009-07-21
  • Персонализация

  • SERP

  • Ссылки

Как Google использует данные о кликах пользователей (CTR и Click Ratio) для определения официального сайта по навигационным запросам
Google анализирует журналы запросов, чтобы определить, какой результат пользователи подавляюще предпочитают по конкретному запросу. Если результат демонстрирует исключительно высокий CTR и/или Click Ratio по популярному запросу, система помечает его как «авторитетную страницу». Затем этот результат может отображаться на выдаче с особым выделением, потенциально переопределяя стандартное ранжирование.
  • US8788477B1
  • 2014-07-22
  • Поведенческие сигналы

  • EEAT и качество

  • SERP

Как Google использует визуальный анализ кликов по картинкам для понимания интента запроса и переранжирования выдачи
Google анализирует визуальное содержимое изображений, которые пользователи чаще всего выбирают в ответ на определенный запрос. На основе этого анализа (наличие лиц, текста, графиков, доминирующих цветов) система определяет категорию запроса (например, «запрос о конкретном человеке» или «запрос на определенный цвет»). Эти категории затем используются для переранжирования будущих результатов поиска, повышая изображения, которые визуально соответствуют выявленному интенту.
  • US9836482B2
  • 2017-12-05
  • Семантика и интент

  • Поведенческие сигналы

  • SERP

Как Google определяет ключевые аспекты (фасеты) сущности для организации и диверсификации поисковой выдачи
Google использует систему для автоматической идентификации различных «аспектов» (подтем или фасетов) сущности в запросе. Анализируя логи запросов и базы знаний, система определяет, как пользователи исследуют информацию. Затем эти аспекты ранжируются по популярности и разнообразию и используются для организации результатов поиска в структурированном виде (mashup), облегчая пользователю навигацию и исследование темы.
  • US8458171B2
  • 2013-06-04
  • Семантика и интент

  • SERP

  • Поведенческие сигналы

Как Google определяет, действительно ли новость посвящена сущности, и строит хронологию событий
Google использует систему для определения релевантности новостей конкретным объектам (сущностям, событиям, темам). Система анализирует кластеры новостных статей (коллекции), оценивая общий интерес к объекту (поисковые запросы, социальные сети) и значимость объекта внутри коллекции (упоминания в заголовках, центральность в тексте). Ключевой механизм — оценка уместности событий: система проверяет, соответствует ли событие типу объекта (например, «новый метод лечения» для болезни), чтобы отфильтровать мимолетные упоминания и создать точную хронологию новостей.
  • US9881077B1
  • 2018-01-30
  • Семантика и интент

  • Поведенческие сигналы

Как Google использует клики и пропуски пользователей для оценки и корректировки правил близости терминов (Proximity Rules)
Google анализирует поведение пользователей для оценки эффективности правил близости (Proximity Rules), которые влияют на ранжирование в зависимости от расстояния между ключевыми словами на странице. Система отслеживает, кликают ли пользователи на результаты, где термины расположены далеко друг от друга, или пропускают их. На основе этих данных (Click Count, Skip Count) вычисляется оценка качества правила, что позволяет Google динамически адаптировать важность фактора близости.
  • US9146966B1
  • 2015-09-29
  • Поведенческие сигналы

  • SERP

Как Google использует персональное дерево интересов пользователя для определения важности слов в запросе и его переписывания
Google использует иерархический профиль интересов пользователя (Profile Tree), построенный на основе истории поиска и поведения, чтобы определить, какие слова в запросе наиболее важны для конкретного человека. Специфичные интересы (глубокие узлы в дереве) получают больший вес. Это позволяет системе отфильтровать шум в длинных запросах и сгенерировать более точный альтернативный запрос.
  • US8326861B1
  • 2012-12-04
  • Персонализация

  • Семантика и интент

  • Поведенческие сигналы

Как Google рассчитывает «VisualRank» для изображений и медиафайлов, используя виртуальные ссылки на основе схожести и поведения пользователей
Google использует алгоритм (концептуально называемый VisualRank) для ранжирования изображений и других медиафайлов путем создания «виртуальных ссылок» между ними. Эти ссылки основаны на визуальной схожести контента, данных о кликах пользователей и контексте размещения (URL analysis). Это позволяет оценить качество и авторитетность медиафайлов даже без явных гиперссылок, при этом система активно избегает показа слишком похожих (дублирующихся) результатов.
  • US8732187B1
  • 2014-05-20
  • Ссылки

  • Мультимедиа

  • Поведенческие сигналы

Как Google использует контекст пользователя для предложения запросов до начала ввода текста (Zero-Input Queries)
Google анализирует историю поисковых запросов, группируя их в «контекстные кластеры» на основе схожести темы и обстоятельств ввода (время, местоположение, интересы). Когда пользователь открывает строку поиска, система оценивает его текущий контекст и мгновенно предлагает релевантные категории запросов (например, «Кино» или «Рестораны»), предсказывая намерение еще до ввода символов.
  • US10146829B2
  • 2018-12-04
  • Семантика и интент

  • Персонализация

  • Поведенческие сигналы

seohardcore