SEO HARDCORE
  • Разборы патентов
    • Патенты Google
  • Скоро SEO инструменты
  • Скоро SEO аналитика
  • seohardcore
SEO HARDCORE
назад

Как Google определяет географическую релевантность документа, анализируя неоднозначные термины и названия мест

CLASSIFICATION OF AMBIGUOUS GEOGRAPHIC REFERENCES (Классификация неоднозначных географических ссылок)
  • US7716162B2
  • Google LLC
  • 2004-12-30
  • 2010-05-11
  • Local SEO
  • Семантика и интент
  • Индексация
  • Описание
  • Разбор
  • Выводы
  • Практика
  • FAQ
  • Похожие

Google использует классификатор местоположений для определения географической привязки документа, даже если в нем нет точного адреса. Система анализирует неоднозначные термины (например, названия районов или улиц) и использует профили георелевантности (гистограммы), показывающие, где эти термины чаще всего используются. Перемножая эти профили, Google разрешает неоднозначность и вычисляет наиболее вероятное местоположение контента.

Описание

Какую проблему решает

Патент решает фундаментальную проблему локального поиска: определение географической релевантности документа (веб-страницы или поискового запроса), когда в нем отсутствуют однозначные географические идентификаторы (например, полный почтовый адрес). Многие документы связаны с конкретным местом, но используют неоднозначные термины (например, «Bay Area», которое может относиться к Калифорнии или Висконсину) или названия улиц без указания города. Система позволяет точно ассоциировать такой контент с географическим регионом.

Что запатентовано

Запатентована система (Location Classifier), которая автоматически классифицирует текст по географическим регионам. Система использует предварительно рассчитанные geo-relevance profiles (гистограммы) для терминов и фраз, которые показывают статистическую связь между ними и конкретными местоположениями (например, почтовыми индексами). Ключевым элементом является метод разрешения неоднозначности путем комбинирования (перемножения) этих профилей для всех релевантных терминов, найденных в документе.

Как это работает

Система работает в два этапа: обучение и классификация.

  • Обучение (Офлайн): Анализируется большой корпус документов с известными, однозначными адресами (geographic signals). Система отслеживает, какие термины встречаются рядом с какими почтовыми индексами, и строит для них гистограммы (geo-relevance profiles).
  • Классификация (Онлайн/Индексирование): При анализе нового документа система находит в нем географически значимые термины. Их гистограммы извлекаются и перемножаются. Пики в итоговом комбинированном профиле указывают на наиболее вероятное местоположение, так как перемножение усиливает области географического пересечения всех терминов.

Актуальность для SEO

Высокая. Локальный поиск и понимание географического контекста контента и запросов остаются критически важными для Google. Хотя методы с 2004 года эволюционировали (с использованием нейронных сетей и сущностей), базовый принцип использования статистического анализа и комбинирования косвенных текстовых сигналов для географической классификации и разрешения неоднозначности по-прежнему актуален.

Важность для SEO

Патент имеет высокое значение (8/10) для локального SEO. Он демонстрирует механизм, позволяющий Google установить точную географическую релевантность страницы, даже если на ней не указан полный адрес (NAP). Это подчеркивает стратегическую важность использования локальных сигналов, таких как названия районов, местных достопримечательностей и улиц, для оптимизации контента под конкретные географические регионы.

Детальный разбор

Термины и определения

Combined Geo-relevance Profile (Сводный профиль георелевантности)
Результирующая гистограмма, полученная путем комбинирования (перемножения) индивидуальных geo-relevance profiles всех географически значимых терминов в документе. Определяет итоговую географическую релевантность.
Geographic Signal (Географический сигнал)
Известная, однозначная информация в обучающем документе, которая точно указывает на местоположение (например, полный почтовый адрес с индексом). Используется как эталон (ground truth) при обучении.
Geo-relevance Profile (Профиль георелевантности) / Histogram (Гистограмма)
Статистический профиль для термина или фразы. Показывает распределение его встречаемости по различным географическим идентификаторам (Location Identifiers). Наличие статистически значимых пиков указывает на географическую релевантность термина.
Location Classifier (Классификатор местоположения)
Основная система, описанная в патенте, которая генерирует информацию о местоположении на основе текстовых строк во входном тексте, разрешая географическую неоднозначность.
Location Identifier (Идентификатор местоположения)
Идентификатор, используемый для представления географического региона. В патенте предпочтительно используются почтовые индексы (zip codes), так как численно близкие индексы часто соответствуют географически близким локациям.
Training Text (Обучающий текст)
Текст, извлеченный из документов вблизи Geographic Signals. Используется для обучения классификатора и генерации Geo-relevance Profiles.

Ключевые утверждения (Анализ Claims)

Патент описывает два основных процесса: операционную работу классификатора и процесс его обучения.

Claim 1 (Независимый пункт): Описывает основной метод определения географической релевантности документа.

  1. Система генерирует (получает) множество гистограмм (geo-relevance profiles) для строк (терминов/фраз) в документе, сравнивая их с заранее созданными гистограммами.
  2. Система генерирует сводную гистограмму (combined histogram) для документа.
  3. Ключевой механизм: Сводная гистограмма генерируется путем перемножения значений (multiplying together values) отдельных гистограмм.
  4. Система определяет географическую релевантность документа на основе сводной гистограммы.

Claim 2 и 25: Уточняют механизм определения релевантности.

  • Географическая релевантность определяется путем анализа сводной гистограммы на наличие пиков (peaks).

Перемножение гистограмм — это критически важный механизм для разрешения неоднозначности. Он гарантирует, что итоговый профиль будет иметь высокие значения только в тех географических регионах, где высока вероятность встретить все идентифицированные термины одновременно (логическое «И»). Если Термин А вероятен в Локации 1 и 2, а Термин Б вероятен в Локации 2 и 3, их перемножение усилит Локацию 2, где они пересекаются.

Claim 15 (Независимый пункт): Описывает метод генерации гистограммы для строки (процесс обучения).

  1. Определение разделов обучающего текста, ассоциированных с географическими регионами.
  2. Накопление вхождений строки в этих разделах.
  3. Ключевое условие (Фильтр boilerplate): Вхождения накапливаются только тогда, когда термины слева или справа от строки отличаются от предыдущих экземпляров ("when terms to a left or right of the string are different from previous instances"). Это механизм для игнорирования шаблонного текста.
  4. Генерация гистограммы на основе накопленных вхождений.

Где и как применяется

Изобретение применяется на нескольких этапах поисковой архитектуры.

INDEXING – Индексирование и извлечение признаков

Основное применение. Location Classifier используется для анализа документов (веб-страниц) во время индексирования с целью определения их географической релевантности, особенно если явные адреса отсутствуют.

  • Процесс: Система идентифицирует географически значимые термины, перемножает их Geo-relevance Profiles и анализирует пики.
  • Выходные данные: Идентификаторы местоположений (например, почтовые индексы), ассоциированные с документом.

Также на этапе индексирования (или в офлайн-процессе) происходит обучение Location Classifier:

  • Процесс: Анализ ко-оккуренции терминов и известных адресов (Geographic Signals), генерация гистограмм.
  • Выходные данные: База данных Geo-relevance Profiles.

QUNDERSTANDING – Понимание Запросов

Патент также применим к поисковым запросам (Claims 6, 14).

  • Процесс: Система определяет географический интент запроса в реальном времени, даже если он неоднозначен (например, запрос [Castro Street Bay Area]).
  • Выходные данные: Информация о географической релевантности запроса, используемая для возврата локализованных результатов.

На что влияет

  • Конкретные типы контента: Наибольшее влияние на контент локального бизнеса, страницы мероприятий, местные новости, обзоры. Особенно влияет на страницы, где полный адрес не указан или указан частично.
  • Специфические запросы: Влияет на запросы с локальным интентом, содержащие неоднозначные названия мест (например, [Springfield pizza] или [Main Street cafe]).
  • Конкретные ниши или тематики: Критически важно для всех ниш, связанных с локальным поиском (услуги, туризм, недвижимость, ритейл).

Когда применяется

  • Триггеры активации: Алгоритм активируется при индексировании документа или обработке запроса, когда система обнаруживает в тексте строки, для которых существуют Geo-relevance Profiles.
  • Условия работы: Используется для разрешения неоднозначности, когда стандартные методы извлечения адресов (парсинг NAP) не дают результата или дают неоднозначный результат.

Пошаговый алгоритм

Алгоритм состоит из двух основных процессов: Обучение и Классификация.

Процесс А: Обучение (Офлайн)

  1. Сбор данных: Получение большого корпуса обучающих документов.
  2. Идентификация географических сигналов: Поиск известных и однозначных Geographic Signals (например, полных адресов с индексами) в документах.
  3. Извлечение обучающего текста: Если сигнал найден, извлекается текст (Training Text), находящийся вблизи сигнала (например, в окне 100 слов).
  4. Ассоциация текста и идентификатора: Извлеченный текст ассоциируется с Location Identifier (почтовым индексом) сигнала.
  5. Накопление вхождений: Для каждой строки (например, биграммы) система накапливает количество ее вхождений относительно каждого Location Identifier.
    • Фильтрация шаблонов (Boilerplate): Вхождение игнорируется, если контекст (слова слева/справа) идентичен предыдущим вхождениям (Claim 15).
  6. Генерация гистограмм: Для каждой строки генерируется Geo-relevance Profile.
  7. Фильтрация и сохранение: Система анализирует гистограмму на наличие статистически значимых пиков. Если пики есть (термин географически релевантен), профиль сохраняется.
  8. Нормализация (Опционально): Профили могут быть нормализованы на основе глобального распределения идентификаторов в обучающих данных, чтобы избежать перекоса.

Процесс Б: Классификация (Индексирование или Обработка запроса)

  1. Получение входного документа: Получение текста (веб-страницы или запроса).
  2. Идентификация релевантных строк: Поиск в документе строк, для которых существуют сохраненные Geo-relevance Profiles.
  3. Извлечение профилей: Извлечение соответствующих гистограмм.
  4. Комбинирование профилей (Перемножение): Генерация сводного профиля (Combined Geo-relevance Profile) путем перемножения значений индивидуальных гистограмм для каждого Location Identifier (Claim 1).
  5. Анализ и вывод: Анализ сводного профиля на наличие пиков. Пики указывают на наиболее вероятные географические регионы, к которым относится документ.

Какие данные и как использует

Данные на входе

  • Контентные факторы: Текст документа или запроса. Анализируются строки (термины и фразы, в частности биграммы). На этапе обучения также анализируется контекст (слова слева и справа от термина) для фильтрации шаблонного текста.
  • Структурные и Географические факторы (в обучении): Используются для идентификации Geographic Signals (формат адресов, почтовые индексы). Близость текста к этим сигналам используется для выбора Training Text.

Какие метрики используются и как они считаются

  • Geo-relevance Profile (Гистограмма): Распределение частоты встречаемости термина по географическим локациям (почтовым индексам).

    Рассчитывается как: Profile(String)={(Loc1,Count1),(Loc2,Count2),...}Profile(String) = \{(Loc_1, Count_1), (Loc_2, Count_2), ...\}.

  • Combined Geo-relevance Profile: Сводный профиль для документа.

    Рассчитывается путем перемножения значений индивидуальных профилей. Если документ содержит строки S1 и S2: CombinedCount(Loc)=Count(S1,Loc)∗Count(S2,Loc)CombinedCount(Loc) = Count(S1, Loc) * Count(S2, Loc). Этот метод усиливает совпадающие сигналы и подавляет шум.

  • Статистическая значимость пиков: Используется для валидации профилей во время обучения (определяет, является ли термин географически релевантным) и для определения итогового местоположения во время классификации.
  • Фильтрация контекста (Anti-Boilerplate): Механизм, используемый при обучении (Claim 15), который игнорирует встречаемость термина, если он появляется в том же контексте (окружающие слова), что и ранее.

Выводы

  1. Географическая релевантность без явных адресов: Google может точно определить географическую привязку документа, используя только косвенные текстовые сигналы (локальные топонимы, названия районов, улиц), даже при отсутствии полного адреса (NAP).
  2. Разрешение неоднозначности через пересечение (Перемножение): Ключевым механизмом является комбинирование Geo-relevance Profiles путем перемножения. Это позволяет эффективно разрешать неоднозначность, усиливая сигналы в тех географических областях, где пересекаются все найденные термины (консенсус).
  3. Статистический подход к локальной семантике: Система обучается путем анализа ко-оккуренции терминов и известных адресов. Это статистический, а не словарный подход к пониманию локального языка.
  4. Активная борьба с шаблонным контентом (Boilerplate): Патент явно описывает механизм (Claim 15) для игнорирования шаблонного текста на этапе обучения. Система учитывает термин, только если он появляется в уникальном контексте.
  5. Применение к запросам и документам: Описанный механизм универсален и используется как для классификации контента при индексировании, так и для понимания географического интента поисковых запросов в реальном времени.

Практика

Best practices (это мы делаем)

  • Насыщение контента гиперлокальными сигналами: Активно используйте в тексте разнообразные локальные идентификаторы: названия районов, ближайших улиц, местных ориентиров (парков, зданий, станций метро) и общепринятых локальных фраз. Наличие нескольких таких сигналов позволяет системе точно определить местоположение за счет механизма пересечения их гео-профилей.
  • Создание уникального контента для локальных страниц: Для сайтов с несколькими филиалами критически важно избегать шаблонного текста (boilerplate). Поскольку система учится игнорировать повторяющиеся контексты (Claim 15), уникальное описание с локальными терминами для каждого филиала необходимо для правильной гео-классификации.
  • Использование локального языка и коллоквиализмов: Используйте термины, которые местные жители применяют для описания своего района. Google может распознавать эти неформальные термины как географически релевантные, если они часто встречаются в обучающих данных.
  • Оптимизация страницы «О нас» и «Контакты»: Убедитесь, что эти страницы содержат не только формальный адрес, но и текстовое описание местоположения с упоминанием локальных ориентиров и пересечений улиц.

Worst practices (это делать не надо)

  • Использование шаблонного контента (Boilerplate): Создание множества локальных страниц путем простой замены названия города в шаблонном тексте. Механизм фильтрации контекста специально разработан для игнорирования таких текстов при обучении ассоциациям.
  • Игнорирование локального контекста в основном контенте: Опора только на структурированные данные (NAP) в футере или микроразметке без подкрепления местоположения в основном контенте страницы. Если контент слишком общий, Location Classifier может не найти достаточных сигналов.
  • Использование географических терминов в изоляции: Полагаться на один неоднозначный термин (например, только название улицы без района или ориентиров) неэффективно, если он существует в нескольких городах.
  • Географический спам (Keyword Stuffing): Беспорядочное перечисление географических названий. Поскольку система перемножает профили, термины должны быть согласованы (консистентны). Противоречивые сигналы могут привести к неопределенной классификации.

Стратегическое значение

Этот патент имеет фундаментальное значение для Local SEO. Он подтверждает, что Google активно стремится понять географический контекст контента за пределами явных адресов. Стратегия локального продвижения должна включать создание аутентичного, гиперлокализованного контента, который естественным образом интегрирует географические ссылки и местные термины. Это также объясняет, почему уникализация контента на локальных страницах является технической необходимостью, а не просто рекомендацией.

Практические примеры

Сценарий: Оптимизация страницы кофейни в определенном районе

  1. Ситуация: Кофейня находится на улице "Main Street" в районе "Capitol Hill" в Сиэтле. Оба названия неоднозначны (Main Street есть почти везде; Capitol Hill есть в Вашингтоне, Денвере и т.д.).
  2. Плохая практика: На странице используется шаблонный текст: "Лучший кофе на Main Street. Приходите к нам в Сиэтл".
  3. Хорошая практика (согласно патенту): В тексте упоминаются пересекающиеся локальные идентификаторы: "Посетите нашу кофейню на углу Main Street и Pike Street, в самом сердце района Capitol Hill. Мы находимся в двух кварталах от парка Cal Anderson".
  4. Как это работает: Location Classifier извлекает профили для "Main Street", "Capitol Hill", "Pike Street" и "Cal Anderson". Хотя первые два термина имеют пики во многих городах, "Pike Street" (в этом контексте) и "Cal Anderson" имеют пики только в Сиэтле. При перемножении всех профилей пики в других городах подавляются, и система уверенно классифицирует страницу как относящуюся к Сиэтлу (Zip Code 98104).

Вопросы и ответы

Как система определяет, какие термины являются географически релевантными?

Система определяет это статистически в процессе обучения. Она анализирует документы с известными адресами и смотрит, какие термины часто встречаются рядом с ними. Если термин значительно чаще встречается в связи с определенным местоположением (т.е. его гистограмма имеет выраженные пики, а не плоское распределение), он помечается как географически релевантный.

Что такое Geo-relevance Profile (гистограмма) на практике?

Это статистическое распределение для термина по почтовым индексам. Например, профиль для термина «Bay Area» будет иметь высокий пик в районе Сан-Франциско (индексы 94xxx) и меньший пик в районе Грин-Бей (индексы 54xxx). Эта гистограмма позволяет системе понять степень неоднозначности термина и его наиболее вероятные географические значения.

Почему используется перемножение гистограмм, а не сложение?

Перемножение используется для разрешения неоднозначности и поиска пересечений. Оно действует как логическое «И», усиливая сигнал только в тех регионах, где ВСЕ найденные термины имеют высокую вероятность появиться вместе. Сложение же могло бы привести к ложным срабатываниям, суммируя популярность разных локаций. Перемножение требует консенсуса между терминами.

Какое значение имеет упоминание в патенте фильтрации шаблонного текста (boilerplate)?

Это критически важно для SEO, особенно для сайтов с филиалами. В Claim 15 описано, что система игнорирует термин при обучении, если он появляется в том же контексте (окружении слов), что и ранее. Это означает, что Google активно учится не учитывать шаблонный текст при определении локальной релевантности. Это подчеркивает необходимость уникального контента для локальных страниц.

Применяется ли этот механизм к поисковым запросам?

Да. Патент явно указывает (Claim 6, 14), что входным текстом может быть поисковый запрос. Система может проанализировать запрос, содержащий неоднозначные локальные термины (например, название ресторана или улицы без города), и определить вероятное географическое намерение пользователя, используя те же самые Geo-relevance Profiles.

Влияет ли этот патент на ранжирование, если на сайте уже указан полный и точный адрес (NAP)?

Да. Хотя точный NAP является основным фактором локализации (Geographic Signal), наличие дополнительных локальных терминов (названий районов, достопримечательностей) может усилить сигнал географической релевантности. Это помогает лучше ранжироваться по гиперлокальным запросам, связанным с конкретным районом или ориентиром.

Заменяет ли этот механизм необходимость в NAP и структурированных данных?

Нет, не заменяет. Этот механизм предназначен для ситуаций, когда NAP отсутствует, неполон или неоднозначен. Наличие точного, структурированного NAP остается лучшей практикой для Local SEO. Описанный механизм дополняет его, позволяя системе подтвердить местоположение через анализ основного контента.

Что делать SEO-специалисту для оптимизации бизнеса без физического адреса (SAB)?

Для SAB критически важно насытить контент сигналами обслуживаемой территории. Указывайте конкретные районы и города, в которых вы работаете. Создавайте кейсы или отзывы с упоминанием местоположения клиентов. Используйте фразы, интегрирующие локальные термины (например, «Услуги электрика в районе [Название района]»), чтобы помочь Location Classifier.

Почему в патенте в качестве идентификаторов используются почтовые индексы (ZIP codes)?

Почтовые индексы удобны тем, что они однозначно определяют регион и, как правило, численно близкие индексы соответствуют географически близким локациям. Это упрощает построение и интерпретацию гистограмм, позволяя видеть кластеры активности в смежных регионах, хотя система может использовать и другие идентификаторы.

Как этот патент связан с современными подходами Google, такими как использование сущностей (Entities)?

Этот патент можно рассматривать как ранний статистический подход к распознаванию и локализации сущностей. Современные системы стремятся связать текстовую строку с конкретной сущностью в Knowledge Graph. Однако базовый принцип — разрешение неоднозначности путем анализа контекста и комбинирования сигналов для определения географической привязки — остается фундаментальным.

Похожие патенты

Как Google использует географическое положение и историю поведения пользователей для разрешения неоднозначных запросов
Google применяет механизм для интерпретации неоднозначных поисковых запросов, которые имеют несколько географических или категориальных значений. Система определяет доминирующий интент, анализируя, как пользователи в том же регионе ранее уточняли похожие запросы и насколько они были удовлетворены результатами. На основе этих локализованных данных (гистограмм и метрик неудовлетворенности) выбирается наиболее вероятная интерпретация, и выдача фильтруется соответственно.
  • US8478773B1
  • 2013-07-02
  • Семантика и интент

  • Персонализация

  • Поведенческие сигналы

Как Google уточняет границы местности в локальном поиске, комбинируя полигоны, почтовые индексы и значимые центры активности
Google использует комплексный механизм для определения географической релевантности бизнеса. Система комбинирует расстояние до официальных границ региона (полигона), верификацию через почтовый индекс и расстояние до «центра активности» (например, центра города, а не геометрического центра). Это позволяет точнее ранжировать локальные результаты, компенсируя неточности карт и почтового зонирования.
  • US8898173B1
  • 2014-11-25
  • Local SEO

Как Google использует "Массу Локации" и гео-подсказки для точного геокодирования запросов и извлечения адресов из контента
Патент Google, раскрывающий фундаментальные механизмы геокодирования и извлечения адресов. Система преобразует текстовые описания мест в точные координаты, используя "Массу Локации" (количество адресов в регионе) для оценки значимости. При наличии "Гео-подсказки" (например, местоположения пользователя) система отдает приоритет ближайшим результатам. Также описан процесс автоматического извлечения адресов с веб-страниц.
  • US8959084B2
  • 2015-02-17
  • Local SEO

Как Google определяет географическую релевантность сайта, анализируя местоположение его посетителей
Google использует механизм для автоматического определения географической релевантности веб-ресурсов путем анализа местоположения их посетителей (через IP-адреса). Система применяет кластерный анализ к этим данным: если аудитория сконцентрирована в определенных регионах, сайт признается локально релевантным этим регионам. Эти данные используются для повышения ранжирования сайта для пользователей из этих же регионов.
  • US8086690B1
  • 2011-12-27
  • Local SEO

  • SERP

Как Google определяет ключевую тематику зданий и адресов, используя клики пользователей для показа релевантной рекламы
Google использует этот механизм для понимания основного назначения физического местоположения (адреса или здания). Система анализирует все бизнесы в этой локации и определяет, какие поисковые запросы чаще всего приводят к кликам по их листингам. Самый популярный запрос используется как доминирующее ключевое слово для выбора релевантной рекламы, когда пользователи ищут этот адрес или взаимодействуют с ним на Картах или в Street View.
  • US20120278171A1
  • 2012-11-01
  • Local SEO

  • Семантика и интент

  • Поведенческие сигналы

Популярные патенты

Как Google ранжирует и рекомендует источники контента (каналы, профили) на основе внутренних ссылок, аннотаций и кликов по ним
Google использует механизм для ранжирования и рекомендации источников контента (например, YouTube-каналов или профилей) внутри платформ. Система анализирует, как часто источник упоминается в аннотациях, описаниях и комментариях к контенту, который просматривал пользователь. Ключевым фактором ранжирования является не только количество упоминаний, но и общее число кликов (активаций) по этим ссылкам.
  • US9235625B2
  • 2016-01-12
  • Ссылки

  • Поведенческие сигналы

  • Мультимедиа

Как Google использует ссылки, которыми делятся в почте, блогах и мессенджерах, как сигнал для корректировки ранжирования
Google запатентовал механизм (User Distributed Search), который учитывает, как пользователи делятся ссылками в коммуникациях (почта, блоги, мессенджеры). Если автор включает ссылку в сообщение, это дает ей первоначальную модификацию в ранжировании. Если получатели переходят по этой ссылке, её Ranking Score увеличивается ещё больше. Оба сигнала используются для влияния на позиции документа в будущей выдаче.
  • US8862572B2
  • 2014-10-14
  • Поведенческие сигналы

  • Ссылки

Как Google анализирует текст вокруг ссылки (Rare Words) для борьбы со спамом и определения шаблонных ссылок
Google использует механизм для оценки качества ссылок, выходящий за рамки анкорного текста. Система анализирует редкие слова (rare words) в тексте, непосредственно окружающем ссылку, чтобы определить её уникальный контекст. Ранжирование улучшается при наличии разнообразия этих контекстов. Ссылки с повторяющимся контекстом (спам, Google-бомбинг или шаблонные/сквозные ссылки) идентифицируются и дисконтируются.
  • US8577893B1
  • 2013-11-05
  • Антиспам

  • Ссылки

  • Семантика и интент

Как Google автоматически обнаруживает и индексирует контент внутри мобильных приложений для показа в поиске (App Indexing)
Google использует систему для индексации контента нативных мобильных приложений. Для приложений, связанных с веб-сайтами, система проверяет аффилиацию и использует существующие веб-URL для доступа к контенту приложения. Для приложений с кастомными URI система эмулирует работу приложения и итеративно обнаруживает внутренние ссылки. Это позволяет контенту из приложений появляться в результатах поиска в виде глубоких ссылок.
  • US10073911B2
  • 2018-09-11
  • Индексация

  • Краулинг

  • Ссылки

Как Google использует визуальное расположение новостей на главных страницах СМИ для ранжирования в Google News
Google анализирует главные страницы авторитетных новостных сайтов («Hub Pages»), чтобы определить важность новостей. Система оценивает «визуальную заметность» (Prominence) ссылки на статью — ее расположение (выше/ниже), размер шрифта, наличие картинки и сниппета. Чем заметнее ссылка на сайте СМИ, тем выше статья ранжируется в агрегаторах новостей.
  • US8375073B1
  • 2013-02-12
  • EEAT и качество

  • SERP

  • Ссылки

Как Google использует контент вокруг ссылок (вне анкора) для генерации «Синтетического Описательного Текста» и ранжирования вашего сайта
Google может генерировать «Синтетический Описательный Текст» для страницы, анализируя контент и структуру сайтов, которые на нее ссылаются. Система создает структурные шаблоны для извлечения релевантного текста (например, заголовков или абзацев рядом со ссылкой), который затем используется как мощный сигнал ранжирования. Этот механизм позволяет лучше понять содержание страницы, особенно если традиционный анкорный текст низкого качества или отсутствует.
  • US9208233B1
  • 2015-12-08
  • Ссылки

  • Семантика и интент

  • Индексация

Как Google динамически перестраивает выдачу, если пользователь игнорирует результаты, связанные с определенной сущностью
Google использует механизм уточнения интента пользователя в реальном времени при обработке неоднозначных запросов. Система группирует результаты поиска по связанным сущностям. Если пользователь демонстрирует отсутствие интереса к одной из групп (например, прокручивает или смахивает результаты), система динамически модифицирует выдачу, понижая или удаляя все результаты, связанные с этой отклоненной сущностью.
  • US9348945B2
  • 2016-05-24
  • Семантика и интент

  • SERP

  • Поведенческие сигналы

Как Google нормализует поведенческие сигналы (Dwell Time), калибруя показатели «короткого» и «длинного» клика для разных категорий сайтов
Google использует механизм для устранения предвзятости в поведенческих сигналах, таких как продолжительность клика (Dwell Time). Поскольку пользователи взаимодействуют с разными типами контента по-разному, система определяет, что считать «коротким кликом» и «длинным кликом» отдельно для каждой категории (например, Новости, Недвижимость, Словари). Это позволяет более точно оценивать качество ресурса, сравнивая его показатели с нормами его конкретной ниши.
  • US8868565B1
  • 2014-10-21
  • Поведенческие сигналы

  • SERP

Как Google использует историю поиска и браузинга для персонализации выдачи и определения предпочтений пользователя
Google записывает и анализирует историю действий пользователя: запросы, клики по результатам и рекламе, посещенные страницы. Система группирует связанные действия в сессии, определяет "Предпочитаемые локации" на основе частоты и времени визитов (stay-time), и использует эту историю для изменения порядка ранжирования, повышая позиции ранее посещенных сайтов в персональной выдаче.
  • US20060224583A1
  • 2006-10-05
  • Персонализация

  • Поведенческие сигналы

Как Google предсказывает следующий запрос пользователя на основе контента текущей страницы и исторических данных
Google использует машинное обучение для анализа логов поведения пользователей, чтобы понять, что они ищут после посещения определенного контента. Система создает совместное векторное пространство (joint embedding) для документов и запросов, где близость отражает семантическую связь и вероятность совместной встречаемости. Это позволяет предлагать релевантные последующие запросы (query suggestions) в реальном времени, даже если ключевые слова для этих запросов на странице отсутствуют.
  • US9594851B1
  • 2017-03-14
  • Семантика и интент

  • Поведенческие сигналы

  • Персонализация

seohardcore