Close Menu
    Telegram
    SEO HARDCORE
    • Разборы патентов
      • Патенты Google
      • Патенты Яндекс
    • Скоро
      SEO инструменты
    • Скоро
      SEO аналитика
    SEO HARDCORE
    Разборы патентов • Патенты Google

    Как Google автоматически создает исторические туры для Карт и Google Earth, используя данные с веб-страниц и PageRank

    HISTORICAL TOURS (Исторические туры)
    • US20140088861A1
    • Google LLC
    • 2014-03-27
    • 2011-07-26
    2011 Мультимедиа Патенты Google

    Патент описывает систему автоматического создания «исторических туров» для виртуальных карт (например, Google Earth). Система находит веб-страницы с геоданными (например, статьи Википедии о достопримечательностях), извлекает исторические изображения для этих мест и оценивает их важность, используя PageRank исходной страницы. Лучшие локации объединяются в KML-файл для интерактивного тура.

    • Описание
    • Детальный разбор
    • Выводы
    • Практика
    • Вопросы и ответы
    • Наверх

    Описание

    Какую задачу решает

    Патент решает задачу автоматизации создания контента для пользователей, изучающих регионы на виртуальных картах (Virtual Map), таких как Google Earth. Цель — предоставить пользователю готовый «исторический тур» (Historical Tour) по региону, который покажет исторические места и связанные с ними данные (изображения, текст), без необходимости ручного поиска этой информации.

    Что запатентовано

    Запатентована система автоматической генерации исторических туров. Система сканирует базы данных веб-страниц (Page Database, например, Википедию), идентифицирует страницы, содержащие конкретные географические координаты. Для этих локаций извлекаются исторические данные (Historical Information, например, старые спутниковые снимки) из Historical Database. Затем система оценивает важность этих локаций и генерирует тур, часто в формате KML (Keyhole Markup Language), который последовательно показывает эти места на карте.

    Как это работает

    Ключевой механизм включает несколько этапов:

    • Идентификация локаций: Система сканирует веб-страницы и отбирает только те, которые содержат четко определенные географические данные (широта/долгота).
    • Извлечение исторических данных: Для найденных локаций извлекаются исторические изображения и их даты.
    • Оценка (Scoring): Для каждой локации рассчитывается оценка (Score), определяющая ее интересность. Ключевым фактором оценки является PageRank исходной веб-страницы. Также учитываются количество и возраст доступных исторических изображений, и корреляция дат, упомянутых на странице, с датами изображений.
    • Группировка и выбор: Локации группируются по регионам (с помощью Reverse Geocoding). Внутри региона выбираются наиболее интересные локации (например, Топ-N по Score).
    • Генерация тура: Создается файл (например, KML), который инструктирует картографическое приложение последовательно перемещаться к выбранным локациям и отображать извлеченный контент.

    Актуальность для SEO

    Средняя. Описанные технологии активно используются в продуктах Google Earth и Google Maps для отображения исторических снимков и генерации туров. Хотя сам патент подан в 2011 году, принципы автоматического извлечения данных из веба, привязки их к геолокациям и оценки важности источников (PageRank) остаются актуальными для понимания работы сервисов Google.

    Важность для SEO

    Влияние на традиционное SEO минимальное (2/10). Патент не описывает алгоритмы ранжирования веб-поиска. Он описывает внутренний механизм Google для генерации специфического контента для картографических сервисов. Однако он дает два важных инсайта: 1) Подтверждает использование PageRank (или аналогичных метрик авторитетности) вне веб-поиска для оценки важности страниц как источников данных. 2) Подчеркивает важность четкой привязки контента к геолокациям для его использования в специализированных сервисах Google.

    Детальный разбор

    Термины и определения

    Geocode Server (Сервер геокодирования)
    Сервер, выполняющий прямое геокодирование (регион в координаты) и обратное геокодирование (Reverse Geocoding) — преобразование координат в один или несколько регионов (город, страна).
    Historical Database (База исторических данных)
    База данных, хранящая историческую информацию, индексированную по географическим областям. В контексте патента — это преимущественно база исторических изображений (спутниковых, аэрофото, Street View) с датами съемки.
    Historical Tour (Исторический тур)
    Сгенерированный продукт (например, KML-файл), который при запуске в картографическом приложении последовательно перемещает вид пользователя к ряду географических локаций и отображает историческую информацию о них.
    KML (Keyhole Markup Language)
    Язык разметки на основе XML для представления трехмерных геопространственных данных в таких программах, как Google Earth и Google Maps.
    Page Database (База данных страниц)
    Хранилище веб-страниц, используемое в качестве источника локаций. В патенте упоминаются Википедия или базы данных GIS.
    PageRank (Ранг страницы)
    Метрика, указывающая на важность или популярность веб-страницы. Используется системой как индикатор вероятности того, что пользователь будет заинтересован в изучении истории соответствующей географической локации.
    Score (Оценка локации)
    Числовая оценка, рассчитываемая для географической локации, чтобы определить ее пригодность и приоритет для включения в исторический тур. Базируется на PageRank, количестве и возрасте исторических изображений, корреляции дат.
    Virtual Map (Виртуальная карта)
    Двух- или трехмерное представление Земли, сгенерированное путем сшивания изображений и/или использования 3D-моделей (например, Google Earth).

    Ключевые утверждения (Анализ Claims)

    Claim 1 (Независимый пункт): Описывает базовый метод генерации исторического тура.

    1. Система выбирает множество страниц, каждая из которых содержит географическую локацию. При этом страницы без географической информации отбрасываются.
    2. Для каждой выбранной страницы система извлекает историческую информацию (Historical Information) из базы данных на основе соответствующей геолокации.
    3. Система генерирует исторический тур (Historical Tour) на основе этих геолокаций, включая в него часть извлеченной исторической информации.

    Claim 5 (Зависимый от 1): Детализирует процесс оценки и выбора локаций.

    1. Для каждой выбранной страницы система получает ее PageRank.
    2. Система рассчитывает оценку (Score) для соответствующей геолокации, основываясь на PageRank и извлеченной исторической информации.
    3. Система выбирает одну или несколько геолокаций для включения в тур на основе рассчитанных оценок.

    Claim 7 (Зависимый от 1): Описывает метод выбора локаций с помощью кластеризации.

    1. Система кластеризует геолокации в несколько кластеров в соответствии с их местоположением (географическая близость).
    2. Система выбирает локации для тура на основе этих кластеров (например, выбирая лучшую локацию из каждого кластера для обеспечения географического разнообразия тура).

    Claim 17 (Независимый пункт): Описывает альтернативный метод генерации тура с фокусом на датах изображений.

    1. Для множества географических локаций система извлекает как минимум одно историческое изображение.
    2. Для каждой локации рассчитывается оценка (Score) на основе даты этого изображения.
    3. Система выбирает подмножество локаций на основе этих оценок.
    4. Система генерирует исторический тур на основе выбранных локаций.

    Где и как применяется

    Этот патент не вписывается в стандартную архитектуру веб-поиска. Он описывает систему генерации контента для специализированной вертикали — картографических сервисов (Google Maps, Google Earth).

    CRAWLING & INDEXING (Сканирование и Индексирование)
    Система полагается на данные, собранные на этих этапах. Она использует Page Database (проиндексированные веб-страницы, такие как Википедия) для поиска локаций и Historical Database (база данных изображений) для поиска контента.

    RANKING (Ранжирование)
    Хотя это не ранжирование в веб-поиске, система использует внутренний механизм ранжирования (Scoring) для определения того, какие локации являются наиболее интересными для включения в тур. Score Module выполняет эту функцию.

    Входные данные:

    • Множество веб-страниц (Page Database).
    • База данных исторических изображений с датами (Historical Database).
    • Данные о PageRank страниц (Page Rank Server).
    • Доступ к сервису геокодирования (Geocode Server).

    Выходные данные:

    • Сгенерированный исторический тур (например, KML-файл), сохраненный в Historical Tour Database.

    На что влияет

    • Конкретные типы контента: Влияет на контент, отображаемый в картографических сервисах (Google Earth, Google Maps). Наиболее релевантно для страниц, описывающих физические объекты, достопримечательности, исторические места, здания.
    • Конкретные ниши или тематики: История, туризм, архитектура, урбанистика.

    Когда применяется

    • Временные рамки и частота применения: Генерация туров происходит офлайн. В патенте указано, что Page Module может периодически (например, ежемесячно) искать и загружать недавно добавленные страницы для обновления туров.
    • Триггеры активации: Тур предоставляется пользователю, когда он изучает определенный регион в картографическом приложении, и для этого региона существует заранее сгенерированный тур.

    Пошаговый алгоритм

    Процесс генерации исторического тура:

    1. Сбор данных (Page Module): Загрузка множества страниц из Page Database (например, дамп Википедии).
    2. Фильтрация страниц: Отбор страниц, которые содержат информацию о местоположении в четко определенном формате (например, координаты широты и долготы). Страницы без геоданных отбрасываются.
    3. Извлечение исторических данных (Historical Information Module): Для каждой отобранной страницы и ее геолокации выполняется запрос к Historical Database для получения исторических изображений и их дат.
    4. Расчет оценки локации (Score Module): Для каждой локации вычисляется Score. Оценка может быть основана на одном или нескольких компонентах:
      • Компонент 1: PageRank исходной страницы (запрашивается у Page Rank Server).
      • Компонент 2: Количество извлеченных исторических изображений.
      • Компонент 3: Возраст изображений (например, возраст самого старого изображения или средний возраст).
      • Компонент 4: Корреляция дат. Даты извлекаются из текста страницы (включая распознавание терминов типа «World War II») и сравниваются с датами изображений. Чем выше корреляция, тем выше оценка.

      Score рассчитывается как взвешенная сумма или произведение этих компонентов. Локации ниже минимального порога могут быть отброшены.

    5. Гео-привязка (Region Module): Для каждой локации определяется регион (город, штат, страна) с помощью запроса Reverse Geocoding к Geocode Server.
    6. Выбор локаций (Location Selection Module): Для конкретного региона (например, «Сан-Франциско») выбираются локации для включения в тур. Методы выбора:
      • Выбор Топ-N локаций с наивысшими Score.
      • Кластеризация локаций по географическому признаку (например, k-means) и выбор локации с наивысшим Score в каждом кластере (для разнообразия).
      • Кластеризация по датам изображений и выбор лучших локаций из кластеров (для временного разнообразия или фокуса на эпохе).
    7. Генерация тура (Tour Generation Module): Создание файла (например, KML). Локации упорядочиваются для создания кратчайшего пути. Файл содержит инструкции для последовательного перемещения вида карты и отображения исторических изображений и контента (текст, ссылки) с исходной веб-страницы.
    8. Хранение: Сгенерированный тур сохраняется в Historical Tour Database.

    Какие данные и как использует

    Данные на входе

    • Контентные факторы: Текст, заголовки и информационные блоки исходной веб-страницы. Используются для извлечения дат (Date Correlation) и для отображения контента пользователю во время тура.
    • Технические факторы: Наличие географических координат (широта, долгота) на странице в распознаваемом формате.
    • Ссылочные факторы: PageRank исходной веб-страницы. Используется как ключевой компонент для расчета Score локации.
    • Мультимедиа факторы: Исторические изображения (спутниковые, аэрофотосъемка, Street View) и даты их создания, полученные из Historical Database.

    Какие метрики используются и как они считаются

    • Score (Оценка локации): Основная метрика для ранжирования локаций внутри региона. Рассчитывается как агрегация (взвешенная сумма или произведение) нескольких компонентов: PageRank, количество изображений, возраст изображений, корреляция дат. Конкретные формулы взвешивания в патенте не приведены.
    • Методы анализа текста: Система использует методы для распознавания дат в различных форматах на веб-странице. Также упоминается распознавание терминов, соответствующих диапазону дат (например, «World War II» -> 1935-1945).
    • Кластеризация: Используются алгоритмы кластеризации (упоминается k-means clustering algorithm) для группировки географических локаций по признаку близости (географическое разнообразие) или по близости дат их исторических изображений (временное разнообразие).

    Выводы

    1. Инфраструктурный патент для картографических сервисов: Патент описывает систему генерации контента для Google Earth/Maps, а не алгоритмы ранжирования в основном веб-поиске. Прямое влияние на SEO минимально.
    2. PageRank как универсальная метрика авторитетности: Ключевой вывод для SEO — это подтверждение того, что Google использует PageRank (или аналогичные метрики авторитетности ссылочного графа) вне контекста веб-поиска. Здесь PageRank используется для оценки «интересности» или «важности» локации на основе авторитетности страницы, которая ее описывает.
    3. Важность привязки контента к сущностям (Entity SEO): Система работает только с теми страницами, из которых удалось извлечь точные географические координаты. Это подчеркивает важность четкого связывания контента с реальными сущностями (в данном случае — локациями) для его использования в различных продуктах Google.
    4. Автоматическая генерация контента: Патент демонстрирует, как Google комбинирует данные из разных источников (Веб-индекс, База данных изображений) для автоматического создания сложного продукта (интерактивного тура).
    5. Оценка качества данных: Система использует сложные метрики для выбора контента, включая корреляцию дат между текстом на странице и метаданными изображений, что указывает на способность Google к кросс-валидации информации.

    Практика

    Best practices (это мы делаем)

    Хотя патент имеет ограниченное применение в традиционном SEO, он дает полезные рекомендации для Local SEO и Entity SEO.

    • Точная разметка геолокаций: Для сайтов, описывающих физические локации (достопримечательности, исторические места, офисы, магазины), критически важно указывать точные географические координаты (широту и долготу) в структурированном формате. Используйте Schema.org/GeoCoordinates. Это помогает системам Google точно идентифицировать локацию, описанную на странице.
    • Работа над авторитетностью страниц (PageRank/E-E-A-T): Поскольку PageRank используется для оценки важности локации, повышение общей авторитетности сайта и конкретных страниц (через качественные ссылки и E-E-A-T) увеличивает вероятность того, что ваш контент будет использован в качестве авторитетного источника в сервисах Google (включая Карты и Google Earth).
    • Насыщение контента фактическими данными (Даты): При описании исторических мест четко указывайте релевантные даты. Система использует корреляцию дат в тексте с имеющимися историческими данными для оценки релевантности (Date Correlation).

    Worst practices (это делать не надо)

    • Отсутствие структурированных геоданных: Полагаться только на адрес в тексте недостаточно. Если система не сможет извлечь точные координаты в нужном формате, страница будет проигнорирована (Claim 1明确 указывает на отбрасывание страниц без географической информации).
    • Предоставление неточных координат: Указание неверных геоданных может привести к неправильной ассоциации контента с локацией.

    Стратегическое значение

    Патент подтверждает стратегический фокус Google на извлечении и структурировании данных из веба для обогащения собственных продуктов и построения Графа Знаний. Для SEO это означает необходимость смещения фокуса в сторону Entity SEO — оптимизации контента вокруг сущностей (в данном случае, локаций) и предоставления четких, структурированных данных о них. Хотя этот конкретный механизм не влияет на ранжирование в веб-поиске, он является частью общей инфраструктуры Google по пониманию контента.

    Практические примеры

    Сценарий: Оптимизация страницы исторического музея для включения в тур Google Earth

    1. Задача: Повысить вероятность того, что страница музея будет использована как источник для автоматического исторического тура по городу.
    2. Действия согласно патенту:
      • Геолокация: Убедиться, что на главной странице и/или странице «О нас» внедрена разметка Schema.org/Museum с точным указанием geo (latitude, longitude).
      • Авторитетность: Разработать стратегию линкбилдинга для получения ссылок с авторитетных ресурсов (другие музеи, городские порталы, туристические сайты) для повышения PageRank страницы.
      • Контент и Даты: Добавить в описание музея ключевые исторические даты (год основания, годы важных событий, периоды реконструкции).
    3. Ожидаемый результат: Система Google при сканировании страницы идентифицирует точные координаты. Высокий PageRank и наличие релевантных дат повысят Score локации. Если Score будет достаточно высоким по сравнению с другими локациями в городе, музей будет включен в сгенерированный Historical Tour, а контент со страницы музея будет показан пользователям Google Earth.

    Вопросы и ответы

    Влияет ли этот патент на ранжирование моего сайта в поиске Google?

    Нет, напрямую не влияет. Патент описывает механизм генерации контента (исторических туров) для картографических сервисов, таких как Google Earth и Google Maps. Он не описывает алгоритмы, определяющие позиции сайтов в стандартной поисковой выдаче.

    Зачем тогда SEO-специалисту изучать этот патент?

    Он дает важное понимание инфраструктуры Google. Во-первых, он подтверждает, что PageRank используется не только в поиске, но и как универсальная метрика важности страниц в других системах Google. Во-вторых, он показывает, насколько критично предоставлять точные структурированные данные (в данном случае, геокоординаты) для корректной интерпретации контента.

    Как система определяет, какие локации включать в тур?

    Система рассчитывает оценку (Score) для каждой потенциальной локации. Эта оценка в значительной степени зависит от PageRank веб-страницы, описывающей локацию, а также от количества и возраста доступных исторических изображений для этого места. В тур включаются локации с наивысшими оценками в данном регионе.

    Что такое KML-файл в контексте патента?

    KML (Keyhole Markup Language) — это формат файла, который используется для отображения географических данных в Google Earth или Картах. В данном патенте KML-файл является конечным продуктом — самим историческим туром. Он содержит инструкции, куда переместить камеру, какой путь показать и какую информацию (изображения, текст) отобразить в каждой точке.

    Что такое «корреляция дат» (Date Correlation) и как она работает?

    Это механизм оценки релевантности. Система извлекает даты из текста веб-страницы (например, год постройки здания) и сравнивает их с датами доступных исторических изображений. Если даты совпадают или близки, оценка локации (Score) повышается, так как система считает, что контент хорошо соответствует имеющимся историческим данным.

    Откуда система берет данные о локациях?

    Система сканирует базы данных веб-страниц (Page Database). В патенте в качестве примеров приводятся Википедия и базы данных GIS (геоинформационные системы). Система ищет страницы, содержащие точные географические координаты.

    Как я могу помочь Google связать мой контент с геолокацией?

    Лучший способ — использовать структурированные данные. Для организаций, достопримечательностей или любых физических объектов необходимо внедрить соответствующую разметку Schema.org и заполнить свойство geo с указанием точных latitude и longitude (широты и долготы).

    Что такое кластеризация локаций, упомянутая в патенте?

    Это метод обеспечения разнообразия в туре. Чтобы не показывать много точек, расположенных рядом, система может сгруппировать близлежащие локации в кластеры (используя, например, алгоритм k-means) и выбрать только одну лучшую локацию из каждого кластера. Также упоминается кластеризация по датам для обеспечения временного разнообразия.

    Использует ли система данные из Google Business Profile (GBP)?

    Патент не упоминает GBP напрямую. Он фокусируется на извлечении данных из веб-страниц (Page Database). Однако, учитывая, что GBP является основным источником проверенных данных о локациях для Google, современные реализации этой системы, вероятно, интегрируют данные из GBP наряду с данными из веба.

    Если мой сайт будет включен в такой тур, получу ли я больше трафика?

    Возможно, но незначительно. Во время тура система отображает контент с исходной страницы и может включать ссылку на нее. Пользователи Google Earth, заинтересованные в дополнительной информации, могут перейти по ссылке. Однако основной целью оптимизации под этот механизм является улучшение представленности вашего объекта в картографических сервисах, а не генерация трафика.

    Навигация
    • Описание
    • Детальный разбор
    • Выводы
    • Практика
    • Вопросы и ответы
    • Наверх
    Telegram
    © 2025 SEO HARDCORE

    Type above and press Enter to search. Press Esc to cancel.