SEO HARDCORE
  • Разборы патентов
    • Патенты Google
  • Скоро SEO инструменты
  • Скоро SEO аналитика
  • seohardcore
SEO HARDCORE
назад

Как Google связывает веб-контент с медиа для воспроизведения на ТВ (Google TV/Chromecast)

DISCOVERING AND DISPLAYING MEDIA CONTENT RELATED TO AN ELECTRONIC DOCUMENT (Обнаружение и отображение медиаконтента, связанного с электронным документом)
  • US9674583B2
  • Google LLC
  • 2012-12-27
  • 2017-06-06
  • Мультимедиа
  • Семантика и интент
  • Описание
  • Разбор
  • Выводы
  • Практика
  • FAQ
  • Похожие

Патент описывает технологию (например, расширение для браузера), которая анализирует просматриваемую веб-страницу для обнаружения связанного медиаконтента (ТВ-программы, потоковое видео). Система позволяет пользователю выбрать этот контент на компьютере и автоматически воспроизвести его на другом устройстве, например, подключенном телевизоре (Google TV).

Описание

Какую проблему решает

Патент решает проблему разрыва между просмотром веб-контента на одном устройстве (например, компьютере или планшете) и потреблением связанного медиаконтента на другом устройстве (например, телевизоре). Он устраняет необходимость для пользователя вручную прерывать просмотр веб-страницы, переключаться на телевизор и заново искать там интересующий медиаконтент, упомянутый или связанный с темой веб-страницы.

Что запатентовано

Запатентована система, состоящая из клиентского модуля (например, расширения браузера) и серверной инфраструктуры, которая анализирует электронный документ, открытый на первом устройстве. Цель анализа — обнаружить медиа-сущности (Media Entities), связанные с тематикой документа, даже если они явно не встроены в документ. Система предоставляет список этих медиа-сущностей пользователю и позволяет инициировать воспроизведение выбранного контента на втором устройстве (например, Connected TV/STB).

Как это работает

Механизм работает следующим образом: клиентский модуль на первом устройстве получает идентификационную информацию о документе (Document Identifying Information) — это может быть URL или исходный код страницы. Эта информация отправляется на сервер (Backend System). Сервер анализирует документ, используя извлечение сущностей (Entity Retriever/WebRef), чтобы понять тематику и найти связанные медиа-сущности в своей базе данных. Эти сущности фильтруются (остаются только медиа) и возвращаются клиенту. Клиент отображает список, и при выборе пользователя отправляет команду воспроизведения на подключенный телевизор или приставку.

Актуальность для SEO

Низкая/Средняя. Патент напрямую связан с продуктом Google TV (предшественник Android TV и Chromecast). Хотя конкретная реализация в виде анализирующего страницу расширения для браузера сейчас не является доминирующей технологией, базовая концепция связи устройств и кросс-платформенного воспроизведения контента (например, Chromecast) остается актуальной. Технология извлечения сущностей (WebRef), лежащая в основе патента, критически важна для Google.

Важность для SEO

Влияние на SEO минимальное (1/10). Патент описывает функциональность конкретного продукта (Google TV/Chrome Extension), а не алгоритмы ранжирования веб-поиска. Он не влияет на то, как сайты ранжируются в Google Search. Однако он демонстрирует возможности Google по глубокому анализу контента и извлечению сущностей (Entity Extraction) для понимания тематики документа, что является важным фоновым знанием для SEO-специалистов.

Детальный разбор

Термины и определения

Backend System (Серверная система)
Сервер, который получает информацию о документе от клиентского устройства, анализирует ее и возвращает список связанных медиа-сущностей.
Client System (Клиентская система / Первое устройство)
Устройство (например, компьютер, планшет), на котором пользователь просматривает электронный документ и взаимодействует с модулем управления ТВ.
Connected TV and/or Set-top box (Подключенный ТВ и/или Приставка / Второе устройство)
Устройство вывода (например, Google TV), которое получает команду от клиентской системы и воспроизводит выбранный медиаконтент.
Document Application (Приложение для работы с документами)
Программа на клиентском устройстве для просмотра контента, чаще всего веб-браузер.
Document Identifying Information (Идентификационная информация о документе)
Данные, отправляемые клиентом на сервер для идентификации контента. Это может быть часть сетевого идентификатора (например, URL) или исходный код документа (например, HTML).
Entity Database (База данных сущностей)
Хранилище, содержащее информацию о различных сущностях (медиа, люди, места и т.д.) и их связях с электронными документами.
Entity Retriever (WebRef) (Извлекатель сущностей)
Компонент серверной системы, который идентифицирует сущности, связанные с электронным документом, используя Entity Database. WebRef — это вероятное внутреннее название системы аннотирования и извлечения сущностей Google.
Media Entity (Медиа-сущность)
Сущность, соответствующая медиаконтенту, такому как запланированные ТВ-программы, потоковое медиа (например, YouTube) или локально сохраненные медиафайлы.
TV Remote Control Module (Модуль дистанционного управления ТВ)
Компонент на клиентском устройстве (часто реализованный как расширение или плагин браузера), который управляет взаимодействием с сервером и подключенным ТВ.

Ключевые утверждения (Анализ Claims)

Патент фокусируется на функциональности продукта, а не на алгоритмах поиска.

Claim 1 (Независимый пункт): Описывает метод на стороне клиентского (первого) устройства.

  1. Открытие электронного документа и получение его идентификационной информации (включая исходный код).
  2. Отправка запроса на сервер для поиска медиа-сущностей, связанных с тематикой (subject) документа. Важное уточнение: эти сущности не обязательно должны быть связаны ссылками или включены в сам документ. Запрос включает идентификационную информацию документа.
  3. Получение от сервера медиа-сущностей, связанных с тематикой документа. Сервер идентифицирует их путем парсинга исходного кода и извлечения данных из базы сущностей.
  4. Отображение списка полученных медиа-сущностей на первом устройстве.
  5. Получение выбора пользователя.
  6. Отправка информации о выборе на второе устройство (ТВ), которое настроено для доступа и отображения соответствующего контента.

Claim 18 (Независимый пункт): Описывает метод на стороне сервера.

  1. Получение от первого устройства идентификационной информации документа (включая исходный код).
  2. В ответ на это:
    • Идентификация тематики (subject) документа.
    • Идентификация медиа-сущностей, связанных с тематикой, путем парсинга исходного кода и извлечения данных из базы сущностей. Включаются сущности, которые не связаны ссылками или не включены в документ.
  3. Отправка набора медиа-сущностей первому устройству для отображения.

Где и как применяется

Этот патент не описывает часть стандартного конвейера веб-поиска (Ranking, Reranking). Он описывает отдельную продуктовую функциональность, которая, однако, опирается на данные, генерируемые на этапе индексирования.

INDEXING – Индексирование и извлечение признаков
Система полагается на предварительно обработанные данные. На этапе индексирования Google анализирует документы, идентифицирует сущности и сохраняет эти связи в Entity Database. Компонент Entity Retriever (WebRef) использует эти данные для быстрого нахождения сущностей, связанных с документом.

Взаимодействие компонентов:

  • TV Remote Control Module (обычно плагин браузера) на клиентском устройстве взаимодействует с Backend System для получения медиа-списка и с Connected TV/STB для инициации воспроизведения.
  • Backend System использует Entity Retriever (WebRef) и Entity Database для анализа и Content Filter для отбора релевантных медиа.

Входные данные:

  • Document Identifying Information (URL или исходный код страницы).
  • Критерии фильтрации (Filtering Criteria) на сервере.
  • Выбор пользователя и команды управления воспроизведением.

Выходные данные:

  • Список медиа-сущностей (Media Entities), отправляемый с сервера клиенту.
  • Информация о выборе (Selection Information), отправляемая клиентом на ТВ.

На что влияет

  • Пользовательский опыт: Влияет только на пользователей, которые используют совместимую экосистему (например, браузер с соответствующим расширением и Google TV/Chromecast).
  • Типы контента: Влияет на обнаружение медиаконтента (ТВ-программы, потоковое видео, локальные файлы), связанного с любыми типами электронных документов (веб-страницы, текстовые файлы).

Когда применяется

  • Условия работы: Алгоритм активируется, когда пользователь просматривает электронный документ на первом устройстве, которое подключено (спарено) со вторым устройством (ТВ).
  • Триггеры активации: Обнаружение связанных медиа-сущностей может происходить автоматически при загрузке страницы или по запросу пользователя через интерфейс модуля управления ТВ.

Пошаговый алгоритм

Этап 1: Подготовка и Идентификация Документа

  1. Соединение устройств: Клиентское устройство устанавливает соединение (спаривание) с Подключенным ТВ/Приставкой (например, через локальную сеть).
  2. Загрузка документа: Пользователь открывает электронный документ (например, веб-страницу) в приложении (например, браузере) на клиентском устройстве.
  3. Получение идентификаторов: TV Remote Control Module получает Document Identifying Information. Это может быть URL или, если контент недоступен публично (например, защищен паролем), исходный код документа.

Этап 2: Обработка на Сервере

  1. Отправка данных: Клиент отправляет идентификационную информацию документа на Backend System.
  2. Извлечение сущностей: Backend System использует Entity Retriever (WebRef) для идентификации множества сущностей, связанных с документом.
    • Если получен URL и страница ранее индексировалась, сущности извлекаются из Entity Database.
    • Если получен исходный код, сервер парсит его для идентификации тематики и сущностей.
  3. Фильтрация: Content Filter применяет критерии фильтрации к найденным сущностям, чтобы отобрать только медиа-сущности (например, отфильтровываются сущности типа «Книга», «Место», «Человек», остаются «ТВ-программа», «Потоковое медиа»).

Этап 3: Взаимодействие с Пользователем и Воспроизведение

  1. Возврат результатов: Backend System отправляет отфильтрованный список Media Entities обратно клиенту.
  2. Отображение списка: TV Remote Control Module отображает список связанных медиа (включая заголовки, типы, миниатюры).
  3. Выбор пользователя: Система получает выбор пользователя из списка.
  4. Инициация воспроизведения: Клиент отправляет Selection Information, идентифицирующую выбранную медиа-сущность, на Подключенный ТВ/Приставку.
  5. Воспроизведение: ТВ/Приставка получает команду, находит соответствующий контент (в интернете, локальной сети или на ТВ-канале) и начинает воспроизведение.
  6. Управление: Клиентское устройство может использоваться как пульт для управления воспроизведением на ТВ.

Какие данные и как использует

Данные на входе

Патент сосредоточен на инфраструктуре связи между устройствами и использовании данных об индексации. Он не детализирует факторы ранжирования.

  • Контентные/Технические факторы (Документ): Используется либо URL (сетевой идентификатор), либо полный исходный код (Source Code) просматриваемого документа. Это ключевые входные данные для анализа.
  • Данные индексации (Системные): Entity Database, содержащая предварительно вычисленные связи между документами и сущностями, полученные в ходе индексирования интернета (например, с помощью WebRef).

Какие метрики используются и как они считаются

В патенте не упоминаются метрики ранжирования (Ranking Scores) или формулы для определения релевантности медиа. Основной механизм — это фильтрация.

  • Filtering Criteria (Критерии фильтрации): Используются для отсева не-медийных сущностей из общего списка сущностей, связанных с документом. Фильтрация происходит по типу сущности (например, оставить только TV programming, Streaming media, Local media content).

Выводы

Патент описывает внутренние процессы Google, связанные с функциональностью конкретных продуктов (Google TV, расширения браузера), и не дает прямых рекомендаций для SEO.

  1. Отсутствие влияния на SEO-ранжирование: Описанные механизмы не влияют на ранжирование сайтов в веб-поиске. Это патент о пользовательском интерфейсе и кросс-устройственом взаимодействии.
  2. Демонстрация возможностей Entity Extraction (WebRef): Патент подтверждает, что Google (через систему, названную здесь Entity Retriever/WebRef) активно анализирует документы для идентификации связанных сущностей и понимания тематики (Subject) документа.
  3. Анализ контента за пределами ссылок: Ключевой аспект патента (Claims 1 и 18) — способность системы находить медиаконтент, связанный с тематикой документа, даже если этот контент явно не связан ссылками или не встроен в документ. Это подчеркивает важность семантического анализа контента.
  4. Возможность анализа исходного кода: Система может принимать не только URL, но и исходный код страницы от клиента. Это позволяет ей анализировать контент, который может быть недоступен поисковым роботам (например, контент за paywall или в интранете), если пользователь предоставляет к нему доступ через расширение.
  5. Фокус на экосистеме: Изобретение направлено на удержание пользователя внутри экосистемы Google (Chrome/Browser + Google TV/Android TV), упрощая потребление контента.

Практика

Этот патент является инфраструктурным и описывает функциональность продукта. Он не дает практических выводов для улучшения позиций в SEO.

Best practices (это мы делаем)

Хотя прямого влияния на SEO нет, патент косвенно подтверждает важность следующих практик для обеспечения корректного понимания контента системами Google (такими как WebRef):

  • Четкое тематическое позиционирование контента: Создание контента с ясной структурой и семантикой помогает системам извлечения сущностей (Entity Retriever) точно определить тематику (Subject) документа и связать его с релевантными сущностями в Knowledge Graph.
  • Использование микроразметки (Schema.org): Разметка медиаконтента (VideoObject, Movie, TVSeries) помогает Google однозначно идентифицировать медиа-сущности на странице, что может улучшить их обработку подобными системами и повысить видимость в релевантных вертикалях.

Worst practices (это делать не надо)

Патент не выявляет новых неэффективных или опасных SEO-тактик.

Стратегическое значение

Стратегическое значение патента для SEO заключается в очередном подтверждении роли семантического анализа и Графа Знаний (Knowledge Graph) в продуктах Google. Системы типа WebRef, которые используются здесь для поиска связанного медиа, также используются в основном поиске для понимания релевантности. Понимание того, как Google интерпретирует сущности, остается ключевым элементом долгосрочной SEO-стратегии.

Практические примеры

Практических примеров для SEO нет. Ниже приведен пример работы функции, описанной в патенте.

Сценарий: Просмотр статьи и воспроизведение связанного видео

  1. Ситуация: Пользователь читает на компьютере (Первое устройство) длинную статью о биографии Авраама Линкольна. У пользователя установлено соответствующее расширение браузера, и компьютер подключен к Google TV (Второе устройство).
  2. Анализ: Расширение отправляет URL статьи на Backend System.
  3. Обработка: Сервер определяет, что тематика статьи — Авраам Линкольн. Используя Entity Retriever (WebRef), он ищет связанные медиа-сущности.
  4. Результат обнаружения: Сервер находит фильм «Линкольн» (Streaming media), документальную передачу о Гражданской войне (TV programming) и популярный обзор фильма на YouTube (Streaming media). Важно: эти материалы могли не упоминаться в самой статье, но связаны с ее тематикой.
  5. Взаимодействие: Расширение в браузере показывает список этих трех медиа-сущностей.
  6. Воспроизведение: Пользователь кликает на фильм «Линкольн». Компьютер отправляет команду на Google TV, который запускает соответствующее приложение (например, Netflix или Google Play Movies) и начинает воспроизведение фильма.

Вопросы и ответы

Влияет ли этот патент на ранжирование моего сайта в Google?

Нет, этот патент не описывает алгоритмы ранжирования веб-поиска. Он описывает функциональность конкретного продукта, позволяющего пользователям находить медиаконтент, связанный с просматриваемой веб-страницей, и воспроизводить его на телевизоре (например, Google TV или Chromecast). Он не вводит новых факторов ранжирования для SEO.

Что такое Entity Retriever (WebRef), упомянутый в патенте?

Entity Retriever (с вероятным внутренним названием WebRef) — это компонент инфраструктуры Google, отвечающий за извлечение и аннотирование сущностей в документах. Он анализирует контент, чтобы понять его тематику, идентифицировать упомянутые сущности (люди, места, фильмы, события) и связать их с Графом Знаний (Knowledge Graph). В контексте этого патента он используется для поиска медиа, связанного с темой просматриваемой страницы.

Может ли система найти связанное медиа, если на моей странице нет ссылок на него?

Да. В Claims 1 и 18 особо подчеркивается, что система идентифицирует медиа-сущности, связанные с тематикой (Subject) документа, даже если они не связаны ссылками или не включены в сам документ. Это означает, что система полагается на общее понимание темы страницы, а не только на анализ исходящих ссылок или встроенных объектов.

Что означает, что система может анализировать «исходный код» (Source Code) документа?

Это означает, что клиентский модуль (расширение браузера) может отправить на сервер не только URL страницы, но и ее полный HTML-код. Это полезно, если страница недоступна для публичного сканирования роботами Google (например, находится в интранете, за paywall или требует авторизации). Анализируя предоставленный пользователем код, система может понять содержание страницы.

Есть ли польза для SEO от этого патента?

Прямой пользы для повышения позиций нет. Косвенная польза заключается в понимании того, насколько глубоко Google анализирует семантику контента. Это подтверждает важность создания четко структурированного контента и использования микроразметки для помощи системам Google (таким как WebRef) в правильной интерпретации тематики ваших страниц.

Как система определяет, какие сущности являются «медиа», а какие нет?

После того как Entity Retriever находит все связанные сущности, в работу вступает Content Filter. Он использует заранее определенные критерии (Filtering Criteria) для классификации сущностей по типам. Сущности типа «Книга», «Человек» или «Место» отфильтровываются, а сущности типа «ТВ-программа», «Потоковое видео» или «Локальный медиафайл» возвращаются пользователю.

К какому этапу поиска относится этот патент?

Патент не относится к этапам ранжирования (Ranking) или переранжирования (Reranking). Он полностью зависит от данных, собранных на этапе Индексирования (Indexing), в частности, от работы систем извлечения признаков и сущностей. Сама функциональность работает поверх индекса как отдельное приложение.

Актуален ли этот патент, если Google TV больше не существует?

Google TV эволюционировал в Android TV и функциональность Chromecast. Концепция, описанная в патенте — обнаружение контента на одном устройстве и воспроизведение на другом — остается крайне актуальной в современных экосистемах стриминга. Технология может быть адаптирована для работы с новыми устройствами.

Нужно ли мне оптимизировать сайт специально под эту функцию?

Нет, специальная оптимизация под эту функцию не требуется. Стандартные лучшие практики SEO по созданию качественного контента и использованию семантической разметки (Schema.org) обеспечат достаточно контекста для работы систем извлечения сущностей, которые лежат в основе этой технологии.

Может ли эта система помочь в продвижении моего видеоконтента?

Теоретически, если ваш видеоконтент является авторитетным и хорошо индексируется Google (например, на YouTube или на вашем сайте с разметкой VideoObject), он может быть обнаружен этой системой как связанное медиа при просмотре пользователями релевантных веб-страниц. Это может привести к дополнительным просмотрам, но только среди пользователей, активно использующих эту функцию.

Похожие патенты

Как Google использует смартфоны в качестве голосового интерфейса для поиска медиаконтента на телевизорах
Патент описывает механизм, позволяющий пользователю вводить голосовой запрос на портативном устройстве (смартфоне). Аудиозапись отправляется на удаленный сервер для преобразования в текст (Speech-to-Text), после чего текст автоматически передается на телевизионную систему. Телевизор использует этот текст для поиска медиаконтента (фильмов, музыки, шоу) и отображает результаты.
  • US8522283B2
  • 2013-08-27
  • Мультимедиа

Как Google агрегирует и фильтрует медиаконтент на основе подписок пользователя на платформах типа Google TV
Google использует систему для унифицированного поиска медиаконтента (фильмы, сериалы) из различных источников (стриминговые сервисы, ТВ, локальные хранилища). Система локально определяет, к каким сервисам у пользователя есть доступ (подписки), и фильтрует результаты, показывая только тот контент, который пользователь реально может посмотреть. Это механизм обеспечения видимости контента в агрегированных медиа-платформах.
  • US9317571B2
  • 2016-04-19
  • Персонализация

  • Мультимедиа

Как Google автоматически перенаправляет результаты поиска на другое устройство пользователя
Google использует механизм для улучшения пользовательского опыта при работе с несколькими устройствами. Пользователь может отправить поисковый запрос (например, голосом) с одного устройства (смартфона), а система автоматически отобразит результаты на другом связанном устройстве (например, телевизоре или планшете), которое лучше подходит для просмотра этого контента.
  • US20110099157A1
  • 2011-04-28
  • Персонализация

Как Google позволяет пользователям "привязывать" веб-контент к конкретным моментам в видео или аудио
Патент Google, описывающий механизм, который позволяет пользователям ассоциировать ("привязывать") один тип контента (например, веб-статью) с конкретной позицией в индексированном контенте (например, таймкодом в видео). При просмотре видео другие пользователи увидят ссылку на привязанную статью в соответствующий момент.
  • US9288121B2
  • 2016-03-15
  • Индексация

  • Мультимедиа

  • Ссылки

Как Google использует контент, который вы смотрите (например, на ТВ), для автоматического переписывания и персонализации ваших поисковых запросов
Google может анализировать контент (фильмы, шоу, аудио), который пользователь потребляет на одном устройстве (например, ТВ), и использовать эту информацию как контекст для уточнения последующих поисковых запросов. Система распознает аудиовизуальный контекст и автоматически дополняет неоднозначные запросы пользователя, чтобы предоставить более релевантные результаты, в том числе на связанных устройствах (например, смартфоне).
  • US9244977B2
  • 2016-01-26
  • Персонализация

  • Семантика и интент

  • Поведенческие сигналы

Популярные патенты

Как Google определяет основной контент страницы, анализируя визуальную структуру и характеристики разделов
Google использует систему для идентификации основного контента веб-страницы путем её разделения на логические разделы на основе визуального макета. Система оценивает характеристики каждого раздела (соотношение ссылок к тексту, количество слов, изображения, расположение) относительно характеристик всей страницы, чтобы выделить наиболее значимый контент и отделить его от навигации и шаблонов.
  • US20140372873A1
  • 2014-12-18
  • Структура сайта

  • Техническое SEO

  • Ссылки

Как Google предсказывает следующий запрос пользователя на основе контента текущей страницы и исторических данных
Google использует машинное обучение для анализа логов поведения пользователей, чтобы понять, что они ищут после посещения определенного контента. Система создает совместное векторное пространство (joint embedding) для документов и запросов, где близость отражает семантическую связь и вероятность совместной встречаемости. Это позволяет предлагать релевантные последующие запросы (query suggestions) в реальном времени, даже если ключевые слова для этих запросов на странице отсутствуют.
  • US9594851B1
  • 2017-03-14
  • Семантика и интент

  • Поведенческие сигналы

  • Персонализация

Как Google определяет интент запроса, анализируя классификацию контента, который кликают пользователи
Google использует данные о поведении пользователей для классификации запросов. Система определяет, какой контент пользователи считают наиболее релевантным для запроса (на основе кликов и времени пребывания). Затем она анализирует классификацию этого контента (например, «продукт», «новости», «взрослый контент») и присваивает доминирующую классификацию самому запросу. Это позволяет уточнить интент и скорректировать ранжирование.
  • US8838587B1
  • 2014-09-16
  • Семантика и интент

  • Поведенческие сигналы

  • SERP

Как Google генерирует связанные запросы (Related Searches), используя сущности из топовых результатов и сохраняя структуру исходного запроса
Google использует систему для автоматической генерации уточнений запросов (например, «Связанные запросы»). Система анализирует топовые документы в выдаче и извлекает из них ключевые сущности. Затем эти сущности комбинируются с важными терминами исходного запроса, при этом строго сохраняется исходный порядок слов, чтобы создать релевантные и естественно звучащие предложения для дальнейшего поиска.
  • US8392443B1
  • 2013-03-05
  • Семантика и интент

  • Поведенческие сигналы

Как Google корректирует позиционную предвзятость (Position Bias) при обучении моделей ранжирования на кликах пользователей
Google использует механизм для устранения позиционной предвзятости (Position Bias) при обучении моделей ранжирования (Learning to Rank). Система анализирует, на какой позиции находился кликнутый результат, и присваивает этому клику вес важности. Клики по нижним позициям получают больший вес, чем клики по ТОП-1. Это позволяет модели учиться определять истинную релевантность, а не просто копировать существующий порядок выдачи.
  • US20210125108A1
  • 2021-04-29
  • Поведенческие сигналы

  • SERP

Как Google определяет скрытый локальный интент в запросах для повышения релевантности местных результатов
Google использует механизм для определения того, подразумевает ли запрос (например, «ресторан») поиск локальной информации, даже если местоположение не указано. Система анализирует агрегированное поведение пользователей для расчета «степени неявной локальной релевантности» запроса. Если этот показатель высок, Google повышает в ранжировании результаты, соответствующие местоположению пользователя.
  • US8200694B1
  • 2012-06-12
  • Local SEO

  • Поведенческие сигналы

  • Семантика и интент

Как Google генерирует интерактивные и иерархические Sitelinks на основе структуры и популярности разделов сайта
Google анализирует навигационную иерархию сайта (DOM), популярность ссылок и глубину разделов для создания интерактивного представления ресурса (расширенных Sitelinks) в SERP. Это позволяет пользователям просматривать ключевые категории и вложенные ссылки через интерфейс вкладок, не покидая страницу результатов поиска.
  • US9348846B2
  • 2016-05-24
  • Структура сайта

  • SERP

  • Ссылки

Как Google определяет язык поискового запроса, используя язык интерфейса, статистику слов и поведение пользователей
Google использует вероятностную модель для точной идентификации языка поискового запроса. Система комбинирует три ключевых фактора: статистику частотности слов в разных языках, язык интерфейса пользователя (например, Google.fr) и исторические данные о том, на какие результаты пользователи кликали ранее. Это позволяет корректно обрабатывать многоязычные и неоднозначные запросы для применения правильных синонимов и стемминга.
  • US8442965B2
  • 2013-05-14
  • Мультиязычность

  • Поведенческие сигналы

Как Google использует внутренние ссылки и структуру DOM для генерации шаблонов сайта и извлечения структурированных сниппетов
Google анализирует повторяющиеся блоки внутренних ссылок (например, списки товаров). Если текст возле ссылки на исходной странице совпадает с текстом на целевой странице, Google определяет DOM-структуру этого текста и создает шаблон домена. Этот шаблон позволяет автоматически извлекать ключевую информацию (например, цену и характеристики) для сниппетов со всех однотипных страниц сайта, даже без микроразметки.
  • US9971746B2
  • 2018-05-15
  • Структура сайта

  • SERP

  • Ссылки

Как Google генерирует блок "Похожие вопросы" (People Also Ask) на основе анализа кликов и поведения пользователей
Google анализирует топовые результаты по исходному запросу и определяет "Тематические запросы" (Topic Sets) — прошлые запросы, по которым пользователи кликали на эти результаты. Затем система ищет популярные вопросы, соответствующие этим темам, фильтрует дубликаты на основе общности кликов и показывает их в блоке PAA для дальнейшего исследования темы.
  • US9213748B1
  • 2015-12-15
  • SERP

  • Семантика и интент

  • Поведенческие сигналы

seohardcore