Анализ патента Google, описывающего систему оценки качества документов на основе исторических данных. Система анализирует, как контент, ссылки и поведение пользователей меняются с течением времени. Патент описывает механизмы определения свежести контента, …
2006
Google определяет, является ли веб-страница авторитетным источником о конкретной сущности (Entity), анализируя все анкорные тексты входящих ссылок. Система находит консенсусное описание (Center of Mass). Если оно совпадает с именем сущности …
Патент описывает систему (User Distributed Search), интегрированную в инструменты создания контента (например, Gmail, блоги). Google отслеживает, какие ссылки пользователи встраивают в свой контент, используя это как сигнал для ранжирования. Также …
Google может обрабатывать запросы, включающие определенные метки (labels). Система идентифицирует домены, связанные с этими метками через внешние аннотации (annotations), которые определяют соответствие метки и шаблона URL (URL pattern). Поисковая выдача …
Google использует метод для точного определения основного объекта (Сущности) веб-страницы, когда заголовок (Title) содержит лишнюю информацию (брендинг, рубрики). Система анализирует заголовки похожих страниц на том же сайте (Peer Documents) и …
Google патентует метод ранжирования, альтернативный классическому PageRank, который трансформирует расчет авторитетности в задачу поиска кратчайшего пути в веб-графе. Система определяет набор доверенных "Seed" сайтов и измеряет расстояние от них до …
Google использует итеративный процесс для улучшения классификации контента и выявления спама, анализируя поведенческие сигналы (CTR и продолжительность клика). Если пользователи быстро покидают документ или игнорируют его в выдаче, он помечается …
Google использует систему для идентификации оригинального контента путем фиксации времени первого появления фрагментов текста (Content Pieces) в индексе. Система отслеживает, как быстро и широко этот контент копируется другими авторами (Copy …
Google использует механизм обобщения запросов для улучшения ранжирования, особенно когда исторических данных по исходному запросу недостаточно. Система создает варианты запроса (удаляя стоп-слова, используя синонимы, стемминг или частичное совпадение) и агрегирует …
Патент Google описывает систему построения персонализированных "сетей доверия". Система определяет, каким источникам (людям или сайтам) доверяет пользователь, анализируя его поведение (web visitation patterns), социальные связи (контакты) и прямые указания ("Trust …
Google использует механизм для переноса важной информации между связанными страницами одного сайта. Авторитетность бренда может передаваться с главной страницы на внутренние (Propagation Down), а специфические термины, адреса или категории товаров …
Патент описывает, как Google динамически определяет тематические "режимы поиска" (например, "Вакансии" или "Рецепты") на основе запроса. Система предлагает переключиться в специализированный режим, который использует структурированные данные вместо общего веб-индекса и …
Google использует модель оценки для различения именованных сущностей с одинаковыми названиями (например, «Ягуар» как животное или автомобиль). Система анализирует контекст запроса и сравнивает его со статьями о сущностях в базе …
Google использует итеративный процесс (бутстрэппинг) для распознавания сущностей в документах. Система начинает с известных фактов о сущности, находит документы, которые, вероятно, ссылаются на нее, анализирует эти документы для уточнения модели …
Анализ патента Google, описывающего фундаментальные механизмы Google Search Console. Патент раскрывает, как Google позволяет верифицированным владельцам сайтов выбирать предпочтительный домен (например, с www или без), консолидируя сигналы ранжирования на канонической …
Патент описывает систему для определения семантического контекста текста (веб-страниц, запросов и истории пользователя). Она разделяет информацию на тематические Домены и вычисляет контекстный вектор (Macro-Context) на основе использования уникальной терминологии. Это …
Патент описывает архитектуру Google для создания и использования Репозитория Фактов. Система извлекает факты из интернета, связывает их с объектами (сущностями), очищает и нормализует данные. В ответ на запрос система находит …
Патент Google, описывающий систему автоматического извлечения и проверки фактов для ответов на вопросы и наполнения базы знаний (Knowledge Graph). Система генерирует гипотетические ответы, проверяет их достоверность по количеству подтверждающих источников …
Анализ патента Google, описывающего метод определения наиболее релевантного географического местоположения для веб-страницы. Система анализирует текст на странице (названия городов, штатов, почтовые индексы) и вычисляет оценку местоположения (Location Score). При расчете …
Патент Google, описывающий специализированный язык запросов для поиска в «Хранилище фактов» (Fact Repository), основе Knowledge Graph. Система позволяет выполнять точные запросы к полуструктурированным данным (пары Атрибут-Значение), используя специальные операторы для …