SEO HARDCORE
  • Разборы патентов
    • Патенты Google
  • Скоро SEO инструменты
  • Скоро SEO аналитика
  • seohardcore
SEO HARDCORE
назад

Как Google определяет и ранжирует наиболее важные факты о сущности на основе совместных упоминаний в интернете

PROVIDING SEARCH RESULTS BASED ON SORTED PROPERTIES (Предоставление результатов поиска на основе отсортированных свойств)
  • US9256682B1
  • Google LLC
  • 2012-12-05
  • 2016-02-09
  • Knowledge Graph
  • Семантика и интент
  • Описание
  • Разбор
  • Выводы
  • Практика
  • FAQ
  • Похожие

Google использует механизм для определения наиболее важных свойств (фактов) о сущности в контексте ее типа. Система анализирует частоту совместного упоминания (co-occurrence) сущности и связанных с ней сущностей в интернете (Related Entity Score), агрегирует эти данные для каждого свойства (Property Score) и сортирует свойства по важности. Это определяет, какие факты будут показаны первыми в результатах поиска, например, в Панели знаний.

Описание

Какую проблему решает

Патент решает проблему определения наиболее релевантных и важных фактов (свойств) о сущности при ответе на запрос, особенно когда сущность имеет несколько типов или ролей. Например, система должна определить, что важнее для пользователя, ищущего «Том Хэнкс»: фильмы, в которых он снимался (тип «Актер»), или фильмы, которые он режиссировал (тип «Режиссер»). Цель — улучшить представление информации о сущностях (например, в Панели Знаний), показывая наиболее значимые свойства первыми.

Что запатентовано

Запатентована система для ранжирования свойств сущности на основе их важности в контексте определенного типа сущности (Entity Type). Важность определяется путем анализа связей в Knowledge Graph и расчета метрик совместной встречаемости (co-occurrence) сущности и связанных с ней сущностей в веб-контенте. Система агрегирует эти метрики для каждого свойства и генерирует отсортированный список свойств (на основе Property Score), который используется для формирования выдачи.

Как это работает

Система работает следующим образом:

  • Идентификация сущностей и связей: В Knowledge Graph определяется основная сущность (например, «Том Хэнкс»), ее типы («Актер», «Режиссер») и связанные сущности (например, «Форрест Гамп») через свойства («Фильмы, в которых снимался»).
  • Расчет Related Entity Score: Для каждой пары (основная сущность, связанная сущность) рассчитывается оценка связанности, основанная на частоте их совместного упоминания (co-occurrence) в интернете.
  • Расчет Property Score: Для каждого свойства агрегируются (в частности, суммируются) Related Entity Scores всех связанных сущностей, относящихся к этому свойству. Например, суммируются оценки всех фильмов для свойства «Фильмы, в которых снимался».
  • Сортировка свойств по типам: Свойства сортируются на основе их Property Score в контексте конкретного Entity Type.
  • Генерация выдачи: Отсортированный список используется для определения порядка представления фактов о сущности в результатах поиска.

Актуальность для SEO

Высокая. Понимание сущностей и организация информации в Knowledge Graph являются фундаментом современного поиска Google. Механизмы, определяющие, как информация представляется в Панелях Знаний и других SERP-фичах, критически важны. Этот патент описывает конкретный алгоритм определения важности фактов на основе консенсуса в вебе (co-occurrence), что напрямую влияет на видимость контента, связанного с сущностями.

Важность для SEO

Патент имеет высокое значение для стратегий, связанных с Entity SEO и управлением репутацией (SERM). Он не влияет напрямую на ранжирование «синих ссылок», но определяет, как Google воспринимает и представляет ключевые аспекты бренда, персоны или продукта. Понимание этого механизма позволяет SEO-специалистам влиять на то, какие ассоциации и факты будут наиболее заметными в Панели Знаний, путем управления совместной встречаемостью сущностей в контенте.

Детальный разбор

Термины и определения

Entity (Сущность)
Уникальный, хорошо определенный объект или концепция (человек, место, предмет, идея). В контексте патента часто используется термин Entity Reference, обозначающий идентификатор или концепцию, ссылающуюся на реальную сущность.
Related Entity (Связанная сущность)
Сущность, которая связана с основной сущностью через определенное свойство в Knowledge Graph.
Property (Свойство)
Тип отношения между двумя сущностями. Описывает, как одна сущность связана с другой (например, «Дата рождения», «Снимался в фильме»). Представлено как ребро (edge) в графе.
Entity Type (Тип сущности)
Категоризация или классификация сущности (например, «Актер», «Президент», «Город»). Сущность может иметь несколько типов, которые определяют контекст для сортировки свойств.
Knowledge Graph (Граф знаний)
Структура данных, состоящая из узлов (nodes), представляющих сущности, типы и литералы, и ребер (edges), представляющих свойства (отношения) между ними.
Related Entity Score (Оценка связанной сущности)
Числовая метрика, определяющая силу или важность связи между основной сущностью и связанной сущностью. Рассчитывается на основе co-occurrence.
Property Score (Оценка свойства)
Агрегированная оценка для конкретного свойства. Рассчитывается путем объединения (например, суммирования) Related Entity Scores всех связанных сущностей, подключенных через это свойство.
Co-occurrence (Совместная встречаемость)
Метрика, показывающая, как часто две сущности упоминаются вместе в корпусе текстов (например, в интернете).
Data Structure of Sortable Properties (Структура данных сортируемых свойств)
Итоговый набор данных, содержащий свойства сущности, отсортированные по их Property Scores, в контексте определенного Entity Type.

Ключевые утверждения (Анализ Claims)

Claim 1 (Независимый пункт): Описывает основной метод сортировки свойств сущности.

  1. Система идентифицирует в Knowledge Graph как минимум одну сущность (entity reference) и связанные сущности, соединенные свойствами.
  2. Для каждой связанной сущности определяется Related Entity Score, ассоциированный со свойством, которое их связывает.
  3. Для каждого свойства генерируется Property Score. Ключевое утверждение: этот score основан на сумме двух или более Related Entity Scores, связанных с этим свойством.
  4. Генерируется и сохраняется структура данных сортируемых свойств (data structure of sortable properties) на основе Property Scores. Эта структура используется для предоставления отсортированных результатов поиска.

Claim 2 (Зависимый от 1): Добавляет контекст типа сущности.

Система идентифицирует как минимум один Entity Type, связанный с сущностью. Property Score рассчитывается с учетом этого Entity Type, и итоговая структура данных ассоциируется с этим типом. Это означает, что сортировка зависит от контекста (например, Актер vs Режиссер).

Claim 3 (Зависимый от 2): Описывает обработку иерархии типов (субтипы и родительские типы).

Если идентифицировано два типа, где второй является субтипом первого (например, «Актер» — субтип «Человек»), и они имеют общие свойства, генерация Property Score включает агрегацию оценок свойств как для родительского типа, так и для субтипа.

Claim 4 (Зависимый от 1): Уточняет метод расчета Related Entity Score.

Related Entity Scores основаны на совместной встречаемости (co-occurrence) основной сущности и связанных сущностей в контенте (например, веб-документах).

Claim 6 (Зависимый от 5): Описывает применение результатов.

Система сортирует набор информации на основе Property Scores из полученной структуры данных и предоставляет этот отсортированный набор информации пользователю.

Где и как применяется

Изобретение затрагивает этапы, связанные с пониманием данных и формированием финальной выдачи, особенно для ответов, основанных на Графе Знаний.

INDEXING – Индексирование и извлечение признаков
На этом этапе происходит сбор данных для Knowledge Graph и анализ веб-контента для расчета метрик совместной встречаемости (co-occurrence) между сущностями. Расчет Related Entity Scores и Property Scores, а также генерация Data Structure of Sortable Properties происходят здесь, преимущественно в офлайн-режиме.

QUNDERSTANDING – Понимание Запросов
Система должна распознать сущность в запросе и определить релевантный Entity Type, если он указан или подразумевается (например, запрос «фильмы Тома Хэнкса» указывает на контекст кино).

METASEARCH – Метапоиск и Смешивание / RERANKING – Переранжирование
Основное применение патента. При формировании SERP, конкретно при генерации блоков, основанных на сущностях (например, Панели Знаний).

  1. Получение данных: Система обращается к предварительно рассчитанной Data Structure of Sortable Properties для запрошенной сущности и релевантного типа.
  2. Формирование блока ответа: Информация о сущности извлекается из Knowledge Graph и упорядочивается в соответствии с порядком свойств в этой структуре. Свойства с наивысшим Property Score отображаются первыми.

Входные данные:

  • Knowledge Graph (сущности, типы, свойства, связи).
  • Корпус веб-контента (для анализа co-occurrence).
  • Запрос пользователя (для определения контекста/типа в реальном времени).

Выходные данные:

  • Data Structure of Sortable Properties (предварительно рассчитанная).
  • Отсортированное представление информации о сущности в SERP (например, Панель Знаний).

На что влияет

  • Конкретные типы контента: В первую очередь влияет на представление структурированной информации о сущностях в SERP (Панели Знаний, карусели сущностей). Не влияет напрямую на ранжирование «синих ссылок».
  • Специфические запросы: Наибольшее влияние на информационные и навигационные запросы, связанные с известными сущностями (персоны, компании, продукты, места).
  • Конкретные ниши или тематики: Влияет на все тематики, где сущности хорошо представлены в Knowledge Graph (медиа, история, наука, бизнес).

Когда применяется

  • Офлайн (Предварительные вычисления): Расчет Related Entity Scores и Property Scores происходит заранее и периодически обновляется по мере обновления индекса и Knowledge Graph.
  • В реальном времени (Ответ на запрос): Когда пользователь вводит запрос, который триггерит показ информации о сущности (например, Панель Знаний), система использует предварительно рассчитанные отсортированные данные для формирования этого блока.

Пошаговый алгоритм

Процесс А: Расчет и сортировка свойств (Офлайн)

  1. Идентификация сущностей: Система идентифицирует основную сущность (E), ее типы (T), и все связанные сущности (REj) в Knowledge Graph, а также свойства (P), которые их соединяют.
  2. Расчет Related Entity Score: Для каждой пары (E, REj) рассчитывается оценка связанности на основе анализа совместной встречаемости в корпусе текстов. Патент предлагает две формулы для Co-occurrence (COO):
    • Формула 1 (Вероятностная):

Выводы

  1. Важность фактов определяется популярностью в интернете (Web Consensus): Патент демонстрирует, что важность свойства сущности напрямую зависит от того, насколько часто эта сущность упоминается вместе со связанными сущностями в веб-контенте (co-occurrence). Это основа для расчета Related Entity Score.
  2. Контекст (Entity Type) имеет решающее значение: Одно и то же свойство может иметь разную важность в зависимости от типа сущности. Система рассчитывает Property Scores отдельно для каждого типа (например, «Актер» против «Режиссер»), что позволяет адаптировать выдачу под контекст.
  3. Агрегация определяет приоритет: Property Score рассчитывается как сумма Related Entity Scores. Это означает, что свойства, которые связывают основную сущность с большим количеством популярных (часто упоминаемых вместе с ней) связанных сущностей, будут иметь более высокий приоритет.
  4. Механизм формирования Панели Знаний: Патент описывает алгоритм, используемый для определения порядка отображения информации в структурированных блоках выдачи. Свойства с наивысшим Property Score показываются первыми.
  5. Entity SEO и Co-occurrence Management: Для влияния на представление сущности в поиске необходимо не только обеспечить наличие фактов в Knowledge Graph, но и активно управлять совместной встречаемостью основной сущности и желаемых связанных сущностей в авторитетном контенте в интернете.

Практика

Best practices (это мы делаем)

  • Управление совместной встречаемостью (Co-occurrence Management): Активно управляйте тем, как ваша основная сущность (бренд, продукт, персона) упоминается вместе с ключевыми связанными сущностями. Создавайте высококачественный контент (статьи, пресс-релизы, обзоры) и работайте с Digital PR, чтобы естественным образом связывать вашу сущность с важными для вас атрибутами на авторитетных ресурсах. Это повышает Related Entity Score.
  • Фокус на популярных связанных сущностях: Определите, какие связанные сущности уже популярны или стратегически важны. Ассоциирование вашего бренда с ними может значительно повысить Property Score. Например, компании выгодно часто упоминаться вместе со своими флагманскими продуктами.
  • Оптимизация под конкретный Entity Type: Определите основной тип вашей сущности и сосредоточьтесь на усилении свойств, наиболее важных именно для этого типа. Используйте соответствующий язык и контекст в контенте, чтобы подчеркнуть нужную типизацию и релевантные связи.
  • Построение полных связей в Knowledge Graph: Убедитесь, что ваша сущность и ее ключевые свойства корректно представлены в Knowledge Graph (через достоверные источники, такие как Wikidata, и подтверждены разметкой Schema.org). Без наличия этих связей система не сможет рассчитать Property Scores.

Worst practices (это делать не надо)

  • Спам совместными упоминаниями: Искусственное завышение co-occurrence через низкокачественный контент или списки. Хотя патент не описывает механизмы защиты от спама, базовые алгоритмы Google фильтруют низкокачественные источники при анализе контента.
  • Игнорирование контекста (Entity Type): Попытка продвинуть свойства, которые нерелевантны основному типу сущности. Система приоритизирует свойства в зависимости от контекста типа.
  • Фокус только на структурированных данных: Недостаточно просто указать факты в разметке Schema.org или Wikidata. Если эти факты не подтверждаются достаточным уровнем совместной встречаемости в веб-контенте (веб-консенсус), их Property Score будет низким, и они не будут показаны на видном месте.

Стратегическое значение

Патент подтверждает стратегическую важность Entity SEO и смещение фокуса с ключевых слов на связи между сущностями. Он демонстрирует, что Google оценивает важность информации не только на основе структурированных данных, но и на основе консенсуса в веб-контенте (через co-occurrence). Долгосрочная стратегия должна включать построение сильных, естественных ассоциаций между брендом и его ключевыми атрибутами в информационном пространстве (Digital PR). Это напрямую влияет на представление бренда в Панели Знаний.

Практические примеры

Сценарий: Оптимизация Панели Знаний для автора книги

Задача: Автор (Сущность E, Тип «Автор») выпустил новую книгу (Сущность RE1), но в его Панели Знаний в первую очередь отображаются старые работы (RE2, RE3).

Анализ (по патенту): Текущая ситуация означает, что Related Entity Score для старых книг (E+RE2, E+RE3) выше, чем для новой (E+RE1), из-за большего количества исторических упоминаний в сети.

Действия по SEO/PR: Необходимо увеличить совместную встречаемость (co-occurrence) автора и новой книги в интернете.

  1. Публикации: Опубликовать пресс-релизы и инициировать обзоры на авторитетных новостных и литературных порталах, где упоминаются и автор, и новая книга.
  2. Обновление биографий: Обновить биографию автора на официальном сайте, в Википедии (с соблюдением правил) и профилях социальных сетей, сделав акцент на новой книге.
  3. Интервью и мероприятия: Провести интервью с автором, фокусируясь на новой работе.

Ожидаемый результат: По мере роста Related Entity Score для новой книги (E+RE1), он начинает вносить больший вклад в общий Property Score свойства «Произведения». Это приведет к тому, что новая книга будет отображаться выше в списке произведений в Панели Знаний.

Вопросы и ответы

Как система определяет Related Entity Score? Основано ли это только на количестве упоминаний?

Патент указывает, что Related Entity Score основан на совместной встречаемости (co-occurrence) двух сущностей в контенте. Это не просто общее количество упоминаний, а именно частота их появления вместе. В патенте приведены формулы, которые нормализуют это значение, учитывая общую популярность каждой сущности (например, используя отношение вероятности найти обе сущности к вероятности найти основную сущность).

Что важнее для этого алгоритма: данные из Knowledge Graph или упоминания в интернете?

Они взаимозависимы. Knowledge Graph предоставляет структуру: он определяет, что две сущности связаны определенным свойством (например, что «Том Хэнкс» снимался в «Форрест Гамп»). Упоминания в интернете (co-occurrence) предоставляют вес (Related Entity Score) для этой связи. Без связи в графе упоминания не будут учтены для расчета Property Score; без упоминаний связь будет иметь низкий вес.

Как рассчитывается Property Score?

Property Score рассчитывается путем агрегации Related Entity Scores всех связанных сущностей, относящихся к этому свойству. Claim 1 патента прямо указывает на использование суммы. Например, Property Score для «Фильмы, в которых снимался» — это сумма Related Entity Scores для «Форрест Гамп», «Большой», «Спасти рядового Райана» и т.д.

Как Google определяет, какой тип сущности использовать, если их несколько?

Патент описывает, что система рассчитывает Property Scores для разных типов (например, «Актер», «Режиссер»). Выбор типа для отображения может зависеть от запроса пользователя (например, запрос «режиссерские работы Тома Хэнкса» явно указывает на тип) или от того, какой тип является наиболее популярным. Система может также отображать результаты для нескольких типов.

Могу ли я повлиять на порядок фактов в Панели Знаний моего бренда?

Да. Ключевым механизмом влияния является управление совместной встречаемостью (co-occurrence) вашего бренда и желаемых связанных сущностей в авторитетном контенте. Если вы хотите, чтобы определенный продукт или услуга отображались выше в Панели Знаний, необходимо увеличить частоту и качество упоминаний вашего бренда вместе с этим продуктом/услугой в интернете.

Влияет ли этот патент на ранжирование синих ссылок?

Патент не описывает механизмы ранжирования стандартных веб-документов («синих ссылок»). Он сфокусирован исключительно на сортировке свойств сущности для представления в результатах поиска, таких как Панель Знаний. Однако понимание того, какие свойства Google считает важными для сущности, может косвенно помочь в общей стратегии контент-маркетинга и построении тематического авторитета.

Что такое иерархия типов и как она используется?

Патент упоминает родительские типы и субтипы (например, «Актер» — субтип «Человек»). Система может агрегировать Property Scores от субтипа к родительскому типу для общих свойств. Это позволяет более точно определить важность свойств на разных уровнях абстракции и гарантирует, что важные свойства субтипа также учитываются при рассмотрении сущности в более общем контексте.

Учитывается ли авторитетность источников при расчете Co-occurrence?

Патент не детализирует, какие именно источники контента используются для расчета co-occurrence и применяются ли к ним веса авторитетности. Он просто ссылается на «контент» или «текстовый корпус». Однако, исходя из общих принципов работы Google, логично предположить, что упоминания на более авторитетных и релевантных ресурсах оказывают большее влияние.

Если факта нет в Knowledge Graph, но он часто упоминается в интернете, будет ли он показан?

Согласно описанному механизму, система работает на основе данных, уже структурированных в Knowledge Graph. Она ранжирует существующие свойства и связанные сущности. Если факта (связи или свойства) нет в Knowledge Graph, этот конкретный алгоритм не сможет его обработать и отсортировать. Частое упоминание в интернете может способствовать добавлению факта в Knowledge Graph, после чего он будет обработан этим алгоритмом.

Где рассчитываются эти оценки – в реальном времени или заранее?

Патент подразумевает, что расчет Related Entity Scores и Property Scores, а также генерация Data Structure of Sortable Properties, выполняются заранее (офлайн) путем анализа Knowledge Graph и веб-контента. В реальном времени система использует уже готовую отсортированную структуру для быстрого формирования результатов поиска.

Похожие патенты

Как Google ранжирует сущности в Knowledge Graph, используя адаптивные веса для метрик вклада, известности и наград
Google использует систему для ранжирования сущностей, извлеченных из Knowledge Graph. Система рассчитывает четыре ключевые метрики: связанность, значимость типа, вклад и награды. Затем она применяет весовые коэффициенты, которые адаптируются в зависимости от типа сущности (например, «Фильм» или «Человек»), чтобы определить итоговый рейтинг. Это влияет на то, какие сущности будут показаны в каруселях, панелях знаний и других функциях поиска, связанных с сущностями.
  • US10235423B2
  • 2019-03-19
  • Knowledge Graph

  • Семантика и интент

  • SERP

Как Google автоматически выбирает категории и контент для страниц сущностей, комбинируя данные о поведении пользователей и Knowledge Graph
Google использует механизм для автоматического создания страниц о сущностях (например, о фильмах или персонажах). Система определяет, какие категории (свойства) сущности наиболее интересны пользователям, сравнивая данные из Knowledge Graph с данными о том, что пользователи ищут или смотрят вместе с этой сущностью. Затем она наполняет эти категории популярным контентом.
  • US11036743B2
  • 2021-06-15
  • Knowledge Graph

  • Семантика и интент

  • Поведенческие сигналы

Как Google использует Граф Знаний для выбора, группировки и ранжирования связанных сущностей в Knowledge Panel
Google использует этот механизм для определения того, какие группы связанных сущностей (например, "Фильмы", "Члены семьи", "Коллеги") показать в Панели Знаний. Система анализирует пути в Графе Знаний, группирует сущности по типу их связи (Path Type) и ранжирует эти группы по популярности и силе связи (Relationship Strength), основанной на совместном упоминании в вебе и запросах.
  • US9411857B1
  • 2016-08-09
  • Knowledge Graph

  • Семантика и интент

Как Google определяет сущности (например, болезни) по их атрибутам (например, симптомам), анализируя результаты поиска и аннотации индекса
Google использует систему для ответа на запросы, которые перечисляют атрибуты (например, симптомы), но ищут сущность (например, болезнь). Система определяет связь между ними, используя несколько методов: предварительное аннотирование индекса связями сущностей, анализ частоты упоминания сущностей в топе выдачи или генерацию комбинированных запросов. Также система предлагает дополнительные атрибуты для уточнения.
  • US8856099B1
  • 2014-10-07
  • Индексация

  • Семантика и интент

  • SERP

Как Google ранжирует сущности (книги, фильмы, людей), анализируя тематичность и авторитетность их упоминаний в вебе
Google использует механизм для оценки значимости конкретных сущностей (например, изданий книг или фильмов). Система анализирует, как эти сущности упоминаются на релевантных веб-страницах, учитывая уверенность распознавания (Confidence) и то, насколько страница посвящена именно этой сущности (Topicality). Эти сигналы агрегируются с учетом авторитетности и релевантности страниц для расчета итоговой оценки сущности, которая затем корректирует ее ранжирование в поиске.
  • US20150161127A1
  • 2015-06-11
  • Семантика и интент

  • EEAT и качество

  • SERP

Популярные патенты

Как Google использует исторические данные о кликах (CTR) по категориям для определения доминирующего интента неоднозначных запросов
Google анализирует, на какие категории результатов пользователи кликали чаще всего в прошлом (CTR) по неоднозначному запросу (например, "Pool"). Система определяет доминирующие интенты, выявляя резкие перепады в CTR между категориями или используя иерархию категорий, и повышает в ранжировании результаты, соответствующие наиболее популярным интерпретациям.
  • US8738612B1
  • 2014-05-27
  • Семантика и интент

  • Поведенческие сигналы

  • SERP

Как Google использует погоду, время и местоположение для понимания истинного намерения пользователя и адаптации поисковой выдачи
Google анализирует, как физическое окружение (погода, время, местоположение) влияет на то, что ищут пользователи. Система выявляет корреляции между средой и поведением пользователей в прошлом (включая длительность кликов), чтобы лучше понять текущий интент многозначных запросов. Затем она переранжирует выдачу или переписывает запрос для предоставления наиболее релевантных результатов и рекламы.
  • US8898148B1
  • 2014-11-25
  • Семантика и интент

  • Поведенческие сигналы

  • Персонализация

Как Google рассчитывает «VisualRank» для изображений и медиафайлов, используя виртуальные ссылки на основе схожести и поведения пользователей
Google использует алгоритм (концептуально называемый VisualRank) для ранжирования изображений и других медиафайлов путем создания «виртуальных ссылок» между ними. Эти ссылки основаны на визуальной схожести контента, данных о кликах пользователей и контексте размещения (URL analysis). Это позволяет оценить качество и авторитетность медиафайлов даже без явных гиперссылок, при этом система активно избегает показа слишком похожих (дублирующихся) результатов.
  • US8732187B1
  • 2014-05-20
  • Ссылки

  • Мультимедиа

  • Поведенческие сигналы

Как Google использует историю браузера, закладки и поведение пользователей для персонализации результатов поиска в e-commerce
Система отслеживает поведение пользователей (клики, время на сайте, покупки) и их сохраненные закладки (content pointers) в сетевой среде. На основе этих данных создается персональная модель релевантности и иерархия предпочтений. Эта модель используется для дополнения запросов, переранжирования результатов поиска и предоставления рекомендаций, обеспечивая персонализированный опыт в e-commerce.
  • US7089237B2
  • 2006-08-08
  • Поведенческие сигналы

  • Персонализация

  • SERP

Как Google идентифицирует, связывает и индексирует концепции (фразы) для понимания тем документов
Фундаментальный патент Google, описывающий переход от индексирования слов к индексированию концепций (фраз). Система определяет «хорошие фразы» на основе частотности и их способности прогнозировать появление других фраз (Information Gain). Документы индексируются не только по содержащимся в них фразам, но и по наличию связанных фраз, что позволяет системе определять основные и второстепенные темы документа, а также контекстуально оценивать анкорный текст ссылок.
  • US7536408B2
  • 2009-05-19
  • Индексация

  • Семантика и интент

  • Ссылки

Как Google использует исторические данные о кликах по Сущностям для ранжирования нового или редко посещаемого контента
Google решает проблему «холодного старта» для новых страниц, у которых нет собственных поведенческих данных. Система агрегирует историю кликов на уровне Сущностей (Entities). Если сущности, упомянутые на новой странице, исторически имеют высокий CTR по целевому запросу, страница получает бустинг в ранжировании, наследуя поведенческие сигналы через эти сущности.
  • US10303684B1
  • 2019-05-28
  • Поведенческие сигналы

  • Семантика и интент

  • SERP

Как Google ранжирует сущности (книги, фильмы, людей), анализируя тематичность и авторитетность их упоминаний в вебе
Google использует механизм для оценки значимости конкретных сущностей (например, изданий книг или фильмов). Система анализирует, как эти сущности упоминаются на релевантных веб-страницах, учитывая уверенность распознавания (Confidence) и то, насколько страница посвящена именно этой сущности (Topicality). Эти сигналы агрегируются с учетом авторитетности и релевантности страниц для расчета итоговой оценки сущности, которая затем корректирует ее ранжирование в поиске.
  • US20150161127A1
  • 2015-06-11
  • Семантика и интент

  • EEAT и качество

  • SERP

Как Google оценивает и выбирает контент для Featured Snippets (Блоков с ответами) на основе консенсуса выдачи
Google использует систему для выбора и оценки Featured Snippets. Система анализирует топовые результаты поиска, чтобы предсказать, какие термины должны быть в ответе (Answer Terms). Затем она оценивает отрывки текста, учитывая совпадение с запросом, наличие предсказанных терминов ответа (консенсус топа), качество исходного сайта, форматирование и языковую модель контента.
  • US9940367B1
  • 2018-04-10
  • SERP

  • Семантика и интент

  • EEAT и качество

Как Google использует нейросетевые эмбеддинги (Two-Tower Model) для семантического поиска изображений с учетом контекста страницы
Google использует систему поиска изображений, основанную на нейронных сетях (модель "Две Башни"). Система создает векторные представления (эмбеддинги) для поисковых запросов и для пар "изображение + посадочная страница", помещая их в общее семантическое пространство. Это позволяет находить релевантные изображения не по ключевым словам, а по близости векторов, учитывая как содержание картинки, так и контекст страницы, на которой она размещена.
  • US11782998B2
  • 2023-10-10
  • Семантика и интент

  • Индексация

  • Мультимедиа

Как Google фильтрует поведенческие сигналы, используя совместимость языков и стран пользователей
Google уточняет ранжирование, анализируя, откуда (страна) и на каком языке (язык пользователя) поступали исторические клики по документу. Если эти характеристики считаются «несовместимыми» с текущим пользователем, поведенческие сигналы (клики) от этих групп могут быть исключены или понижены в весе. Это предотвращает искажение релевантности данными от кардинально отличающихся аудиторий.
  • US8498974B1
  • 2013-07-30
  • Поведенческие сигналы

  • Мультиязычность

  • Персонализация

seohardcore