Как Google использует генетические алгоритмы для оптимизации порядка применения факторов ранжирования

SELECTING SCORE IMPROVEMENTS (Выбор улучшений оценки)

US9152714B1
Google LLC
2012-10-01
2015-10-06

Google использует генетические алгоритмы для определения оптимальной последовательности применения корректировок ранжирования (adjusters). Система тестирует разные комбинации порядка факторов, оценивая их эффективность на основе исторических данных о поведении пользователей (клики, время на сайте). Цель — найти ту последовательность, которая поднимает предпочитаемые пользователями результаты выше в выдаче.

Какую проблему решает

Патент решает проблему оптимизации сложного процесса ранжирования. Поисковые системы применяют множество корректировок (adjusters) к исходным оценкам релевантности документов. Порядок применения этих корректировок существенно влияет на итоговую выдачу. Задача состоит в том, чтобы автоматически определить оптимальную последовательность применения этих adjusters для максимизации релевантности результатов, основываясь на реальных предпочтениях пользователей.

Что запатентовано

Запатентована система (Score Improvement Selector System), использующая генетические алгоритмы для поиска наилучшего упорядоченного списка корректировок ранжирования (Score Improvement List). Система эволюционным путем определяет, в каком порядке следует применять различные факторы и модификаторы к результатам поиска, чтобы повысить качество выдачи на основе обратной связи от пользователей.

Как это работает

Система работает по принципу эволюционного отбора:

Инициализация: Создается пул Score Improvement Lists, каждый из которых представляет собой разную последовательность применения adjusters.
Тестирование пригодности (Fitness Testing): Пары списков сравниваются («сражаются») между собой на основе исторических данных (Search Query Data). Для запроса определяется «предпочитаемый пользователем результат» (User Preferred Search Result) — тот, который чаще выбирали или дольше изучали.
Оценка: Список, который ранжирует предпочитаемый результат выше, «побеждает» и получает очки (Point Value). Проигравший теряет очки.
Размножение (Breeding): Списки с высокими баллами «скрещиваются» с использованием генетических операторов (кроссовер, мутация) для создания новых «дочерних» списков.
Итерация: Процесс повторяется до достижения критериев остановки (например, стабилизации оценок). Лучший список выбирается для использования в поисковой системе.

Актуальность для SEO

Высокая (с точки зрения инфраструктуры). Проблема оптимизации последовательности применения множества ранжирующих сигналов и корректировок (особенно на этапе Reranking/Twiddlers) крайне актуальна. Подход к автоматической оптимизации архитектуры ранжирования (AutoML) на основе обратной связи от пользователей является стандартной практикой в современных поисковых системах.

Важность для SEO

Влияние на SEO низкое (3/10). Это инфраструктурный патент, описывающий внутренние методы Google для оптимизации собственного алгоритма ранжирования. Он не вводит новые факторы ранжирования и не описывает, какие именно adjusters используются. Однако патент критически важен для понимания того, что поведенческие метрики (клики, время на сайте) используются Google как эталон качества («функция пригодности») для автоматической настройки и валидации работы алгоритмов ранжирования.

Термины и определения

Adjuster (Корректировщик/Модификатор): Компонент системы ранжирования, который изменяет исходную оценку (initial score) результата поиска. Например, модификатор может повышать результаты с учетом местоположения, если запрос содержит локальный интент.
Score Improvement List (Список улучшений оценки): Упорядоченный список Adjusters. Определяет последовательность, в которой модификаторы применяются к результатам поиска.
Score Improvement Selector System (Система выбора улучшений оценки): Основная система, описанная в патенте, которая использует генетические алгоритмы для выбора оптимального Score Improvement List.
Fitness Tester (Тестировщик пригодности): Модуль, который сравнивает два Score Improvement Lists, чтобы определить, какой из них лучше ранжирует результаты на основе исторических данных.
Breeder (Селекционер): Модуль, который создает новые («дочерние») Score Improvement Lists из существующих («родительских») с использованием генетических операторов.
Genetic Operators (Генетические операторы): Методы, используемые для создания новых списков. Включают Crossover (скрещивание частей двух списков) и Mutation (случайное изменение порядка в списке).
User Preferred Search Result (Предпочитаемый пользователем результат): Результат поиска, который пользователи исторически предпочитали для данного запроса. Определяется по количеству кликов (selected by a majority of users) или по времени, проведенному на ресурсе (dwell time).
Search Query Data (Данные поисковых запросов): Исторические данные (логи), включающие запросы, показанные результаты и данные о выборе пользователей (user selection data).
Point Value (Значение очков): Оценка, присваиваемая Score Improvement List на основе результатов тестирования пригодности. Увеличивается при победе, уменьшается при проигрыше.

Ключевые утверждения (Анализ Claims)

Claim 1 (Независимый пункт): Описывает основной метод выбора улучшений оценки с использованием эволюционного подхода.

Система получает исторические данные о запросах и поведении пользователей (Search Query Data и user selection data).
Система получает множество Score Improvement Lists (упорядоченные списки adjusters), каждый со своим счетчиком очков (Point Value).
Итеративно выбираются пары списков из пула.
Для каждой пары автоматически выполняется:
- Применение упорядоченных списков adjusters из каждого списка к результатам исторического запроса.
- Идентификация итогового порядка результатов для каждого списка.
- Определение «победившего» и «проигравшего» списка на основе user selection data.
- Увеличение Point Value победителя и уменьшение Point Value проигравшего.
Тестирование повторяется до достижения критериев остановки (ending criteria).
Выбирается один или несколько Score Improvement Lists на основе их итоговых Point Values.

Claim 2 (Зависимый): Дополняет Claim 1, вводя механизм размножения (Breeding).

Выбираются списки с высокими Point Values.
Эти списки скрещиваются друг с другом с использованием genetic operators для создания «дочерних» списков.
Дочерние списки добавляются в общий пул для последующего тестирования.

Claim 6 и 7 (Зависимые): Детализируют процесс определения победителя (Fitness Function).

Определяется User Preferred Search Result на основе исторических данных. Claim 7 уточняет, что это результат с большинством кликов или наибольшим временем пребывания пользователя (greatest user time spent).
Сравнивается ранжирование этого предпочитаемого результата в выдачах, сгенерированных двумя сравниваемыми списками.
Список, который ранжирует User Preferred Search Result выше (имеет более высокую оценку), назначается победителем (Claim 6).

Где и как применяется

Этот патент описывает механизм оптимизации самой архитектуры ранжирования. Он не применяется в реальном времени для обработки конкретного запроса пользователя, а используется для настройки системы поиска (офлайн).

RANKING – Ранжирование и RERANKING – Переранжирование
На этих этапах в реальном времени применяются Adjusters (модификаторы, твидлеры) для корректировки исходных оценок релевантности. Описанная в патенте система определяет оптимальный порядок (Score Improvement List), в котором эти Adjusters должны применяться во время живой обработки запросов.

Офлайн-оптимизация и анализ данных
Сам процесс генетического отбора (тестирование и размножение) происходит офлайн или в фоновом режиме. Он использует логи поисковых сессий (Search Query Data) для анализа и улучшения качества ранжирования.

Входные данные (для офлайн-процесса):

Пул исходных Score Improvement Lists (различные последовательности Adjusters).
Search Query Data (исторические логи запросов, результатов и пользовательских выборов/поведения).

Выходные данные (результат офлайн-процесса):

Один или несколько оптимизированных Score Improvement Lists, выбранных для использования в продакшн-системе ранжирования.

На что влияет

Патент носит универсальный инфраструктурный характер. Поскольку он оптимизирует порядок применения факторов ранжирования в целом, он влияет на все типы контента, все типы запросов и все ниши. Он не нацелен на конкретные тематики, а на повышение общей эффективности поисковой системы.

Когда применяется

Процесс оптимизации: Генетический алгоритм работает офлайн или непрерывно в фоновом режиме для тестирования и улучшения конфигурации ранжирования. Он не активируется в ответ на конкретный запрос пользователя.
Применение результатов: Выбранный оптимальный Score Improvement List применяется в реальном времени на этапах Ranking/Reranking при обработке запросов пользователей.
Критерии остановки (Ending Criteria): Оптимизация останавливается, когда Point Values в пуле стабилизируются, достигнуто пороговое количество итераций или один список значительно опережает другие.

Пошаговый алгоритм

Процесс генетической оптимизации порядка ранжирования (Офлайн)

Инициализация пула: Система генерирует начальный пул Score Improvement Lists. Каждый список может содержать одинаковый набор Adjusters, но в разном порядке. Каждому списку присваивается начальный Point Value (например, 0).
Выбор пар для тестирования: Из пула выбираются пары списков (случайно или по принципу «каждый с каждым»).
Тестирование пригодности (Битва):
- Выбирается исторический поисковый запрос из Search Query Data.
- Определяется User Preferred Search Result для этого запроса (по кликам или времени пребывания).
- Первый список применяется к результатам запроса, генерируется Порядок А.
- Второй список применяется к результатам запроса, генерируется Порядок Б.
- Сравнивается позиция (оценка) User Preferred Search Result в Порядке А и Порядке Б.
Определение победителя и корректировка очков: Список, который поставил предпочитаемый результат выше, объявляется победителем. Его Point Value увеличивается (например, +1), а у проигравшего уменьшается (например, -1).
Селекция и размножение (Breeding):
- Идентифицируются списки с высокими Point Values (например, топ-10%).
- Эти списки скрещиваются с помощью оператора Crossover для создания дочерних списков.
- Может применяться оператор Mutation (особенно при скрещивании высокорейтинговых списков с низкорейтинговыми) для внесения случайных изменений в порядок Adjusters.
- Дочерние списки добавляются в пул.
Итерация: Шаги 2-5 повторяются до достижения критериев остановки.
Выбор результата: Список (или списки) с наивысшим Point Value выбирается для использования в поисковой системе.

Какие данные и как использует

Данные на входе

Патент сосредоточен на использовании поведенческих данных для оптимизации архитектуры ранжирования.

Поведенческие факторы: Являются критически важными для работы системы. Используются Search Query Data и user selection data. Конкретно используются:
- Данные о кликах (какие результаты были выбраны пользователями).
- Время пребывания на ресурсе (dwell time / length of user time spent at a particular resource).
Системные данные:
- Adjusters: Сами модификаторы ранжирования (их код и логика).
- Initial Scores: Исходные оценки релевантности результатов поиска до применения модификаторов (берутся из логов).

Какие метрики используются и как они считаются

User Preferred Search Result: Метрика, определяемая для каждого исторического запроса. Рассчитывается как результат, получивший большинство кликов ИЛИ результат с наибольшим временем пребывания пользователя.
Fitness Function (Функция пригодности): Сравнивает ранги User Preferred Search Result в выдачах, сгенерированных двумя разными списками. Побеждает тот, чей ранг выше.
Point Value: Агрегированная оценка качества Score Improvement List, которая изменяется итеративно на основе результатов тестирования пригодности.
Алгоритмы машинного обучения: Используется генетический алгоритм (Genetic Algorithm) — метод эволюционных вычислений для решения задач оптимизации, включающий Crossover и Mutation.

Инфраструктурный характер патента: Патент описывает не то, *какие* факторы использует Google, а то, *как* Google определяет оптимальный *порядок* их применения. Это механизм автоматической настройки алгоритма ранжирования (AutoML).
Критическая роль поведенческих данных в оптимизации ранжирования: Патент явно демонстрирует использование данных о поведении пользователей (клики и время пребывания) в качестве эталона качества (Fitness Function). Система ранжирования эволюционирует так, чтобы максимизировать эти метрики.
Сложность архитектуры ранжирования: Подтверждается, что ранжирование состоит из серии последовательных корректировок (Adjusters), и порядок их применения имеет существенное значение для итоговой выдачи.
Автоматизация настройки алгоритмов: Google использует машинное обучение (генетические алгоритмы) для автоматической оптимизации своей архитектуры, уходя от ручного подбора порядка применения факторов.
Ограниченная прямая ценность для SEO: SEO-специалисты не могут напрямую влиять на этот процесс оптимизации или контролировать порядок применения Adjusters.

Патент является инфраструктурным и описывает внутренние механизмы настройки алгоритмов Google. Он не дает прямых практических рекомендаций для SEO-специалистов по оптимизации сайтов, но предоставляет важное стратегическое понимание.

Best practices (это мы делаем)

Фокус на удовлетворении интента пользователя (User Satisfaction): Поскольку вся система оптимизируется для того, чтобы поднимать выше User Preferred Search Results (определяемые по кликам и времени пребывания), ключевой стратегией остается создание контента, который наилучшим образом отвечает на запрос пользователя.
Оптимизация под поведенческие метрики: Необходимо работать над повышением CTR (привлекательные сниппеты) И одновременно над увеличением времени вовлеченного взаимодействия с контентом (Dwell Time). Качественный контент, удерживающий пользователя, подтверждает правильность работы алгоритмов ранжирования в глазах этой системы оптимизации.

Worst practices (это делать не надо)

Использование кликбейта без удовлетворения интента: Тактики, направленные на получение клика, но приводящие к быстрому возврату в выдачу (короткий Dwell Time), контрпродуктивны. Это сигнализирует системе оптимизации, что текущая конфигурация ранжирования, показавшая этот результат высоко, является неэффективной.
Попытки угадать порядок факторов: Бессмысленно пытаться реконструировать порядок применения факторов ранжирования. Как показывает патент, этот порядок определяется автоматически и является результатом сложного процесса машинного обучения.

Стратегическое значение

Этот патент подтверждает стратегический приоритет удовлетворенности пользователей как главного мерила качества поиска. Он показывает, что Google использует автоматизированные системы (генетические алгоритмы), которые обучаются на основе агрегированных поведенческих данных для оптимизации самой структуры ранжирования. Это усиливает важность долгосрочной стратегии, ориентированной на пользовательский опыт, а не на поиск лазеек в конкретных алгоритмах.

Практические примеры

Практических примеров применения данного патента в работе SEO-специалиста нет, так как он описывает внутреннюю методологию тестирования и оптимизации алгоритмов Google. Однако можно смоделировать, как система работает внутри Google.

Сценарий: Оптимизация порядка применения факторов свежести и локальности

Задача Google: Определить, что применить сначала: фактор свежести (QDF) или фактор локальности.
Adjusters: Adjuster A (Свежесть), Adjuster B (Локальность).
Тестируемые списки: Список 1 [A, B], Список 2 [B, A].
Тестирование: Система анализирует исторический запрос (например, «последние новости о выборах в городе N»).
User Preferred Result: Пользователи исторически предпочитали (кликали и долго читали) свежие новости от местного новостного портала, а не старую статью от федерального СМИ.
Результат битвы: Список, который привел к более высокому ранжированию местного новостного портала, побеждает и получает очки.
Итог: После множества итераций система определяет оптимальный порядок применения этих факторов для данного класса запросов.

Что такое «Score Improvement List»?

Это упорядоченный список корректировок ранжирования (Adjusters). Он определяет последовательность, в которой различные факторы или модификаторы применяются к исходным результатам поиска. Ключевая идея патента в том, что изменение порядка в этом списке меняет итоговую выдачу.

Что такое «Adjusters»?

Это конкретные модификаторы ранжирования. Патент не уточняет их природу, но в контексте архитектуры поиска это могут быть различные факторы, фильтры или «твидлеры» (Twiddlers), которые повышают или понижают результаты на основе определенных критериев (например, свежесть, локальность, персонализация).

Вводит ли этот патент новые факторы ранжирования?

Нет. Патент не описывает новые факторы (Adjusters). Он описывает исключительно механизм для оптимизации порядка применения уже существующих факторов с помощью генетических алгоритмов. Это инфраструктурный патент.

Как Google определяет «User Preferred Search Result» (Предпочитаемый пользователем результат)?

Согласно патенту, он определяется на основе анализа исторических данных (Search Query Data). Предпочитаемым считается результат, который получил большинство кликов пользователей (selected by a majority of users) ИЛИ результат, на ресурсе которого пользователи провели наибольшее количество времени (greatest user time spent / Dwell Time).

Какова роль генетических алгоритмов в этом патенте?

Генетические алгоритмы используются для автоматического поиска оптимальной последовательности Adjusters. Система симулирует эволюцию: тестирует разные варианты порядка («битва»), отбирает лучшие («выживание наиболее приспособленных») и создает новые варианты на их основе («размножение» через кроссовер и мутацию), пока не найдет наилучшую конфигурацию.

Означает ли это, что CTR и Dwell Time являются прямыми факторами ранжирования?

Патент демонстрирует, что эти метрики используются как эталон качества (Fitness Function) для обучения и оптимизации алгоритмов ранжирования в офлайн-режиме. Они служат «учителем» для генетического алгоритма. Это подтверждает важность поведенческих факторов для Google, но не обязательно означает их прямое использование в ранжировании конкретного запроса в реальном времени.

Могут ли SEO-специалисты влиять на этот процесс?

Напрямую — нет. SEO-специалисты не могут контролировать порядок, в котором Google применяет свои внутренние корректировки. Однако, поскольку система оптимизируется под удовлетворение пользователя, работа над качеством контента и улучшением пользовательского опыта (что ведет к хорошим поведенческим метрикам) является лучшей долгосрочной стратегией.

Почему порядок применения корректировок (Adjusters) имеет значение?

Порядок имеет значение, потому что каждая корректировка изменяет оценку релевантности, и следующая корректировка работает уже с измененной оценкой. В зависимости от того, применяется ли, например, повышение за авторитетность до или после корректировки за локальность, итоговый результат может сильно отличаться.

Что такое «Crossover» и «Mutation» в контексте этого патента?

Это генетические операторы. Crossover (Скрещивание) берет два успешных списка и комбинирует их части для создания нового (например, берет первую половину порядка из Списка А и вторую половину из Списка Б). Mutation (Мутация) вносит случайные изменения в порядок Adjusters в списке (например, меняет два элемента местами) для исследования новых вариантов.

Происходит ли этот процесс оптимизации в реальном времени при каждом запросе?

Нет. Описанный процесс является офлайн-оптимизацией. Google использует его для настройки и тестирования своих алгоритмов ранжирования. Результат этого процесса (оптимальная последовательность adjusters) затем внедряется в боевую систему и используется для обработки реальных запросов.

Как Google персонализирует поисковую выдачу, анализируя историю кликов и поведение пользователя на сайте

Google использует механизм для персонализации поисковой выдачи на основе истории взаимодействия пользователя с результатами поиска. Система отслеживает, какие сайты пользователь выбирает, как долго он на них остается (Dwell Time), частоту и контекст выбора. Основываясь на этих данных, предпочитаемые пользователем ресурсы повышаются в ранжировании при его последующих запросах.

US9037581B1
2015-05-19

Персонализация
Поведенческие сигналы
SERP

Как Google использует историю поиска, поведение и многофакторные профили пользователей для персонализации поисковой выдачи

Google создает детальные профили пользователей на основе истории запросов, взаимодействия с результатами (клики, время просмотра) и анализа контента посещенных страниц. Эти профили (включающие интересы по терминам, категориям и ссылкам) используются для корректировки стандартных оценок ранжирования. Степень персонализации динамически регулируется уровнем уверенности системы в профиле (Confidence Score).

US9298777B2
2016-03-29

Персонализация
Поведенческие сигналы
SERP

Как Google объединяет разные стратегии и поведенческие данные для генерации и выбора лучших альтернативных запросов

Google использует архитектуру, которая одновременно применяет множество стратегий (расширение, уточнение, синтаксис, анализ сессий) для генерации альтернативных запросов. Система оценивает качество этих вариантов с помощью показателей уверенности, основанных на поведении пользователей (например, длительности кликов) и критериях разнообразия. Лучшие альтернативы предлагаются пользователю, часто с превью результатов, чтобы помочь уточнить поиск.

US7565345B2
2009-07-21

Поведенческие сигналы
SERP

Как Google динамически переоценивает значимость факторов ранжирования, основываясь на их надежности в контексте конкретной выдачи

Google использует механизм для повышения качества ранжирования путем анализа надежности (Trustworthiness) различных факторов, влияющих на позицию документа. Если система обнаруживает значительную разницу в надежности сигналов среди результатов поиска, она снижает влияние менее достоверных факторов. Это гарантирует, что документы, получившие высокие оценки за счет ненадежных или легко манипулируемых сигналов, не будут ранжироваться выше документов с более достоверными показателями качества и релевантности.

US9623119B1
2017-04-18

EEAT и качество
Поведенческие сигналы
SERP

Как Google использует данные сессий и разнообразие результатов для генерации блока "Связанные запросы"

Google анализирует поисковые сессии пользователей, чтобы найти запросы, которые часто следуют за одним и тем же предшествующим запросом (родственные запросы). Затем система фильтрует эти потенциальные "Связанные запросы", чтобы убедиться, что они предлагают разнообразные результаты по сравнению с исходным запросом и другими предложениями, помогая пользователям исследовать смежные, но отличные темы.

US8244749B1
2012-08-14

Семантика и интент
Персонализация
Поведенческие сигналы

Как Google использует механизм «Pull-Push» для валидации ссылок через трафик и время вовлечения (Dwell Time)

Google использует механизм «Pull-Push» для борьбы с искусственными ссылками, анализируя соотношение между количеством ссылок и реальными кликами по ним. Если ссылки не генерируют пропорциональный трафик (с учетом времени вовлечения), они обесцениваются. Сайты, которые систематически ставят такие ссылки, классифицируются как «неквалифицированные источники», и их исходящие ссылки дисконтируются при ранжировании.

US9558233B1
2017-01-31

Ссылки
Поведенческие сигналы
Антиспам

Как Google персонализирует поисковые подсказки (Autocomplete) на основе недавно просмотренного медиаконтента

Google использует информацию о недавно потребленном пользователем медиаконтенте (видео, аудио, книги, игры) для персонализации поисковых подсказок. Система извлекает атрибуты (аспекты) из этого контента, такие как названия, имена актеров или артистов, и повышает в ранжировании те подсказки, которые соответствуют этим атрибутам. Влияние потребления медиа на подсказки зависит от времени, прошедшего с момента просмотра, типа контента и того, делился ли им пользователь.

US9268880B2
2016-02-23

Персонализация
Семантика и интент
Мультимедиа

Как Google рассчитывает «VisualRank» для изображений и медиафайлов, используя виртуальные ссылки на основе схожести и поведения пользователей

Google использует алгоритм (концептуально называемый VisualRank) для ранжирования изображений и других медиафайлов путем создания «виртуальных ссылок» между ними. Эти ссылки основаны на визуальной схожести контента, данных о кликах пользователей и контексте размещения (URL analysis). Это позволяет оценить качество и авторитетность медиафайлов даже без явных гиперссылок, при этом система активно избегает показа слишком похожих (дублирующихся) результатов.

US8732187B1
2014-05-20

Ссылки
Мультимедиа
Поведенческие сигналы

Как Google использует исторические данные о кликах (CTR) по категориям для определения доминирующего интента неоднозначных запросов

Google анализирует, на какие категории результатов пользователи кликали чаще всего в прошлом (CTR) по неоднозначному запросу (например, "Pool"). Система определяет доминирующие интенты, выявляя резкие перепады в CTR между категориями или используя иерархию категорий, и повышает в ранжировании результаты, соответствующие наиболее популярным интерпретациям.

US8738612B1
2014-05-27

Семантика и интент
Поведенческие сигналы
SERP

Как Google использует машинное обучение для оптимизации обхода Knowledge Graph и поиска связанных концепций

Google оптимизирует обход Knowledge Graph для эффективного поиска семантически связанных фраз. Вместо анализа всех связей сущности система использует ML-модели для выбора только тех отношений (свойств), которые вероятнее всего приведут к ценным результатам. Этот выбор основан на истории поисковых запросов и контексте пользователя, что позволяет экономить вычислительные ресурсы и повышать релевантность предложений.

US10140286B2
2018-11-27

Knowledge Graph
Семантика и интент
Персонализация

Как Google динамически фильтрует и изменяет подсказки Autocomplete в реальном времени при вводе навигационного запроса

Google использует систему для оптимизации функции автозаполнения (Autocomplete). При вводе частичного запроса система определяет широкий набор потенциальных навигационных ссылок (Superset) и фильтрует его до узкого подмножества (Subset) на основе сигналов, таких как история поиска, популярность и тип документа. Интерфейс может динамически изменять отображаемые подсказки, если пользователь делает паузу при вводе.

US9454621B2
2016-09-27

Семантика и интент
SERP
Поведенческие сигналы

Как Google использует время пребывания на странице (Dwell Time) для оценки качества и корректировки ранжирования

Google анализирует продолжительность визитов пользователей на страницы из результатов поиска (Dwell Time). Система рассчитывает метрику, сравнивающую количество «длинных кликов» (длительных визитов) с общим количеством кликов для конкретного документа по конкретному запросу. Этот показатель используется как сигнал качества, независимый от позиции в выдаче, для повышения или понижения документа в ранжировании.

US8661029B1
2014-02-25

Поведенческие сигналы
SERP

Как Google создает и наполняет Панели Знаний (Knowledge Panels), используя шаблоны сущностей и популярность фактов

Google использует систему для отображения Панелей Знаний (Knowledge Panels) рядом с результатами поиска. Когда запрос относится к конкретной сущности (человеку, месту, компании), система выбирает соответствующий шаблон и наполняет его контентом из разных источников. Выбор фактов для отображения основан на том, как часто пользователи искали эту информацию в прошлом.

US9268820B2
2016-02-23

Knowledge Graph
SERP
Семантика и интент

Как Google проверяет работоспособность Deep Links и обратную совместимость перед индексированием контента мобильных приложений

Google использует автоматизированную систему верификации для индексирования контента мобильных приложений. Перед добавлением в индекс система эмулирует запуск приложения по Deep Link, проверяя корректность загрузки, отсутствие ошибок и соответствие контента связанной веб-странице. Также система тестирует обратную совместимость ссылок при обновлениях приложения, гарантируя, что в поиск попадают только функциональные результаты.

US9645980B1
2017-05-09

Индексация
Ссылки
Техническое SEO

Как Google идентифицирует, связывает и индексирует концепции (фразы) для понимания тем документов

Фундаментальный патент Google, описывающий переход от индексирования слов к индексированию концепций (фраз). Система определяет «хорошие фразы» на основе частотности и их способности прогнозировать появление других фраз (Information Gain). Документы индексируются не только по содержащимся в них фразам, но и по наличию связанных фраз, что позволяет системе определять основные и второстепенные темы документа, а также контекстуально оценивать анкорный текст ссылок.

US7536408B2
2009-05-19

Индексация
Семантика и интент
Ссылки