Автор: Виктор Репин

2008 EEAT и качество Индексация Краулинг Патенты Google

Как Google использует теорию информации (энтропию) для автоматического определения канонических URL и игнорирования нерелевантных параметров

Google применяет статистический анализ на основе теории информации для определения, какие параметры URL влияют на уникальность контента. Система вычисляет условную энтропию между значениями параметров и отпечатками контента (fingerprints). Это позволяет автоматически игнорировать нерелевантные параметры (например, session ID, трекинг-коды), определять канонический URL и оптимизировать краулинговый бюджет.

2014 EEAT и качество Индексация Краулинг Патенты Google

Как Google анализирует структуру DOM для автоматического определения основного контента на странице

Google использует сложный алгоритм для анализа DOM-структуры, чтобы отличить основной контент (статьи, посты) от шаблонных элементов (меню, виджеты). Система генерирует стабильный идентификатор (например, CSS-селектор) для контейнеров основного контента. Это позволяет системам индексирования и размещения рекламы точно находить и взаимодействовать с главным содержимым страницы.

2011 Knowledge Graph Local SEO Патенты Google Семантика и интент

Как Google управляет данными о сущностях (Knowledge Graph, Maps), используя неизменяемые «наблюдения» вместо фиксированных идентификаторов

Патент Google, описывающий инфраструктуру управления данными о сущностях (например, компаниях или местах). Вместо использования фиксированных ID, система обрабатывает входящую информацию (правки, отзывы) как неизменяемые «наблюдения». Наблюдения группируются в «кластеры» на основе контекста (например, NAP). Это позволяет системе сохранять историю и корректно обрабатывать изменения, слияния или переезды сущностей.

2018 EEAT Качество контента Патенты Яндекс Яндекс Новости

Как Яндекс определяет первоисточник контента с помощью анализа репутации, ссылок и упоминаний внутри тематического кластера

Яндекс использует машинное обучение для определения оригинального источника (первоисточника) контента, который был многократно перепечатан. Система группирует похожие публикации в тематические кластеры и анализирует исходящие ссылки внутри этого кластера. Учитывая репутацию источников, время публикации и частоту цитирования (ссылками и текстовыми упоминаниями), система вычисляет ссылку на оригинальный объект, даже если сам этот объект не был проиндексирован.

2018 EEAT и качество Индексация Патенты Google Свежесть контента

Как Google создает интерактивные временные шкалы (Timelines) событий, фильтруя результаты по авторитетности источников

Google использует двухэтапную систему для генерации временных шкал. Сначала система определяет значимые события, анализируя всплеск публикаций от широкой категории источников (например, всех СМИ) в определенные интервалы времени. Затем для этих событий выбираются лучшие результаты исключительно от самых авторитетных источников (например, топовых СМИ), которые отображаются в хронологическом порядке.

2013 Local SEO Мультиязычность Патенты Google Семантика и интент

Как Google использует контекстно-зависимые шаблоны запросов для понимания локальных поисковых запросов

Google анализирует исторические логи поиска, чтобы понять, как пользователи в разных странах и на разных языках структурируют географические запросы. Система генерирует вероятностные Шаблоны Запросов (Query Templates) и рассчитывает вероятность их корректности в зависимости от контекста пользователя (локаль, язык, устройство). Это позволяет точнее интерпретировать неоднозначные локальные запросы и адаптироваться к региональным особенностям.

2023 Индексация Мультимедиа Патенты Google Семантика и интент

Как Google использует одновременный ввод видео и аудио (Multimodal Search) для понимания сложных запросов

Google разрабатывает систему мультимодального поиска, позволяющую пользователям записывать видео и одновременно задавать вопрос голосом или записывать звук. Система использует продвинутые ML-модели для генерации видео-эмбеддингов, анализа временной информации и аудиосигнатур. Это позволяет поиску понимать сложные запросы, требующие визуального и аудиального контекста (например, диагностика поломок, обучение действиям), и находить релевантные ответы в виде видео, веб-страниц или AR.

2006 Антиспам Безопасный поиск Мультимедиа Патенты Google

Как Google использует контекст всего сайта для выявления и фильтрации нежелательного контента (SafeSearch)

Патент описывает систему оценки изображений на предмет нежелательного (например, взрослого) контента. Система анализирует не только само изображение и страницу, на которой оно размещено, но и агрегированные статистические данные по другим изображениям и страницам на том же сайте. Этот общесайтовый контекст позволяет точнее классифицировать спорный контент и применяется для фильтрации результатов, например, через SafeSearch.

2011 Индексация Патенты Google Поведенческие сигналы Свежесть контента

Как Google динамически обновляет сниппеты и фильтрует выдачу при уточнении запроса без выполнения нового поиска

Патент Google описывает механизм уточнения результатов поиска прямо на странице выдачи. Пользователь вводит уточняющий запрос, и система динамически фильтрует уже показанные результаты и генерирует новые сниппеты, релевантные уточнению. Все это происходит без выполнения нового полноценного поиска основным движком.

2012 SERP Патенты Google Персонализация Семантика и интент

Как Google персонализирует поиск, повышая в выдаче объекты, которые пользователь ранее явно отметил как интересные

Google использует механизм персонализации поисковой выдачи. Если пользователь явно отметил определенный объект (например, место, компанию, веб-страницу) как интересующий его, этот объект получит значительное повышение в ранжировании при последующих релевантных запросах этого пользователя. Уровень повышения зависит от степени интереса, указанной пользователем.

2012 Мультимедиа Патенты Google Семантика и интент

Как Google использует анализ движения в видео (Motion Manifolds) для понимания семантической связи между визуально непохожими объектами

Google анализирует, как объекты движутся и трансформируются в видео (траектории), чтобы понять, что визуально разные состояния (например, открытый и закрытый глаз) семантически являются одним и тем же объектом. Эта технология («Motion Manifold») позволяет определять семантическое сходство изображений и видео, даже если они выглядят по-разному, улучшая поиск и рекомендации.

2004 EEAT и качество Local SEO Патенты Google Персонализация

Как Google использует социальные связи, авторитетность и рекомендации для персонализации и переранжирования локальной выдачи

Google может использовать данные из социальных сетей (member networks) для изменения ранжирования локальных результатов и рекламы. Система учитывает рекомендации (endorsements) от связанных пользователей, корректируя их вес на основе близости социальной связи (degree of separation) и авторитетности рекомендателя (credibility factor), чтобы повысить доверенные результаты.

2012 Knowledge Graph Local SEO Патенты Google Семантика и интент

Как Google использует Knowledge Graph для ответа на запросы о пространственной и временной близости сущностей (например, «банки рядом с ресторанами»)

Google обрабатывает сложные «композиционные запросы», сравнивая атрибуты (местоположение или время) разных типов сущностей в Knowledge Graph. Система находит пары, удовлетворяющие критерию связи (например, расстоянию), и визуализирует результаты на картах или временных шкалах с возможностью динамической фильтрации.

2013 Knowledge Graph Индексация Патенты Google Семантика и интент

Как Google извлекает данные об опыте, образовании и навыках из резюме и профилей для оценки экспертизы и моделирования карьерных путей

Google разработал систему для автоматического анализа неструктурированных документов о занятости (резюме, CV, профили в соцсетях). Система извлекает информацию о должностях, компаниях, образовании и датах работы, структурируя эти данные в виде графа карьерных переходов. Это демонстрирует возможности Google по оценке профессионального опыта и квалификации людей (E-E-A-T).

2012 Патенты Google Семантика и интент

Как Google в Автоподсказках (Suggest) предлагает искать запрос в разных вертикалях поиска (Картинки, Новости, Карты)

Патент описывает механизм «разветвления» (forking) автоподсказок Google Suggest. Система анализирует введенные символы и определяет, в каких вертикалях поиска (Корпусах) — таких как Картинки, Новости или Карты — пользователи чаще всего ищут предложенный запрос. Если корреляция с конкретной вертикалью высока (на основе Corpus Score), система предлагает пользователю искать сразу в ней, наряду со стандартным универсальным поиском.

2010 Патенты Google Персонализация Поведенческие сигналы

Как Google использует Социальный Граф и метрику Affinity для персонализации и ранжирования поиска по картинкам

Google использует социальный граф пользователя для персонализации поиска по картинкам. Система идентифицирует изображения, опубликованные контактами пользователя (друзьями, подписками), и ранжирует их в единой выдаче с общими результатами. Ключевую роль играет метрика Affinity (близость контакта к пользователю), основанная на степени связи и частоте взаимодействий, которая используется для повышения релевантных социальных результатов.

2024 Патенты Google Персонализация Семантика и интент

Как Google использует эмбеддинги, примеры запросов и механизм Hotfixing для понимания интентов и аргументов

Патент Google описывает систему семантического парсинга для точной интерпретации запросов. Система определяет интент и извлекает аргументы (сущности), сравнивая запрос с эталонными примерами в векторном пространстве (эмбеддингах). Ключевая особенность — механизм «Hotfixing», позволяющий быстро корректировать ошибки понимания интентов путем добавления примеров без переобучения всей модели.

2013 Патенты Google Семантика и интент

Как Google переписывает и маршрутизирует естественно-языковые запросы в специализированные поисковые движки для генерации прямых ответов

Google использует систему для обработки запросов на естественном языке (например, голосовых). Она определяет тематическую область запроса (домен), выбирает наиболее подходящий специализированный поисковый движок или базу данных и переформатирует исходный запрос в оптимизированный структурированный вид. Цель — повысить точность и сгенерировать единственный прямой ответ (single result).

2008 Local SEO Патенты Google Персонализация Семантика и интент

Как Google использует местоположение и контекст пользователя для точного распознавания голосовых запросов и локализации выдачи

Google использует контекст пользователя (текущее местоположение по GPS, просматриваемую карту или активное приложение) для выбора специализированной «грамматики» (словаря). Это позволяет системе точнее распознавать названия местных бизнесов и объектов во время голосового поиска и предоставлять локально релевантные результаты.

2007 SERP Патенты Google Семантика и интент Техническое SEO

Как Google определяет доминирующий интент запроса, классифицируя результаты поиска с учетом их позиций (Position Bias)

Google анализирует контент (URL, заголовки, сниппеты, метки) топовых результатов поиска для определения доминирующего интента. Система присваивает категории каждому результату и взвешивает их, отдавая значительное предпочтение результатам на более высоких позициях (Position Bias). Итоговая классификация SERP используется для генерации релевантных элементов страницы (например, блоков Универсального поиска).