Автор: Виктор Репин

2010 Индексация Краулинг Патенты Google Техническое SEO

Как Google использует структуру URL для прогнозирования качества, популярности и поведения пользователей для новых страниц

Google анализирует исторические данные о поведении пользователей (например, долгие клики) и атрибуты документов, агрегируя их по схожим шаблонам URL. Если страница новая и не имеет собственных данных, система прогнозирует ее ценность, основываясь на показателях других страниц с аналогичной структурой URL. Это влияет на приоритеты сканирования, индексирования и начальное ранжирование.

2018 Knowledge Graph Патенты Google Семантика и интент

Как Google Assistant понимает голосовые команды, ссылающиеся на визуальные объекты на карте (например, «Отвези меня сюда»)

Патент описывает, как цифровой ассистент интерпретирует неоднозначные голосовые команды (например, «Поехали туда» или «В тот, что слева»), ссылающиеся на объекты, видимые на экране навигационного приложения. Система получает визуальный контекст из видимой области карты (viewport), анализирует команду с помощью NLP и точно определяет, какой объект имел в виду пользователь, для выполнения действия.

2014 Мультимедиа Патенты Google

Как Google использует архитектуру параллельных поисковых систем для обработки визуальных запросов (Visual Search/Google Lens)

Google использует систему для обработки визуальных запросов (изображений). Изображение одновременно отправляется в несколько специализированных поисковых систем (распознавание лиц, OCR, распознавание объектов, штрих-кодов и т.д.). Система агрегирует, ранжирует результаты и может создать интерактивный документ, выделяя распознанные объекты и связывая их с соответствующими результатами поиска.

2022 Google Shopping Патенты Google Семантика и интент

Как Google использует выделенный на странице контент для параллельного поиска в специализированных базах данных (приложения, расширения, товары)

Google патентует механизм «ассистированного поиска» для специализированных баз данных (например, магазинов приложений или расширений). Пользователь выделяет контент (текст/изображение) на веб-странице, и система использует его как запрос. Специальный конвертер анализирует выделенное, определяет несколько возможных интентов, оптимизирует их под конкретную базу данных и выполняет параллельный поиск, выдавая сгруппированные результаты.

2004 Антиспам Краулинг Патенты Google Свежесть контента

Как Google использует кэширование для ускорения поиска, гарантируя при этом свежесть сниппетов в выдаче

Патент раскрывает инфраструктуру Google для кэширования результатов поиска и сниппетов. Описан механизм, использующий «метки времени» (datestamps) для проверки актуальности кэшированной информации на основе даты последнего индексирования документа. Если кэшированный сниппет устарел, система извлекает свежую версию из базы данных документов перед показом пользователю, обеспечивая баланс между скоростью и свежестью.

2009 Патенты Google Ссылки

Как Google сегментирует URL-адреса для обучения моделей голосового поиска и восстанавливает их из речи

Google анализирует текстовые URL-адреса из журналов поиска, чтобы определить наиболее вероятный способ их произношения (например, facebook.com -> «face book dot com»). Этот процесс использует большие языковые модели для сегментации URL. Полученные данные используются для обучения систем распознавания речи. Когда пользователь произносит URL, система распознает слова и реконструирует текстовый URL для поисковой системы.

2012 Local SEO SERP Патенты Google Персонализация

Как Google использует время в пути для определения статуса «Открыто сейчас» и динамически фильтрует локальную выдачу

Google персонализирует статус доступности локального бизнеса, рассчитывая предполагаемое время прибытия пользователя (текущее время + время в пути). Бизнес помечается как «Открыто сейчас», только если пользователь физически успевает добраться до закрытия. Патент также защищает интерактивные фильтры для динамического переключения между текущим и будущим временем.

2020 Патенты Яндекс Поведенческие факторы Рекомендательные системы Яндекс Дзен

Как Яндекс персонализирует соотношение разных типов контента в рекомендательных лентах (например, в Дзен)

Яндекс использует систему для определения оптимального соотношения типов контента (видео, статьи, изображения) в ленте рекомендаций для конкретного пользователя. Система сравнивает, насколько активно пользователь взаимодействует с определенным типом контента (CTR или Dwell Time) по сравнению со средним пользователем. Если вовлеченность выше средней, система увеличивает долю этого типа контента в его персональной ленте в рамках заданных интервалов.

2015 Knowledge Graph Безопасный поиск Мультимедиа Патенты Google

Как Google использует Knowledge Graph, сигналы вовлеченности и Co-Watch для алгоритмического отбора контента для детей (например, YouTube Kids)

Google использует автоматизированную систему для наполнения детских интерфейсов безопасным и интересным контентом. Система определяет темы, интересующие детей, через Knowledge Graph и внешние источники, рассчитывает «Оценку детской близости» (Children’s Affinity Score) для этих тем, учитывая качество и популярность связанного контента. Затем эти оценки используются для отбора и ранжирования каналов и плейлистов.

2011 Индексация Патенты Google Поведенческие сигналы Семантика и интент

Как Google создает интерфейс для построения сложных цепочек фильтрации документов (конвейерных запросов)

Патент Google, описывающий пользовательский интерфейс для создания сложных, модифицируемых запросов, называемых «конвейерами». Этот интерфейс позволяет пользователям последовательно фильтровать наборы документов, используя вывод одного запроса как источник для следующего. Технология разработана для задач электронной обработки данных (e-discovery) и юридического анализа документов.

2007 Knowledge Graph Local SEO SERP Патенты Google

Как Google ранжирует географические объекты на основе их реальных физических характеристик, связей и контекста

Google использует систему для оценки важности географических объектов (городов, дорог, зданий) на основе их физических и географических атрибутов, таких как размер, плотность населения, экономическая активность и связность транспортных сетей. Эти оценки (Rank Scores) используются для определения порядка результатов в локальном поиске и выбора объектов для отображения на Картах, независимо от традиционных веб-сигналов, таких как PageRank.

2018 SERP Антиспам Патенты Яндекс Яндекс Браузер

Как Яндекс использует данные органического поиска и логи браузеров для выявления вредоносных сайтов

Яндекс патентует метод выявления вредоносных сайтов путем анализа несоответствия между подозрительным автоматизированным трафиком и органической популярностью в поиске. Система анализирует логи браузеров, выявляя автоматические запуски сайтов неизвестными программами («первый запуск»). Если такой сайт имеет низкую видимость, плохие позиции или негативную репутацию в органическом поиске, он классифицируется как вредоносный.

2007 Google Shopping Индексация Мультимедиа Патенты Google

Как Google использует компьютерное зрение для анализа, сегментации и визуального поиска товаров в E-commerce

Патент описывает комплексную систему Google для визуального поиска товаров. Система автоматически обрабатывает изображения: отделяет объект от фона (сегментация), выравнивает его, извлекает визуальные признаки (цвет, форма, текстура) и создает цифровые подписи (векторы). Это позволяет пользователям искать похожие товары, используя изображение в качестве запроса (CBIR), уточнять поиск по визуальным характеристикам и находить товары на сторонних сайтах.

2021 Антикачество Антиспам Обучение моделей Патенты Яндекс

Как Яндекс использует вирусный контент в социальных сетях для поиска ошибок классификации и автоматического переобучения ML-моделей

Яндекс патентует метод автоматического улучшения своих классификаторов (например, SafeSearch). Система отслеживает аномальные всплески поискового трафика, исходящие из социальных сетей. Если пользователи массово делятся результатом поиска как примером ошибки (например, шок-контент при включенном фильтре), система идентифицирует этот документ, подтверждает ошибку классификации и использует его для переобучения и улучшения алгоритма машинного обучения.

2013 Knowledge Graph Индексация Патенты Google Персонализация

Как Google создает и использует Персональный Граф Знаний (User-Specific Knowledge Graph) для гиперперсонализации поиска и рекомендаций

Google анализирует личные данные пользователя (история поиска, email, социальная активность) для построения Персонального Графа Знаний. Этот граф структурирует сущности и связи, значимые для пользователя. Сила связей динамически обновляется: усиливается при повторном взаимодействии (Reinforcement) и ослабевает со временем (Decay). Граф используется для глубокой персонализации результатов поиска и генерации проактивных рекомендаций (например, в Google Discover).

2023 Knowledge Graph Мультимедиа Патенты Google

Как Google предсказывает, какие сущности пользователи будут искать во время просмотра видео, и отображает контекстные карточки

Google анализирует видеоконтент для выявления сущностей (терминов, концепций), которые пользователи, вероятно, захотят найти в поиске. Система использует ML, обученное на реальных поисковых запросах, возникающих во время просмотра видео. Когда сущность упоминается, Google отображает «Карточку сущности» с кратким описанием и изображением прямо в интерфейсе плеера, не прерывая просмотр.

2005 Knowledge Graph Индексация Краулинг Патенты Google

Как Google использует кластеры совместной встречаемости терминов и иерархические оценки для классификации сайтов по тематическим вертикалям

Google использует автоматизированный процесс для категоризации веб-сайтов в иерархическую таксономию. Система анализирует контент для выявления семантических кластеров (групп совместно встречающихся терминов), сопоставляет их с концепциями и определяет наиболее подходящую категорию. Ключевой механизм выбирает самую специфичную (глубокую) категорию в иерархии, которая превышает порог статистической значимости.

2022 Индексация Краулинг Мультимедиа Патенты Google

Как Google создает поисковый индекс для NFT и интегрирует блокчейн (Web3) в результаты поиска

Google разрабатывает инфраструктуру для индексации данных напрямую из блокчейнов, фокусируясь на NFT. Система извлекает описания, историю транзакций и сами цифровые активы, следуя по ссылкам в блокчейне. Она оценивает качество и подлинность NFT, дедуплицирует контент и интегрирует проверенные NFT в поисковую выдачу как специализированные результаты.

2010 Индексация Краулинг Патенты Google Свежесть контента

Как Google использует машинное обучение для определения значимости обновлений контента на веб-страницах

Google использует модель машинного обучения (например, Support Vector Machine) для анализа изменений между двумя версиями веб-страницы. Система оценивает контентные, структурные (ссылки) и поведенческие (трафик) признаки, чтобы классифицировать обновление как «значимое» или «незначимое». Это позволяет поисковой системе понять, какие обновления требуют внимания (например, для оценки свежести или переиндексации), а какие являются техническим шумом.

2023 Антикачество Антиспам Обучение моделей Патенты Яндекс

Как Яндекс использует социальные сети и аномалии трафика для обнаружения ошибок в поиске и переобучения своих алгоритмов

Яндекс патентует систему автоматического контроля качества поиска. Система отслеживает аномальные всплески поискового трафика, исходящие из социальных сетей, и анализирует посты пользователей (например, скриншоты выдачи с комментариями об ошибках). Обнаруженные ошибки классификации используются для генерации новых обучающих данных и переобучения алгоритмов машинного обучения (MLA), повышая точность и безопасность выдачи.