2003

Google оптимизирует вычислительные ресурсы, отслеживая популярность запросов через счетчик использования кэша (Reuse Count). Для редких запросов предоставляется быстрый «стандартный» результат. Если запрос становится популярным (превышает порог), система запускает более ресурсоемкий …
Google может использовать данные из своих рекламных систем (поисковая и контекстная реклама) для влияния на органическое ранжирование. Патент описывает анализ кликов по рекламе для определения интента запроса, использование данных о …
Google использует систему для определения коммерческого намерения пользователя в реальном времени. Система использует предварительно созданный список коммерческих шаблонов, основанный на данных рекламодателей, анализе логов и выявлении манипулятивных техник (например, доменов …
Google использует сложную иерархическую вероятностную модель для понимания семантики текста. Система обучается на огромных массивах данных (например, поисковых сессиях), чтобы автоматически выявлять «концепции» (кластеры семантически связанных слов и фраз). Это …
Google использует механизм для автоматического обнаружения сайтов, которые встраивают идентификаторы сессий (Session ID) в URL. Система скачивает страницу дважды и сравнивает внутренние ссылки. Если большая часть ссылок меняется (из-за разных …
Google идентифицирует результаты поиска, в которых система максимально уверена («очень релевантные»). Для этого анализируется комбинация факторов: доминирующий показатель кликабельности (CTR) относительно конкурентов, высокая позиция в ранжировании и значительный отрыв по …
Патент Google, описывающий фундаментальную архитектуру персонализированного поиска. Система собирает и синхронизирует между устройствами персональные данные пользователя: закладки, историю посещений, оценки и поведенческие сигналы. При поиске результаты из этих персональных источников …
Google использует систему для выполнения одного запроса сразу по нескольким категориям (вертикалям) поиска, таким как Веб, Новости, Товары или Картинки. Система оценивает релевантность не только отдельных результатов, но и целых …
Google использует иерархический метод для динамического определения предпочтительных языков пользователя, анализируя HTTP-заголовки, настройки браузера, IP-адрес и язык самих результатов поиска. Затем система переранжирует выдачу, повышая позиции документов на предпочтительных языках …
Google использует механизм для тестирования качества своего ранжирования, перемещая результаты из глубины выдачи (невидимые пользователю) на топовые позиции. Это делается либо случайным образом (Exploration), либо путем подмешивания высокоранжированных результатов из …
Google использует механизм для автоматического обнаружения идентификаторов сессий в URL-адресах во время сканирования. Система анализирует подстроки, которые выглядят случайными и повторяются в нескольких URL с одного сайта. Эти идентификаторы удаляются …
Патент Google, описывающий фундаментальный механизм автоматического обнаружения ссылок между веб-страницами разных авторов. Когда система обнаруживает, что Страница B ссылается на Страницу A, она может автоматически встроить представление (например, ссылку) Страницы …
Google использует «Фактор чувствительности к местоположению» (Location Sensitivity Factor), чтобы динамически определять, насколько важна близость для конкретного запроса. Система объединяет оценку расстояния (Distance Score) и тематическую оценку (Topical Score) в …
Google патентует систему кросс-языкового поиска, которая заранее переводит документы и ссылающийся на них анкорный текст. Для повышения точности перевода используется контекстно-зависимая модель, анализирующая анкорный текст входящих ссылок и структуру сайта. …
Google запатентовал механизм клиентской персонализации, который локально отслеживает историю посещений пользователя (частоту, время на сайте). Система перехватывает стандартные результаты поиска и переранжирует их, повышая позиции сайтов, с которыми пользователь ранее …
Google анализирует структуру веб-страницы (HTML-теги, форматирование), разделяя ее на регионы (заголовок, основной текст, списки ссылок). Система определяет локальные концепции для каждого блока, а затем сравнивает их, чтобы выявить общее значение …
Google использует механизм для расширения поисковых запросов, добавляя синонимы, связанные концепции и альтернативные написания. Патент описывает, как система определяет эти расширения (включая обработку фраз) и как она может представлять их …
Google ранжирует документы (особенно новости), группируя их в тематические кластеры. Система определяет «Золотые источники» (Selected Sources) на основе количества и свежести их оригинального контента в конкретных категориях. Ранжирование документа зависит …
Google использует систему для автоматического поиска и извлечения определений из веб-страниц (глоссариев). Система анализирует HTML-структуру, в частности списки определений (теги , , ), для разделения термина и его значения. Извлеченные …
Google может группировать результаты поиска, анализируя, как документы ссылаются друг на друга. Система оценивает силу связи между документами, проверяя контекстуальную близость общих цитирований. Ссылки, расположенные в одном предложении (co-citation) или …