Развитие системы мониторинга вычислительных ресурсов Гетерогенной платформы HybriLIT

8 Jul 2025, 14:00
15m
Room 406

Room 406

Speaker

Дмитрий Беляков (MLIT JINR)

Description

В докладе представлен обзор систем мониторинга различных компонент Гетерогенной платформы HybriLIT. Сформулированы цели и назначение применяемых систем, являющихся одним из важных инструментов системного администрирования платформы.
Для контроля за состоянием вычислительных ресурсов применяется разработанная ранее система мониторинга, которая позволяет в реальном времени отслеживать загрузку CPU и GPU компонентов вычислительного узла, использование оперативной памяти и систем хранения данных, объём сетевого трафика и т.п.
В докладе представлена новая система мониторинга, являющаяся логическим развитием разработанной ранее системы, обеспечивающая ряд дополнительных функций для контроля за состоянием вычислительных ресурсов платформы.

Authors

Геннадий Карпов (DVFU) Данил Дереза (DVFU) Дмитрий Беляков (MLIT JINR) Mr Максим Зуев (MLIT JINR) Максим Лебедев (DVFU) Максим Сказкин (DVFU)

Presentation materials

There are no materials yet.