Speaker
Description
Доклад посвящён новому распределённому хранилищу данных, развернутому в Объединённом институте ядерных исследований для поддержки участия института в международных нейтринных экспериментах. Хранилище основано на системе dCache и интегрировано в экосистему многофункционального информационно-вычислительного комплекса Лаборатории информационных технологий им. М. Г. Мещерякова. В докладе рассматривается подход к управлению хранилищем, основанный на принципах методологии GitOps: декларативном описании инфраструктуры, её версионировании и отслеживании изменений конфигурации с использованием системы контроля версий Git. Будет рассмотрен применяемый стек технологий и регламенты работы — от организации хранения конфигураций и автоматизированного развёртывания до процедур проверки изменений перед их применением на рабочем кластере. Отдельное внимание уделяется системе мониторинга, включающей сбор метрик и оповещение на базе Prometheus, Grafana и Alertmanager, а также подходам к обеспечению отказоустойчивости и масштабируемости хранилища.