(по материалам кандидатской диссертации)
В диссертации разработан новый метод построения и использования цифровых двойников (ЦД) распределенных центров сбора, хранения и обработки данных (РЦОД) с целью улучшения их технических характеристик, принятия решений по выбору конфигураций оборудования в рамках задачи масштабирования и развития центров, управления ресурсами и процессами, происходящими в них. Предложенный метод отличается от существующих возможностью моделировать процессы обработки и хранения данных, учитывая характеристики потоков данных и задач, вероятностей сбоев, отказов и изменений в производительности оборудования и других процессов, происходящих в моделируемой системе. Представлены алгоритмы для реализации метода и модель данных.
На основе созданных моделей, методов и алгоритмов разработано специальное программное обеспечение (СПО), позволяющее сравнивать эффективность функционирования РЦОД в зависимости от различных конфигураций оборудования. Верификация СПО проведена на примере центра сбора, хранения и обработки данных эксперимента BM@N комплекса NICA.
Продемонстрированы результаты опытной эксплуатации СПО при построении ЦД вычислительной инфраструктуры эксперимента BM@N и вычислительной системы онлайн-фильтра данных эксперимента SPD комплекса NICA. Получены рекомендации, которые учтены при проектировании и развитии вычислительных инфраструктур крупных экспериментов в области физики высоких энергий. Результаты применения СПО доказали работоспособность и высокое качество разработанных в диссертации моделей и алгоритмов.
Digital twins for solving management and development tasks of distributed data acquisition, storage and processing centers
(based on the PhD thesis)
A new method for creating and using digital twins (DTs) of distributed data acquisition, storage and processing centers (DDCs) is developed in the PhD thesis. The main goal of creating a DT to improve DDC technical characteristics, to make decisions on choosing equipment configurations within the task of scaling and developing centers, managing resources and processes occurring in the DDC. The proposed method differs from existing ones in the ability to simulate such processes as data storage and processing, taking into account the characteristics of data flows and jobs, the probabilities of failures and changes in the equipment performance and other processes occurring in the simulated system. Algorithms for the implementation of the method and a data model are presented.
Special software is developed on the basis of the created models, methods and algorithms. The software allows comparing the efficiency of the DDC operation depending on different hardware configurations. The verification of the modeling program is performed using the example of the computing infrastructure of the BM@N experiment of the NICA accelerator complex.
The results of the experimental operation of the software are demonstrated in the creation of the DT of the computing infrastructure of the BM@N experiment and the computing system of the online data filter of the SPD experiment of the NICA complex. Recommendations on the results of the DT functioning are taken into account in the design and development of computing infrastructures for large-scale experiments in the field of high-energy physics. The results of the software application prove the efficiency and high quality of the models and algorithms developed in the thesis.