Общелабораторный семинар (Ужинский А.В., Олейник Д., Петросян А.)
Wednesday 20 December 2023 -
11:00
Monday 18 December 2023
Tuesday 19 December 2023
Wednesday 20 December 2023
11:00
Машинное обучение в прикладных и научных задачах, решаемых в ЛИТ им. М.Г. Мещерякова
-
Alexander Uzhinskiy
(
JINR
)
Машинное обучение в прикладных и научных задачах, решаемых в ЛИТ им. М.Г. Мещерякова
Alexander Uzhinskiy
(
JINR
)
11:00 - 11:20
В докладе приведены результаты за 2018−2023 гг. Основная тема исследований - экологический мониторинг с использованием данных дистанционного зондирования земли и использование современных средств автоматизации и машинного обучения для нужд сельского хозяйства. Также будут кратко даны прочие направления деятельности докладчика. __Research on Machine Learning Solutions for Applied and Scientific Challenges Conducted at the Meshcheryakov Laboratory of Information Technologies__ The report presents findings from 2018 to 2023, focusing on two primary research areas: environmental monitoring utilizing Earth remote sensing data, and the application of contemporary automation and machine learning tools in agriculture. It will cover research directions, motivation, goals, objectives, attained results, published works, and future plans. Additionally, a brief overview of other areas within the speaker's sphere of activity will be provided.
11:20
Система первичной обработки данных эксперимента SPD: SPD OnLine Filter
-
Danila Oleynik
(
JINR MLIT
)
Система первичной обработки данных эксперимента SPD: SPD OnLine Filter
Danila Oleynik
(
JINR MLIT
)
11:20 - 11:40
Ожидаемая частота событий, регистрируемых детектором SPD составляет около 3 МГц (для протон-протонных взаимодействий с энергией 27 ГэВ и светимосьтю 1032 см−2с−1). Это эквивалентно потоку данных в 20 Гб/c или 200 Пб в года учитывай что периоды набора данных будут в пределах 1/3 календарного года. Ключевой проблемой для системы обработки данных SPD является тот факт, что простой отбор физических событий невозможен на аппаратном уровне, поскольку триггерный сигнал зависел бы от измерения импульса и положения вершины, что требует определения траектории (трекинга). Более того, свободно работающая система сбора данных(free-run DAQ) обеспечивает непрерывный поток данных, который требует относительно сложной расшифровки для выявления отдельных событий. Именно по этой причине любая надежная аппаратная триггерная система оказывается чрезмерно сложной, и вычислительной системе приходится справляться с полным объемом данных, предоставляемых системой DAQ. Основной целю специализированной вычислительной системы SPD OnLine Filter является, сокращение объема данных для последующей обработки и долговременного хранения до 20 раз, чтобы ежегодный прирост, включая результаты моделирования, оставался в пределах 10 Пб. __SPD Online filter__ The expected event rate of the SPD experiment is about 3 MHz (pp collisions at 27 GeV and 1032 cm−2s−1 design luminosity). This is equivalent to a raw data rate of 20 GB/s or 200 PB/year, assuming a detector duty cycle of 0.3. The key challenge of SPD computing is the fact that no simple selection of physics events is possible at the hardware level, since the trigger decision would depend on the measurement of momentum and the vertex position, which requires tracking. Moreover, the free-running DAQ provides a continuous data stream that entails a sophisticated unscrambling prior to building individual events. That is the reason why any reliable hardware-based trigger system turns out to be overcomplicated, and the computing system has to cope with the full amount of data supplied by the DAQ system. The main goal of the SPD online filter facility is at least to decrease the data rate by a factor of 20, so that the annual growth of data, including simulated samples, stays within 10 PB.
11:40
Среда распределенного хранения и обработки данных эксперимента SPD
-
Artem Petrosyan
(
JINR
)
Среда распределенного хранения и обработки данных эксперимента SPD
Artem Petrosyan
(
JINR
)
11:40 - 12:00
Сооружаемая на коллайдере NICA установка SPD будет генерировать большие потоки данных, которые, после проведения первичной фильтрации, необходимо будет хранить и обрабатывать. Учитывая ожидаемые объемы этих данных, в организации хранения и обработки предполагается использовать как ресурсы ОИЯИ, так и сторонние, предоставляемые участниками коллаборации. В докладе представлен статус работ по организации среды распределенного хранения и обработки данных эксперимента SPD. __Distributed Storage and Computing Environment for the SPD Experiment__ The SPD facility, being under construction at the NICA collider, will generate large data streams, which, after initial filtering, will need to be stored and processed. Given the expected amount of this data, both JINR resources and external resources provided by the collaboration participants are supposed to be used in organizing storage and processing. The report presents the status of work on the organization of the distributed storage and processing environment of SPD experiment data.