В рамках научного направления «Распределенные и высокопроизводительные вычисления для подготовки, реализации и поддержки экспериментальных и теоретических исследований, проводимых в рамках крупных инфраструктурных проектов ОИЯИ» проводятся работы по следующим темам.
Эксперимент BM@N:
Эксперимент MPD:
Эксперимент SPD:
Руководитель: к.т.н. Герценбергер К. В.
Аннотация
Научно-исследовательская программа проводимого с 2015 года международного эксперимента BM@N на строящемся ускорительном комплексе класса мегасайенс NICA направлена на исследование фазовой диаграммы кварк-глюонной материи при экстремальных барионных плотностях и температурах. Данные исследования тесно связаны с астрофизикой и изучаемыми ей процессами формирования звезд. Получаемые данные по релятивистским столкновениям тяжелых ионов позволят изучить структуру плотной барионной материи, её уравнение состояния, определить детали фазового перехода, ответить на вопросы о существовании критической точки. Для проведения исследований в рамках эксперимента BM@N необходима разработка современного программного обеспечения, используемого для обработки и мониторинга больших данных, получаемых с установки.
Обработка и анализ экспериментальных, как и моделированных данных являются неотъемлемой частью экспериментов на ускорительных установках. Для современных научных исследований характерно оперирование огромными объемами данных, регистрируемых в ходе высокоинтенсивных столкновений частиц в эксперименте, которые необходимо достаточно быстро обработать и своевременно получить физический результат, соответствующий поставленной цели. Современные вычислительные комплексы характеризуются гетерогенностью по программным и аппаратным ресурсам и географической распределенностью, в связи с чем в данном направлении решаются задача разработки и внедрения современных программных решений для обработки и управления большими данными на гетерогенных платформах, для распределенной обработки данных, получаемых на установке эксперимента, а также анализа существующей инфраструктуры.
Возможные темы дипломных работ
1. Создание и апробация комплексной методики (синтетические тесты и использование макета обработки) оценки производительности распределенных вычислительных систем для эксперимента BM@N.
Краткое описание представленной задачи:
Методика оценки производительности существующих вычислительных платформ должна быть комплексной, то есть включать как синтетические тесты для оценки отдельных вычислительным подсистем по различным критериям, влияющим на скорость обработки данных (оценки LINPACK, SPEC, iperf), так и “реальные” тесты для оценки производительности собственно обработки данных эксперимента. В настоящее время для эксперимента BM@N используются следующие вычислительные платформы: кластер NICA, суперкомпьютер «Говорун», ЦИВК ОИЯИ с фрагментами центров Tier1 и Tier2 системы GRID, а также онлайн ферма DAQ Data Center (DDC). Также одной из задач данного направления является оценка влияния на производительность обработки реальных данных эксперимента использование процессорной технологии HyperThreading на предоставляемых аппаратных платформах.
Общие требования к студентам
- Знание основ операционных систем семейства Linux, а также английского языка (чтение/перевод).
2. Развитие специализированной системы запуска NICA-Scheduler эксперимента BM@N для распределенного запуска задач обработки на вычислительных платформах с различными типами систем планирования и требованиями к выполняемым задачам.
Краткое описание представленной задачи:
Одним из направлений параллельной обработки данных эксперимента BM@N является запуск задач обработки через специализированные системы планирования, отвечающие за распределение и отслеживание задач на вычислительных аппаратных платформах. Доступные для эксперимента вычислительные кластеры могут иметь различные системы планирования (например, Torque, SLURM, Condor и др.) с разными требованиями и ограничениями, например, по количеству запускаемых задач и по количеству задач в очереди. Для упрощения запуска и выполнения задач обработки данных эксперимента BM@N на платформах с разными система планированиями и предъявляемыми требованиями к задачам пользователя на языке C++ реализуется специализированная система запуска задач NICA-Scheduler, которая также решает часть вопросов, специфичных проблематике обработки данных эксперимента по столкновению частиц. В рамках данной работы будет проводиться расширение функциональности данной системы, являющейся важной частью программного обеспечения эксперимента BM@N для параллельной обработки его данных на распределенных вычислительных архитектурах.
Общие требования к студентам
- Знание языка программирования C++, основ операционных систем семейства Linux.
3. Разработка централизованного веб-сервиса поддержи проведения официальной массовой обработки данных эксперимента BM@N.
Краткое описание представленной задачи:
Целью проекта является создание централизованного веб-сервиса коллаборации для определения обязательных входных параметров массовой обработки данных эксперимента BM@N в виде таблицы с возможностью комментирования и обсуждения. Сервис призван обеспечить прозрачность и отслеживаемость всех официальных запусков обработки экспериментальных и смоделированных данных, а также организовать уведомления о ходе данных операций через интеграцию с мессенджером Telegram с возможностью обсуждения хода работ.
Общие требования к студентам
- Знание современной системы веб-программирования, например, React или Angular, основ операционных систем семейства Linux, а также английского языка (чтение/перевод).
4. Реализация многопоточного режима моделирования столкновения частиц эксперимента BM@N при помощи пакета Geant4.
Краткое описание представленной задачи:
Исследования, проводимые на ускорительном комплексе NICA, требуют реализации эффективных и быстроработающих алгоритмов моделирования и реконструкции событий столкновения частиц. Для проведения моделирования событий основной фреймворк BmnRoot использует пакет транспорта частиц Geant4, в последних версиях которого реализована возможность работы в многопоточном режиме для ускорения обработки. В ходе данной работы предлагается решить задачу распараллеливания моделирования событий столкновения частиц в программной среде BmnRoot за счёт многопоточного режима пакета Geant4 и сравнить производительность последовательного и нового, параллельного режима работы.
Общие требования к студентам
- Знание основ операционных систем семейства Linux, языка программирования C++, а также английского языка (чтение/перевод).
Руководитель: к.т.н. Герценбергер К. В.
Аннотация
Научно-исследовательская программа проводимого с 2015 года международного эксперимента BM@N на строящемся ускорительном комплексе класса мегасайенс NICA направлена на исследование фазовой диаграммы кварк-глюонной материи при экстремальных барионных плотностях и температурах. Данные исследования тесно связаны с астрофизикой и изучаемыми ей процессами формирования звезд. Получаемые данные по релятивистским столкновениям тяжелых ионов позволят изучить структуру плотной барионной материи, ее уравнение состояния, определить детали фазового перехода, ответить на вопросы о существовании критической точки. Важной частью систем, как работающих в режиме онлайн (во время идущего эксперимента), так и решающих задачи после него (офлайн), включая обработку и анализ полученных физических данных, являются информационные системы, построенные на современных базах данных и предлагающие различные пользовательские сервисы для прозрачного доступа и управления хранимыми данными и информацией о проводимом эксперименте. Для проведения исследований в рамках эксперимента BM@N необходима разработка и использование подобного современного программного обеспечения для хранения и предоставления на обработку данных эксперимента, а также вспомогательной информации, требуемой для проведения обработки полученных событий.
Возможные темы дипломных работ
1. Разработка решения по хранению параметрических данных эксперимента BM@N произвольной структуры в реляционной базе данных состояний эксперимента в формате JSON.
Краткое описание представленной задачи:
Одной из важных программных систем эксперимента является база данных состояний и условий работы эксперимента, направленная на хранение, обработку и использование параметров и режимов работы различных устройств и детекторов установки в онлайн и офлайн системах обработки данных эксперимента, в том числе в алгоритмах реконструкции и физического анализа событий столкновения частиц. Соответствующая информационная система решает также задачу удобного доступа и управления требуемыми параметрическими данными подсистем установки для их учета на всех этапах обработки событий столкновения частиц эксперимента. В настоящее время разработана и используется базы данных состояний на реляционной СУБД PostgreSQL, которая обеспечивает хранение параметрических данных эксперимента в бинарном виде, где их упаковка производится в C++ API в соответствии с предопределёнными правилами. Предполагается, что хранение таких данных в полях формата JSON СУБД PostgreSQL позволит повысить гибкость их сохранения, отображения и предоставления другим системам, в связи с чем в рамках данной работы необходимо реализовать программное решение по хранению параметрических данных эксперимента BM@N произвольной структуры в реляционной базе данных состояний эксперимента в формате JSON, осуществить перенос уже существующих параметрических данных в новое решение и произвести оценочное сравнение обоих решений с точки зрения размера хранимых данных и производительности работы с ними.
Общие требования к студентам
- Знание основ баз данных, SQL, основ операционных систем семейства Linux, а также английского языка (чтение/перевод).
2. Выбор и оценка эффективности применения современной NoSQL базы данных (Cassandra, MongoDB…) для хранения параметрических данных в базе данных состояний и условий работы эксперимента BM@N.
Краткое описание представленной задачи:
Одной из важных программных систем эксперимента является база данных состояний и условий работы эксперимента, направленная на хранение, обработку и использование параметров и режимов работы различных устройств и детекторов установки в онлайн и офлайн системах обработки данных эксперимента, в том числе алгоритмах реконструкции и физического анализа событий столкновения частиц. Соответствующая информационная система решает также задачу удобного доступа и управления требуемыми параметрическими данными подсистем установки для их учета на всех этапах обработки событий столкновения частиц эксперимента. В настоящее время разработана и используется базы данных состояний на реляционной СУБД PostgreSQL, однако с учётом современных тенденций и целесообразности использования NoSQL баз данных для хранения большого числа параметрических данных произвольного формата, в рамках данной работы необходимо провести исследование эффективности применения современных NoSQL решений, таких как Cassandra или MongoDB, для хранения параметрических данных эксперимента BM@N.
Общие требования к студентам
- Знание основ баз данных, SQL, основ операционных систем семейства Linux, а также английского языка (чтение/перевод).
3. Реализация системы унифицированного разворачивания информационных систем эксперимента на программной платформе Ansible.
Краткое описание представленной задачи:
Успешная, эффективная работа крупных физических экспериментов зависит от многих важных факторов, одним из которых является современное программное обеспечение. Для эксперимента BM@N в настоящее время реализован большой набор информационных систем различного назначения, таких как система электронного журналирования, конфигурационная онлайн платформа, база данных состояний и условий работы, геометрическая база данных и система метаданных событий. Эти информационные системы, помимо прочего, используются для централизованного хранения, доступа и обмена информацией для работы эксперимента и успешной, своевременной обработки его данных. Очевидно, что подобные системы востребованы и в других экспериментах физики высоких энергий, поэтому данная работа посвящена разработке единого, общего программного решения по удобному разворачиванию реализованных информационных систем как для эксперимента BM@N, так и для других экспериментов по столкновению частиц. Новое унифицированное решение должно обеспечить удобную, настраиваемую установку приведенных систем, включая её базу данных, пользовательские интерфейсы и вспомогательные сервисы, распределенно, одним запуском установочного скрипта в соответствии с заданной конфигурацией в настроечном JSON-файле. Система должна уметь разворачивать программные компоненты систем в docker-контейнерах и основываться на системе Ansible для автоматизации шагов установки.
Общие требования к студентам
- Знание языков программирования Python, C++, основ операционных систем семейства Linux, контейнеризации, а также английского языка (чтение/перевод).
4. Разработка прикладного программного интерфейса (C++ API) для базы данных состояний и условий работы эксперимента BM@N.
Краткое описание представленной задачи:
Сбор, хранение, обработка и анализ экспериментальных и смоделированных данных являются неотъемлемой частью современных экспериментов физики высоких энергий. Эти задачи приобретают особое значение в эксперименте BM@N проекта NICA в связи с высокой скоростью набора событий в секунду и большой множественностью событий столкновения частиц с мишенью, поэтому особую актуальность представляет задача автоматизации рассматриваемых процессов для комплекса NICA. Для решения этой задачи в физических экспериментах по столкновению частиц используются различные информационные системы, обеспечивающие сбор, хранение, организацию удобного, прозрачного доступа и управление информацией, необходимой для обработки и анализа полученных данных, на протяжении всего жизненного цикла научных исследований. Одной из таких информационных систем является база данных состояний и условий работы физического эксперимента, предназначенная для хранения, управления, а также поиска, отбора и использования необходимых параметров и режимов работы детекторов и систем при обработке экспериментальных и смоделированных событий столкновения частиц. Основное свойство хранимых параметрических данных заключается в том, что они меняются со временем и используются для обработки данных, собранных только в течение периода действия соответствующего параметра. Также важной особенностью базы данных состояний является то, что разработанная архитектура обеспечивает хранение параметров произвольной структуры. В рамках данной работы необходима разработка прикладного программного интерфейса на C++ для использования хранимых данных программным обеспечением эксперимента при онлайн и офлайн обработке.
Общие требования к студентам
- Знание языка программирования C++, основ операционных систем семейства Linux, а также английского языка (чтение/перевод).
5. Разработка и интеграция компонент системы метаданных событий на базе каталога физических событий эксперимента BM@N для проведения выборочного физического анализа.
Краткое описание представленной задачи:
Данная система метаданных событий предназначена для хранения и индексации событий столкновения частиц и предоставляет возможность поиска по хранимым метаданным и получения только событий, необходимых для конкретного физического анализа, в соответствии с заданными критериями. Ядром системы является база данных (называемая Каталогом событий), представляющая каталог полученных событий и включающая сводные данные о событиях столкновения частиц эксперимента BM@N (сами физические события хранятся в файлах среды ROOT), и обеспечивает запись и управление данной информацией, необходимой для поиска и отбора по различным параметрам требуемого набора событий для их дальнейшей обработки и физического анализа. Помимо информации, описывающей физические события, метаданные содержат версию программ обработки событий и уникальные ссылки на соответствующие события в файлах в распределенном хранилище. Основные компоненты системы метаданных событий реализованы, но необходима реализация вспомогательных сервисов: сервиса генерации метаданных, диспетчера выполнения запросов, сервиса сборки событий, системы мониторинга и статистики системы, сервиса кэширования.
Общие требования к студентам
- Знание языка программирования C++, основ операционных систем семейства Linux, а также английского языка (чтение/перевод).
6. Разработка и внедрение специализированного формата miniDST для хранения реконструированных данных событий эксперимента BM@N в компактном, независимом от языка программирования виде.
Краткое описание представленной задачи:
Модель обработки данных эксперимента BM@N имеет многоуровневую структуру. При обработке экспериментальных данных полученные с детекторов данные событий столкновения частиц оцифровываются и переводятся в понятный пользователям ROOTформат. Далее макрос реконструкции восстанавливает информацию о частицах, зарегистрированных детекторами, их треках и других параметрах, которая записывается в выходной файл формата DST. После чего для исследования физических свойств материи, образованной в результате столкновения тяжелых ионов с мишенью, проводится физический анализ реконструированных данных. В случае обработки модельных данных, содержащими полную информацию об образованных частицах, полученную при помощи генераторов событий, моделируется прохождение частиц через детекторы при помощи пакетов транспорта частиц, и эта информация преобразуется в отклики детекторов. На следующем шаге также реконструируются события столкновения частиц с сохранением в выходной DST формат, и производится финальный физический анализ. Однако для физического анализа зачастую используют не формат DST, содержащий максимально полную информацию о реконструированных событиях столкновения частиц, а более компактный miniDST (или nanoDST). Одной из основных целей приведения к формату miniDST и его использованию является исключение зависимости от конкретного языка программирования с целью проведения физического анализа пользователями с применением удобного им инструментария. Помимо этого при переходе к формату miniDST компактность файлов данных достигается уменьшением их размера за счет реализации различных процедур, таких как введение дополнительного отбора на первичную вершину, удаление веток дерева событий, не требующихся для физического анализа, уменьшение разрядности значений (преобразование вещественных чисел двойной точности в одинарную), удаление контрольной Монте-Карло информации и других вспомогательных действий. В данной работе предлагается провести анализ существующих решений, выбрать современный формат хранения miniDST и после его утверждения и реализации провести генерацию данных в новом формате для набранных экспериментальных и моделированных данных эксперимента BM@N, оценить эффективность перехода к новому формату.
Общие требования к студентам
- Знание языка программирования C++, основ операционных систем семейства Linux, а также английского языка (чтение/перевод).
Руководитель: к.т.н. Герценбергер К. В.
Аннотация
Для распределённой обработки данных эксперимента BM@N помимо основных вычислительных платформ для офлайн обработки, то есть после сеанса эксперимента, таких как: кластер NICA в Лаборатории физики высоких энергий и Многофункциональный информационно-вычислительный комплекс в Лаборатории информационных технологий, включающего Центральный информационно-вычислительный комплекс с центрами Tier1 и Tier2 системы GRID и гетерогенную платформу HybriLIT с суперкомпьютером Говорун, также используется онлайн кластер (онлайн-ферма) BM@N. Онлайн-ферма BM@N используется как во время сеансов эксперимента для полной реконструкции событий и физического экспресс-анализа параллельно с приёмом экспериментальных данных для контроля качества поступающих данных, так и между сеансами для массовой обработки первичных данных, реконструкции событий и физического анализа в качестве компонента единой географически-распределённой платформы обработки. В связи с постепенным увеличение потока данных и количества набираемых событий в ходе эксперимента постоянно развивается онлайн-ферма, закупаются и устанавливаются новые элементы обработки и хранения. В рамках данной работы необходимо разработать комплекс программных инструментов для оперативного расширения онлайн кластера BM@N, включая средства автоматизированного разворачивания (например, Puppet или Ansible) операционных систем и системных библиотек, необходимых для осуществления распределённой обработки событий столкновения частиц, так и программных инструментов распределения задач по узлам кластера (в настоящее время используется batch-система SLURM) и сетевых файловых систем (CephFS). Кроме того, данный комплекс должен включать программные средства поддержки работы онлайн кластера: системы мониторинга, отслеживающей критические элементы инфраструктуры и сохраняющей соответствующие параметры состояния с визуализацией на центральном сервисе и уведомлением о сбоях в работе или критических значениях параметров в Telegram-канал, на базе современных стеков, таких как Zabbix-TimescaleDB-Grafana или Telegraf-InfluxDB-Grafana.
Тема: Разработка программного обеспечения для мониторинга данных эксперимента NICA/MPD
Руководители: к.ф.-м.н. Рогачевский О.В., Крылов В.А.
Аннотация
Проект посвящён созданию программного комплекса для мониторинга данных эксперимента MPD, получаемых во время работы эксперимента на коллайдере NICA (Nuclotron-based Ion Collider fAcility) (режим online). MPD — один из ключевых мегасайенс-проектов России, который реализуется в Объединённом институте ядерных исследований (ОИЯИ, г. Дубна). Это многоцелевой детектор , предназначенный для изучения свойств барионной материи, фазового перехода адронной материи в кварк-глюонную плазму и других фундаментальных явлений в физике высоких энергий.
Для контроля и управления состоянием детектора MPD разрабатывается система мониторинга данных эксперимента в режиме online (Event Display Monitoring). Этот программный комплекс контролирует текущее состояние детектора и собирает физические данные о работе всех подсистем детектора (Quality Assurance).
Главной задачей мониторинга является создание системы быстрой обработки экспериментальных данных в режиме online при частотах до 7КГц событий в секунду.
Для решения этой задачи используется архитектура микросервисов для распределенных вычислений и параллельной обработки данных.
На данном этапе система мониторинга состоит из нескольких частей:
1. Распределенная система обработки данных эксперимента (С++, ZeroMQ, Docker, Kubernetes);
2. Оперативная база данных для хранения текущего состояния детектора и статистической информации (In-memory DB: Valkey/Redis);
3. Клиент-серверное web приложение для мониторинга полученных данных и состояния детекторов (NodeJS/Bun, React, Redux, JSRoot)
Возможные темы дипломных работ
1. Разработка клиент-серверного приложения для визуализации экспериментальных данных с использованием современных веб-технологий.
Краткое описание представленной задачи:
Бэкенд среда NodeJS с возможностью перехода на новую среду выполнения Bun. Фронтенд библиотеки — React, Redux, ThreeJS.
2. Применение архитектуры микросервисов для распределенной обработки данных эксперимента MPD в режиме онлайн на базе библиотеки ZeroMQ.
Краткое описание представленной задачи:
Использование платформы Docker для создания программных контейнеров, запуска микросервисов и контролем за их работой.
3. Разработка системы тестов для мониторинга событий эксперимента MPD.
Общие требования к студентам
- Опыт создания программ на языках программирования С++ и JavaScript.
- Общее представление о принципах работы и особенностях сетевых протоколов обмена данных: TCP/IP, UDP, WebSocket
- Английский язык (чтение/перевод).
- Плюсом является знание платформы Docker и Kubernetes, библиотеки Cern Root, а также библиотек для работы с трехмерной графикой и web интерфейсом.
Тема: Распределенная обработка данных эксперимента SPD
Руководители: к.т.н. Олейник Д.А. к.т.н. Петросян А.Ш.
Аннотация
SPD (Spin Physics Detector) это планируемый эксперимент по спиновой физике на адронном коллайдере NICA, мегасайенс-установке, которая строится в ОИЯИ (г.Дубна, Россия). Основная цель эксперимента - проверка основ квантовой хромодинамики (КХД), фундаментальной теории сильных ядерных взаимодействий, путем изучения поляризованной структуры нуклона и спиновых явлений при столкновении продольно и поперечно поляризованных протонов и дейтронов с энергией центра масс до 27 ГэВ и светимостью до 1032 см-2 с-1. Для этого будут проведены измерения зависящих от поперечного импульса партонных распределений (TMD PDF) для глюонов в таких сложных процессах, как рождение очарованных частиц, состояний чармония и прямых фотонов.
Детектор SPD проектируется как универсальный 4π-спектрометр, основанный на современных технологиях. Общее количество каналов регистрации в установке SPD составляет около 500000. С учетом ожидаемой максимальной частоты столкновений частиц в коллайдере около 3 МГц, суммарный поток данных с детектора можно оценить, как 20 ГБ/с, что эквивалентно 200 ПБ/год (для эксперимента предполагается выделить 30% пучкового времени коллайдера). Сбор, обработка и хранение такого объема данных представляет собой серьезную проблему для вычислительной инфраструктуры эксперимента и требует разработки новых методов и подходов для реконструкции событий, моделирования и физического анализа данных с использованием высокопроизводительных и распределенных вычислений. Однако в Российской Федерации отсутствует опыт построения вычислительных систем с подобной производительностью, что делает обозначенную в настоящем проекте проблему крайне актуальной.
В рамках проекта планируется развитие системы распределенной обработки данных эксперимента SPD, состоящей из набора управляющих систем, таких, как система управления данными, управления задачами и заданиями, информационная система, сервис передачи данных, а также систем хранения и вычислительных ресурсов. Система должна поддерживать различные сценарии обработки, использовать эффективно использовать многоядерные и гетерогенные вычислительные ресурсы.
Возможные темы дипломных работ
1. Поддержка и развитие облачной инфраструктуры, используемой для размещения центральных сервисов эксперимента SPD.
Краткое описание представленной задачи:
Количество виртуальных машин, занятых под различные сервисы эксперимента, приближается к 30. Все они должны быть вовремя обслужены, включая установку критических обновлений, настройку сетевых экранов, проверку на корректность функционирования установленных на них сервисов и приложений. Необходимо создать хранилище образов и наладить их ручное и, при необходимости, автоматическое создание.
В прошлом году для мониторинга инфраструктуры был развернут сервис Zabbix, в котором в настоящее время собираются метрики со всех машин, как участвующих в управлении хранением и обработкой, так и с машин системы хранения EOS. Необходимо продолжить развитие сервиса, собирать метрики, специфичные для каждого из сервисов, а не только данные о состоянии виртуальных машин и базовых метриках, таких, как состояние диска, загрузка процессора и памяти, и т.п. Для собираемых метрик необходимо создать индивидуальные представления.
2. Развитие системы управления нагрузкой PanDA.
Краткое описание представленной задачи:
Система управления нагрузкой PanDA используется в эксперименте SPD для управления вычислениями на распределенных вычислительных ресурсах. В функции системы входят подготовка вычислений, создание задач подходящего размера, подбор подходящих для выполнения задач вычислительных вычислительных центров, доставка на них полезной нагрузки, запуск и мониторинг выполнения прикладного программного обеспечения, выгрузка результатов и обработка ошибок. При необходимости система автоматически перезапускает некорректно завершившиеся задачи. PanDA имеет архитектуру, предполагающую написание плагинов и эксперимент SPD поддерживает свои реализации унаследованных от базовых классов модулей каждого компонента. Требуется разработка и поддержка специфичных для эксперимента SPD представлений и модулей системы PanDA.
3. Развитие пилотного приложения системы управления нагрузкой PanDA.
Краткое описание представленной задачи:
Пилотное приложение используется для контроля за запуском и выполнением экземпляра прикладного программного обеспечения на удаленном вычислительном узле. Пилот загружает описание задачи, готовит среду, скачивает необходимые для выполнения файлы с удаленных хранилищ, запускает полезную нагрузку, выполняет мониторинг работы приложения, обрабатывает ошибки и выгружает результаты на удаленные хранилища. Пилотное приложение имеет расширяемую архитектуру и эксперимент SPD развивает свои версии необходимых модулей. Требуется развитие приложения в преддверии миграции на новую платформу прикладного ПО Sampo.
Общие требования к студентам
- Знание операционных систем семейства Linux на уровне продвинутого пользователя, либо системного администратора.
- Опыт создания алгоритмов и практика разработки скриптов на языках программирования bash, python, docker, kubernetes.
- Английский язык (чтение/перевод), грамотный русский язык.
Тема: Система сбора данных эксперимента SPD
Руководители: Бойков А.В., к.ф.-м.н. Афанасьев Л.Г., Грицай К.И., Фролов В.Н.
Аннотация
Spin Physics Detector (SPD) — это будущий эксперимент на коллайдере NICA в ОИЯИ (Дубна, Россия). Его ключевая задача — исследование спиновых эффектов в столкновениях поляризованных протонов и дейтронов. Эти исследования позволят проверить ключевые положения теории сильных взаимодействий (КХД). В частности, ученые будут измерять, как движутся глюоны внутри нуклона, наблюдая за рождением определенных типов частиц.
Детектор SPD проектируется как современный универсальный 4π-спектрометр. Его система регистрации, насчитывающая порядка 600 тыс каналов, должна работать в условиях высокой частоты пересечения пучков, достигающей 13 МГц. Прогнозируемый поток данных с детектора составляет не менее 20 ГБ/. Сбор данных с каждого элемента детектора, является комплексной задачей. Включающей не только реализацию программных комплексов для сбора данных, но и создание аппаратных платформ, сетевой инфраструктуры и организацию систем контроля и управления.
В рамках проекта планируется реализовать, на уровне аппаратно-программных прототипов, элементы системы управления системой сбора данных эксперимента SPD.
Возможные темы дипломных работ
1. Разработка интерфейса для библиотеки обмена сообщений.
Краткое описание представленной задачи:
Библиотека разработана для межкомпьютерного и межпрограммного обмена сообщениями, используя сетевой протокол TCP/IP. Данная библиотека написана на языке C++ и имеет интерфейс для использования в программах, написанных на языке C. Необходимо разработать интерфейс для применения данной библиотеки в программах, использующих языки Python и/или JAVA. И обеспечить пропускную способность для данных разного типа и размера в различных конфигурациях.
2. Система мониторинга аппаратной составляющей системы сбора данных установки SPD.
Краткое описание представленной задачи:
Мониторинг состояния компонентов системы сбора данных, таких как система концентратов и система синхронизации. Данные элементы не поддерживают классические механизмы сообщений, и для этого планируется создать систему конвертации пакетов мониторинговых данных в формат, подходящий для агрегации в системе аккумулирования и обработки мониторинговых данных.
Общие требования к студентам
- Знание операционных систем семейства Linux.
- Английский язык (чтение/перевод), грамотный русский язык.
- Опыт разработки на языках программирования С++ и Python.