В рамках научного направления «Современные методы и технологии обработки и анализа информации» проводятся работы по следующим темам:
Тема: Машинное обучение и искусственный интеллект для решения научных и прикладных задач
Руководители: к.т.н. Ужинский А.В., д.ф.-м.н. Ососков Г.А.
Аннотация
Доступ к современные вычислительным ресурсам и профильные специалисты высокого уровня позволяют реализовывать в Лаборатории информационных технологий имени Мещерякова (МЛИТ) проекты с использованием машинного обучения в различных областях, в том числе в физике высоких энергий, сельском хозяйстве и экологическом мониторинге.
Выход результатов современных и планируемых экспериментов физики высоких энергий на режимы с большой светимостью и, соответственно на экзабайтный уровень потоков получаемых данных, требует развития методов обработки данных, получаемых с детекторов. Реализация эффективных и хорошо масштабируемых алгоритмов реконструкции событий в экспериментальных детекторах основанных на применении глубоких нейронных сетей – актуальная для ОИЯИ задача.
Искусственный интеллект применяется во многих задачах сельского хозяйства, включая обнаружение проблем, мониторинг состояния урожая, прогнозирование урожайности, прогнозирование цен, картирование урожайности, оптимизацию использования пестицидов и удобрений и многое другое. Лаборатория информационных технологий Объединенного института ядерных исследований занимается различными областями применения ИИ в сельском хозяйстве, в основном в области задач классификации в условиях малой обучающей выборки, детекции и сегментации.
Вопросы контроля загрязнения окружающей среды и экологической безопасности всегда актуальны. Несмотря на позитивную динамику, общество продолжает сталкиваться как с локальными, так и с глобальными проблемами, влияющими на жизнь и здоровье людей. Прогнозирование – важный этап экологического мониторинга, позволяющий заполнить пробелы в данных и реализовывать прогнозирование. В рамках исследований, проводимых в Лаборатории инфомрационных технологий, развивается механизм прогнозирования, основанный на применении машинного обучения совместно с данными дистанционного зондирования земли.
Возможные темы дипломных работ
- Развитие алгоритмов поиска треков-кандидатов в детекторах нейросетевыми методами и методами теории графов. (научный руководитель Ужинский А.В.)
- Развитие методов классификация изображений в условиях малой обучающей выборки. (научный руководитель Ужинский А.В.)
- Прогнозирование загрязнений на основе данных дистанционного зондирования Земли и алгоритмов машинного обучения. (научный руководитель Ужинский А.В.)
- Разработка алгоритмов для реконструкции событий в трековых детекторах физики высоких энергий. (научный руководитель Ососков Г.А.)
- Разделение и параметризация перекрывающихся сигналов на основе вейвлет-анализа и других аппроксимационных методов. (научный руководитель Ососков Г.А.)
- Разработка алгоритмов классификации изображений свёрточными нейронными сетями в задачах диагностирования заболеваний в биологии и медицине. (научный руководитель Ососков Г.А.)
- Исследование методов глубокого обучения нейросетевого классификатора в условиях сильного дисбаланса обучающей выборки. (научный руководитель Ососков Г.А.)
- Применение информационных методов анализа социальных сетей для определения структуры малых социальных групп. (научный руководитель Ососков Г.А.)
Общие требования к студентам
- Ответственность, работоспособность, мотивированность
- Знание базовых понятий принципов машинного обучений
- Представление об искусственных нейронных сетях и теории графов
- Умение программировать на Python и/или С++
- Представление о пользовании библиотеками PyTorch и NumPy.
- Знание английского языка, хотя бы на уровне беглого чтения.
Тема: Идентификация частиц в пробежной (мюонной) системе эксперимента SPD
Руководитель: к.ф.-м.н. Верхеев А.Ю.
Аннотация
В настоящее время в ОИЯИ, г. Дубна, реализуется мегасайенс проект – ускорительный комплекс NICA (Nuclotron-based Ion Collider fAcility). На базе коллайдера NICA планируется выполнение нескольких крупных экспериментов, в частности детектор SPD (Spin Physics Detector) предназначен для проведения исследований по спиновой физике при столкновении пучков протонов и ионов.
Одной из ключевой детекторной системой установки SPD является пробежная (мюонная) система, предназначенная для идентификации мюонов в широком диапазоне энергий.
Важным этапом проведения экспериментов является обработка и анализ модельных и физических данных.
Целью данной работы является изучение существующих и разработка новых алгоритмов и программ, позволяющих идентифицировать частицы в мюонной системе, используя методы машинного обучения.
Общие требования к студентам
- Знание языков программирования C++, ROOT, Python.
- Базовые навыки работы с системой контроля версий Git.
- Знание основ ОС Linux.
- Технический английский язык.
Руководитель: к.биол.н. Чижов К.А.
Аннотация
В условиях сложной геометрии основным средством прогнозирования доз внешнего облучения персонала являются программы Монте-Карло моделирования (например, Geant4). Для широкого диапазона энергий и типов частиц эти программы дают очень хорошее соответствие с реальными данными, что подтверждено многочисленными экспериментами.
При моделировании радиационной обстановки основное время занимает создание расчётной геометрии, т.е. описание реальных объектов геометрическими примитивами и задание материалов из которых они состоят. Функционал для описания геометрии в расчётных программах примитивен, оператору нужно в текстовом виде прописывать геометрию с возможностью просмотра результата в весьма ограниченном интерфейсе визуализации.
Системы автоматизированного проектирования (САПР) напротив дают весьма широкие и удобные возможности для создания и редактирования 3D-моделей. Таким образом, создание конвертера 3D-моделей из формата САПР в формат Geant4, позволит ускорить работу над созданием расчётной геометрии в несколько десятков раз.
В каждой расчётной программе своя логика описания 3D объектов - это и ограничение объекта плоскостями, и задание математической формулой и задание объекта через координаты множества точек. Таким образом, конвертер должен уметь работаться всеми этими форматами.
Цель проекта: Разработать ПО для конвертации 3д моделей, состоящих из простых примитивов, из формата файлов программ 3D моделирования в формат программ Монте-Карло моделирования (Geant4, FairRoot). Для выполнения цели проекта необходимо решить следующие задачи:
- Найти формат экспорта файлов из САПР, который было бы удобно парсить.
- Разобраться с типом данных, как задаются различные геометрические примитивы в файле 3д модели.Выделить форматы описания различных геометрических объектов.
- Разобраться с типом данных, как задаются различные геометрические примитивы в формате Geant4. Выделить форматы описания различных геометрических объектов.
- Разобраться с типом данных, как задаются различные геометрические примитивы в формате FairRoot. Выделить форматы описания различных геометрических объектов.
- Выбрать основные геометрические примитивы.
- Написать парсер и конвертер для выбранных форматов и геометрических примитивов.
Возможные темы дипломных работ
- Создание конвертера 3D-моделей из САПР в формат Geant4 для моделирования радиационной обстановки.
- Создание конвертера 3D-моделей из САПР в формат FairRoot для моделирования радиационной обстановки.
Общие требования к студентам
- Опыт создания алгоритмов и практика разработки скриптов на языках программирования С++, python.
- Знание аналитической геометрии, стереометрии.
- Опыт работы в 3D редакторах.
- Опыт работы с Xml-форматом.
- Знание операционных систем семейства Linux на уровне пользователя.
Руководитель: к.т.н. Герценбергер К. В.
Аннотация
Научно-исследовательская программа проводимого с 2015 года международного эксперимента BM@N на строящемся ускорительном комплексе класса мегасайенс NICA направлена на исследование фазовой диаграммы кварк-глюонной материи при экстремальных барионных плотностях и температурах. Данные исследования тесно связаны с астрофизикой и изучаемыми ей процессами формирования звезд. Получаемые данные по релятивистским столкновениям тяжелых ионов позволят изучить структуру плотной барионной материи, ее уравнение состояния, определить детали фазового перехода, ответить на вопросы о существовании критической точки. Для проведения исследований в рамках эксперимента BM@N необходима разработка и использование современного программного обеспечения для хранения и предоставления на обработку данных эксперимента, а также вспомогательной информации, требуемой для проведения обработки полученных событий.
Возможные темы дипломных работ
1. Реализация быстрой реконструкции событий для проведения онлайн обработки поступающих данных с использованием нейронных сетей и машинного обучения.
Краткое описание представленной задачи:
Для оценки качества происходящих событий столкновения частиц в экспериментах реализуется быстрая реконструкция событий. В отличии от обычной реконструкции быстрая должна успевать обрабатывать как можно большее количество событий в единицу времени, потому что частота событий в эксперименте BM@N достигает 15 000 событий в секунду. Для реализации быстрой реконструкции событий часто используют последние достижения в аппаратном и программном обеспечении: использование графических видеокарт, применение нейронных сетей и методов машинного обучения, которые хорошо распараллеливаются. Реализованное решение по быстрой реконструкции будет предшествовать монитору событий для визуального представления текущих событий идущего эксперимента.
Общие требования к студентам
- Знание основ баз данных, SQL, основ операционных систем семейства Linux, а также английского языка (чтение/перевод).
Тема: Многоагентные и рекомендательные системы по научным направлениям ОИЯИ
Руководители: к.т.н. Артамонов А.А.
Аннотация
Существенное увеличение объемов научно-технической информации приводит к необходимости реализации задач доступа и доставки релевантной информации научному сотруднику. Необходимо разработать эффективные алгоритмы и программные средства выделения физических, математических величин, сложных объектов (технология, эксперимент) из текстовой информации, реализовать эффективные самообучающиеся модели классификации потока неструктурированной информации для научного сотрудника, на основе его предпочтений. Отдельной важной научно-технической задачей является разработка динамических визуальных представлений для оперативной навигации в собранных данных.
Возможные темы дипломных работ
- Разработка методов и программных средств автоматизированного сбора информации о научных публикациях и патентных исследованиях
- Методы графовой и визуальной аналитики для выявления тенденций в научных исследованиях.
- Разработка методов и программных средств на основе машинного обучения для рекомендательной системы подбора материалов по научным направлениям ОИЯИ.
Общие требования к студентам
- Знание языка программирования Python.
- Знание основ БД.