В рамках научного направления «Современные методы и технологии обработки и анализа информации» проводятся работы по следующим темам:
Тема: Машинное обучение и искусственный интеллект для решения научных и прикладных задач
Руководители: к.т.н. Ужинский А.В., д.ф.-м.н. Ососков Г.А.
Аннотация
Доступ к современные вычислительным ресурсам и профильные специалисты высокого уровня позволяют реализовывать в Лаборатории информационных технологий имени Мещерякова (МЛИТ) проекты с использованием машинного обучения в различных областях, в том числе в физике высоких энергий, сельском хозяйстве и экологическом мониторинге.
Выход результатов современных и планируемых экспериментов физики высоких энергий на режимы с большой светимостью и, соответственно на экзабайтный уровень потоков получаемых данных, требует развития методов обработки данных, получаемых с детекторов. Реализация эффективных и хорошо масштабируемых алгоритмов реконструкции событий в экспериментальных детекторах основанных на применении глубоких нейронных сетей – актуальная для ОИЯИ задача.
Искусственный интеллект применяется во многих задачах сельского хозяйства, включая обнаружение проблем, мониторинг состояния урожая, прогнозирование урожайности, прогнозирование цен, картирование урожайности, оптимизацию использования пестицидов и удобрений и многое другое. Лаборатория информационных технологий Объединенного института ядерных исследований занимается различными областями применения ИИ в сельском хозяйстве, в основном в области задач классификации в условиях малой обучающей выборки, детекции и сегментации.
Вопросы контроля загрязнения окружающей среды и экологической безопасности всегда актуальны. Несмотря на позитивную динамику, общество продолжает сталкиваться как с локальными, так и с глобальными проблемами, влияющими на жизнь и здоровье людей. Прогнозирование – важный этап экологического мониторинга, позволяющий заполнить пробелы в данных и реализовывать прогнозирование. В рамках исследований, проводимых в Лаборатории инфомрационных технологий, развивается механизм прогнозирования, основанный на применении машинного обучения совместно с данными дистанционного зондирования земли.
Возможные темы дипломных работ
- Развитие алгоритмов поиска треков-кандидатов в детекторах нейросетевыми методами и методами теории графов. (научный руководитель Ужинский А.В.)
- Развитие методов классификации изображений в условиях малой обучающей выборки. (научный руководитель Ужинский А.В.)
- Прогнозирование загрязнений на основе данных дистанционного зондирования Земли и алгоритмов машинного обучения. (научный руководитель Ужинский А.В.)
- Разработка алгоритмов для реконструкции событий в трековых детекторах физики высоких энергий. (научный руководитель Ососков Г.А.)
- Разделение и параметризация перекрывающихся сигналов на основе вейвлет-анализа и других аппроксимационных методов. (научный руководитель Ососков Г.А.)
- Разработка алгоритмов классификации изображений свёрточными нейронными сетями в задачах диагностирования заболеваний в биологии и медицине. (научный руководитель Ососков Г.А.)
- Исследование методов глубокого обучения нейросетевого классификатора в условиях сильного дисбаланса обучающей выборки. (научный руководитель Ососков Г.А.)
- Применение информационных методов анализа социальных сетей для определения структуры малых социальных групп. (научный руководитель Ососков Г.А.)
Общие требования к студентам
- Ответственность, работоспособность, мотивированность
- Знание базовых понятий принципов машинного обучений
- Представление об искусственных нейронных сетях и теории графов
- Умение программировать на Python и/или С++
- Представление о пользовании библиотеками PyTorch и NumPy.
- Знание английского языка, хотя бы на уровне беглого чтения.
Руководитель: к.б.н. Чижов К.А.
Аннотация
Радиационный мониторинг на рабочих местах за защитой ускорителей осуществляется с помощью многошарового спектрометра Боннера, который позволяет детектировать нейтроны в широком диапазоне энергий. Показания спектрометра связаны со спектром через систему интегральных уравнений Фредгольма 1-го рода, и с математической точки зрения задача восстановления спектра по результатам нескольких измерений является некорректно поставленной, поскольку допускает множество решений из-за ограниченного количества шаров-замедлителей и погрешности в исходных данных.
В проекте предлагается решить данную задачу параметрическими, эволюционными и итерационными алгоритмами, роем частиц, максимизацией ожидания максимального правдоподобия, Байесовской оптимизацией. А также методами машинного обучения. Далее построить гибридную модель, состоящую из нескольких алгоритмов для получения наиболее точного решения и реализовать её как веб-приложение.
Результаты работы будут применены при оценке радиационной обстановки на базовых установках ОИЯИ.
Возможные темы дипломных работ
- Разработка и реализация веб-приложения для восстановления спектров нейтронов.
- Реализация комбинированного алгоритма восстановления спектра нейтронов.
- Реализация параметрического алгоритма восстановления спектра нейтронов по показаниям спектрометра Боннера.
- Реализация алгоритма, основанного на рое частиц, для восстановления спектра нейтронов по показаниям спектрометра Боннера.
- Реализация алгоритма, основанного на байесовской оптимизации, для восстановления спектра нейтронов по показаниям спектрометра Боннера.
- Реализация эволюционного алгоритма для восстановления спектра нейтронов по показаниям спектрометра Боннера.
- Реализация алгоритма, основанного на максимизации ожидания максимального правдоподобия, для восстановления спектра нейтронов по показаниям спектрометра Боннера.
- Реализация моделей глубокого обучения в комбинации с итерационными алгоритмами для восстановления спектра нейтронов.
Общие требования к студентам
- Хорошая математическая подготовка.
- Опыт программирования на языке программирования python.
- Английский язык (чтение/перевод), грамотный русский язык.
Руководитель: к.т.н. Герценбергер К. В.
Аннотация
Научно-исследовательская программа проводимого с 2015 года международного эксперимента BM@N на строящемся ускорительном комплексе класса мегасайенс NICA направлена на исследование фазовой диаграммы кварк-глюонной материи при экстремальных барионных плотностях и температурах. Данные исследования тесно связаны с астрофизикой и изучаемыми ей процессами формирования звезд. Получаемые данные по релятивистским столкновениям тяжелых ионов позволят изучить структуру плотной барионной материи, ее уравнение состояния, определить детали фазового перехода, ответить на вопросы о существовании критической точки. Для проведения исследований в рамках эксперимента BM@N необходима разработка и использование современного программного обеспечения для обработки данных эксперимента.
Возможные темы дипломных работ
1. Разработка и реализация алгоритма быстрой реконструкции треков частиц, образованных в результате столкновения пучка с фиксированной мишенью эксперимента BM@N, с использованием нейронных сетей и машинного обучения.
Краткое описание представленной задачи:
Для оценки качества происходящих во время сеанса эксперимента событий столкновения частиц реализуется быстрая реконструкция событий, то есть восстановление информации о частицах, родившихся в результате столкновения пучка с мишенью, их треках и других параметрах. В отличии от обычной реконструкции быстрая должна успевать обрабатывать как можно большее количество событий в единицу времени, потому что частота событий в эксперименте BM@N составляет порядка 4 000 событий в секунду, и в дальнейшем планируется её увеличение. Для реализации быстрой реконструкции событий часто используют последние достижения в аппаратном и программном обеспечении, например, использование графических видеокарт, применение нейронных сетей и методов машинного обучения, которые хорошо распараллеливаются. В данной работе необходимо разработать и реализовать в составе программного фреймворка BmnRoot алгоритм быстрой реконструкции треков частиц для проведения онлайн обработки поступающих данных с использованием нейронных сетей и машинного обучения/ Реализованное решение по быстрой реконструкции будет предшествовать монитору событий для визуального представления текущих событий столкновения частиц идущего эксперимента BM@N.
Общие требования к студентам
- Знание основ операционных систем семейства Linux, базовые знания методов машинного обучения и нейросетевых подходов, а также английского языка (чтение/перевод).
2. Реализация трекинга частиц эксперимента BM@N с использованием существующего пакета ACTS, разрабатываемого в ЦЕРНе на базе методов машинного обучения.
Краткое описание представленной задачи:
Для оценки качества происходящих событий столкновения частиц в экспериментах реализуется быстрая реконструкция событий (восстановление информации о частицах, родившихся в результате столкновения пучка с мишенью, их треках и других параметрах). Одним из наиболее нетривиальных и времязатратных этапов является реконструкция треков частиц, образованных в результате столкновения. Для реализации данного этапа предлагается внедрить пакет ACTS, разработанный и уже активно используемый в экспериментах на БАК, в основной фреймворк эксперимента BmnRoot. Помимо реконструкции треков в ходе данной работы необходимо будет провести сопоставление локальных (внутри отдельных детекторных систем) сегментов трека с хитами других детекторов с учетом магнитного поля и среды. В результате работы проводится сравнение производительности и эффективности реконструкции треков новым подходом с уже использующимся методом на клеточных автоматах.
Общие требования к студентам
- Знание языка программирования C++, основ операционных систем семейства Linux, а также английского языка (чтение/перевод).
3. Разработка и реализация метода быстрого моделирования лавин в газоэлектронных умножителях (детекторы GEM) и адронном калориметре FHCal с использованием нейронных сетей и машинного обучения.
Краткое описание представленной задачи:
В современных физических экспериментах по столкновению частиц обработка получаемых экспериментальных данных огромного объёма зачастую занимает меньшее время, чем проведение моделирования этих же исследуемых процессов для сравнения полученных в результате эксперимента результатов с различными физическими моделями. Одним из таких процессов, очень затратных по времени и требующих большой вычислительной мощности, является моделирование лавин в калориметрах. В экспериментах на БАК было показано, что использование современных методов машинного обучения и нейронных сетей, например, генеративных сетей GANs, обученных на модельных данных, позволяет существенно сократить время моделирования данных процессов и снизить требования к используемым вычислительным мощностям. В настоящее время в эксперименте BM@N моделирование лавин происходит путем обработки каждого рожденного электрона в объемах GEM детекторов. в связи с чем необходимо провести изучение и внедрение соответствующих методов для быстрого моделирования лавин частиц как в газо-электронных умножителях GEM, так и переднем адронном калориметре FHCal. В результате необходимо будет провести сравнение сгенерированных откликов с откликами, полученными полным, медленным моделированием на традиционном подходе.
Общие требования к студентам
- Знание основ операционных систем семейства Linux, базовые знания методов машинного обучения и нейросетевых подходов, а также английского языка (чтение/перевод).
Тема: Многоагентные и рекомендательные системы по научным направлениям ОИЯИ
Руководители: к.т.н. Артамонов А.А.
Аннотация
Современный рост объёмов научно-технической информации требует эффективных решений для обеспечения доступа к ней и доставки релевантных данных научным сотрудникам. Для эффективной обработки и анализа больших объёмов информации необходимо разработка специализированных инструментов, способных собирать, систематизировать и визуализировать данные, что позволит выделять значимую информацию, выявлять закономерности и взаимосвязи, для решения научно-технологических и аналитических задач. Отдельной важной научно-технической задачей является разработка динамических визуальных представлений для оперативной навигации в собранных данных.
Возможные темы дипломных работ
- Исследование и разработка методов построения динамических графов (учет временных характеристик и прогнозирование методами машинного обучения). Решение аналитических задач на основе графовых представлений. Вычисление характеристик графов, кластеризация сегментов графов. Применение методов кластеризации объектов графового представления для решения прикладных задач. (Учет изменения входных данных во времени, построение графов с поддержкой временной шкалы и анимации структурных изменений, разработка интерактивной визуальной системы отслеживания изменений.)
- Построение многослойных карт.
- Исследование производительности инструментов оркестрации.
- Исследование методов promt-engineering для автоматизированного формирования обзора литературы, сравнения заданных пользователем объектов.
- Разработка методов и программных средств автоматизированного сбора научно-технической информации.
- Разработка методов и программных средств на основе машинного обучения для рекомендательной системы подбора материалов по научным направлениям ОИЯИ.
- Исследование и разработка представлений на карте в решении задачи линейного программирования.
Общие требования к студентам
- Знание языка программирования Python.
- Знание основ БД.
Руководители: к.ф.-м.н. Зинатулина Д.Р., к.ф.-м.н. Сушенок Е.О.
Аннотация
Проект MONUMENT (Muon Ordinary capture for the NUclear Matrix elemENTs) ставит перед собой задачу экспериментального изучения процесса мюонного захвата атомными ядрами. В эксперименте измеряются величины, характеризующие процесс, такие как полные и парциальные скорости захвата. Значения этих величин определяются в ходе анализа временной зависимости числа фотонов, испускаемых при γ-распаде возбуждённых состояний ядер, которые образуются после поглощения остановившегося мюона ядром-мишенью.
В эксперименте используются современные решения прецизионной ядерной гамма-спектроскопии. Это позволяет получить результат с высокой степенью точности, но может потребовать имплементации сложных схем анализа данных. Так, в случае тяжёлых нейтронно-избыточных ядер решение задачи идентификации продуктов реакции мюонного захвата осложняется присутствием большого числа спектральных линий, которые образуют сложную форму спектра, характерную детекторам из высоко чистого германия (HPGe). Их разделение и последующее определение интенсивности требует применения широкого набора инструментов статистического анализа, включающие методы удаления шума из сигнала, методы нелинейной регрессии, проверки статистических гипотез. Данная процедура может быть реализована с использованием профессиональных программных пакетов, поддерживающих автоматизацию повторяющихся задач (скриптовую обработку).
Возможные темы дипломных работ
- Анализ формы спектра HPGe-детектора. Идентификация спектральных линий продуктов ядерного мюонного захвата. Программная реализация.
Общие требования к студентам
- Базовое знание операционных систем семейства Linux.
- Базовые навыки работы с ПО ROOT Cern.
- Опыт написания программ (C++, Python или скриптовые языки).
- Базовые знания ядерной физики и математической статистики. Знание устройства германиевого детектора или опыт работы с ним приветствуется.
- Английский язык (чтение/перевод).