Методы и технологии обработки и анализа информации

В рамках научного направления «Современные методы и технологии обработки и анализа информации» проводятся работы по следующим темам:

 


Тема: Машинное обучение и искусственный интеллект для решения прикладных и научных задач

Руководители:  к.т.н. Ужинский А.В., д.ф.-м.н. Ососков Г.А.

Аннотация

Наличие опытных специалистов в области нейронных сетей, машинного обучения и современные вычислительные ресурсы делают Лабораторию информационных технологий имени Мещерякова (МЛИТ) привлекательной для реализации проектов в различных областях, в том числе в физике высоких энергий, сельском хозяйстве или экологическом мониторинге.

С выходом результатов современных и планируемых экспериментов физики высоких энергий (ФВЭ) на режимы с большой светимостью и, соответственно на экзабайтный уровень потоков получаемых данных,  неизбежно потребуется новый подход к методам их обработки, который должен обеспечить реализацию эффективных и хорошо масштабируемых алгоритмов реконструкции событий в экспериментальных детекторах, а также моделирования этих событий с учетом всех условий экспериментов. Подобные подходы разрабатываются на основе методов машинного обучения, использующих аппарат глубоких нейронных сетей.

По прогнозам Продовольственной и сельскохозяйственной организации ООН (Food and Agriculture Organization, FAO) население Земли к 2050 превысит 9 миллиардов человек. Чтобы его прокормить потребуется увеличить производство продуктов питания на 70 процентов. В тоже время основным трендом в сельском хозяйстве является отток кадров. Так в Евросоюзе за последнее десятилетие количество работников сельского хозяйство сократилось на треть, а более половины компаний считают нехватку персонала своей основной проблемой. Эти факторы, среди прочего, привели к повышенному интересу к передовым технологиям в сельском хозяйстве, таким как интернет вещей, датчики, роботы, дроны, цифровизация и искусственный интеллект. Искусственный интеллект (ИИ) и машинное обучение оказались полезными для многих задач в сельском хозяйстве, включая обнаружение проблем, мониторинг состояния урожая, прогнозирование урожайности, прогнозирование цен, картирование урожайности, оптимизацию использования пестицидов и удобрений и многое другое. Лаборатория информационных технологий Объединенного института ядерных исследований занимается различными областями применения ИИ в сельском хозяйстве, в основном в области задач классификации, детекции и сегментации.

Вопросы контроля загрязнения окружающей среды и экологической безопасности всегда актуальны. Несмотря на позитивную динамику, общество продолжает сталкиваться как с локальными, так и с глобальными проблемами, влияющими на жизнь и здоровье людей. По данным всемирной организации здравоохранения около 7 миллионов человек ежегодно умирают из-за проблем, связанных с загрязнением воздуха. Для контроля и мониторинга окружающей среды создаются различные государственные и международные программы. Как правильно исследования строятся на данных, получаемых в точках сбора образцов в ручном режиме или с помощью тех или иных датчиков и приборов. Собранный материал анализируется с использованием различных техник на местах или в специальных лабораториях. Затем данные объединяются и интерпретируются, причем достаточно часто результаты неоднозначны и требуют привлечения экспертов. Прогнозирование – важный этап экологического мониторинга, позволяющий заполнить пробелы в данных. В рамках исследования развивается механизм прогнозирования, основанный на применении машинного обучения совместно с данными дистанционного зондирования земли.

Некоторые наработки из реализованных проектов можно применять и для решения практических задач в различных областях.

Возможные темы дипломных работ

  1. Развитие алгоритмов поиска треков-кандидатов в детекторах нейросетевыми методами и методами теории графов.
  2. Классификация изображений для решения задач распознавание болезней растений
  3. Отслеживание объектов и сегментация для решения задач распознавания болезней растений и прочих нужд сельского хозяйства
  4. Прогнозирование загрязнения воздуха на основе данных дистанционного зондирования Земли и алгоритмов машинного обучения.
  5. Разработка решений для сферы интеллектуальных ресторанов и систем самообслуживания

Общие требования к студентам

  • Ответственность, работоспособность, мотивированность
  • Знание языка программирования Python
  • Знание базовых понятий принципов машинного обучений и нейронных сетей

 


Тема: Идентификация частиц в пробежной (мюонной) системе эксперимента SPD

Руководитель: к.ф.-м.н. Верхеев А.Ю.

Аннотация

В настоящее время в ОИЯИ, г. Дубна, реализуется мегасайенс проект – ускорительный комплекс NICA (Nuclotron-based Ion Collider fAcility). На базе коллайдера NICA планируется выполнение нескольких крупных экспериментов, в частности детектор SPD (Spin Physics Detector) предназначен для проведения исследований по спиновой физике при столкновении пучков протонов и ионов.

Одной из ключевой детекторной системой установки SPD является пробежная (мюонная) система, предназначенная для идентификации мюонов в широком диапазоне энергий.

Важным этапом проведения экспериментов является обработка и анализ модельных и физических данных.

Целью данной работы является изучение существующих и разработка новых алгоритмов и программ, позволяющих идентифицировать частицы в мюонной системе, используя методы машинного обучения.

Общие требования к студентам

  • Знание языков программирования C++, ROOT, Python.
  • Базовые навыки работы с системой контроля версий Git.
  • Знание основ ОС Linux.
  • Технический английский язык.

 


Тема: Изучение возможностей установки  MPD (NICA) в режиме работы c фиксированной мишенью

Руководители: к.ф.-м.н. Тараненко А.В., Парфенов П.Е.

Аннотация

Многоцелевой детектор MPD (Multi Purpose Detector) на  коллайдере NICA (ОИЯИ , г.Дубна), готовиться  своему первому эксперименту в 2025 году. Основная цель эксперимента – изучение свойств сильновзаимодействующей материи при больших барионных плотностях и умеренных температурах с помощью  столкновений релятивистских тяжелых ионов в диапазоне энергий 4-11 ГэВ. Анизотропные коллективные потоки адронов являются одними из наблюдаемых, чувствительных к состоянию материи образующейся в процессе ядро-ядерных столкновений  на ранних этапах ее эволюции.

Установка MPD представляет собой 4π-спектрометр, способный хорошо детектировать заряженные адроны, электроны и фотоны в ядро-ядерных столкновениях. Для этого, MPD включает в себя время-проекционную камеру TPC, позволяющую определять траектории заряженных адронов и электронов в магнитном поле, детектором времени пролета TOF, с помощью которого можно измерить время пролета частиц, электромагнитный калориметр ECAL и передний адронный калориметр FHCal, позволяющий измерять энергии электронов и адронов.

Целью данной работы является изучение возможностей установки MPD для измерения анизотропных коллективных потоков адронов. Под этим подразумевается комплекс работ по измерению потоков адронов, используя реалистично реконструированные модельные данные, изучение различных методов  коррекций для учета эффектов акцептанса и эффективности различных детекторных подсистем. Алгоритмы и программы, разработанные в ходе данной работы будут внедрены в программный пакет MPDRoot для анализа данных эксперимента MPD.

Возможные темы дипломных работ

  1. Изучение эффективности детектирующих способностей установки MPD в режиме работы с фиксированной мишенью для измерения анизотропных потоков заряженных адронов.

Общие требования к студентам

  • Базовое знание языка программирования C++, ROOT.
  • Базовые навыки работы с системой контроля версий Git.
  • Знание основ статистического анализа.
  • Базовое знание ОС Linux.

 


Тема: Изучение возможностей измерения азимутальных коллективных потоков в эксперименте BM@N

Руководители: к.ф.-м.н. Тараненко А.В.,  Мамаев М.В.

Аннотация

BM@N (Baryonic Matter at Nuclotron) — это спектрометр, работающий на выведенном пучке ускорителя Нуклотрон в Объединенном Институте ядерных исследований в Дубне. В столкновениях тяжелых ионов при энергиях, достигаемых на Нуклотроне, создается сильно взаимодействующая материя при плотностях до 5 раз превышающих плотность нормальной ядерной материи. Изучение уравнение состояния такой материи является ключевой задачей установки BM@N. В нецентральных столкновениях ядер пространственная асимметрия области перекрытия эволюционирует в импульсную анизотропию рожденных адронов. Величина анизотропии рожденных частиц зависит от свойств материи образованной в области перекрытия во время столкновения. Таким образом, азимутальные потоки — численная оценка этой анизотропии — являются важной наблюдаемым инструментов для определения уравнения состояния сильно взаимодействующей материи.

Установка BM@N задумана как эксперимент с фиксированной мишенью и предназначена для регистрации заряженных адронов и лёгких ядер в широком диапазоне псевдобыстрот. Спектрометр оснащен трекинговой системой, расположенной в магнитном поле для измерения импульса заряженных частиц, времяпролетной системой TOF для их идентификации и системой регистрации фрагментов налетающего ядра (FHCal, ScWall, Quartz Hodoscope).

Целью данного проекта является изучение возможностей измерения азимутальных потоков адронов в эксперименте BM@N. Это подразумевает ряд работ по измерению азимутальных потоков используя реальные экспериментальные данные, которые  BM@N набрал в 2022-2023 годах и результаты анализа модельных данных, изучению влияния геометрии детектора и алгоритмов трекинга на результаты измерений. Алгоритмы и программы, разработанные в ходе данной работы будут внедрены в программный пакет BMNRoot – для анализа данных эксперимента BM@N.

Возможные темы дипломных работ

  1. Изучение возможности измерения потоков легких адронов в эксперименте BM@N
  2. Изучение возможности измерения потоков лёгких ядер в эксперименте BM@N

Общие требования к студентам

  • Знание основ языка программирования C++, ROOT.
  • Базовые навыки работы с системой контроля версий Git.
  • Знание основ Линукс.
  • Навыки в проектировании программного обеспечения.

 


Тема: Многоагентные и рекомендательные системы по научным направлениям ОИЯИ

Руководители: к.т.н. Артамонов А.А.

Аннотация

Существенное увеличение объемов научно-технической информации приводит к необходимости реализации задач доступа и доставки релевантной информации научному сотруднику. Необходимо разработать эффективные алгоритмы и программные средства выделения физических, математических величин, сложных объектов (технология, эксперимент) из текстовой информации, реализовать эффективные самообучающиеся модели классификации потока неструктурированной информации для научного сотрудника, на основе его предпочтений. Отдельной важной научно-технической задачей является разработка динамических визуальных представлений для оперативной навигации в собранных данных.

Возможные темы дипломных работ

  1. Разработка методов и программных средств автоматизированного сбора информации о научных публикациях и патентных исследованиях
  2. Методы графовой и визуальной аналитики для выявления тенденций в научных исследованиях.
  3. Разработка методов и программных средств на основе машинного обучения для рекомендательной системы подбора материалов по научным направлениям ОИЯИ.

Общие требования к студентам

  • Знание языка программирования Python.
  • Знание основ БД.

 


Тема: Математические методы и алгоритмы для трекинга мега-сайнс экспериментов ФВЭ

Руководитель: к.ф.-м.н. Войтишин Н.Н., д.ф.-м.н. Шматов С.В.

Аннотация

Физика элементарных частиц (ФЭЧ) изучает фундаментальные свойства материи и пытается объяснить структуру и свойства элементарных частиц, закономерности их рождения и уничтожения и дать ответы на многие другие вопросы, возникающие при попытках понять происхождение Вселенной.

Современные эксперименты ФВЭ характеризуются высокой частотой соударений, большой множественностью и плотностью заряженных частиц, а также сложной структурой детекторов и наличием массивных слоев вещества. Поэтому для измерения характеристик элементарных частиц необходимы быстрые и эффективные алгоритмы и комплексы программ, устойчивые к «зашумлению» траекторий частиц и высокому уровню загрузок в детекторах.

Реконструкция траекторий заряженных частиц (далее «трекинг») является одним из ключевых этапов в процессе полной реконструкции физических событий. Она направлена на оценку импульсов частиц, их идентификации и восстановлении точки взаимодействия. Эта задача является чрезвычайно сложной, учитывая большую множественность частиц, возникающих при каждом соударении, будь то встречных пучков в точках взаимодействия или пучка с фиксированной мишенью.

Группа участвует во многих экспериментах ФВЭ и имеет большой опыт по разработке и адаптации различных методов и алгоритмов трекинга.

Целью предлагаемых задач является изучение существующих и разработка новых алгоритмов и программ, позволяющих восстановить траектории регистрируемых частиц в трековых детекторах различных экспериментов на ускорительных комплексах БАК и НИКА, в том числе используя методы машинного обучения.

Возможные темы дипломных работ

  1. Восстановление траектории детектируемых частиц в эксперименте SPD на комплексе НИКА.
  2. Применение дискретного подходов вейвлет-анализа для разделения перекрывающихся сигналов от пролетевших частиц на слое катодно-стриповых камер (КСК) мюонной системы эксперимента CMS на Большом адронном коллайдере.
  3. Оптимизация на наборах данных 2022-2023 гг. алгоритмов локальной реконструкции треков в дрейфовых камерах DCH и CSC эксперимента BM@N, их сшивка с сцинтилляционными детекторами для глобальной реконструкции и идентификации частиц, юстировка детекторов и оценка параметров их работы.
  4. Автоматизация получения передаточной функции для восстановления траектории в DCH детекторах эксперимента BM@N на НИКА.

Общие требования к студентам

  • Знание языков программирования C++
  • Желательно, но необязательно - ROOT, Python.
  • Базовые навыки работы с системой контроля версий Git.
  • Знание основ ОС Linux.
  • Технический английский язык