Поддержка и развитие МИВК ОИЯИ

В рамках научного направления «Поддержка и развитие Многофункционального информационно-вычислительного комплекса (МИВК) ОИЯИ» проводятся работы по следующим темам:

 


Тема: Разработка и внедрение новых систем сбора и анализа статистики использования вычислительных ресурсов и прикладного программного обеспечения гетерогенной платформы "HybriLIT"

Руководители:  к.ф.-м.н. Подгайный Д.В., к.ф.-м.н. Стрельцова О.И., Зуев М.И., Беляков Д.В., Матвеев М.А., Кокорев А.А., Любимова М.А.

Аннотация

Гетерогенная платформа «HybriLIT» является частью Многофункционального информационно-вычислительного комплекса Лаборатории информационных технологий имени Мещерякова М.Г. (МИВК ЛИТ). Платформа состоит из суперкомпьютера «Говорун» и учебно-тестового полигона «HybriLIT», предназначенных для выполнения параллельных вычислений с использованием CPU и GPU ресурсов.

Доступ к платформе предоставляется авторизованным пользователям в интерактивном режиме с помощью пользовательских интерфейсов, которые построены на основе пула виртуальных машин и прокси-сервера HaProxy. Для управления вычислительными очередями на платформе применяется менеджер ресурсов SLURM. Для пользователей доступы различные очереди с CPU и GPU ресурсами, для выделенных пользователей также доступны очереди, состоящие из вычислительных узлов с большой оперативной памятью (2 TB).

На платформе применяется многоуровневая система хранения и обработки данных с разными скоростями доступа, построенная на основе файловых систем NFS/ZFS и Lustre, что обеспечивает высокую скорость чтения и записи данных при выполнении счётных задач, а также упрощает копирование выходных данных на другие вычислительные ресурсы ОИЯИ.

Для распространения прикладного программного обеспечения (ПО) используется файловая система CernVM File System (CVMFS), сервис Squid и пакет Environment Modules. Применение данных технологий не только упрощает процессы администрирования, связанные со сборкой из исходных файлов, установкой и обновлением прикладного ПО, но и также даёт возможность пользователям выбирать разные варианты сборок прикладного ПО с различными настройками компиляторов и используемых библиотек. Кроме этого, преимуществом данного подхода является возможность подключения и смены необходимого прикладного ПО как в ходе интерактивного сеанса пользователя, так и в пакетных файлах для менеджера ресурсов SLURM.

В составе платформы представлен сегмент для ML/DL, построенный на основе нескольких серверов и программного пакета JupyterHub, позволяющий выполнять быстрое прототипирование программ на языке программирования Python с использованием различных библиотек.

Предлагаемые темы дипломных работ связаны с разработкой и внедрением системного программного обеспечения, направленного на развитие функционала гетерогенной платформы «HybriLIT».  Выполнение дипломных работ будет осуществляться под руководством сотрудников рабочей группы «HybriLIT» — Подгайным Д.В., Стрельцовой О.И., Зуевым М.И., Беляковым Д.В., Матвеевым М.А., Кокоревым А.А., Любимовой М.А.

Возможные темы дипломных работ

  1. Система сбора и анализа в режиме онлайн сетевого трафика вычислительных узлов гетерогенной платформы "HybriLIT".
  2. Система контроля за выполнением счётных задач на гетерогенной платформе "HybriLIT" на основе телеграм-бота.
  3. Федерация вычислительных кластеров с использованием менеджера ресурсов SLURM и распределённой файловой системы Lustre.
  4. Автоматизация процессов установки прикладного программного обеспечения по запросу пользователей на ресурсы гетерогенной платформы "HybriLIT".
  5. Система мониторинга используемого прикладного программного обеспечения платформы на гетерогенной платформе "HybriLIT".

Общие требования к студентам

  • знание операционных систем семейства Linux (предпочтительно RedHat) на уровне продвинутого пользователя, либо системного администратора;
  • опыт создания алгоритмов и практика разработки скриптов на языках программирования bash, python;
  • английский язык (чтение/перевод), грамотный русский язык

 


Тема: МИВК: T1/T2/СХД

Руководители: Мицын В.В., Голунов А.О., Кашунин И.А.

Возможные темы дипломных работ

  1. Настройка, тестирование и поддержка системы сверхбольшого хранилища данных - EOS.
  2. Настройка, тестирование и поддержка системы пакетной обработки задач - SLURM.
  3. Настройка, тестирование и поддержка системы долговременного хранения и доступа к данным на ленточных роботах - CTA.

 


Тема: Инженерная система МИВК

Руководители: Гаврилов С.В., Воронцов А.C., Полежаев Д.С., Гавриш А.П., Паржицкий C.C.

Возможные темы дипломных работ

  1. Развитие и поддержка вычислительной сети ОИЯИ, Дисковых и вычислительных серверов МИВК, Силовых электро-установок ЛИТ, Систем холодо и климат контроля МИВК.