В рамках научного направления «Поддержка и развитие Многофункционального информационно-вычислительного комплекса (МИВК) ОИЯИ» проводятся работы по следующим темам:
Руководители: к.ф.-м.н. Подгайный Д.В., к.ф.-м.н. Стрельцова О.И., Зуев М.И., Беляков Д.В., Матвеев М.А., Кокорев А.А., Любимова М.А.
Аннотация
Гетерогенная платформа «HybriLIT» является частью Многофункционального информационно-вычислительного комплекса Лаборатории информационных технологий имени Мещерякова М.Г. (МИВК ЛИТ). Платформа состоит из суперкомпьютера «Говорун» и учебно-тестового полигона «HybriLIT», предназначенных для выполнения параллельных вычислений с использованием CPU и GPU ресурсов.
Доступ к платформе предоставляется авторизованным пользователям в интерактивном режиме с помощью пользовательских интерфейсов, которые построены на основе пула виртуальных машин и прокси-сервера HaProxy. Для управления вычислительными очередями на платформе применяется менеджер ресурсов SLURM. Для пользователей доступы различные очереди с CPU и GPU ресурсами, для выделенных пользователей также доступны очереди, состоящие из вычислительных узлов с большой оперативной памятью (2 TB).
На платформе применяется многоуровневая система хранения и обработки данных с разными скоростями доступа, построенная на основе файловых систем NFS/ZFS и Lustre, что обеспечивает высокую скорость чтения и записи данных при выполнении счётных задач, а также упрощает копирование выходных данных на другие вычислительные ресурсы ОИЯИ.
Для распространения прикладного программного обеспечения (ПО) используется файловая система CernVM File System (CVMFS), сервис Squid и пакет Environment Modules. Применение данных технологий не только упрощает процессы администрирования, связанные со сборкой из исходных файлов, установкой и обновлением прикладного ПО, но и также даёт возможность пользователям выбирать разные варианты сборок прикладного ПО с различными настройками компиляторов и используемых библиотек. Кроме этого, преимуществом данного подхода является возможность подключения и смены необходимого прикладного ПО как в ходе интерактивного сеанса пользователя, так и в пакетных файлах для менеджера ресурсов SLURM.
В составе платформы представлен сегмент для ML/DL, построенный на основе нескольких серверов и программного пакета JupyterHub, позволяющий выполнять быстрое прототипирование программ на языке программирования Python с использованием различных библиотек.
Предлагаемые темы дипломных работ связаны с разработкой и внедрением системного программного обеспечения, направленного на развитие функционала гетерогенной платформы «HybriLIT». Выполнение дипломных работ будет осуществляться под руководством сотрудников рабочей группы «HybriLIT» — Подгайным Д.В., Стрельцовой О.И., Зуевым М.И., Беляковым Д.В., Матвеевым М.А., Кокоревым А.А., Любимовой М.А.
Возможные темы дипломных работ
- Система сбора и анализа в режиме онлайн сетевого трафика вычислительных узлов гетерогенной платформы "HybriLIT".
- Система контроля за выполнением счётных задач на гетерогенной платформе "HybriLIT" на основе телеграм-бота.
- Федерация вычислительных кластеров с использованием менеджера ресурсов SLURM и распределённой файловой системы Lustre.
- Автоматизация процессов установки прикладного программного обеспечения по запросу пользователей на ресурсы гетерогенной платформы "HybriLIT".
- Система мониторинга используемого прикладного программного обеспечения платформы на гетерогенной платформе "HybriLIT".
Общие требования к студентам
- знание операционных систем семейства Linux (предпочтительно RedHat) на уровне продвинутого пользователя, либо системного администратора;
- опыт создания алгоритмов и практика разработки скриптов на языках программирования bash, python;
- английский язык (чтение/перевод), грамотный русский язык
Руководители: Мицын В.В., Голунов А.О., Кашунин И.А.
Возможные темы дипломных работ
- Настройка, тестирование и поддержка системы сверхбольшого хранилища данных - EOS.
- Настройка, тестирование и поддержка системы пакетной обработки задач - SLURM.
- Настройка, тестирование и поддержка системы долговременного хранения и доступа к данным на ленточных роботах - CTA.
Руководители: Гаврилов С.В., Воронцов А.C., Полежаев Д.С., Гавриш А.П., Паржицкий C.C.
Возможные темы дипломных работ
- Развитие и поддержка вычислительной сети ОИЯИ, Дисковых и вычислительных серверов МИВК, Силовых электро-установок ЛИТ, Систем холодо и климат контроля МИВК.