Speaker
Илья Никольский
(МГУ им М.В. Ломоносова)
Description
Встраиваемые устройства (embedded devices) становятся все более
популярными. Их можно найти в моб. телефонах, планшетах,
автомобильной электронике, роботах и т.д. Количество
задач, решаемых на таких устройствах, постоянно растет,
что приводит к необходимости объединения их в кластеры.
Такой кластер, например, установлен на сингапурском спутнике
X-Sat[xsat].
Исследование возможностей встраиваемых устройств
упростилась с появлением
одноплатного компьютера Raspberry Pi [rpi]. Этот компьютер размером
с кредитную карту обладает 4х ядерным ARM-процессором Cortex-A7
с частотой 900МГц, 1 Гб ОЗУ
(характеристики приведены для Raspberry Pi 2 model B).
Для него существует Debian-подобная ОС Raspbian
и даже специальная версия Windows (Windows IoT).
Устройство потребляет до 600 мА (без внешней периферии)
при напряжении в 5В.
Эти характеристики вкупе с невысокой стоимостью (35$) сделали
это устройство весьма популярным. На его основе было построено
несколько учебных кластеров (например 64х узловый кластер
Iridis-Pi в университете Саутгемптона[iridis]). Такие системы как правило
позиционируются как прототипы реальных распределенных
систем, позволяющие студентам опробовать такие технологии как
Hadoop, Spark и др. Достоинствами таких встраиваемых кластеров
(embedded cluster) являются невысокая стоимость, низкое
энергопотребление и компактнось. По всей видимости, в будущем
такие кластеры смогут найти применение и в реальных приложениях -
например, в робототехнике.
В работах, посвященных кластерам (напр [iridis]), как правило
приводятся результаты различных стандартных тестов (пропускная способность,
Linpack и т.д.)
В предлагаемой работе мы исследуем возможности
распределенных вычислений широко известной среды статистических
вычислений R. Вычислительные эксперименты проводятся на кластере
из Raspberry Pi, построенном одним из авторов. В качестве теста
используется программа, оценивающая прогноз линейной регрессии
методом бутстрап.
Наш кластер состоит из трех Raspberry Pi 2 model B , соединенных
с помощью бюджетного роутера фирмы Asus. Питается кластер
от USB-хаба. На каждом узле установлена ОС Raspbian. На каждом
узле запущен ssh-сервер, что позволяет получать доступ с терминала
через любой ssh-клиент. Используется R версии 3.2.3.
Основные выводы, полученные в результате работы:
1) Кластер из Raspberry Pi может быть построен очень быстро
и сравнительно с небольшими затратами;
2) скорость вычислений на таких машинах невысока, но они
представляют собой отличный полигон для изучения
концепций и технологий распределенных
вычислений;
3) среда статистических вычислений R включает несколько
интересных инструментов для распределенных вычислений,
весьма удобных в использовании;по всей видимости для
быстрого старта в распределенных вычислениях эта среда
подходит лучше, чем такие тяжелые технологии, как
Hadoop и Spark.
[xsat]I. V. McLoughlin, T. R. Bretschneider, Chen Zheming
Virtualized Development and Testing for Emb edded Cluster Computing
International Journal of Networking and Computing
Volume 2, Number 2, pages 160–187, July 20A
[rpi]https://www.raspberrypi.org/
[iridis] Simon J. Cox, James T. Cox, Richard P. Boardman, Steven J. Johnston, Mark Scott, Neil S. O'Brien
Iridis-pi: a low-cost, compact demonstration cluster
Cluster Computing, June 2013, Volume 17, Issue 2, pp 349-358
Primary author
Илья Никольский
(МГУ им М.В. Ломоносова)
Co-author
Mr
Кирилл Фурманов
(НИУ ВШЭ)