МОДЕЛИ ПОВЕДЕНИЯ РОССИЙСКИХ УЧАСТНИКОВ ДОБРОВОЛЬНЫХ РАСПРЕДЕЛЕННЫХ ВЫЧИСЛЕНИЙ НА ПЛАТФОРМЕ BOINC

5 Jul 2016, 17:15
15m
Sectional reports 7. Desktop grid technologies and volunteer computing 7. Desktop grid technologies and volunteer computing

Speaker

Dr Виктор Тищенко (Институт системного анализа ФИЦ "Информатика и управление" РАН)

Description

В исследовании показано, что виртуальное сообщество российских участников добровольных распределённых вычислений (volunteer computing, VC) на платформе BOINC может быть рассмотрено в форме сети. В качестве узлов сети рассмотрены 2 типа объектов: участники сообщества (аккаунты пользователей, зарегистрированных на сайте boinc.ru) и исследовательские проекты, в которых пользователи принимают участие (зарегистрированные в системе BOINC учетные записи проектов). В графе, представляющем данную сеть, ребро соединяет одну из вершин, относящихся к первому типу – пользователи, а другую, ко второму – проекты, в которых пользователь, отображенный первой вершиной, принимает участие (предоставляет свои ресурсы для вычислений). В результате мы получим двудольный граф с типами вершин “участник” и “проект”. Вес каждого ребра равен количеству “кредитов” заработанных участником на исследовании, с которым он связан данным ребром. Рассматриваемая сеть состоит из 134 проектов, 740 проектов и 44985 участников, что в сумме дает 45119 вершин, 82827 связей между ними. Средняя степень вершины в графе составляет примерно 1,83. Среднее количество участников в проекте – 618. Диаметр графа равен 6, средняя длина пути: 2.14. По мнению исследователей российского BOINC-сообщества [Андреева А.,2014; Курочкин И. И., Якимец В.Н.,2014] мотивами участия в проектах и соответствующими моделями поведения участников VC являются: - ощущение причастности к важным научным исследованиям и, соответственно, получению значимых научных результатов; - командный дух и атмосфера состязательности; участники VC могут объединяться в команды по разным признакам (национальному, региональному, пр.); за выполненное задание пропорционально затраченным вычислительным ресурсам участникам проектов начисляются т.н. «кредиты»; количество «кредитов» является характеристикой, по которой команды и отдельные участники соревнуются между собой; - информированность о командном и/или индивидуальном участии в проекте; при получении результатов обычно на сайте проекта выкладывается информация об участнике, на ПК которого был получен данный результат. Описанные модели поведения участников VC рассмотрим в качестве гипотез исследования двудольного графа – тематическая, командная и количественная. Для проверки гипотез были использованы четыре различных метода кластеризации двудольных графов (методы SRE, k-means, PDDP, “информационного бутылочного горлышка”), в основном ранее применявшиеся для кластеризации документов. Сравнение результатов работы методов показало высокую степень применимости каждого из них к данному объекту исследования. Можно с уверенностью говорить о том, что тематическая гипотеза о том, что поведение участников boinc.ru находится в сильной зависимости от их тематических научных интересов, была доказана. Гипотеза о том, что поведение участников находится в зависимости от команды, в которой они состоят, была подтверждена частично. И наконец, предположение о том, что общая активность участников будет сильным сигналом их поведения при выборе проектов, было почти полностью опровергнута, за исключением отдельной группы сверхактивных участников. Результаты кластеризации подтверждают сформированное ранее представление о статистике участия российских кранчеров в проектах VC [Тищенко В. И., Прочко А. Л., 2014]. Те участники добровольных распределённых вычислений, которые были ориентированы на развитие проекта как способа решения фундаментальной научной проблемы и видели результаты своего труда – демонстрировали лучшие показатели в предоставлении вычислительных мощностей своих компьютеров – активность, постоянство, время подключения и т.п. Полученные результаты могут иметь существенное применение при решении практических задач по оптимизации работы в рамках сети Boinc.ru.

Summary

The article shows that the Russian community members volunteer distributed computing (VC) on the BOINC platform can be represented in the form of a network, followed by visualizing as bipartite graph. Using the paradigm of complex networks and the analysis of the data obtained by different methods of clustering bipartite graph, allowed to verify the basic behaviors of the Russian participants of the VC in selecting and joining the research projects. Decisive are the thematic preferences of participants of the VC. And practically there is no any effect on the behavior of a team or individual activity, quantitatively expressed as krédits.
The results can be significant for optimizing VC management for solving problems that require large computational resources.

Primary author

Dr Виктор Тищенко (Институт системного анализа ФИЦ "Информатика и управление" РАН)

Presentation materials

There are no materials yet.