В исследовании показано, что виртуальное сообщество российских участников добровольных распределённых вычислений (volunteer computing, VC) на платформе BOINC может быть рассмотрено в форме сети. В качестве узлов сети рассмотрены 2 типа объектов: участники сообщества (аккаунты пользователей, зарегистрированных на сайте boinc.ru) и исследовательские проекты, в которых пользователи принимают участие (зарегистрированные в системе BOINC учетные записи проектов). В графе, представляющем данную сеть, ребро соединяет одну из вершин, относящихся к первому типу – пользователи, а другую, ко второму – проекты, в которых пользователь, отображенный первой вершиной, принимает участие (предоставляет свои ресурсы для вычислений). В результате мы получим двудольный граф с типами вершин “участник” и “проект”. Вес каждого ребра равен количеству “кредитов” заработанных участником на исследовании, с которым он связан данным ребром. Рассматриваемая сеть состоит из 134 проектов, 740 проектов и 44985 участников, что в сумме дает 45119 вершин, 82827 связей между ними. Средняя степень вершины в графе составляет примерно 1,83. Среднее количество участников в проекте – 618. Диаметр графа равен 6, средняя длина пути: 2.14.
По мнению исследователей российского BOINC-сообщества [Андреева А.,2014; Курочкин И. И., Якимец В.Н.,2014] мотивами участия в проектах и соответствующими моделями поведения участников VC являются:
- ощущение причастности к важным научным исследованиям и, соответственно, получению значимых научных результатов;
- командный дух и атмосфера состязательности; участники VC могут объединяться в команды по разным признакам (национальному, региональному, пр.); за выполненное задание пропорционально затраченным вычислительным ресурсам участникам проектов начисляются т.н. «кредиты»; количество «кредитов» является характеристикой, по которой команды и отдельные участники соревнуются между собой;
- информированность о командном и/или индивидуальном участии в проекте; при получении результатов обычно на сайте проекта выкладывается информация об участнике, на ПК которого был получен данный результат.
Описанные модели поведения участников VC рассмотрим в качестве гипотез исследования двудольного графа – тематическая, командная и количественная. Для проверки гипотез были использованы четыре различных метода кластеризации двудольных графов (методы SRE, k-means, PDDP, “информационного бутылочного горлышка”), в основном ранее применявшиеся для кластеризации документов. Сравнение результатов работы методов показало высокую степень применимости каждого из них к данному объекту исследования.
Можно с уверенностью говорить о том, что тематическая гипотеза о том, что поведение участников boinc.ru находится в сильной зависимости от их тематических научных интересов, была доказана. Гипотеза о том, что поведение участников находится в зависимости от команды, в которой они состоят, была подтверждена частично. И наконец, предположение о том, что общая активность участников будет сильным сигналом их поведения при выборе проектов, было почти полностью опровергнута, за исключением отдельной группы сверхактивных участников.
Результаты кластеризации подтверждают сформированное ранее представление о статистике участия российских кранчеров в проектах VC [Тищенко В. И., Прочко А. Л., 2014]. Те участники добровольных распределённых вычислений, которые были ориентированы на развитие проекта как способа решения фундаментальной научной проблемы и видели результаты своего труда – демонстрировали лучшие показатели в предоставлении вычислительных мощностей своих компьютеров – активность, постоянство, время подключения и т.п.
Полученные результаты могут иметь существенное применение при решении практических задач по оптимизации работы в рамках сети Boinc.ru.