10 августа 2012

Десять наиболее критичных пакетов R



По состоянию на 5 августа 2012 г. на сайте CRAN было опубликовано 3969 пакетов для R (см. ниже). Многие из них используются разработчиками новых пакетов. В ходе публикации нового пакета автор должен указать, от каких из уже существующих пакетов он зависит (поле Depends является обязательным в описаниях всех R-пакетов - см., например, здесь). Следовательно, количество ссылок на тот или иной пакет в поле Dеpends, может служить показателем его критичности для всей "экосистемы" R.

Недавно Дирк Эддельбюттель (Dirk Eddelbuettel, один из авторов известных Rcpp и RcppArmadillo) выполнил соответствующий анализ, который выявил следующие топ-10 критичных пакетов (в том смысле, что если бы они вдруг исчезли, то перестали бы работать и многие другие пакеты):
  • mvtnorm: многомерные нормальное и t-распределения
  • coda: вывод результатов симуляций Монте Карло по схеме марковских цепей
  • Rcpp: интеграция R с C++
  • sp: классы и методы для пространственных данных
  • rgl: 3D графическое устройство (на основе OpenGL)
  • ggplot2: графический пакет от проф. Хэдли Уикхэма (Hadley Wickham)
  • XML: инструменты для работы с XML в R и S-Plus
  • rJava: низкоуровневая интеграция R с Java
  • Hmisc: набор из множества инструментов для анализа и визуализации данных от проф. Фрэнка Хэрелла (Frank Harell)
  • zoo: анализ временных рядов
Следует отметить, что в приведнный список не включены т.н. "рекомендуемые" пакеты, которые по умолчанию устанавливаются вместе с R (тем не менее, многие из них, например, MASS, lattice, survival, Matrix, nlme, и boot, все же вошли в составленный Д. Эддельбюттелем список наиболее критичных пакетов R - см. рисунок ниже из оригинальной статьи).
CRAN package chart of Reverse Depends relations


 P.S.: здесь можно найти статью по сходной тематике (на англ. яз.).


Комментариев нет :

Отправить комментарий