08 мая 2011

Как изучать R?



На сайте R-сообщества Insider-R, сотрудник компании Revolution Analytics Джозеф Рикерт (Joseph Ricker) поделился своим видением того, как стоит изучать язык статистических вычислений R (подробнее см. здесь). Джозеф считает, что процесс изучения R можно разделить на следующие пять стадий:
  1. Поверхностное понимание культуры R-сообщества и программной среды, в которой функционирует и разрабатывается язык R. Знакомство с имеющимися вспомогательными ресурсами. Инсталляция R на компьютере пользователя и выполнение первых тестовых скриптов.
  2. Считывание данных из csv-файлов и уверенное использование R-функций для выполнения привычного пользователю статистического анализа.
  3. Использование базовых структур языка R для написания простых программ. Написание собственных функций. Ознакомление со структурами данных, с которыми может работать R. Ознакомление с более сложными возможностями языка. Работа с базами данных, веб-страницами и внешними источниками данных.
  4. Написание сложных программ на языке R. Самостоятельная разработка и глубокое понимание структуры объектов S3- и S4-класса.
  5. Разработка профессиональных программ на языке R. Самостоятельное создание дополнительных модулей-библиотек для R.

Стадия 1, как считает Джозеф, может быть пройдена менее чем за день, особенно при наличии хорошего вводного учебника. Преодоление стадий 2 и 3 потребует регулярной работы с R. Большинство рядовых пользователей R остановятся за стадии 3, т.к. полученных к этому времени знаний им будет вполне достаточно для выполнения рутинных статистических задач.
Начинать изучение R рекомендуется с ознакомления с содержанием таких сайтов, как Inside-R, CRAN (хранилище R-библиотек) и Сrantastic. Для удобной работы стоит инсталлировать какую-либо из имеющихся интегрированных сред разработки (IDE)  для R с графическим пользовательским интерфейсом. Отличным вариантом является использование IDE от компании Revolution Analytics, однако ее бесплатная версия доступна лишь для сотрудников академических учреждений. Другим хорошим вариантом является бесплатная RStudio.
Основные образовательные ресурсы для изучения R можно разделить на три группы:
  1. Книги, статьи, презентации, и другие подобные материалы
  2. Блоги
  3. Специальные курсы по R
Книги
Большинство книг по R выпускаются тремя основными издетальствами - Springer, Cambridge University Press и Chapman & Hall / CRC (см., например, почти исчерпывающий список книг здесь). Так, Springer издает целую серию (Use-R) отличных и относительно недорогих по стоимости вводных пособий. Дж. Рикерт советует несколько литературных источников, на которые стоит обратить особое внимание в ходе изучения R:
К сожалению, на русском языке на данный момент не опубликовано ни одной полноценной книги по R. Полезными вводными пособиями могут оказаться серия статей в журнале Linux Format (pdf-файлы статей можно скачать здесь), а также методические рекомендации к лабораторным работам по курсу "Машинное обучение", который предподают на Факультете вычислительной математики и кибернетики Нижегородского университета.

Блоги
Помимо книг и сопровождающих их веб-сайтов, отличным источником интересных и полезных примеров R-кода являются блоги. Дж. Рикерт рекомендует обратить особое внимание на блог Дэвида Смита  (David Smith, сотрудник Revolution Analytics), а также на Quick R, R-Bloggers и блог Роба Хиндмана  (Rob Hyndman).
Русскоязычные блоги о R на данный момент весьма немногочисленны. Тем не менее, в  сообщениях имеющихся блогов также можно найти много полезной информации, особенно здесь:
Специальные курсы по R
Если Вам позволяют финансовые возможности, Вы можете пройти специальные курсы по R, вроде тех, что предлагают на сайте statistics.com, и получить официальный сертификат. Обучение, как недтрудно догадаться, происходит на английском языке. Насколько мне известно, подобных курсов на русском языке пока не существует.

    Комментариев нет :

    Отправить комментарий