27 декабря 2014

Пять наиболее важных событий в мире R по итогам 2014 г.



Перед наступлением нового года принято подводить итоги года ушедшего. Следуя этой традиции, я попытался составить небольшой список из пяти наиболее важных событий, имевших место в мире R в 2014 г. (перечислены в произвольном порядке). Список этот, конечно, сугубо субъективный, и почти наверняка в нем чего-то недостает. Если я упустил что-то важное, пожалуйста, сообщите об этом в комментариях - будет интересно узнать и мне, и другим читателям.

  1. Создание пакета dplyr. Пакет dplyr, автором которого является известный всем Хэдли Уикхэм, предназначен для выполнения эффективных манипуляций с таблицами данных (data frames) - одним из наиболее распространенных типов данных в R. Главными особенностями этого пакета являются (i) интуитивно понятный синтаксис команд, (ii) использование оператора последовательных вычислений %>% из пакета magrittr (подробнее см. здесь), что значительно упрощает написание кода и его читаемость, (iii) быстродействие на больших объемах данных (поскольку все критичные процедуры реализованы на C++), а также (iv) возможность работы с удаленными базами данных, при которой все "тяжелые" вычисления выполняются на стороне сервера, а в среду R возвращается только результат этих вычислений. С момента выхода первой версии в январе 2014 г., пакет dplyr приобрел широкую популярность среди пользователей R (о чем свидетельствует, в частности, наличие более 550 вопросов с тэгом "dplyr" на StackOverflow к моменту написания этой статьи). С введением в основные возможности dplyr на русском языке можно ознакомиться здесь.
  2. Создание усовершенствованного дистрибутива R - Revolution Open R. Отличительными особенностями этой версии R от компании Revolution Analytics является существенно увеличенная скорость вычислений при выполнении операций линейной алгебры, а также  наличие инструментов, обеспечивающих воспроизводимость кода. Подробнее см. здесь.
  3. Публикация нескольких книг по R на русском языке:
    • Кабаков Р. И. (2014) R в действии. Анализ и визуализация данных в программе R. - перевод с англ. П. Волковой. - М.: ДМК Пресс, 580 с.
    • Савельев А. А., Мухарамова С. С., Чижикова Н. А., Пилюгин А. Г. (2014) Теория пространственных точечных процессов в задачах экологии и природопользования (с применением пакета R). - Казань: Изд-во Казан. ун-та, 146 с. PDF | Скрипты
    • Мастицкий С. Э., Шитиков В. К. (2014) Статистический анализ и визуализация данных с помощью R. - Электронная книга, 400 с. PDF | Скрипты
  4. Запуск сервиса Azure Machine Learning. Этот многообещающий новый сервис от Microsoft позволяет легко развертывать полноценные промышленные приложения, в основе которых лежат модели машинного обучения, разработанные на языке R. На сайте habrahabr.ru можно ознакомиться со статьями на русском языке, дающими обзор сервиса, а также пример его использования для создания модели распознавания тональности текста.
  5. Проведение первой конференции "Эффективные применения языка R" (Effective Applications of the R Language, EARL). Использование системы статистических вычислений R для решений бизнес-задач постоянно растет. Конференция EARL, прошедшая в сентябре в Лондоне, стала естественным отражением этого процесса. В отличие от конференции UseR, где преимущественно обсуждаются технические аспекты R, EARL обещает стать регулярной платформой, где ее участники будут демонстрировать реальные примеры внедрения аналитических решений на основе R в бизнес-процессы и обмениваться соответствующим опытом.
Всех с наступающим Новым Годом! Добра и света вам и вашим близким!


7 комментариев :

Yury Arrow комментирует...

http://www.mann-ivanov-ferber.ru/books/paperbook/visualize-this/

Yury Arrow комментирует...

Пропало первое сообщение. К книгам бы добавил "Искусство визуализации в бизнесе" которая и открыла мне мир R в этом году.

Sergey Mastitsky комментирует...

Спасибо, Юрий. С удовольствием добавил бы эту книгу, но она опубликована в 2013 г. :)
http://r-analytics.blogspot.co.uk/2013/08/blog-post.html

Анонимный комментирует...

Здравствуйте Сергей,
сегодня установил Revolution R Open + RStudio. Инсталляция прошла успешно, но при загрузке программы, в консоли отображается следующая ошибка:

Error installing package: ������: ������: ��� ���� ��� ������������ ����� 'C:/Program Files/RRO/R-3.1.2/library'

Error installing package: ������: ������: ��� ���� ��� ������������ ����� 'C:/Program Files/RRO/R-3.1.2/library'

Очевидно, какие-то из пакетов не установились, но я не могу понять в чем здесь дело, и как эту ошибку исправить. Также R лишился возможности устанавливать другие пакеты. Поиск ошибки по интернету не дал результатов. Прошу помощи у Вас. Работаю в Windows7.

Sergey Mastitsky комментирует...

Судя по "кракозябрам" в сообщении об ошибке, возможно, проблема вызвана названиями каких-то папок кириллицей. Не зная других особенностей конфигурации Вашей машины, что-то более конкретное сказать сложно - с такими ошибками я не сталкивался...

Анонимный комментирует...

Сергей, спасибо за отзывчивость. Проблему решил сам.
Оказывается, Windows7, изначально, ставит на свойства системных папок и файлов режим "Только для чтения". Интересный момент: несмотря на то, что под моим именем стоит надпись "Администратор", это, отнюдь, не позволяет мне иметь админ права О_о. Пришлось лезть в настройки системы, и "возвращать" свой админ доступ. Не знал раньше об этой проблеме. Пользователи Windows7 - будьте внимательны!

Sergey Mastitsky комментирует...

Спасибо, будет интересно и другим читателям!

Отправить комментарий