07 декабря 2014

Интересное из мира R (1-7 декабря 2014 г.)



  • Компания RStudio на базе платформы DataСamp запустила онлайн-курс по пакету ggvis, который позволяет создавать интерактивные графики в стиле ggplot2. Курс стоит 95 евро, однако первую его часть можно пройти бесплатно. Подробности здесь.
  • 17 декабря 2014 г. компания RStudio проведет также вебинар, посвященный их пакету packrat. В состав этого пакета входят функции, использование которые обеспечивает воспроизводимость R-кода (см. также одно из предыдущих сообщений по похожему пакету checkpoint).
  • Вышла новая версия (v1.5) пакета magrittr, чей оператор последовательного выполнения команд %>% наделал много (позитивного) шума в мире R в этом году. Эта версия пакета содержит несколько нововведений, одно из которых звучит особенно заманчиво: теперь при помощи %>% можно последовательно объединять в "цепочку" вызовы нескольких функций, т.е. по сути, создавать новые функции. Проще пояснить это на примере. Так, команда

    mae <- . %>% abs %>% mean(na.rm = TRUE)

    будет эквивалентна следующему стандартному подходу:

    mae <- function(x) { mean(abs(x), na.rm = TRUE) }
  • Макс Кун (Max Kuhn), один из авторов известной книги "Applied Predictive Modeling", в своем блоге опубликовал отличную статью, в которой он проводит сравнение эффективности нескольких распространенных способов кросс-проверки (cross-validation) прогнозной точности моделей (на примере регрессионных моделей).
  • В блоге "R and SAS" опубликовано интересное сообщение с инструкцией по запуску RStudio Server на одном из облачных сервисов.

4 комментария :

Pavel Karateev комментирует...

У DataCamp очень вкусные курсы по R, да вот только разоришься их все проходить = (

Георгий комментирует...

Здравствуйте! Я новичок в R. Попытался протестировать метод опорных векторов с помощью пакета для svm анализа e1071. Для этого создал тестовые наборы данных BAI1<- list(0,1); tr1<- list(25,24.5);c1<-list(90.8,86.6);ca1<-list(90,82.4);trh1<-list(26,23);train<-list(tr1,trh1,c1,ca1). И запустил команду model <- svm(BAI1~ ., data = train). Результат - Ошибка в eval(expr, envir, enclos) : объект '25' не найден. Не подскажете, в чём дело?

Pavel Karateev комментирует...

Приветствую! Вы криво данные для моделирования составляете, оно не понимает что с вашими вложенными списками делать. Вот так будет корректно (как вариант): https://gist.github.com/lancelote/3490d1bf441cb2f8d1d3

Сергей комментирует...

DataCamp - а почему евро? У меня цену в долларах показывает...
Все хочу по их dplyr курсу ревью написать. Если таки напишу, то скину ссылку сюда

Отправить комментарий