• В своем блоге Боб Мюнхен (Bob Muenchen) опубликовал результаты небольшого исследования "доли рынка" аналитического программного обеспечения на основе числа книг, опубликованных по каждой программе/системе. Выяснилось, что R занимает, как минимум, 3-е место (на 1-м и 2-м местах оказались SAS и SPSS соответственно, хотя многие книги по этим системам имеют несколько изданий, что завышает общее число публикаций по ним).
  • В блоге компании Databricks было объявлено о том, что в новый релиз Apache Spark (фреймворк для организации кластерных вычислений при работе с большими данными) будет включен пакет SparkR, который позволит использовать возможности Spark'а прямо из консоли R. Синтаксис команд SparkR похож на команды dplyr, что облегчит освоение этого нового API пользователям dplyr.
  • В блоге The DataCamp было опубликовано сообщение, в котором в сжатой и очень доступной форме обобщены 15 полезных "рецептов" работы с таблицами данных (data frames) в R.
  • На DataReview.info приведен пример сбора данных с веб-сайтов при помощи пакета rvest.
  • 15 июня на базе платформы T&P начинается бесплатный онлайн-курс "Статистический анализ даных на R".


1 Комментарии

Анонимный написал(а)…
> В блоге The DataCamp было опубликовано сообщение, в котором в сжатой и очень доступной форме обобщены 15 полезных "рецептов" работы с таблицами данных (data frames) в R.

Там грубая ошибка в разделе "How To Create An Empty Data Frame", вместо "ab <- data.frame(Age, Name, ID, Gender, Date)" написано "ab <- data.frame(c(Age, Name, ID, Gender, Date))", причем приведен вывод, из которого ясно видно, что результат неправильный. Sapienti sat.
Новые Старые