10 января 2015

Интересное из мира R (5-11 января 2015 г.)



  • Тал Галили (Tal Galili), создатель известного агрегатора R-bloggers, представил список статей, которые оказались наиболее популярными среди посетителей его сайта в 2014 г. Список дает некоторое представление о том, чем интересуются пользователи R, и с какими проблемами сталкиваются.
  • Компания RStudio объявила об обновлении своего сервиса shinyapps.io до бета-версии. Этот сервис предназначен для публикации веб-приложений, созданных на базе фреймворка Shiny, и, несмотря на свой тестовый режим, уже сейчас насчитывает тысячи пользователей.
  • Хэдли Уикхэм (Hadley Wickham) объявил о работе над вторым изданием своей книги, посвященной популярному графическому пакету ggplot2. В мае 2014 г. ggplot2 "дорос" до версии 1.0.0, превратившись в самостоятельную графическую систему, которая, согласно Хэдли, в дальнейшем существенно изменяться не будет. Необходимость в новом издании обусловлена многочисленными изменениями в функционале ggplot2, имевшими место с момента публикации первой книги в 2009 г. Когда именно следует ждать выхода новой книги, не сообщается. Тем не менее, желающие уже сейчас могут ознакомиться с рабочими версиями исходников текста и кода на github.
  • Буквально в тот же день (9 января) Хэдли сделал еще два объявления - о выходе новых версий двух пакетов, в разработке которых он принимает активное участие - dplyr 0.4.0 и RMySQL 0.10.0. Особенно заметные изменения были сделаны в случае с dplyr - в новую версию пакета вошли, в частности, несколько новых функций для объединения таблиц данных.
  • Команда инженеров из компании Twitter представила разработанный ими R-пакет AnomalyDetection, предназначенный для обнаружения аномалий (необычных наблюдений, выбросов) во временных рядах (см. пример анализа просмотров страниц Wikipedia здесь). AnomalyDetection опубликован на github и находится в свободном доступе. Стоит отметить, что это уже второй R-пакет, представленный широкой публике инженерами Twitter за последнее время. Так, в октябре 2014 г. они опубликовали BreakoutDetection - пакет, предназначенный для нахождения "переломных точек" во временных рядах, т.е. таких моментов времени, когда в состоянии наблюдаемой системы происходит существенный сдвиг (в частности, изменение среднего уровня некоторой переменной, характеризующей систему; см. пример здесь). BreakoutDetection рутинно используется в Twitter для автоматического обнаружения изменений в поведении пользователей. С описанием метода, лежащего в основе BreakoutDetection, можно ознакомиться в этой статье.


Комментариев нет :

Отправить комментарий