В период с 16 по 18 августа состоялась седьмая ежегодная международная конференция UseR!. В этом году организатором конференции выступила Кафедра статистики Университета г. Уорвик, Великобритания. Проведение данного форума преследует три основные цели:
  • Обсуждение тенденций развития языка R, ставшего сегодня лингва-франка в области статистических вычислений и анализа данных;
  • Предоставление платформы, где происходит обмен идеями по использованию R для статистического анализа и визуализации данных;
  • Обзор новых возможностей быстро развивающегося R-проекта.

Как и ранее, конференция UseR! 2011 состояла из двух частей:
  • Приглашенные докладчики представили новые возможности R и наиболее яркие примеры использования R для анализа данных;
  • Участники конференции (440 человек из 41 страны) продемонстрировали примеры практического использования R для решения статистических задач в самых разнообразных областях науки, инженерии и финансов.
Ниже приведен обзор наиболее интересных, на мой взгляд, моментов, имевших место на конференции. Обзор составлен на основе сообщений, опубликованных в блогах нескольких непосредственных участников этого события.

Общая часть

Профессор Брайен Рипли (Brian Ripley) сделал доклад о тенденциях развития R, из которого стало известно, что:
  • На сегодняшний день в хранилище CRAN имеется более 3000 библиотек для R. Еженедельно кураторы проекта получают на рассмотрение в среднем 110 новых библиотек.
  • Из хранилища CRAN будут удалены все инсталляционные файлы R, возраст которых превышеает 2 года.
  • Набор функций, входящих в базовую версию R, по-видимому, будет сокращаться.
  • В последнее время были значительно улучшены возможности R для рендеринга графических объектов.
  • Команда library(), служащая для подключения дополнительных библиотек R, будет заменена на use().
  • Вскоре будет опубликована библиотека parallel, предназначенная для организации параллельных вычислений над большими объемами данных.
Дэвид Смит (David Smith) из компании Revolution Analytics в своем докладе об "экосистеме R" сообщил, что число пользователей R в мире сегодня оценивается в 2 миллиона. Доклад Барри Роулингсона (Barry Rowlingson) назывался "Почему хелп-система R должна умереть" ("Why R-help must die!"). Он предложил вместо стандартной системы помощи R использовать сайты вроде Stack Overflow и Cross Validated (оба явлются частью проекта Stack Exchange), где пользователи могли бы задавать свои вопросы о R другим пользователям и осуществлять поиск среди ответов на ранее заданные вопросы. Появление такого сайта, посвященного непосредственно R, ожидается в ближайшем будущем. Доклад Тобиаса Вербеке (Tobias Verbeke) из OpenAnalytics был посвящен StatET - одной из интегрированных сред разработки для R на основе Eclipse.

Графика

Тоби Дилан Хокинг представил постерный доклад о библиотеке directlabels, фукнции которой позволяют наносить метки и легенды для кривых или групп точек непосредственно на готовом графике, без необходимости писать отдельный код для легенды. Александр Коварик (Alexander Kowarik) говорил о своей библиотеке sparkTable, при помощи которой можно создавать html-таблицы, включающие небольшие графические элементы. Саймон Урбанек (Simon Urbanek) сообщил о нескольких новых графических функциях R. Например, функция rasterImage() работает гораздо быстрее, чем прежняя image(), а новая функция polypath() позволяет рисовать полигоны с "дырами".

Пол Мюррелл (Paul Murrell) представил интересный доклад о том, как географическую карту в формате PDF можно превратить в динамический график. При наведении указателя мыши на номер здания в легенде такого графика подсвечивается здание с соответствующим номером на карте (и наоборот). PDF-файл был преобразован в postscript-файл, загружен в R через grImport и затем сохранен как SVG-файл при помощи gridSVG. Часть кода при этом пришлось писать на Java. См. слайды презентации и пример карты.

Саймон Урбанек (Simon Urbanek) сделал сообщение о библиотеке iPlots eXtreme (сегодня проект развивается под названием Acinonyx), которая предоставляет великолепные возможности для быстрого создания динамической графики. Функции библиотеки отличаются эффективной работой с большими объемами данных. Библиотека использует OpenGL - графический стандарт, разработанный в недрах игровой индустрии.

Финансы

Фаусто Молинари (Fausto Molinari) представил новую библиотеку R-adamant (см. слайды здесь), предназначенную для выполнения эконометрического анализа. Функциональные возможности этой библиотеки в определенной степени дублируют таковые из хорошо известной Rmetrics, однако концептуальный подход несколько отличается.

R-документация

Многие участники конференции говорили о проблеме поиска документации по R. Количество библиотек растет экспоненциально, однако еще быстрее растет количество документов по R. Встает большой вопрос о том, как обеспечить легкий поиск целевой информации, необходимой пользователям. Пока решения неясны.

Следующая конференция UseR! пройдет в июне 2012 г. в Университете Вандербильта в Нэшвилле, Теннеси.

Послать комментарий

Новые Старые