29 декабря 2016

Пять наиболее важных событий в мире R по итогам 2016 г.



Автор: Сергей Мастицкий

Рисунок заимствован с сайта
https://www.r-consortium.org
Традиционно попытаюсь подвести итоги 2016 г., перечислив пять наиболее важных (на мой взгляд) событий и тенденций, имевших место в этом году в мире R. Если упустил что-то интересное, пожалуйста, сообщите об этом в комментариях.
  • IDE RStudio v1.0. В ноябре компания RStudio объявила о выходе новой версии (1.0) их одноименного IDE для R. Это был 10-й крупный релиз этого продукта, начиная с февраля 2011 г. В состав RStudio v1.0 вошло большое количество нововведений, среди которых стоит отметить следующие:
    • работа с R Notebooks - инструментом для интерактивного исполнения R-кода и одновременного документирования получаемых результатов;
    • интеграция с функционалом пакета sparkyr (см. ниже);
    • интеграция с функционалом пакета profvis, предназначенного для выполнения профилирования R-кода;
    • улучшенные средства импорта данных (на основе пакетов readr, readxl и haven); 
    • возможность создавать несложные веб-сайты и документы размером с книгу при помощи языка разметки R Markdown.
  • Создание пакета sparklyr. Apache Spark - это чрезвычайно популярный инструмент для выполнения вычислений над "большими данными". Разработанный компанией RStudio пакет sparklyr представляет собой R-интерфейс для работы с этим инструментом. Важными особенностями sparklyr (в отличие от, например, встроенного в Spark пакета sparkR) являются следующие:
    • возможность написания легко читаемого кода с использованием синтаксиса, принятого в пакете dplyr;
    • пользователи R могут работать с большинством алгоритмов машинного обучения, реализованных в Spark'овской библиотеке MLlib;
    • как было отмечено выше, sparklyr интегрирован в RStudio v1.0, что делает работу с ним еще удобнее.
  • Релиз платформы Steam. Компания h20.ai выпустила Steam (под лицензией AGPL) - платформу, которая позволяет "...от начала и до конца выстроить весь процесс создания и разворачивания "умных" приложений". Если говорить "немаркетинговым" языком, то эта платформа помогает наладить совместную работу аналитиков, разрабатывающих предсказательные модели на базе движка h2o (поддерживаются такие языки программирования, как R, Python и Java), и разработчиков приложений (последние "потребляют" предсказания моделей посредством запросов к соответствующим API, которые можно легко опубликовать с помощью Steam). Выстраивание подобной связи между аналитиками и разработчиками эффективным образом - большая головная боль многих компаний, которые пытаются внедрять предсказательные модели в свои бизнес-процессы. В этом смысле Steam - платформа с большим потенциалом, особенно если учесть, что в состав h2o входят одни из наиболее эффективных алгоритмов машинного обучения среди существующих. Подробнее о Steam можно узнать из официальной документации, а также из приведенного ниже видео.



С наступающим Новым Годом! Добра и мира вам и вашим близким!

2 комментария :

Альтер Эго комментирует...
Этот комментарий был удален автором.
Альтер Эго комментирует...

в 1 полугодии 2016-го Microsoft анонсировало поддержку R в Power BI только в части визуализации по загруженным в модель Power BI датасетам
(https://powerbi.microsoft.com/en-us/guided-learning/powerbi-learning-3-11h-r-visual-integration/)

В октябре 16-го анонсировали использование R для обработки полученных в модель данных в части трансформации, заполнения пропусков и т.д.
(https://powerbi.microsoft.com/en-us/documentation/powerbi-desktop-r-in-query-editor/)

В декабре 16-го анонсировали интеграцию Power BI с IDE (на примере с RStudio:
https://powerbi.microsoft.com/en-us/documentation/powerbi-desktop-r-ide/)

Отправить комментарий