Автор: Сергей Мастицкий
Перед тем как привести обзор новых (и обновленных) R-пакетов за январь, стоит сказать о важном событии: в этом месяце общее количество пакетов в хранилище CRAN перевалило за 10000 (эта цифра не включает в себя примерно 1300 пакетов, опубликованных в хранилище BioConductor, а также сотни пакетов, доступных только в репозиториях GitHub). Наличие такого разнообразия пакетов в распоряжении пользователей R - дело, несомненно, хорошее. Однако со временем пользователям становится все сложнее ориентироваться в этом разнообразии и находить нужные пакеты. В этой связи, возможно, стоит напомнить о некоторых инструментах, которые могут оказаться полезными при выполнении соответствующего поиска:
- Обзор пакетов для решения ряда распространенных задач, приведенный на сайте CRAN - CRAN Task Views;
- Список популярных пакетов на сайте RDocumentation.org;
- Список популярных пакетов, опубликованных на плафторме GitHub;
- CRANberries - обновляющийся в реальном времени список пакетов, добавляемых в хранилище CRAN;
- Инструмент для поиска по хранилищу CRAN, доступный на сайте MRAN (Microsoft R Application Network);
- Shiny-приложение для поиска пакетов по категориям CRAN Task Views, созданное Михаилом Поповым;
- Функция findFn() из пакета sos.
А теперь, собственно, сам список новых/обновленных пакетов, показавшихся мне особенно интересными:
- fst - пакет для выполнения (сверх-)быстрой сериализации и десериализации таблиц данных R.
- intrval - набор утилит, облегчающих разбиение количественных переменных на интервалы.
- newsflash - R-интерфейс к GDELT Television Explorer API, с помощью которого можно выяснить, сколько раз то и или иное ключевое слово встречалось в новостях телевизионных каналов США за определенное время.
- roxygen2 - вышла новая версия этого популярного пакета, предназначенного для написания документации в ходе разработки R-пакетов. Теперь такую документацию можно писать и в формате Markdown.
- RPushbullet - новая версия пакета, представляющего собой R-интерфейс к Pushbullet API - сервису для обмена сообщениями между устройствами.
- RQGIS - новая версия пакета, представляющего собой R-интерфейс к QGIS API. QGIS - это геоинформационная система с открытым кодом, в которой реализовано более 1000 различных алгоритмов обработки геоданных.
- sparklyr - новая версия пакета, предназначенного для работы со Spark-кластерами из среды R.
- superheat - новый пакет для построения диаграмм типа "тепловая карта" (heatmap). Имеется возмжность создавать составные рисунки (например, путем добавления к тепловой карте диаграмм рассеяния, диаграмм размахов и т.п.) и выполнять тонкую настройку их элементов.
- tensorflow - R-интерфейс к TensorFlow - известной библиотеке от Google для создания предсказательных моделей.
- xml2 - новая версия пакета от RStudio для работы с данными в формате XML.
Отправить комментарий