05 ноября 2017

Обзор интересных R-пакетов за октябрь 2017 г.



  • fastrtext - R-интерфейс к библиотеке fastText, разработанной исследователями из Facebook. Эта библиотека предназначена для работы с текстовыми данными и построения моделей путем обучения с учителем и без учителя.
  • googleLanguageR - пакет для работы с несколькими API от Google для обработки естественных языков (в частности, Natural Language APICloud Speech API и Cloud Translation API).
  • JuliaCall - R-интерфейс к языку Julia.
  • OutliersO3 - набор методов для обнаружения выбросов в наборах данных с большим количеством переменных.
  • powerlmm - анализ мощности для панельных данных с двумя или тремя уровнями случайных эффектов.
  • re2r - пакет для работы с регулярными выражениями, в основе которого лежит алгоритм RE2 от Google. См. примеры здесь.
  • slowraker - реализация алгоритма RAKE, предназначенного для автоматического извлечения ключевых слов из отдельных текстовых документов. См. примеры здесь.
  • tscount - построение моделей для временных рядов, представленных счетными переменными.
  • udpipe - пакет для выполнения распространенных задач, возникающих при обработке естественных языков (выделение токенов, лемматизация, определение части речи и др.).
  • Здесь можно ознакомиться со списком из 44 пакетов для R, обеспечивающих доступ к источникам данных разной тематики.