01 марта 2015

Интересное из мира R (23 февраля - 1 марта 2015 г.)



  • На этой неделе компания RStudio объявила о том, что бета-тестирование их (уже ставшего популярным) сервиса shinyapps.io завершено и запущено его коммерческое использование. Сервис предназначен для разворачивания аналитических веб-приложений, созданных на базе фреймворка Shiny. Цены варьируют от 0$/месяц (тариф "Free": хостинг 5 приложений, 25 часов активного использования) до 299$/месяц (тариф "Professional": хостинг неограниченного количества приложений, авторизация пользователей, 5000 часов активного использования, приоритетная поддержка, и др.).
  • Завершается работа над новой версией интегрированной среды разработки RStudio (v0.99), но уже сейчас пользователи могут скачать и протестировать пред-релизную версию v0.99.315. Редактор RStudio теперь будет включать много полезных и давно ожидаемых опций, среди которых особого упоминания заслуживают:
    • возможность сортировки и фильтрации полей, а также полнотекстовый поиск в просмотрщике данных;
    • значительно "поумневшее" автозавершение кода (в частности, при работе с использованием оператора последовательного выполнения команд %>% из пакета magrittr);
    • подсветка кода для целого ряда новых языков;
    • улучшенный функционал для работы в режиме эмуляции редактора Vim.
  • На сайте Udemy начинается новый курс по Data Science от Нины Зумель (Nina Zumel) и Джона Маунта (John Mount) - авторов недавно опубликованной книги "Practical Data Science with R".
  • Издательством Wiley опубликована книга "Data Mining Algorithms: Explained Using R". Очень обстоятельная работа (720 страниц!), в которой автор (Pawel Cichosz) "на пальцах" объясняет основные алгоритмы машинного обучения.
  • В блоге "Язык R в финансах и экономике" опубликована статья, где описывается пример применения алгоритма "решающие деревья" для предсказания цены акций.

24 февраля 2015

И снова об авторизации при работе с Twitter API



В одном из предыдущих сообщений я описал простой пример использования возможностей пакетов twitteR и tm для анализа Twitter-сообщений. Сервис Twitter постоянно изменяется, что приводит к соответствующим изменениям и в той большой "экосистеме" программного обеспечения, которая выросла вокруг этого сервиса. Так, в 2013 г. в Twitter API были внесены существенные изменения касательно процедуры авторизации приложений, что усложнило работу с пакетом twitteR. Однако в последнее время процесс авторизации стал проще - об этом и будет данное сообщение.



21 февраля 2015

Русскоязычные ресурсы по статистике, машинному обучению, R



Вместо еженедельного обзора "Интересное из мира R" сегодня я хотел бы представить вашему вниманию список наиболее интересных (с моей субъективной точки зрения) русскоязычных ресурсов по теории статистики, машинному обучению и R. Его можно найти на специально созданной по этому случаю новой странице - "Ресурсы". Учитывая глобальный рост интереса к анализу данных в целом и к R в частности (см. Google-тренд), я уверен, что количество сайтов соответствующей тематики будет также расти и список будет пополняться новыми интересным ссылками.


15 февраля 2015

Интересное из мира R (9-15 февраля 2015 г.)



  • Каждые три месяца сайт githut.info обобщает информацию с GitHub.com по интенсивности использования разных языков программирования. По результатам последнего квартала 2014 г., R оказался на 12 месте. Первые три места приходятся на JavaScript, Java и Python.
  • Согласно объявлению, сделанному Хэдли Уикхэмом в официальном блоге RStudio, компания Epoch.com (система онлайн-платежей) окажет финансовую поддержку для дальнейшей разработки пакета RMySQL.
  • Тарак Ша (Tarak Shah) из Калифорнийского университета в Беркли создал пакет rcrunchbase, который позволяет делать запросы к CrunchBase - самой крупной базе данных, содержащей профили стартап-компаний со всего мира.
  • Илья Кипнис в своем блоге QuantStrat TradeR привел подробный пример использования алгоритма PELT, предназначенного для обнаружения "точек перелома" во временных рядах.
  • В Сети появилось видео презентации по Shiny, которую Джо Ченг (Joe Cheng) из RStudio сделал в январе на одном из воркшопов сообщества  DataScience.LA:



08 февраля 2015

Интересное из мира R (2-8 февраля 2015 г.)



  • Опубликован новый номер журнала The R Journal. Все вошедшие в него статьи можно скачать в виде одного PDF файла по этой ссылке.
  • Объявлено начало регистрации на 3-ю конференцию R in Insurance (Использование R в индустрии страхования), которая пройдет 29 июня 2015 г. в  университете Амстердама. На конференции будут обсуждаться такие темы, как управление рисками, ценообразование, моделирование потерь и др. с использованием R в качестве основного инструмента.
  • Дэвид Робинсон (David Robinson) сообщил в своем блоге о создании пакета stackr, который позволяет делать запросы к API Q&A-сайтов Stack Exchange и собирать информацию по заданным там вопросам, ответам, тэгам сообщений, пользователям и т.п. Результаты таких запросов сохраняются в виде стандартных таблиц данных R, что значительно облегчает их дальнейший анализ и визуализацию.
  • Ричард Паф (Richard Pugh) из Mango Solutions описал способ встраивания html-кода интерактивных страниц, созданных при помощи R (например, графики googleVis или приложения Shiny), в презентации PowerPoint.
  • На сайте profitraders.com в рамках рубрики "Язык R для трейдера" опубликован пример использования R для создания простой торговой стратегии на основе пары скользящих средних.