16 ноября 2014

Интересное из мира R (10-16 ноября 2014)



Этим сообщением я начинаю новую рубрику "Интересное из мира R" (вдохновил меня на это еженедельный "обзор наиболее интересных материалов по анализу данных и машинному обучению", публикуемый на Хабрахабре). По мере возможностей, каждую неделю я планирую публиковать краткий обзор пяти событий и/или публикаций, имеющих отношение к R, которые, по моему субъективному мнению, заслуживают внимания. Вот список за эту неделю:

  1. 22 ноября в рамках образовательного проекта GeekLabs в Одессе пройдет конференция FOSS Sea 2014, на которой, в частности, будут представлены доклады по таким темам, как текстовый анализ и цифровая обработка сигналов с использованием R. Кроме того, по окончании конференции пройдет мастер-класс, где будет рассмотрен пример сегментации клиентов интернет-магазина по товарным предпочтениям с помощью R.
  2. Объявлен прием тезисов докладов для второй конференции "Effective Applications of the R language" (EARL), которая пройдет в Лондоне 15-16 сентября 2015 г. Тематика докладов должна охватывать примеры использования R в бизнес-приложениях. Автор принятого доклада сможет бесплатно участвовать в конференции в день презентации. Тезисы следует направлять по адресу earl-team@mango-solutions.com, используя соответствующую форму.
  3. В журнале Journal of Machine Learning Research была опубликована статья (Fernández-Delgado et al. 2014), в которой выполнено сравнение эффективности 179 алгоритмов машинного обучения для решения практических задач классификации. Авторы обнаружили, что по точности получаемых предсказаний первое место занимают алгоритмы семейства Random Forest.  Значительная часть этой работы была выполнена с использованием известного R-пакета caret, предоставляющего унифицированный набор инструментов для создания предсказательных моделей. Автора пакета caret Макс Кун (Max Kuhn), который выступил одним из рецензентов статьи, делится в своем блоге некоторыми соображениями о результатах, полученных Fernández-Delgado et al. (2014).
  4. В издательстве Packt Publishing вышла книга "Practical Data Science Cookbook", в которой собраны 89 рецептов решения практических задач по построению предсказательных моделей с использованием R и Python. Тем же издательством в ноябре будет опубликована еще одна книга, посвященная реализации методов машинного обучения средствами R: "R Language Essentials". Основной упор в этой второй работе будет сделан на практическое применение соответствующих методов при решении реальных бизнес-проблем.
  5. В своем блоге Econometrics and Free Software Бруно Родригес (Bruno Rodriges) привел результаты сравнения быстродействия четырех различных реализаций R. На первом месте оказалась реализация Revolution R Open, о которой я писал совсем недавно.

4 комментария :

Tsch комментирует...

Хорошее начинание - удачи!

Анонимный комментирует...

Спасибо. Ждем продолжения!

Илья комментирует...

отличная рубрика!

atner комментирует...

Дело нужное, глядишь и местное R-сообщество подтянется до уровня публикации своих статей, кои далее будут системно попадать в Ваш обзор.

Отправить комментарий