27 июля 2014

Знакомьтесь - tidyr



На днях в официальном блоге RStudio проф. Хэдли Уикхэм объявил о выходе своего нового пакета - tidyr, функции которого предназначены для подготовки "опрятных" (англ. tidy) данных. Ниже приведен перевод этого объявления.




14 июля 2014

Книга "Наглядная статистика. Используем R!" теперь в свободном доступе



В 2012 г. была опубликована первая "толстая" книга по R на русском языке "Наглядная статистика. Используем R!". Как сообщил один из авторов этой книги, теперь она доступна в открытом доступе в виде PDF-файла: http://ashipunov.info/shipunov/school/books/rbook.pdf

P.S.: Здесь можно почитать интервью, которое ранее мне дал первый автор книги - Алексей Шипунов.








28 июня 2014

Как большие компании используют R, чтобы конкурировать на современном рынке



Недавно на сайте DataInformed Дэвид Смит (David Smith) из Revolution Analytics опубликовал статью о том, как большие компании используют R, чтобы составлять конкуренцию на современном, насыщенном данными, рынке. Привожу [вольный] перевод этой интересной статьи.

18 мая 2014

Линейная регрессия: насколько хорошо построенная модель описывает данные?



В сообщении "Каков возраст Вселенной?" был приведен пример построения простой линейной регрессии при помощи функции lm(). Полученная в том примере оценка коэффициента регрессии оказалась статистически значимой, что, казалось бы, указывает на высокое качество модели. Но так ли это? В данном сообщении будут рассмотрены количественные показатели, позволяющие ответить на этот вопрос.

04 мая 2014

Оценка неопределенности в отношении параметров линейной регрессии



В предыдущем сообщении был приведен пример оценки параметров простой линейной регрессии при помощи стандартной R-функции lm(). Как и в случае с любыми другими выборочными оценками, всегда существует неопределенность в отношении того, насколько выборочные оценки параметров регрессионной модели близки к соответствующим истинным значениям (т.е. в генеральной совокупности). В данном сообщении будут рассмотрены несколько способов, позволяющих охарактеризовать эту неопределенность.