14 июля 2014

Книга "Наглядная статистика. Используем R!" теперь в свободном доступе



В 2012 г. была опубликована первая "толстая" книга по R на русском языке "Наглядная статистика. Используем R!". Как сообщил один из авторов этой книги, теперь она доступна в открытом доступе в виде PDF-файла: http://ashipunov.info/shipunov/school/books/rbook.pdf

P.S.: Здесь можно почитать интервью, которое ранее мне дал первый автор книги - Алексей Шипунов.


28 июня 2014

Как большие компании используют R, чтобы конкурировать на современном рынке



Недавно на сайте DataInformed Дэвид Смит (David Smith) из Revolution Analytics опубликовал статью о том, как большие компании используют R, чтобы составлять конкуренцию на современном, насыщенном данными, рынке. Привожу [вольный] перевод этой интересной статьи.

18 мая 2014

Линейная регрессия: насколько хорошо построенная модель описывает данные?



В сообщении "Каков возраст Вселенной?" был приведен пример построения простой линейной регрессии при помощи функции lm(). Полученная в том примере оценка коэффициента регрессии оказалась статистически значимой, что, казалось бы, указывает на высокое качество модели. Но так ли это? В данном сообщении будут рассмотрены количественные показатели, позволяющие ответить на этот вопрос.

04 мая 2014

Оценка неопределенности в отношении параметров линейной регрессии



В предыдущем сообщении был приведен пример оценки параметров простой линейной регрессии при помощи стандартной R-функции lm(). Как и в случае с любыми другими выборочными оценками, всегда существует неопределенность в отношении того, насколько выборочные оценки параметров регрессионной модели близки к соответствующим истинным значениям (т.е. в генеральной совокупности). В данном сообщении будут рассмотрены несколько способов, позволяющих охарактеризовать эту неопределенность.

06 апреля 2014

Каков возраст Вселенной?



Как было показано в предыдущем сообщении, статистическая модель представляет собой упрощенное математическое представление процесса, который, как мы полагаем, привел к генерации наблюдаемых значений изучаемой переменной. Статистические модели используются для решения двух типов задач: 1) выявление характера взаимоотношений между переменной-откликом и некоторыми внешними факторами (предикторами) и 2) предсказание значений переменной-отклика на основе известных значений предикторов. В данном сообщении будет представлен пример использования простой линейной регрессии для решения задачи первого типа. Этой задачей будет установление... возраста Вселенной. Но сначала, как обычно, немного теории...