- d (от "density", плотность): функции плотности вероятности ("функция распределения масс" для дискретных величин);
- p (от "probability", вероятность): кумулятивные функции распределения вероятностей;
- q (от "quantile", квантиль): функции для нахождения квантилей того или иного распределения;
- r (от "random", случайный): функции для генерации случайных чисел в соответствии с параметрами того или иного закона распределения вероятностей.
В частности, в базовой версии R реализованы следующие законы распределения вероятностей:
- Бета-распределение (см. ?dbeta)
- Биномиальное распределение (включая распределение Бернулли) (dbinom)
- Распределение Коши (dcauchy)
- Распределение хи-квадрат (dchisq)
- Экспоненциальное распределение (dexp)
- Распределение Фишера (df)
- Гамма-распределение (dgamma)
- Геометрическое распределение (как частный случай отрицательного биномиального распределения) (dgeom)
- Гипергеометрическое распределение (dhyper)
- Логнормальное распределение (dlnorm)
- Полиномиальное (= мультиномиальное) распределение (dmultinom)
- Отрицательное биномиальное распределение (dnbinom)
- Нормальное распределение (dnorm)
- Распределение Пуассона (dpois)
- Распределение Стьюдента (dt)
- Равномерное распределение (dunif)
- Распределение Вейбулла (dweibull)
В качестве примера рассмотрим d-, p-, q- и r-функции, предназначенные для работы с нормальным распределением. Предположим, что мы имеем дело с непрерывной количественной величиной X, значения которой распределены в соответствии со стандартным нормальным распределением (среднее значение = 0, стандартное отклонение = 1). Функция плотности вероятности представляет собой такую функцию \(f(x)\), что для любых двух значений \(a\) и \(b\) (при \(a \leq b\)):
\[P(a \leq x \leq b )=\int_{a}^{b}f(x)dx.\]
Иными словами, вероятность того, что некоторая случайная величина \(X\) принимает значение, лежащее в интервале \([a, b]\), равна площади под кривой плотности вероятности, ограниченной этим интервалом. По определению площадь под всей кривой плотности вероятности равна 1. Функция плотности вероятности стандартного нормального распределения задается уравнением
\[f(x)=\frac{1}{\sqrt{2\pi}}e^{-x^2/2}.\]
R-функция drnorm() позволяет рассчитать значение функции плотности вероятности для заданного значения (или сразу для вектора из нескольких значений) \(X\). Так, для \(x = 1\) в случае со стандартным нормальным распеделением получаем
pnorm(-1) [1] 0.1586553
Рис. 2 |
Рис. 3 |
d-, p-, q- и r-функции для других распределений работают сходным образом. В заключение стоит отметить, что в дополнительных R-пакетах можно найти функции для работы с большим числом других законов распределения вероятностей. Особенно полезными, в частности, могут оказаться пакеты VGAM, actuar, gamlss и ActuDistns. Подробнее можно почитать здесь (англ. яз.).
Не могу не упомянуть пакет gamlss, который значительно расширяет приведённый в статье перечень.
Отправить комментарий