13 апреля 2012

Статистика - это не математика



Недавно в одном из блогов, которые я постоянно читаю - Simply Statistics - встретил небольшое сообщение, в котором автор рассуждает о том, почему люди ассоциируют статистику с математикой. Мне эти рассуждения показались интересными, и более того - близкими моим собственным представлениям по данному вопросу. Привожу мой перевод этого сообщения.

"Статистика, подобно многим другим дисциплинам (физика, инженерия, химия, информатика), находится в зависимости от математики. Однако, так же, как и все эти другие дициплины, статистика не является математикой; математика - лишь инструмент, используемый для решения статистических проблем. И все же, в отличие от других дисциплин, статистику отождествляют с математикой в новостных заголовках. Каждый раз, когда люди используют статистический анализ для решения интересной проблемы, мы видим в этих заголовках что-то вроде "Математику можно использовать для решения замечательной проблемы Х" или "Математические основы явления Y". Вот несколько реальных примеров.

  • The Mathematics of Lego (Математика Lego) - использование конструкций из деталей Lego для оценки статистического распределения;
  • The Mathematics of War (Математика войны) - использование данных по военным конфликтам, также для оценки статистического распределения; 
  • Usain Bolt can run faster with maths (Усэйн Болт может бежать быстрее при помощи математики) - twitter-сообщение о статистическом анализе длительности забегов известного спринтера Усэйна Болта;
  • The Mathematics of Beauty (Математика красоты) - анализ данных о связи между количестве отзывов на профиль в сервисе знакомств и привлекательностью фотографии владельца профиля.
Это лишь немногие сходу пришедшие мне в голову примеры, но я регулярно вижу подобные заголовки. Мне кажется, что есть несколько причин, по которым математику ассоциируют со статистикой: (1) многие отцы-основатели статистики изначально были математиками (но не все); (2) многие статистики по-прежнему считают себя математиками, и (3) в некоторых случаях статистике дают довольно узкое определение.

Касаясь пункта (3), обратите внимание на следующие дисциплины:
  • Биостатистика
  • Наука о данных (Data Science)
  • Машинное обучение
  • Обработка естественных языков
  • Обработка сигналов
  • Бизнес-аналитика
  • Эконометрия
  • Классификация документов
  • Социологическая статистика
  • Управление процессами
Любую из перечисленных дисциплин можно легко классифицировать как "прикладная статистика". Но как много представителей этих областей назвали бы себя статистиками? Или, что еще более важно, в отношении скольких из них "настоящие статистики" заявили бы, что эти люди не имеют отношения к статистике?"

А что вы думаете по этому поводу?


3 комментария :

Асджадс комментирует...

В школе были проблемы с математикой из-за преподавателя. К середине-концу обучения в университете обнаружил тягу к цифрам. В итоге для меня Numbers Rule Your World, статистика - это та же жизнь, но в цифрах. Погружаясь в статистику я думаю о себе и закономерностях своей жизни, которую исследую, но ни как не о математике. Математика это правила счета и какие-то теоремы.

One more thing ... Сергей, очень сложно комментировать блог, который предлагает подписаться используя учетную запись Google, LJ, WP, TypePad, AIM или OpenID. Думаю, в 80% случаев, даже зная, что сказать я бы промолчал...

Сергей Мастицкий комментирует...

Асджадс, спасибо за комментарий, особенно с учетом того, как непросто это сделать :)
Теперь все ограничения на учетную запись сняты.

Анонимный комментирует...

На самом деле очень трудно провести границу между математикой и статистикой, потому что наряду с теоретической существует также и прикладная математика, которая "предоставляет свои модели другим наукам и инженерным дисциплинам". С другой стороны, статистику, как область деятельности, также можно разделить на математическую статистику вкупе с теорией вероятности и анализ данных. На мой взгляд, математическая статистика является частью математики. Анализ данных, который начинается с частного, по определению не является математикой.

Отправить комментарий