28 июня 2014

Как большие компании используют R, чтобы конкурировать на современном рынке



Недавно на сайте DataInformed Дэвид Смит (David Smith) из Revolution Analytics опубликовал статью о том, как большие компании используют R, чтобы составлять конкуренцию на современном, насыщенном данными, рынке. Привожу [вольный] перевод этой интересной статьи.


Свободно распространяемый язык программирования R является в настоящее время наиболее популярным статистическим программным обеспечением. Его используют более 2 миллионов аналитиков и статистиков по всему миру, и рост числа пользователей продолжается. Согласно исследованиям Dice.com и O'Reilly, специалистам, способным работать с R, готовы платить очень высокие зарплаты, из чего следует, что R все больше и больше приживается в бизнес-среде.

Компании, основанные на социальных сетях, были одними из первых, кто распознал ценность анализа своих богатых баз данных для понимания поведения и потребностей пользователей и улучшения соответствующих онлайн-платформ новыми опциями. Компания Facebook, которая ежедневно обрабатывает более 500 терабайт данных, использует R для понимания того, как пользователи взаимодействуют с предоставляемыми сервисами. Разведочный анализ данных помогает Facebook лучше понять, что их пользователи делают в течение дня, и как популярные мемы вирусно распространяются по социальной сети. Визуализация данных - важная часть этой работы. Facebook поделились своим опытом создания диаграмм при помощи R в рамках онлайн-курса по разведочному анализу данных на сайте Udacity, и даже использовали график, построенный при помощи R, в документе, который описывал перспективы первичного публичного размещения акций компании.

Анализ данных становится все более важным также для средств массовой информации - сектора, где наличие открытых источников информации привело к возникновению журналистики, основанной на данных (англ. data journalism). The New York Times были пионерами в этой области, использовав R для создания интерактивных приложений для предсказания результатов выборов в Сенат и определения места рождения человека по его диалекту. Журнал Time также регулярно применяет R для более наглядного изложения материала в статьях, тематика которых варьирует от распределения благосостояния в США до обсуждения лучших бейсбольных питчеров. Возможности R для быстрого прототипирования означают, что журналисты могут в считаные часы перейти от концепции к полноценной иллюстрации - важное обстоятельство для быстрого анализа срочных новостей.

Маркетинговая аналитика - это еще один сектор, где R быстро набирает обороты. По мере того, как ритейлеры собирают все больше данных по поведению, предпочтениям и другим характеристиками своих покупателей, появляются многочисленные аналитические компании, помогающие извлечь полезную информацию из этих данных. DataSong использует "анализ времени до наступления события", чтобы помочь ритейлерам вроде Williams-Sonoma понять маркетинговые события (рекламные объявления, рассылка каталогов или электронных писем, и т.п.), которые приводят к совершению покупки клиентом. Аналогично, [X+1] обрабатывает терабайты данных для обеспеспечения компаний вроде JP Morgan Chase и Verizon анализом поведения их клиентов в режиме реального времени с целью оптимизации маркетиновых мероприятий.

Финансовая и страховая индустрии всегда были лидерами в использовании сложных статистических методов, и поэтому неудивительно, что R широко применяется здесь для разработки новых стратегий в отношении трейдинга, ценовой политики и оптимизации для увеличения прибыли и снижения рисков. American Century Investments использует R для анализа "социальной сети компаний", в которой связи между узлами сети отражают финансовые взаимоотношения между компаниями. (Понимание того, как функционирование поставщиков влияет на производителей помогает компании оптимизировать свои инвестиционные портфолио). ANZ Bank использует R для оценки рисков, связанных с выдачей кредитов на покупку недвижимости. Оценка рисков также важна для страховой индустрии - компания Lloyds of London применяет R для моделирования потенциальных затрат, связанных с катастрофами, вроде ураганов и землетрясений.

Однако R практикуется не только большими компаниями. Этот язык программирования также используется для улучшения жизни незащищенных слоев населения и повышения общего благополучения общества. National Weather Service применяет R для предсказания уровней рек и оповещения населения о наводнениях, а Realclimate.org создает иллюстрации эффектов изменения климата (например, таяние льда в Арктике). В горячих точка планеты, вроде Сирии, Human Rights Data Analysis Group использует R для получения более объективных оценок числа жертв военных действий на основе неполной информации.

Все это - лишь небольшой перечень организаций, которые ежедневно используют R в своей деятельности, и список этот постоянно растет.

Одним из следствий происходящей сегодня революции "больших данных" стало осознание компаниями того, что ключ к успеху заключается в способности собрать и проанализировать необходимые данные и принять соответствующие решения на основе полученной информации раньше, чем это сделают конкуренты. В конкурентноспособных организациях это стало сегодня стратегической инициативой, и поэтому компании начали быстро нанимать новых аналитиков. В сравнении с другим программным обеспечением, R позволяет этим специалистам анализировать данные быстрее и при помощи более продвинутых методов, что объясняет быстрый рост популярности R в разных секторах экономики.


1 комментарий :

Александр Невеселов комментирует...

вот это бы http://www.algorithmist.ru/ кто-нибудь продолжил бы)) а то ничего нет

Отправить комментарий