10-12 сентября в Лондоне прошла 6-я ежегодная конференция по использованию R в бизнесе "Enterprise Applications of the R Language (EARL)". В конференции приняли участие представители самых разнообразных отраслей - страхование, банковское дело, маркетинг, авиация, фармацевтика, розничная торговля, консалтинг, журналистика и др. Ниже я поделюсь своими заметками об увиденном и услышанном на EARL в этом году.
Первый день конференции был традиционно отведен на проведение нескольких практических семинаров:
- Использование R Markdown для создания интерактивных отчетов;
- Глубокое обучение с помощью Keras и R;
- Объяснимые модели в машинном обучении (очень "горячая" тема сегодня!);
- Развертывание Shiny-приложений в промышленных условиях.
Второй день начался с двух пленарных докладов:
- Хелен Хантер (Helen Hunter), директор по работе с данными из торговой сети Sainsbury's, рассказала о технологическом стеке, используемом в их компании для создания универсальной платформы по обработке больших объемов данных, формированию автоматизированных отчетов, а также разработке и развертыванию предсказательных сервисов.
- Джулия Силге (Julia Silge), аналитик из Stack Overflow, рассказала о том, как она использует R в своей работе, в частности для анализа данных, собираемых в ходе ежегодного опроса разработчиков "Developer Survey".
Далее последовали доклады, посвященные таким темам, как:
- развертывание основанных на R аналитических приложений в промышленных условиях,
- примеры промышленных Shiny-приложений,
- воспроизводимость аналитических проектов, а также
- примеры использования R для решения конкретных бизнес-задач (анализ текстовых данных, прогнозирование временных рядов, выявление аномалий, маркетинговые исследования, анализ и оптимизация процессов, и др.).
Мне особенно были интересны примеры развертывания R-приложений. В посвященных этой теме докладах особых неожиданностей не было - в большинстве случаев применяется контейнеризация с помощью Docker'а и последующие оркестрация и масштабирование Docker-контейнеров с помощью Kubernetes. В нескольких случаях для создания API предсказательных сервисов было отмечено использование пакета plumber, что тоже неудивительно. Томас Лабер (Thomas Laber) из Austrian Post привел также примеры применения бессерверных технологий для развертывания R-приложений в "облаке" (в частности, с помощью сервиса AWS Lambda, в котором с недавних пор можно реализовать практически любую среду выполнения, включая R).
Третий день начался с пленарного доклада, в котором завсегдатай конференции Тим Полден (Tim Paulden) из ATASS Sports рассказал, как он помогает с преподаванием R школьникам из математических классов. После доклада Тима было представлено несколько "молниеносных презентаций" (длительностью до 10 мин.) о том, как R используется в некоммерческих организациях (Национальная служба здравоохранения Великобритании, Stop The Traffik, и др.). Темы последовавших далее обычных по длительности докладов значительно пересекались с таковыми в предыдущий день.
Интересно, что в этом году было несколько презентаций от представителей страховой индустрии, в том числе и доклад Елены Фурлан (Elena Furlan) из моей команды (я сейчас работаю в страховой компании Aviva, где руковожу разработкой рекомендательных систем и других похожих приложений). Елена рассказала о проекте, целью которого было обнаружение семантически однородных поисковых фраз, используемых посетителями Google при поиске информации о страховых продуктах. Имея такие группы поисковых фраз, далее можно оптимизировать бюджет и исполнение соответствующих рекламных кампаний. В этом проекте мы применили алгоритм для получения вложений слов и предложений fastText, разработанный исследователями из Facebook в 2013 г. Эти вложения далее были использованы в кластерном анализе по методу K-средних. Кстати, похожий доклад сделала также Аманда Бидхэм (Amanda Beedham) из RSA Insurance, в котором рассказала о примененном ею другом алгоритме от Facebook - StarSpace (см. также пакет ruimtehol для R) - для обнаружения семантически однородных групп среди медицинских записей.
Как обычно, конференция была очень хорошо организована (этим занимается консалтинговая компания Mango Solutions) и прошла успешно. В целом, несмотря на значительный рост популярности Python в последнее время, было приятно убедиться, что старый добрый R не только не сдает позиции в качестве специализированного языка для анализа и визуализации данных, но и находит новые практические приложения и способы внедрения.
Отправить комментарий