Сообщения за 2015

Пять наиболее важных событий в мире R по итогам 2015 г.

Как и в прошлом году , попытаюсь подвести некоторые итоги, перечислив пять наиболее важных, как мне кажется, событий и тенденций, имевших м...

Интересное из мира R (16-29 ноября 2015 г.)

Аббревиатура API расшифровывается как " Application Programming Interface " ( интерфейс программирования приложений ). По сути, э...

Введение в словарный и семантический анализ документов (на примере предвыборных программ кандидатов в президенты Беларуси)

11 октября 2015 г. в Беларуси состоятся очередные президентские выборы. На высшую должность претендуют четыре кандидата , каждый из которых...

В Лондоне прошла конференция "Эффективные применения языка R - 2015"

На этой неделе в Лондоне прошла 2-я конференция " Effective Applications of the R Language ( EARL )" ("Эффективные применен...

Опубликована новая книга на русском языке по практическому применению методов машинного обучения

В издательстве ДМК Пресс вышла новая переводная книга по машинному обучению - " Построение систем машинного обучения на языке Python...

Интересное из мира R (10 августа - 6 сентября 2015 г.)

Экосистема R продолжает расти с захватывающим дух темпом. 12 августа 2015 г. количество пакетов, опубликованных в хранилище CRAN, превысило...

Разбиение исходных данных на обучающую и контрольную выборки

Как было отмечено ранее, при построении предсказательных моделей исходные данные обычно разбиваются на обучающую (" training set &quot...

Подготовка данных для создания предсказательных моделей: преобразование качественных переменных в количественные

Рисунок заимствован из Wiki Эта статья завершает обзор основных методов подготовки данных для создания предсказательных моделей и посв...

Интересное из мира R (13 июля - 9 августа 2015 г.)

В блоге Revolution Analytics Дэвид Смит ( David Smith ) сообщил о создании нового подкаста " R Talk ", который будет посвящен но...

Какую модель выбрать, учитывая, что бесплатный сыр бывает только в мышеловке?

Рисунок заимствован с сайта coursera.org Одна из ключевых проблем, с которой исследователь сталкивается при разработке предсказательной...

Подготовка данных для создания предсказательных моделей: трансформация предикторов

Это сообщение продолжает начатую ранее тему подготовки данных для создания предсказательных моделей и посвящено трансформации предикторов....

Интересное из мира R (29 июня - 12 июля 2015 г.)

Из всего произошедшего в мире R за последние две недели хотелось бы отдельно остановиться на одной, но очень большой новости - 30 июня The ...

Подготовка данных для создания предсказательных моделей: обнаружение и удаление "ненужных" предикторов

Стадия подготовки исходных данных играет очень важную роль в процессе создании эффективных предсказательных моделей. Следующие сообщения бу...

Интересное из мира R (15 - 28 июня 2015 г.)

"Ньюсмейкером" в последние дни была компания RStudio, которая сообщила о: нескольких новых пакетах: leaflet для создания инте...

Переобучение - фундаментальная проблема, возникающая при создании предсказательных моделей

Многие современные методы регрессии и классификации способны описать очень сложные нелинейные связи между предикторами и переменной-отклико...

Интересное из мира R (1 - 14 июня 2015 г.)

В своем блоге Боб Мюнхен ( Bob Muenchen ) опубликовал результаты небольшого исследования "доли рынка" аналитического программног...

Открыт предварительный заказ нового издания книги "Статистический анализ и визуализация данных с помощью R"

С радостью сообщаю, что опубликованная в декабре прошлого года электронная книга " Статистический анализ и визуализация данных с пом...

Пакет caret - универсальный интерфейс для доступа к десяткам алгоритмов машинного обучения

Использование сложных алгоритмов для построения предсказательных моделей становится все более распространенным в самых разных областях - от...

Интересное из мира R (18-31 мая 2015 г.)

Вышла новая полноценная версия интегрированной среды разработки RStudio (v0.99). C обзором многочисленных нововведений можно ознакомиться...

Протокол разработки предсказательных моделей, предназначенных для решения бизнес-задач

В отличие от моделей, основное назначение которых заключается в установлении взаимоотношений между предикторами и некоторой переменной-откл...

Интересное из мира R (4-17 мая 2015 г.)

Похоже, скоро мы увидим первый, и очень серьезный, результат слияния компании Revolution Analytics с Microsoft. Как стало известно из офици...

Создание предсказательных моделей: основные шаги

Как отмечалось в одном из предыдущих сообщений , статистические модели создаются либо с целью получения предсказаний , либо для понимания  ...

Интересное из мира R (27 апреля - 3 мая 2015 г.)

В своем блоге "Язык R в финансах и экономике" Илья Езепов опубликовал  перевод  известной страницы  Google's R Style , в кот...

Интересное из мира R (20-26 апреля 2015 г.)

На этой неделе многие интересные публикации были связаны с фреймворком  Shiny : Дин Аттали ( Dean Attali ) объявил о выходе своего пакета...

Интересное из мира R (13-19 апреля 2015 г.)

Вышла новая версия R v3.2.0 . В этой версии разработчиками был сделан упор на оптимизацию быстродействия (в духе того, как это реализовано ...

Интересное из мира R (6-12 апреля 2015 г.)

В блоге RStudio Хэдли Уикхэм (Hadley Wickham) объявил о выходе своего нового пакета readr , предназначенного для импорта данных в среду R....

Интересное из мира R (30 марта - 5 апреля 2015 г.)

Импорт данных в R из Excel - довольно распространенная операция. Несмотря на наличие нескольких пакетов, позволяющих выполнять эту задачу, ...

Метод "случайный лес" помогает понять факторы, определяющие расселение чужеродного вида

Двустворчатый моллюск дрейссена речная ( Dreissena polymorpha ) является одним из наиболее агрессивных пресноводных видов-вселенцев . Выхо...

Интересное из мира R (23-29 марта 2015 г.)

Во вторник на этой неделе состоялся вебинар " Reproducibility with Revolution R Open and the Checkpoint Package ", организованный...

Диагностика линейных регрессионных моделей. Часть 3

Это сообщение является последним по теме диагностики линейных моделей (см. первые две части здесь и здесь ). Обсуждение этой темы мы завер...

Интересное из мира R (16-22 марта 2015 г.)

Роберт Мюнхен ( Robert Muenchen , автор таких книг, как " R for SAS and SPSS users " и " R for Stata users ") опубликов...

Интересное из мира R (9-15 марта 2015 г.)

Гарет Гролмунд ( Gareth Grolemund ) из RStudio опубликовал очень полезную шпаргалку по созданию пакетов R, которую можно скачать по этой сс...

Книга Петера Флаха по машинному обучению переведена на русский язык

Издательство "ДМК Пресс", в котором ранее вышли книги А. Б. Шипунова и соавт. " Наглядная статистика. Используем R! "...

Интересное из мира R (2-8 марта 2015 г.)

В этом году R Foundation снова была выбрана в качестве одной из организаций-менторов для проведения Google Summer of Code . В ходе этого ...

Как говорить на языке "Data Science"

О Data Science, Big Data, Machine Learning и т.п. сегодня не говорит только ленивый, и на то есть масса объективных причин. Однако из-за вс...

Интересное из мира R (23 февраля - 1 марта 2015 г.)

На этой неделе компания RStudio объявила о том, что бета-тестирование их (уже ставшего популярным) сервиса shinyapps.io  завершено и запущ...

И снова об авторизации при работе с Twitter API

В одном из предыдущих сообщений я описал простой пример использования возможностей пакетов twitteR и tm для анализа Twitter-сообщений. С...

Ещё сообщения Нет результатов.