Осенью этого года в московском издательстве "ДМК Пресс" вышли две новые книги по R на русском языке. Краткое описание этих книг приводится ниже.


Визуализация данных играет важную роль на всех этапах статистического анализа – от первичного ознакомления со свойствами данных до диагностики качества построенных моделей и представления полученных результатов. Из всего разнообразия статистических программ выделяется R - интенсивно развивающаяся и свободно распространяемая система статистических вычислений, в которой реализовано множество классических и современных методов анализа данных. Программные реализации алгоритмов, входящих в базовую версию R, проверены на практике не одним поколением пользователей и ученых. Кроме того, пользователи R постоянно разрабатывают многочисленные дополнения (т.н. «пакеты») для этой системы. Настоящая книга посвящена ggplot2 - одному из таких пакетов, который значительно расширяет и без того богатые базовые графические возможности R. В 2015 г. ggplot2 был установлен более миллиона раз. Такая популярность этого пакета обусловлена несколькими причинами, среди которых можно отметить эстетическую привлекательность и пригодное для публикации качество получаемых с его помощью графиков, возможность создавать пользовательские типы диаграмм, а также большой набор опций для тонкой настройки внешнего вида графиков. В этой книге описаны основы работы с ggplot2 и приведены многочисленные примеры кода, которые читатели легко могут модифицировать для собственных нужд. Книга окажется полезной для всех пользователей R, желающих освоить новый мощный инструмент анализа данных.



Всё, что регистрирует человек и созданные им машины, может считаться данными. Фиксируя новое и переводя архивы в цифровую форму, мы с каждым днём производим всё больше данных. Часть из них находится в специальных хранилищах, готовые к использованию. Но гораздо чаще случается так, что данные разбросаны по всемирной сети на многочисленных страницах онлайновых магазинов, заметках в со­циальных сетях, логах серверов и т. п. Прежде чем начать работать с такими данными, их необходимо собрать и сохранить в пригодном для анализа виде. Решению этих вопросов и посвящена данная книга. Основной материал книги разделён на две части. В первой части дано краткое введение в R - описание среды разра­ботки, языка и основных пакетов-расширений. Вторая часть посвящена непосредственно сбору данных: работе с открытыми данными, извлечению данных из веб-страниц и из соци­альных сетей. Также рассмотрены необходимые технические вопро­сы: протокол HTTP, функции импорта данных различных форматов и регулярные выражения. Завершается рассказ созданием карт на основе собранных данных. Издание предназначено специалистам по анализу данных, а также программистам, интересующихся сбором данных в Интернете.

Распространение информации об этих книгах приветствуется!

Сергей Мастицкий


3 Комментарии

Анонимный написал(а)…
Добрый день, Сергей! Сейчас читаю книгу "Введение в статистическое обучение", спасибо, перевод очень нравится. Планируете ли перевести еще какую-нибудь книгу, какие планы?
Unknown написал(а)…
Здравствуйте Сергей
Визуализация данных с помощью ggplot2 - отличная книга
Сбор данных в Интернете на языке R - написано мало о многом - ознакомительная
присоединяюсь к вопросу выше о планах
было бы круто перевести книгу Advanced R (Chapman & Hall/CRC The R Series) ну или что-то подобное Введение в статистическое обучение (отличная книга)
Sergey Mastitsky написал(а)…
Спасибо за отзывы! В ближайшие пару лет никакой работы над новыми книгами не планирую - слишком много времени и сил они занимают, к сожалению. Но здесь в блоге после Нового Года появится много новых материалов, так что подписывайтесь на рассылку и следите за новостями!
PS: над переводом книги Advanced R работал один и моих знакомых, но в каком состоянии тот проект сейчас я не знаю...
Новые Старые