LINUX.ORG.RU

Интервью с Алексеем Шипуновым на тему «Наглядная статистика. Используем R»

 , ,


0

1

Внезапно я наткнулся на интервью с основным автором книги «Наглядная статистика. Используем R» Алексеем Шипуновым.

В интервью изложена история и причины появления книги. Кратко: история сложная, а основная цель книги — ликвидация нехватки информации в России по этому свободному профессиональному инструменту анализа статистических данных.

>>> Подробности

★★★★★

Проверено: anonymous_incognito ()
Последнее исправление: Evgueni (всего исправлений: 1)

Ответ на: комментарий от anonymous

Статьи из LXF доступны тут: http://www.inp.nsk.su/~baldin/DataAnalysis/index.html

Через три года планируется выложить текст книги в открытый доступ.

В электронном виде в обозримом будущем нигде, так как этой опции в российских издательствах пока особо не предусмотрено (BHV что-то планирует, но по-момему и там пока ловить нечего). Англоязычные же книги по R (коих под сотню), соответственно доступны в англоязычных магазинах.

Evgueni ★★★★★
() автор топика

Я вот одного не понимаю. Чем эта штука лучше чем gnuplot + скрипты на перле или питоне ?

Reset ★★★★★
()
Ответ на: комментарий от Reset

Книга как раз именно для этого и написана. Как прочитаешь — сразу поймёшь. Я гарантирую это!

Evgueni ★★★★★
() автор топика
Ответ на: комментарий от Reset

Там все стыкуется со всем в режиме «по умолчанию», поэтому минимумом телодвижений перелопачиваешь данные под любым углом зрения. Много абстракций операций над данными.

Например: Декларативная графика в виде lattice и ggplot2. Огромной сложности диаграмма (рисовать её в любом другом пакете можно протянуть ноги за те несколько часов которые понадобятся) рисуется блоком кода в пяток строчек.

psv1967 ★★★★★
()
Ответ на: комментарий от Reset

Скрипты на перле или питоне трудны для восприятия экологов, биологов, экономистов. психологов и прочих исследователей, у которых есть данные. А R для них (и не только для них) удобнее, чем какой-нибудь Excel.

oami ★★
()
Ответ на: комментарий от psv1967

Ну это я больше ради цитаты из MiB вбросил :) А так R хорошая штука.

buddhist ★★★★★
()
Ответ на: комментарий от psv1967

а это не работает?

Не знаю, я просто спросил, но теперь гляну. Просто нахожусь в пассивном поиске замены python + networkx + matplotlib, т.к. разрабы не собираюсь либо свои под винду, а не все, с кем я работаю хотят и умеют использовать Linux.

Norgat ★★★★★
()
Ответ на: комментарий от Reset

Я вот одного не понимаю. Чем эта штука лучше чем gnuplot + скрипты на перле или питоне ?

На питоне, к сожалению, пока что нет столько хороших скриптов как в R.

yvv ★★☆
()

R удобен, только не хвататет автоматической раскраски графиков и построения легенды, как в гнуплоте. Или просто я чего-то недопетрил.

kerzol
()
Ответ на: комментарий от kerzol

посмотрите ggplot2 и lattice

в обычной графике тоже можно делать легенду, для этого есть операторы (но её надо именно делать :)

psv1967 ★★★★★
()
Ответ на: комментарий от psv1967

Спасибо за наводку, сейчас поставил R и начал курить статейки. Вроде очень годная штука, если либы устроят, то переведу на него часть своей работы))

Norgat ★★★★★
()

Для того, чтобы осилить эту книгу - нужно быть гуру по матстатистике? или это необязательно?

это ведь отдельный предмет в вузах... который как правило изучают на матлабе =) и изучают хреново, кстати. зачёт по нему стоит, но от этого не легче ;)

BattleCoder ★★★★★
()
Ответ на: комментарий от BattleCoder

Для того, чтобы осилить эту книгу - нужно быть гуру по матстатистике? или это необязательно?

Эта книга вводит в анализ данных на примере среды R. Предполагается максимально близкий к нулю уровень старта :).

Потом, освоив R и зачатки анализа, читатель сможет сам читать литературу и записывать узнанное в виде R кода.

psv1967 ★★★★★
()
Ответ на: комментарий от gaga

а как если с матлабом сравнивать оно? ну кроме того, что свободное.

это Схема с clos подобной системой, облагороженным синтаксисом и массой APL подобных векторных операций. циклы в нем писать не приветствуется :)

Мощная (очень) графика.

матлаб лично мне кажется более многословным, ну и для анализа данных как то бедновато в нем по сравнению с R.

psv1967 ★★★★★
()

Надо будет взять на заметку. Вдруг понадобится!

vada ★★★★★
()

У всех нехватка информации

ACR
()
Ответ на: комментарий от michwill

Вроде бы не так давно рекламировались (не на ЛОР) pandas для замены R: http://pandas.pydata.org/

О, процесс идёт, отлично!

yvv ★★☆
()

Спасибо, было интересно читать!

ymn ★★★★★
()

Заказал на Ozone, все-таки бумага под рукой лучше, чем что-либо еще, если работаю с техом, то всегда под рукой лежит «Первые шаги в LaTeX'e» Гретцера, есть простые примеры набора формул + таблицы символов AMS и LaTeX, если забываю, то подглядываю.

ErasimHolmogorin
()
Ответ на: комментарий от vitruss

по поводу либ под винду посмотри python(x,y) там всё это есть в дистрибе под винду.

Да у меня всё работает и под видной, кроме pygraphviz, который разрабы банально не собирают под винду (он там в тихую тащится в linux, как часть networkx). Но мне нужен именно этот layount для графов, т.к. в остальных layout'ах мои графы выглядят просто ужасно. Смысла тащить какую-то сборку либ не вижу - нужна либа - easy_install *libname*.

Norgat ★★★★★
()
Ответ на: комментарий от ACR

каким боком тут ексель? и по нему вроде хватает документации =)

BattleCoder ★★★★★
()
Ответ на: комментарий от michwill

Вроде бы не так давно рекламировались (не на ЛОР) pandas для замены R

Ха, один из основателей R (Ross Ihaka) призвал задуматься переехать с самописной Схемы на cl :)

psv1967 ★★★★★
()
Ответ на: комментарий от BattleCoder

Для того, чтобы осилить эту книгу - нужно быть гуру по матстатистике? или это необязательно?

Насчёт книги не знаю. Но в основном R даже помогает лучше освоить статистику.

anonymous
()
Ответ на: комментарий от Evgueni

Толсто же, аж между Красноярских столбов не пролазит

Да толстовато, но зато годная ссылка в результате вброса :)

ACR
()

R годная вещь. Как-то пришлось оставить машину на пару дней, чтобы провести фрактальный анализ на большом объеме данных СЗМ. R неплохо справился.

ApostolPetr
()
Ответ на: комментарий от ErasimHolmogorin

Заказал на Ozone, все-таки бумага под рукой лучше, чем что-либо еще

Тоже чуть там не заказал, остановила неудобная форма оплаты: через банковскую карту есть, никогда такой штукой не пользовался, а через удобнейший банковский перевод нет:( Ну раз нет, то подождём издания в дежавю, походу автор именно его опасается, потому и отправка заказов только после 4 марта.

Napilnik ★★★★★
()
Ответ на: комментарий от psv1967

wow!

ggplot2 нормальный такой пакет. К примеру, http://had.co.nz/ggplot2/stat_smooth.html выглядит довольно няшно.

раньше вместо этого я делал примерно так: library(gplots) my.plotCI = function(data) plotCI(mean(data),uiw=apply(data, 2, my.confdiff),type='l',lty=1, gap = 0,barcol='lightblue',pch=",sfrac=0,xlab='Iter.')

kerzol
()
Ответ на: комментарий от Napilnik

походу автор именно его опасается, потому и отправка заказов только после 4 марта.

конгениально, но миром правит не ложа а лажа

издательство тираж печатает по 200 экземпляров за раз, вот и все объяснение :)

PS пользоваться книгой для начального изучения R удобнее в бумажном варианте (С) мой скромный личный опыт

PPS вот русский перевод Введения в R http://m7876.wiki.zoho.com/Introduction-to-R.html?pid=78912000000002015

psv1967 ★★★★★
()
Ответ на: комментарий от kerzol
library(gplots)
my.plotCI <- function(data) plotCI(mean(data),
                                   uiw=apply(data, 2, my.confdiff),
                                   type='l',
                                   lty=1,
                                   gap = 0,
                                   barcol='lightblue',
                                   pch='',
                                   sfrac=0,
                                   xlab='Iter.')

не используйте «=» оно ломает потом автоотступы в коде, например в ess.

и где my.confdiff ? )

psv1967 ★★★★★
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.