LINUX.ORG.RU
 
Evgueni

Интервью с Алексеем Шипуновым на тему «Наглядная статистика. Используем R»


0

1

Внезапно я наткнулся на интервью с основным автором книги «Наглядная статистика. Используем R» Алексеем Шипуновым.

В интервью изложена история и причины появления книги. Кратко: история сложная, а основная цель книги — ликвидация нехватки информации в России по этому свободному профессиональному инструменту анализа статистических данных.

>>> Подробности


[#]  

где купить в электронном виде?

anonymous ()
[#] Ответ на: комментарий от anonymous 22.02.2012 20:41:15  
Evgueni

Статьи из LXF доступны тут: http://www.inp.nsk.su/~baldin/DataAnalysis/index.html

Через три года планируется выложить текст книги в открытый доступ.

В электронном виде в обозримом будущем нигде, так как этой опции в российских издательствах пока особо не предусмотрено (BHV что-то планирует, но по-момему и там пока ловить нечего). Англоязычные же книги по R (коих под сотню), соответственно доступны в англоязычных магазинах.

***** ()
[#]  
buddhist

R не нужен.

Славься, K! Славься, К!

*** ()
[#]  
Reset

Я вот одного не понимаю. Чем эта штука лучше чем gnuplot + скрипты на перле или питоне ?

***** ()
[#] Ответ на: комментарий от Reset 22.02.2012 21:19:47  
Evgueni

Книга как раз именно для этого и написана. Как прочитаешь — сразу поймёшь. Я гарантирую это!

***** ()
[#] Ответ на: комментарий от Reset 22.02.2012 21:19:47  
psv1967

Там все стыкуется со всем в режиме "по умолчанию", поэтому минимумом телодвижений перелопачиваешь данные под любым углом зрения. Много абстракций операций над данными.

Например: Декларативная графика в виде lattice и ggplot2. Огромной сложности диаграмма (рисовать её в любом другом пакете можно протянуть ноги за те несколько часов которые понадобятся) рисуется блоком кода в пяток строчек.

*** ()
[#] Ответ на: комментарий от Reset 22.02.2012 21:19:47  

Скрипты на перле или питоне трудны для восприятия экологов, биологов, экономистов. психологов и прочих исследователей, у которых есть данные. А R для них (и не только для них) удобнее, чем какой-нибудь Excel.

** ()
[#] Ответ на: комментарий от buddhist 22.02.2012 21:18:13  
psv1967

Ну R из APL почерпнул достаточно на тему векторных операций.

*** ()
[#]  
Norgat

Вопрос спецам по R:

R умеет рисовать графы, используя graphviz, под виндой?

** ()
[#] Ответ на: комментарий от psv1967 22.02.2012 21:52:36  
buddhist

Ну это я больше ради цитаты из MiB вбросил :) А так R хорошая штука.

*** ()
[#] Ответ на: комментарий от psv1967 22.02.2012 22:01:25  
Norgat
>>-----Цитата---->>

а это не работает?

<<-----Цитата----<<

Не знаю, я просто спросил, но теперь гляну. Просто нахожусь в пассивном поиске замены python + networkx + matplotlib, т.к. разрабы не собираюсь либо свои под винду, а не все, с кем я работаю хотят и умеют использовать Linux.

** ()
[#] Ответ на: комментарий от Reset 22.02.2012 21:19:47  
>>-----Цитата---->>

Я вот одного не понимаю. Чем эта штука лучше чем gnuplot + скрипты на перле или питоне ?

<<-----Цитата----<<

На питоне, к сожалению, пока что нет столько хороших скриптов как в R.

* ()
[#]  

R удобен, только не хвататет автоматической раскраски графиков и построения легенды, как в гнуплоте. Или просто я чего-то недопетрил.

()
[#] Ответ на: комментарий от kerzol 22.02.2012 22:59:01  
psv1967

посмотрите ggplot2 и lattice

в обычной графике тоже можно делать легенду, для этого есть операторы (но её надо именно делать :)

*** ()
[#] Ответ на: комментарий от Norgat 22.02.2012 22:06:58  
psv1967

там собранный пакет именно под виндовс

*** ()
[#] Ответ на: комментарий от psv1967 22.02.2012 23:16:38  
Norgat

Спасибо за наводку, сейчас поставил R и начал курить статейки. Вроде очень годная штука, если либы устроят, то переведу на него часть своей работы))

** ()
[#]  

Для того, чтобы осилить эту книгу - нужно быть гуру по матстатистике? или это необязательно?

это ведь отдельный предмет в вузах... который как правило изучают на матлабе =) и изучают хреново, кстати. зачёт по нему стоит, но от этого не легче ;)

** ()
[#] Ответ на: комментарий от Reset 22.02.2012 21:19:47  
hope13

тем что очень удобно и просто.

()
[#]  

а как если с матлабом сравнивать оно? ну кроме того, что свободное.

()
[#] Ответ на: комментарий от gaga 23.02.2012 0:07:27  

Для статистики гораздо пригоднее. В связи с тем что богаче методами.

* ()
[#] Ответ на: комментарий от BattleCoder 22.02.2012 23:39:44  
psv1967
>>-----Цитата---->>

Для того, чтобы осилить эту книгу - нужно быть гуру по матстатистике? или это необязательно?

<<-----Цитата----<<

Эта книга вводит в анализ данных на примере среды R. Предполагается максимально близкий к нулю уровень старта :).

Потом, освоив R и зачатки анализа, читатель сможет сам читать литературу и записывать узнанное в виде R кода.

*** ()
[#] Ответ на: комментарий от gaga 23.02.2012 0:07:27  
psv1967
>>-----Цитата---->>

а как если с матлабом сравнивать оно? ну кроме того, что свободное.

<<-----Цитата----<<

это Схема с clos подобной системой, облагороженным синтаксисом и массой APL подобных векторных операций. циклы в нем писать не приветствуется :)

Мощная (очень) графика.

матлаб лично мне кажется более многословным, ну и для анализа данных как то бедновато в нем по сравнению с R.

*** ()
[#] Ответ на: комментарий от gaga 23.02.2012 0:26:05  
psv1967
>>-----Цитата---->>

а с processing?

<<-----Цитата----<<

а что это?

*** ()
[#]  
vada

Надо будет взять на заметку. Вдруг понадобится!

**** ()
[#]  

У всех нехватка информации

()
[#] Ответ на: комментарий от michwill 23.02.2012 3:50:33  
>>-----Цитата---->>

Вроде бы не так давно рекламировались (не на ЛОР) pandas для замены R: http://pandas.pydata.org/

<<-----Цитата----<<

О, процесс идёт, отлично!

* ()
[#] Ответ на: комментарий от Norgat 22.02.2012 22:06:58  

по поводу либ под винду посмотри python(x,y) там всё это есть в дистрибе под винду.

* ()
[#]  

Спасибо, было интересно читать!

** ()
[#]  
ErasimHolmogorin

Заказал на Ozone, все-таки бумага под рукой лучше, чем что-либо еще, если работаю с техом, то всегда под рукой лежит «Первые шаги в LaTeX'e» Гретцера, есть простые примеры набора формул + таблицы символов AMS и LaTeX, если забываю, то подглядываю.

* ()
[#]  

лучше бы по екселю нормальную статью запилили

()
[#] Ответ на: комментарий от ACR 23.02.2012 8:35:19  
Evgueni

Толсто же, аж между Красноярских столбов не пролазит.

***** ()
[#] Ответ на: комментарий от vitruss 23.02.2012 7:39:45  
Norgat
>>-----Цитата---->>

по поводу либ под винду посмотри python(x,y) там всё это есть в дистрибе под винду.

<<-----Цитата----<<

Да у меня всё работает и под видной, кроме pygraphviz, который разрабы банально не собирают под винду (он там в тихую тащится в linux, как часть networkx). Но мне нужен именно этот layount для графов, т.к. в остальных layout'ах мои графы выглядят просто ужасно. Смысла тащить какую-то сборку либ не вижу - нужна либа - easy_install *libname*.

** ()
[#] Ответ на: комментарий от ACR 23.02.2012 8:35:19  
psv1967
>>-----Цитата---->>

лучше бы по екселю нормальную статью запилили

<<-----Цитата----<<

R прекрасно интегрируется с экселем http://rcom.univie.ac.at/

*** ()
[#] Ответ на: комментарий от ACR 23.02.2012 8:35:19  

каким боком тут ексель? и по нему вроде хватает документации =)

** ()
[#] Ответ на: комментарий от michwill 23.02.2012 3:50:33  
psv1967
>>-----Цитата---->>

Вроде бы не так давно рекламировались (не на ЛОР) pandas для замены R

<<-----Цитата----<<

Ха, один из основателей R (Ross Ihaka) призвал задуматься переехать с самописной Схемы на cl :)

*** ()
[#] Ответ на: комментарий от BattleCoder 22.02.2012 23:39:44  
>>-----Цитата---->>

Для того, чтобы осилить эту книгу - нужно быть гуру по матстатистике? или это необязательно?

<<-----Цитата----<<

Насчёт книги не знаю. Но в основном R даже помогает лучше освоить статистику.

anonymous ()
[#] Ответ на: комментарий от Evgueni 23.02.2012 8:46:23  
>>-----Цитата---->>

Толсто же, аж между Красноярских столбов не пролазит

<<-----Цитата----<<

Да толстовато, но зато годная ссылка в результате вброса :)

()
[#]  

R годная вещь. Как-то пришлось оставить машину на пару дней, чтобы провести фрактальный анализ на большом объеме данных СЗМ. R неплохо справился.

* ()
[#] Ответ на: комментарий от ErasimHolmogorin 23.02.2012 8:10:15  
Napilnik
>>-----Цитата---->>

Заказал на Ozone, все-таки бумага под рукой лучше, чем что-либо еще

<<-----Цитата----<<

Тоже чуть там не заказал, остановила неудобная форма оплаты: через банковскую карту есть, никогда такой штукой не пользовался, а через удобнейший банковский перевод нет:( Ну раз нет, то подождём издания в дежавю, походу автор именно его опасается, потому и отправка заказов только после 4 марта.

*** ()
[#] Ответ на: комментарий от psv1967 22.02.2012 23:15:12  
>>-----Цитата---->>

посмотрите ggplot2 и lattice

<<-----Цитата----<<

спасибо, погляжу.

()
[#] Ответ на: комментарий от psv1967 22.02.2012 23:15:12  

wow!

ggplot2 нормальный такой пакет. К примеру, http://had.co.nz/ggplot2/stat_smooth.html выглядит довольно няшно.

раньше вместо этого я делал примерно так: library(gplots) my.plotCI = function(data) plotCI(mean(data),uiw=apply(data, 2, my.confdiff),type='l',lty=1, gap = 0,barcol='lightblue',pch='',sfrac=0,xlab='Iter.')

()
[#] Ответ на: комментарий от Napilnik 23.02.2012 20:59:57  
psv1967
>>-----Цитата---->>

походу автор именно его опасается, потому и отправка заказов только после 4 марта.

<<-----Цитата----<<

конгениально, но миром правит не ложа а лажа

издательство тираж печатает по 200 экземпляров за раз, вот и все объяснение :)

PS пользоваться книгой для начального изучения R удобнее в бумажном варианте (С) мой скромный личный опыт

PPS вот русский перевод Введения в R http://m7876.wiki.zoho.com/Introduction-to-R.html?pid=78912000000002015

*** ()
[#] Ответ на: комментарий от kerzol 23.02.2012 21:31:02  
psv1967
library(gplots)
my.plotCI <- function(data) plotCI(mean(data),
                                   uiw=apply(data, 2, my.confdiff),
                                   type='l',
                                   lty=1,
                                   gap = 0,
                                   barcol='lightblue',
                                   pch='',
                                   sfrac=0,
                                   xlab='Iter.')

не используйте "=" оно ломает потом автоотступы в коде, например в ess.

и где my.confdiff ? )

*** ()