LINUX.ORG.RU

Вышла новая версия пакета для статистической обработки данных R-2.6.0


0

0

3 октября вышла новая версия популярной кроссплатформенной (*nix/MacOS/M$) среды, включающей в себя интерпретатор языка R и набор библиотек, для анализа и обработки данных R-2.6.0

R был выпущен Оклендским университетом чуть более 10 лет назад как свободный диалект уже тогда популярного среди профессиональных статистиков языка S. За 10 лет мегабайтный пакет развился в мощную среду с замечательными графическими возможностями, средствами построения пользовательского интерфейса и своим обширным community разработчиков. Помимо собственно инсталяционного пакета весом в 15 мегабайт, проект поддерживает репозитарий дополнительных пакетов CRAN, созданного по образцу CPAN/CTAN, где можно найти иснтрументы для решения задач, выходящих далеко за пределы мат.статистики, вроде, например, Matlab/Оctave совместимого пакет для обработки сигналов signal.

>>> Ссылка на CRAN

ща сюда быдлолисперы набегут и просветят всех как это круто

anonymous
()

Вот и повод вновь попробовать его на моих задачах. Спасибо!

voronaam ★★
()

Замечательный инструмент. Всем, кто занимается анализом данных имеет смысл присмотреть к этом пакету. Он действительно позволяет переложить дурную работу на компьютер и освободить мозг для более важных дел. Это путь истинной автоматизации.

Evgueni ★★★★★
()

будем иметь в виду, если вдруг припрет)

AiFiLTr0 ★★★★★
()
Ответ на: комментарий от Evgueni

> У анонизмуса весёленькое расщепление личности, я только не понял на две или на три части, и кому досталась бОльшая часть мозга? :-D

alx_me ★★☆
()
Ответ на: комментарий от vadiml

"Не стреляйте в пианиста - он играет как умеет"

mk
() автор топика

УРА, товарищи! R forever.

caddr
()

Особых прорывов нет. GC теперь подчищает неиспользуемые открытые соединения, улучшена ленивая загрузка пакетов (утверждается, что на 50%), пофикшены баги. Угрожают, что некоторые фичи скоро перейдут в разряд defunct (типа адресации векторов с помощью $), так что, если есть старые R-скрипты, то лучше их лишний раз прогнать на предмет Warnings.

mk
() автор топика

Ближайший предок R это APL (и по сфере применения и по стилю работы с ним). Только передавать он умел только массивы. R передает объекты.

Все книжки про APL можно смело читать, была брошюрка с примерами обработки данных в среде APL (ну там тормозной путь машины регрессионной моделью аппроксимируют) ее очень даже можно читать и сейчас.

Особенно что бы въехать в логику применения и не допускать глупых криков.

anonymous
()

кстате очень забавно автокомплектация в базовой поставке все расширяется и расширяется :) все таки народ предпочитает "считать реальными данные, а не код"...

Меня так хватает только иметь запущенный рядом кате с кодом, и то принуждаешь себя :) обычно просто сессию сохранить достаточно.

anonymous
()
Ответ на: комментарий от mk

> Вы, случайно, не путаете R с J ?

про J первый раз услышал от Вас :)

о прочитал, полистал... оно еще на большее подобие пожалуй претендует :)

anonymous
()
Ответ на: комментарий от Valeriy_Onuchin

> почему нет Manuals на русском, и не одного русского Supporting Members?

вопрос сформулирован неправильно :) "я хочу организивать перевод документации на русский, все выложено в вики урл..."

не Михаил :)

anonymous
()
Ответ на: комментарий от Evgueni

Интересно узнать, что на нем было сделано, для автоматизации чего, как именно? Просто необходим пакет для стат. обработки данных, желательно на сервере , чтобы он получал данные от БД, обрабатывал, и в виде полноценного отчета отправлял пользователю...

armaron
()
Ответ на: комментарий от armaron

> Интересно узнать, что на нем было сделано, для автоматизации чего, как именно? Просто необходим пакет для стат. обработки данных, желательно на сервере , чтобы он получал данные от БД, обрабатывал, и в виде полноценного отчета отправлял пользователю...

да очень просто, есть библиотеки коннектящие пакет к SQL серверу, есть вывод в TeX, есть веб интерфес -> запускай в нужное время.

Если хочется по другому, есть возможность дергать либу, в том числе и dcom под виндой.

Если есть необходимость все интегрируется в электронную таблицу.

anonymous
()
Ответ на: комментарий от armaron

> Интересно узнать, что на нем было сделано, для автоматизации чего, как именно?

Конкретно я ничего с помощью R не делал - у меня задачи другого рода (очень большой объём данных, выборки из него по условию и подгонка гистограмм). Я к R только присматривался и нахожу что он для статистической обработки большого объёма (не "очень большого" а просто большого :) ) однородных данных очень хорош с огромным числом уже _готовых_ решений. Конкретнее описание следует смотреть документацию. С другой стороны если нужно, например, просто посчитать число коннектов и найти среднее, то можно обойтись более простыми средствами.

P.S. Были попытки написать серию популярных статей в соавторстве с тем, кто с R "на ты" именно по делу, но не "срослось". А я сам остановился только на уровне стения стандартной документации и проверки базовой функциональности. Мне очень система понравилась, но к сожалению мне требуется решать немного другие задачи.

Evgueni ★★★★★
()
Ответ на: комментарий от Valeriy_Onuchin

> Михаил, только без флейма :) почему нет Manuals на русском, и не одного русского Supporting Members?

Валерий, а можно без флейма :) почему нет Manuals на русском по root?

P.S. По R в этом году не вышло с Михаилом написать, но я думаю в следующем году напрягусь и что-то будет :)

Evgueni ★★★★★
()
Ответ на: комментарий от anonymous

>Ближайший предок R это APL

Еще там есть замыкания, содранные со Схемы. Функции можно сохранять в переменных и возвращать в качестве результата. Кстати для фитирования гистограмм эта система подходит идеально, поскольку можно писать что-то типа fit(hist,function (x) x*x) (вместо x*x может быть все что угодно). В ROOT так нельзя, там сначала надо определить функцию, завести объект TF1, и потом его передать в функцию фита. При интерактивной работе это здорово напрягает.

anonymous
()
Ответ на: комментарий от anonymous

Ну, стандартные простые функции предопределены. А нестандартную, как правило, форумулой не обойдёшься - приходится функцию писать.

У ROOT, как у наследника paw есть одно, но очень веское преимущество - ntuple (или tree), позволяющие быстро работать с очень большими объёмами данных. Гистограммы и там и там очень естественные объекты. То, что для интерактивной работы с ROOT приходится писать программы/скрипты - это да сильное ухудшение по сравнению с paw.

Evgueni ★★★★★
()
Ответ на: комментарий от Evgueni

По-русски по R есть следующее:

Шипунов А.Б. R - объектно-ориентированная статистическая среда. http://herba.msu.ru/shipunov/software/r/r-ru.htm

Меретилов М.А. Методические указания к лабораторным работам по курсу Методы анализа данных http://myths.ru/tmp/r-metoda-2006.10.23.pdf

K-3

anonymous
()
Ответ на: комментарий от Evgueni

>У ROOT, как у наследника paw есть одно, но очень веское преимущество - ntuple (или tree), позволяющие быстро работать с очень большими объёмами данных.

Это да, но физика высоких энергий -- это не только прочесывание гигантских ntuples. "Cтандартные простые формулы" --- это костыль, поскольку часто имеется набор уже готовых функций (которые написал пользователь), и ему необходимо комбинировать эти функции при помощи простых (типа разделить,умножить,сложить). Я не призываю выкинуть ROOT на помойку. Я против применения его из политических соображений (типа ROOT сделан специально для физики частиц, поэтому ВСЕ задачи решаем на нем).

anonymous
()
Ответ на: комментарий от anonymous

> Я против применения его из политических соображений (типа ROOT сделан специально для физики частиц, поэтому ВСЕ задачи решаем на нем).

Проблема в том, что часть задач можно решить только на нём, так как он во многих местах таки удобнее PAW. Других конкурентов для таких задач (как причёсывание гиганских нтаплов - других просто не держим :) ) нет, хотя ROOT весьма далёк от идеала. Подгонка в нём вполне удовлетворительна, надёжна и предсказуема, чтобы её на что-то менять без особой необходимости. А вот GUI писать на ROOT (такое встречается) это действительно глупость.

Evgueni ★★★★★
()
Ответ на: комментарий от anonymous

Вторую ссылку изучал. За первую ссылку спасибо.

Evgueni ★★★★★
()
Ответ на: комментарий от anonymous

> Меретилов М.А. ...

За вторую ссылку спасибо, а то я думал, что кроме моих (уже изрядно устаревших) материалов про R в сети по-русски ничего нет.

Никто из присутствующих, кстати, не хочет помочь в переводе сообщений R на русский? Переведено уже довольно много, но остались непереведенными почти все так называемые "Recommended"-пакеты.

===

С уважением, А. Шипунов

anonymous
()
Ответ на: комментарий от Evgueni

> P.S. Были попытки написать серию популярных статей в соавторстве с тем, кто с R "на ты" именно по делу, но не "срослось"...

Давайте напишем! У меня были большие планы, даже предварительный договор с издательством, но тоже "не срослось" -- моих сил не хватило...

===

С уважением, А. Шипунов

anonymous
()
Ответ на: комментарий от Valeriy_Onuchin

Прошу прощения за третье подряж сообщение. Я просто читаю дискуссию снизу вверх, потому что вверху -- сплошной флейм...

> почему нет Manuals на русском, и не одного русского Supporting Members?

Есть трое русских, занимавшихся переводом R. И немножко материалов.

===

С уважением, А. Шипунов

anonymous
()
Ответ на: комментарий от anonymous

> Давайте напишем! У меня были большие планы, даже предварительный договор с издательством, но тоже "не срослось" -- моих сил не хватило...

E.M.Baldin(в)inp(точка)nsk(точка)su - были планы написать серию статей (3-5) в Linux Format.

К сожалению до января следующего года серьезно вкладываться я не в состоянии. Можно пока пообсуждать.

Evgueni ★★★★★
()
Ответ на: комментарий от Evgueni

> Можно пока пообсуждать.

Написал Вам.

А.Ш.

anonymous
()
Ответ на: комментарий от Valeriy_Onuchin

>>почему нет Manuals на русском, и не одного русского Supporting Members?

Ответ, наверное очевиден :) Поскольку переводом мне заниматься не интересно, а эта работа не оплачивается ни полностью, ни частично.
Материальную поддержку я тоже оказать не могу, поскольку не имею для этого свободных денег. Думаю, тем не менее, что R Foundation от этого сильно не пострадает, у них достаточно спонсоров, да и статистик на Западе - это уважаемая и хорошо оплачиваемая профессия.
Свой код вместе с кривой документацией на ломаном английском я время от времени выкладываю в сеть. Я пытался как-то поднять деньги под написание проекта на R в научных фондах, но особо в этом не преуспел.

mk
() автор топика
Ответ на: комментарий от Evgueni

>>По R в этом году не вышло с Михаилом написать

Это не я ;)

Насколько я помню из обсуждений на ЛОре, писать вы её собирались с Меретиловым (автором упоминавшейся выше методички) AKA http://www.linux.org.ru/whois.jsp?nick=Ay49Mihas . Но, судя по аватаре, у него и так сейчас забот хватает :)

mk
() автор топика
Ответ на: комментарий от mk

> Это не я ;)

Я не понял к кому был вопрос Валерия :). Вы правы, что планировалось написать серию с Михаилом Меретиловым.

Evgueni ★★★★★
()
Ответ на: комментарий от anonymous

> Есть трое русских, занимавшихся переводом R. И немножко материалов.

как подключиться к процессу?

есть ли то что надо перевести в wiki или другом формате?

anonymous
()
Ответ на: комментарий от anonymous

R хорош тем, что его пишут профессиональные статистики.
Несомненнно, хотелось бы, иметь возможность (как-то)
использовать их код под ROOTом.
Есть ли опыт "конвертации" R-module (lib) into ROOT module (lib)?

Valeriy_Onuchin ★★
()
Ответ на: комментарий от Valeriy_Onuchin

>>Есть ли опыт "конвертации" R-module (lib) into ROOT module (lib)?

Многие R-модули представляют из себя смесь С/C++/Fortran кода, с обертками на R-скрипте. Как вы предполагаете это конвертировать? Разве что свой интерпретатор написать. Но и этого можно не делать, поскольку R компилируется в динамическую библиотеку. Подрубить ее к ROOT и готово :)

mk
() автор топика
Ответ на: комментарий от Valeriy_Onuchin

off-topic

> А вот GUI писать на ROOT (такое встречается) это действительно >глупость.

Евгений, не надо быть таким категоричным, и не надо судить о том,
в чем Вы не разбираетесь, либо не имеете понятие.

Valeriy_Onuchin ★★
()
Ответ на: комментарий от mk

в ROOTe модуль - это тоже динамическая библиотека, после загрузки
которой все функции описанные в этой библиотеке становятся
доступны интерпретатору.

Возможно ли убедить авторов пишущих R модули, "переписать"
их под ROOT. На сколько я понял, отношение R-собшества к ROOT
по крайней мере скептическое.

Valeriy_Onuchin ★★
()
Ответ на: комментарий от Valeriy_Onuchin

>off-topic

>> А вот GUI писать на ROOT (такое встречается) это действительно глупость.

>Евгений, не надо быть таким категоричным, и не надо судить о том, в чем Вы не разбираетесь, либо не имеете понятие.

Имею понятие, так как видел несколько попыток это сделать - не, оно как-то работает, но зрелище весьма жалкое. Всё, что за пределами ntupl'ов, гистограмм и подгонки у ROOT, IMHO, весьма плохо получается.

Evgueni ★★★★★
()
Ответ на: комментарий от Valeriy_Onuchin

>еще одно достоинство R - ето, несомненно, наличие CRAN. В ROOTe не помешало бы иметь нечо подобное.

IMHO, модель CTAN/CPAN/CRAN при стабильной, хорошо документированной и структурированной базе (чего всё-таки ROOT пока не хватает) самая разумная модель распределённой децентрализованной разработки.

Evgueni ★★★★★
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.