LINUX.ORG.RU

Релиз R 3.0.0

 ,


3

2

Вышла мажорная версия самой динамично развивающейся среды для работы со статистической информацией, включающая язык программирования и огромное количество пакетов. Этот открытый проект является стандартом де-факто для множества компаний и университетов (достаточно взглянуть на связанные со статистикой курсы на Coursera).

Лицензия: GPLv2 и GPLv3, отдельные пакеты могут использовать BSD, MIT и другие лицензии.

Краткий список изменений:

  • поддержка длинных векторов (2^31 и более значений) на 64-разрядных системах;
  • память, доступная R на 64-разрядных системах, ограниченна исключительно ОС;
  • запрет использования отрицательных чисел в качестве цвета;
  • многочисленные улучшения производительности (замена .Call() на .Internal(), уменьшение числа копирований при операциях и т.п.);
  • исправления в реализации бета-распределения;
  • установка переменной окружения R_C_BOUNDS_CHECK=yes включает проверку выхода за границы массива при вызовах кода на C и Fortran;
  • из базы лицензий убрана проблемная лицензия artistic;
  • множество других изменений, детально описанных в анонсе по ссылке.

При наличии пакетов, ранее установленных с помощью R, а не через системный менеджер пакетов, может понадобится их пересборка:

update.packages(checkBuilt=TRUE)

Кроме того, стоит упомянуть, пусть и несколько запоздало, выход новой версии замечательного пакета lambda.r, который добавляет удобный синтаксис для функционального программирования в R.

На момент написания новости релиз уже должен был разойтись по зеркалам CRAN.

>>> Подробности



Проверено: Shaman007 ()
Последнее исправление: Dendy (всего исправлений: 4)

Ответ на: комментарий от Evgueni

сомневаюсь что это ему поможет - в root данные представляются/хранятся немного совсем иначе.Да и вообще он зело неудобен если сравнивать с R(каждый день использую ROOT на работе, да)

skvitek ★★★
()
Ответ на: комментарий от skvitek

Да ROOT — гадость, но весьма узкоспециализированная и для своей узкой специализации альтернативы как бы и нет.

Evgueni ★★★★★
()
Ответ на: комментарий от skvitek

Поэтому я и написал ещё и про списки.

И ты конечно же понимаешь, что простые списки это не вариант, т.к. они не индексированы ну вообще никак. И доступ к мало-мальски крупным объёмам данных будет чудовищно тормозным. И конечно, накладные расходы на хранение данных будут просто астрономическими. Сколько там одна Ncell на 64-битной R занимает? 56 байта? А сколько их нужно на поддежку одной записи, скажем, в 10-мерном массиве?

rtvd ★★★★★
()
Ответ на: комментарий от rtvd

не знаю, у меня списки всегда были индексированы. Алсо, может ROOT на меня уже повлиял или ещё что... Но если ваши данные представлены настолько идиотски, не стоит ли представить их нормально или хотябы иначе?

skvitek ★★★
()
Ответ на: комментарий от skvitek

не знаю, у меня списки всегда были индексированы. Алсо, может ROOT на меня уже повлиял или ещё что... Но если ваши данные представлены настолько идиотски, не стоит ли представить их нормально или хотябы иначе?

В чём именно заключается идиотскость представления? И как предлагаете это представление изменить?

rtvd ★★★★★
()
Ответ на: комментарий от rtvd

10-мерные массивы - это страшно и ужасно. В руте, например, чтобы избежать этого говна сделали деревья и бранчи. Да, рут страшное, дичайшее говно, но хранят данные они умело.

Никак не предлагаю представлять, я ведь даже не видел что там за оно, но возможно вам бы помго xps(сахарок - использование рутовского формата) от bioconductor. Собсно, это самый старый пакет на моей памяти, который мог в bigdata. Алсо, сейчас ещё парочка есть, но я, хоть убей, не вспомню их названий.

skvitek ★★★
()
Ответ на: комментарий от rtvd

Какой стандартной функцией я могу отобразить трёхмерное поле, где одна из компонент - цвет, а другая - степень прозрачности?

ну что вы в самом деле? с такими запросами как у прапорщика к табуретке :) сразу используйте рендерелку http://www.vtk.org/

psv1967 ★★★★★
()
Ответ на: комментарий от Vudod

Пусть Леннарт пишет пакеты для R (только к ядру его не пускайте), лишь бы завязывал с systemd.

не не не (С) у ленарта еще домашнее задание не окончено --- пропатчить _весь_ софт во _всех_ дистрибутивах что использует /dev/dsp (у меня его гуано так и клинит на всяких программах которые лезут напрямую к карте, а поскольку «до ленарта» ничего не глючило, пусть пашет :) ).

psv1967 ★★★★★
()
Ответ на: комментарий от Evgueni

Начал осваивать R и прихожу к выводу, что данный инструмент не очень хоршо подходит для реализации собственных алгоритмов, больше подходит для применения уже существующего алгоритма к данным. Правильное у меня впечатление?

Jurik_Phys ★★★★★
()
Ответ на: комментарий от Evgueni

Читаю литературу, примеров программирования, сколь-нибудь сложных практически нет. Несколько часов искал способа создания многомерных массивов, а это первое с чем столкнулся. Про for прямо написано, что не рекомендуется им злоупотреблять и т.д.

В общем, пока не понял философию использования R, буду разбираться.

Jurik_Phys ★★★★★
()
Ответ на: комментарий от psv1967

Мой алгоритм очень похож на алгоритм k-means из кластерного анализа, если судить по описанию. Но, хочется самому реализовать, чтобы досконально разобраться.

Jurik_Phys ★★★★★
()
Ответ на: комментарий от Jurik_Phys

Элемент над которым производится действие в R — вектор. Из одномерного массива всегда легко можно сделать многомерный. Хотя в R есть нормальные многомерные массивы в R — это матрицы.

От того что что-то советуют вовсе не значит, что советам следует следовать. Вон GOTO тоже советуют не употреблять, но это не мешает мне его где нужно (в основном конечно при модификации старых программ) добавлять :)

Да, интересно (для понимания): для каких статистических данных потребовались многомерные массивы?

Evgueni ★★★★★
()
Ответ на: комментарий от Evgueni

Есть периодически проводимый замер концентраций газов (семь газов) растворенных в масле силовых трансфлрматоров. Стоит задача классифицировать по этим данным состояние трансформатора. Собственно, массив с состояниями, по сути кластеры, на которые разбиваем множество замеров. В каждом кластере должно быть некоторое количество замеров, каждому соответствует семь газов.

Для формализации состояний и потребовался многомерный массив.

Jurik_Phys ★★★★★
()
Последнее исправление: Jurik_Phys (всего исправлений: 1)
Ответ на: комментарий от Jurik_Phys

в принципе есть готовые алгоритмы кластеризации пространства состояний марковского процесса с латентными переменными. там аналогичный пример контроль водостока по замерам в разных точках разветвленного русла реки. в результате выводятся состояния и матрица перехода между ними. + online вариант алгоритма видел для непрерывной оценки и перестройки этого пространства состояний

psv1967 ★★★★★
()
Ответ на: комментарий от psv1967

Главное, что я понял, что всё реализуемо с помощью R. Буду разбираться.

Jurik_Phys ★★★★★
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.