LINUX.ORG.RU

R — самое используемое приложение в data mining

 , ,


2

3

Регулярно проводимый опрос популярности программного обеспечения среди специалистов по прикладному анализу данных KDnuggets Software Poll впервые показал превышение доли продуктов анализа с открытым кодом над проприетарными решениями анализа данных.

Доля пользователей использующих именно R превысила 30%. Это самое популярное средство анализа в абсолютной категории. Эта доля подозрительно равна доле специалистов, использующих только средства анализа с открытым кодом. Похоже, R — полностью самодостаточный продукт анализа данных.

Доля пользователей, использующих одновременно и открытые, и проприетарные средства анализа, составила 41%.

Доля пользователей, использующих исключительно проприетарные программные продукты — 28%.

Обзор интересен также списком наиболее популярных продуктов анализа данных.

>>> Подробности

Ответ на: комментарий от Macil

слипнется юноша у вас все :)

еще раз --- R это интепретатор схемы, все конструкции языковые реализованы как синтаксический сахар.

psv1967 ★★★★★ ()
Ответ на: комментарий от psv1967

еще раз --- R это интепретатор схемы

Да-а-а? И каким же это местом? Определенное влияние Схемы на R есть, но это не значит, что R автоматически стал Схемой.

Macil ★★★★★ ()
Ответ на: комментарий от Macil

какое «влияние»? месье филолог?

это _самописная_ схема. автор изначальный даже пожалел публично что стали велосипедить, а не взяли готовую реализацию. полный контроль за потрохами интерпертатора-компилятора не окупает недостаток ресурсов на вторичную по природе велосипедную работу. (он вообще свободную реализацию лиспа типа sbcl предложил как движок R, а все выкрунтасы с типами запилить макросами :)

но сейчас народ взялся чуть ли не на регистрах вместо стека переписать имеющийся интерпретаторо-компилятор и типа радикально все ускорить. До очередного запора в развитии велосипеда надо полагать :)

psv1967 ★★★★★ ()
Ответ на: комментарий от psv1967

Круто. А можно ли R как-нибудь интегрировать в офисные пакеты. В первую очередь интересует MSO, но про OOO тоже интересно было бы узнать.

anonymous ()
Ответ на: комментарий от psv1967

но сейчас народ взялся чуть ли не на регистрах вместо стека переписать имеющийся интерпретаторо-компилятор и типа радикально все ускорить. До очередного запора в развитии велосипеда надо полагать :)

в смысле форкнули или же главразрабы переписивают?

anonymous ()
Ответ на: комментарий от anonymous

Есть возможность встроить R эксель.

anonymous ()

Похоже, R — полностью самодостаточный продукт анализа данных.

При этом великолепно идет с гарниром из питона или руби

DNA_Seq ★★☆☆☆ ()
Ответ на: комментарий от anonymous

Как-то была идея запилить в OOo, но инвестор слился (походу бабло там попилили, поскольку организация государственная была).

Suntechnic ★★★★★ ()
Ответ на: комментарий от sanaris

вы перепутали data mining с text mining (хотя иногда они достаточно плотно связаны)

XVilka ★★★★★ ()
Ответ на: комментарий от buddhist

вся идея векторности операторов по умолчанию и оформления синтаксиса выборки из векторов-массивов действительно взята из APL (еще в момент создания S как наследника APL систем анализа данных)

psv1967 ★★★★★ ()
Ответ на: комментарий от sanaris

ну уж тогда не «разведка», а «поиск»; как филолог филологу :)

psv1967 ★★★★★ ()
Ответ на: комментарий от Evgueni

Для опенофиса у R есть odfweave. Это не calc конечно, а writer :). Но и техника грамотного программирования + векторные операции в R лучше, чем концепция электронных таблиц.

psv1967 ★★★★★ ()
Ответ на: комментарий от psv1967

Я думаю, что в основном имелось в виду возможность вызывать таблицах команды R, так как не все готовы заниматься именно обработкой данных (в 99% случае обработка в exel — это картинка одной переменной от другой и в лучшем случае подгонка прямой). Хотя в таком разе действительно R особо не нужен.

Я видел как-то диплом под названием «Система статистической обработки данных», где автор героически обходил ограничения exel, так как данных внезапно стало на порядок больше, чем раньше и все любовно накарябанные скрипты в таблице перестали работать. Диплом не взлетел, но впечатлил количеством найденных граблей.

Evgueni ★★★★★ ()

На чем можно удобно программировать под R?

На чем можно удобно программировать под R?

R, конечно, мощная вещь. Но уж больно не удобная. Есть ли удобные средства работы с R.

Хотя бы с поддержкой автокомплишена и подсказки на типы параметров функций?

PS пробовал сначала сам интерпретатор R, затем Rcommander. Rcmdr чуть более привлекателен. Но даже VS от оффтопика удобнее основных сред под R.

VoDA ★★ ()
Ответ на: комментарий от Evgueni

в случае электронной таблицы это как r ограниченный одним dataframe с возможностью применяться целиком к столбцу (да я знаю что там есть внешняя процедура субсета) (в сущности статистика для виндовс получается :) отсутствие возможности трансофрмации данных из «широкого» датафрейма в «длинный»... мрак и ужас :)

psv1967 ★★★★★ ()

нажмите таб в интерпретаторе наконец :) он более чем достаточен для эффективной работы. ctrl-(s|r) поиск по истории.

функции (и в принципе любые объекты) на редактирование в интерпретаторе вызывать edit()

----------------

например ess + все для латекса и noweb в emacs

----------------

rstudio пытается реализовать функционал ess со товарищи

psv1967 ★★★★★ ()
Ответ на: комментарий от anonymous

А можно ли R как-нибудь интегрировать в офисные пакеты.

Не знаю, не пользуюсь. Но R можно круто интегрировать в LaTeX. man Sweave, если интересно.

ugoday ★★★★★ ()
Ответ на: комментарий от ugoday

плюсую! Ещё в совокупности с Org mode - вообще прелесть!

mlt ()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.