LINUX.ORG.RU

Нужен ли мне R?

 


0

1

На работе обрабатываю многогигабайтные датасеты из JSON, XML, CSV.

Пока хватало Python, bash, sed, grep, head, tail, wc, xargs, cut, sort, XML Starlet.

Статистику не считаю, но часто ищу данные, выбираю группы строк из разных файлов по определенным критериям, нормализирую, денормализирую, дедуплицирую.

Если что-то одновременно не разовое, чтобы на bash, и одновременно не часть основного приложения, чтобы на Scala, то пишу на Python, особенно если скрипт нужно дать другим людям погонять.

Станет ли мне легче жить если я попробую с bash+python перейти на R?

★★★★★

Последнее исправление: vertexua (всего исправлений: 1)

Ответ на: комментарий от Evgueni

Когда перефразировал, что сказать хотел?

vertexua ★★★★★
() автор топика
Ответ на: комментарий от ados

Какой интерфейс - другой вопрос, я хочу определиться с самим R

vertexua ★★★★★
() автор топика
Ответ на: комментарий от anonymous

Норм, чо, спасибо, надо тоже глянуть

vertexua ★★★★★
() автор топика

Статистику не считаю

Станет ли мне легче жить если я попробую с bash+python перейти на R?

Не станет.

yvv ★★☆
()

Нет, не станет. Для подобных рутинных задач обработки данных, которые не используют специфичные/продвинутые статистические алгоритмы, лучше R не использовать. Это не те задачи, под которые он создавался.

visitor
()
Ответ на: комментарий от Deleted

Касательно статиситки и обработки чисел по отзывам во всех блогах R рвет что либо созданое для Python включая pandas как тузик тряпку.

Но у меня задачи попроще, потому в Python может быть смысл.

vertexua ★★★★★
() автор топика
Ответ на: комментарий от vertexua

Во всех блогах, посвященных R?;-)

И по какому параметру R рвет? По удобству использования? По наглядности синтаксиса? По производительности?

AIv ★★★★★
()
Ответ на: комментарий от vertexua

Кстати, если данных действительно гигабайты, то посмотри на hdf5, панда его тоже умеет.

Deleted
()
Ответ на: комментарий от AIv

И по какому параметру R рвет?

По количеству реализованных статистических методов, таки да, рвёт. Правда, могие из них переносятся в питон с помощью numpy элементарно.

yvv ★★☆
()

Станет ли мне легче жить если я попробую с bash+python перейти на R?

Ответ на твой вопрос придётся получить опытным путём.

Попробуй пакет data.table для R.

unikum ★★★★★
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.