LINUX.ORG.RU

Сообщения workForFood

 

Посоветуйте пожалуйста математическую библиотеку

Форум — Development

Уважаемые жители и гости этого форума!

Предистория: ударился я немного в DataMining, однако с матчастью у меня туговато, поэтому подтягиваю матстатистику своими силами.

Необходимо построить регрессионную модель, в принципе сложностей нет, однако все мои «преподаватели-консультанты» советуют использовать MS Excel (Тут наверное должна быть НЕНАВИСТЬ, однако я считаю Эксель неплохим продуктом). Соотв. получаем выборку данных, строим гистрограммы и ВРУЧНУЮ из массива данных выбрасываем пики и спады (О_о). И, хотя модели достаточно простые, статистические критерии к выборкам не применяются, все на глаз.

Массивы данных достаточно объемные, мне хотелось бы как-то это дело автоматизировать. Статистика может поступать в двух видах, либо это книги пресловутого Экселя, либо распечатки каких-то древних программ на бумаге. В любом случае получение информации не представляется очень сложным, даже без установленного офтопика с МС ОФЕС.

Грубо говоря систему я представляю в таком виде: в нее какими-то путями загружается статистика, она ее обрабатывает и выдает отчет с моделями и рекомендациями. Детали процесса не важны в данном случае.

Суть проблемы: хотелось бы полной автоматизации процесса обработки данных и построения моделей в итоге, алгоритмы есть, однако я теряюсь в выборе математической библиотеки.

Поэтому, прошу вашей помощи по вопросам:

1) Существуют ли библиотеки, позволяющие работать с матстатистикой для какого-нибудь достаточно известного языка, например Си или Руби/Питона? Как я понимаю, мне достаточно численных вычислений. (Разницу между символьными и численными понимаю смутно)

2) Возможно, есть какие-то интерфесы для доступа к существующим системам, к примеру к Maxima (исключая терминальный режим, хотя, тоже вариант, на крайний случай). Интересуют именно внешний способ взаимодействия (вызвал программу, дал инструкции, результат куда-то сложили, закрыл, обработал во внешней программе), а не внутренние скриптовые языки.

3) Возможно в самой постановке задачи есть ошибка? Может быть есть какие-то альтернативные способы решения?

Графики строить предполагаю gnuplot'ом, из библиотек сейчас нашел и пытаюсь изучать следующие: http://www.scimath.com/ http://www.thefreecountry.com/sourcecode/mathematics.shtml http://www.wessa.net/

Еще часто мелькает S.A.G.E но меня пугает его размер, и назначение я не совсем понял.

Предпочтение я отдаю кроссплатформенным библиотекам, потом библиотеки только под *nix и все, Виндоус-онли не надо. Си меня интересует потому, что хочу интегрировать эти библитеки с Руби. Если же выхода не будет, выучу Питон.

P.S. Может быть кто-то посоветует толковый учебник по матстатистике?

Благодарю за внимание.

workForFood
()

RSS подписка на новые темы