Nonlinear fit: GSL vs. Gnuplot vs. Python (scipy). Разбежка в результатах

gnuplot, gsl, scipy, математика, численные методы

0

2

Есть у меня датасет, я пытаюсь его аппроксимировать. Проблема в том, что результаты на выходе у каждой софтины слегка отличаются. Насколько я знаю, метод вычисления везде один и тот же.

Здесь похожая проблема без конкретного решения

Не могу понять, где загвоздка.

P.S. GSL выдает ошибку больше, чем gnuplot. Есть такой пример , не могу понять, почему разрабы первого умножают на GSL_MAX_DBL(1, sqrt(chisq / dof)), а разрабы второго - просто на sqrt(chisq / dof) (я сравнивал результаты). Питон выдаёт значения, которые очень близки к гнуплотовским, разбежка в 3-4 знаках.

Я не сильно знаком с подобными числаками, поэтому могу что-то упускать.

Ссылка

←	Возможен ли коде-фирст в серьезном числовом методе?

Простой анализ FM-вещания

→

набор данных фтудию. Заодно и то, как ты хочешь аппроксимировать.

~~dikiy~~ ★★☆☆☆
(03.06.17 02:03:24 MSK)

Я бы попробовал в чем то коммерческом (где за такое бьют по голове больно...), для сравнения - чтобы узнать кто врет... Натыкался на проги для КПК и телефонов которые делают неимоверные ошибки в вычислениях.

Питон выдаёт значения

По моему они писали что флоут у них использовать нельзя для серьезной математики...

LinuxDebian ★★★★
(03.06.17 15:01:32 MSK)

П.С: Не знаю что ты там делаешь, я в универе юзал: http://ru.smath.info/

LinuxDebian ★★★★
(03.06.17 15:04:04 MSK)

Ссылка

Ответ на: комментарий от LinuxDebian 03.06.17 15:01:32 MSK

В смысле? Если тип float, то у меня double, если в целом non-integer, тогда зачем такой язык нужен.

Вот только что ради интереса протестировал Mathematica. Примерно те же значения, что у python и gnuplot. Надо пойти покурить.

Я понимаю, что дело может быть в round-off error, но я специально взял небольшой датасет на 600 точек.

ZERG ★★★★★
(03.06.17 19:54:47 MSK) автор топика

Ссылка

Ответ на: комментарий от dikiy 03.06.17 02:03:24 MSK

https://pastebin.com/eSP0t79t - данные

функция простая до безобразия:

A * exp(-x / tau1) + (1 - A) * exp(-x / tau2)

ZERG ★★★★★
(03.06.17 19:57:27 MSK) автор топика

Ссылка

Ответ на: комментарий от LinuxDebian 03.06.17 15:01:32 MSK

По моему они писали что флоут у них использовать нельзя для серьезной математики...

В питоне флоат 64-битный, соответствующий IEEE 754, даже без numpy, что еще-то надо?

lu4nik ★★★
(04.06.17 02:21:41 MSK)

Ссылка

Ответ на: комментарий от dikiy 03.06.17 02:03:24 MSK

Есть результаты?

ZERG ★★★★★
(04.06.17 20:51:02 MSK) автор топика

В общем, есть подозрение, что сам метод странноват. Читал мануал несколько дней, заменил аналитическую производную на разность и получил сходимость на порядок лучше. Значения всё равно слегка расходятся, буду курить маны дальше.

ZERG ★★★★★
(05.06.17 14:49:12 MSK) автор топика

Ссылка

Ответ на: комментарий от ZERG 04.06.17 20:51:02 MSK

Есть результаты?

Есть. У тебя функция не выпуклая, как результат локальный минимум не является глобальным и методы сходятся возможно к разным локальным минимумам. Причем только один из них является глобальным. Если он вообще есть, ведь функция также не коерцитивная, а значит, если не задана компактная область значения параметров, по которым оптимизируется, то вообще решения может не существовать.

~~dikiy~~ ★★☆☆☆
(06.06.17 01:54:49 MSK)

Ответ на: комментарий от dikiy 06.06.17 01:54:49 MSK

Резонно. Но метод-то одинаков во всех случаях, да и решение существует: питон поддерживает задание диапазонов параметров, при этом выдаётся тот же результат.

ZERG ★★★★★
(06.06.17 14:46:22 MSK) автор топика

Ответ на: комментарий от ZERG 06.06.17 14:46:22 MSK

питон поддерживает задание диапазонов параметров

this. Таким образом ты задаешь компактное множество допустимых решений. А на таком множестве любая непрерывная функция имеет минимум.

А вот результат будет зависеть в общем случае от стартовой точки и численного метода (а также, возможно и от области допустимых значений параметров). Если хочешь точно попасть в глобальный минимум, то рекомендую решить аналитически (если лень руками, то в CAS сделай). Благо функция у тебя не сложная.

~~dikiy~~ ★★☆☆☆
(06.06.17 16:56:53 MSK)
Последнее исправление: dikiy 06.06.17 16:58:54 MSK (всего исправлений: 1)

Ответ на: комментарий от dikiy 06.06.17 16:56:53 MSK

Забавно, что gnuplot и GSL при одинаковых методах и стартовых точках всё равно расходятся в 3-4 знаке. Но ладно, если ты говоришь, что это нормально, то я в целом могу расслабиться.

P.S. Я вдруг понял, что у меня-то области параметров и не были-то заданы. Только общая зависимость и необходимость равняться единице в точке x == 0. И задать я их не могу, потому что негде взять. Ладно, спасибо в любом случае.

P.P.S. А нет, кое-какие ограничения я могу задать: как минимум tau1 и tau2 больше нуля, а сама функция лежит в диапазоне [-1:1]. Эх, где бы ещё время взять на разбор этого.

ZERG ★★★★★
(06.06.17 19:23:34 MSK) автор топика
Последнее исправление: ZERG 06.06.17 19:29:24 MSK (всего исправлений: 1)

Ответ на: комментарий от ZERG 06.06.17 19:23:34 MSK

Попробуй на наборе в 5-6 точек. Мне здается, что у тебя там куча целая локальных минимумов. Надо методы посерьезней, если хочешь глобальный минимум найти. Так что подумай, может тебе просто локального минимума достаточно?

~~dikiy~~ ★★☆☆☆
(06.06.17 19:51:53 MSK)

Ответ на: комментарий от dikiy 06.06.17 19:51:53 MSK

Да мне в целом-то не очень важно, это автокорреляция, она и так не суперточная, особенно в конечных точках. В целом должна уменьшаться экспоненциально, но по факту такое далеко не всегда случается.

Просто не было ясно, почему разные софтины выдают отличающиеся ответы. Я боялся, что где-то накосячил, а с проверкой помочь некому было.

Кстати, а что за методы, если уж действительно точно аппроксимировать?

ZERG ★★★★★
(06.06.17 22:11:43 MSK) автор топика

Ответ на: комментарий от ZERG 06.06.17 22:11:43 MSK

Гарантии ни один метод не даст в общем случае. Но есть всякие достаточно неплохие квази-Ньютоновские методы, или тот же BGFS. Ну и стартовать их из разных точек. А потом выбирать лучшую.

Есть еще Levengerg-Marquardt как раз для аппроксимации.

Но все они локальные. Чтобы получить глобальный минимум надо анализировать функцию и ее производные. Так что общего метода наверное нет.

Но если интересно ищи по словам global minimum.

UPD: https://en.wikipedia.org/wiki/Global_optimization

~~dikiy~~ ★★☆☆☆
(07.06.17 13:03:57 MSK)
Последнее исправление: dikiy 07.06.17 13:07:38 MSK (всего исправлений: 2)