LINUX.ORG.RU

Подскажите инструмент для генерации данных

 data generation,


0

1

Задача такая: на каком-то промежутке времени есть реально полученные аналитические данные, на следующем промежутке (который может быть и больше первого) - никаких данных нет (а надо бы...), дальше - снова появляются данные. В промежутке были проблемы на сервере сбора данных, но заказчику знать об этом совершенно необязательно.

Я написал собственный алгоритм «лечения» недостающего участка копированием нужного для восполнения «пробела» количества данных либо слева, либо справа (выбор на основе дисперсии по времени - где интервалы прихода данных более ровные, оттуда и возьмём). Но как-то терзает меня мысль, что можно было бы намного лучше сделать. Например, есть MPlus, который теоретически умеет и то, что мне нужно, хотя и непонятно как.

Что можете посоветовать на этот счёт? Думаю, не я один сталкивался с такой ситуацией, когда для отчётности нужно тупо «заткнуть дыры» ;)

★★★★★

Что можете посоветовать на этот счёт?

Из всего похожего тыкал только в авторегрессию (на лабах), но это было давно.

i-rinat ★★★★★
()

Тебя посадят, и правильно сделают. Лгать нехорошо.

anonymous
()
Ответ на: комментарий от i-rinat

Кубические сплайны должны помочь, похоже :)

DRVTiny ★★★★★
() автор топика

Я бы сделал немного «лечения» тем кто мне присылает такие данные вместо того чтобы сделать какие-то метки о сбое.

amaora ★★
()

«data imputation»

есть несколько пакетов соответствующих mitools, VIM, mtsdi ... их много очень.

psv1967 ★★★★★
()

ну если дыры небольшие, а данные достаточно гладкие, то поможет простая интерполяция многочленом n-ной степени (n небольшое, <10). Если данные не гладкие, а зашумлённые, их можно сгладить, интерполировать, и добавить шум.

Если дыры большие, то лучше честно признаться, что был сбой.

алгоритм «лечения» недостающего участка копированием нужного для восполнения «пробела» количества данных либо слева, либо справа (выбор на основе дисперсии по времени - где интервалы прихода данных более ровные, оттуда и возьмём)

так лучше не делать. Заказчик может заметить, и послать тебя на…

emulek
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.