История изменений
Исправление hateyoufeel, (текущая версия) :
Есть данные и есть содержащаяся в них информация. У человека способности к извлечению информации куда скромнее, чем у модели, обученной на сотнях тысяч кейсов.
Ну заставьте модель угадать десятизначное число по двум известным цифрам. Можете обучить модель на 10 миллиардах кейсов.
Ты в своём примере исходишь из предположения, что цифры в этом числе абсолютно независимы и случайны, но в случае с медицинскими данными это не так. Причём вообще никогда. Существует просто вагон корреляций между различными кусками данных, и у среднего человека (или даже среднего врача) тупо не хватит времени в жизни все их выучить и держать в голове. А у машины хватит.
Поэтому да, если две цифры в этом числе коррелируют с остальными восемью, предсказать остальные с некоторой точностью будет вполне возможно.
Исходная версия hateyoufeel, :
Есть данные и есть содержащаяся в них информация. У человека способности к извлечению информации куда скромнее, чем у модели, обученной на сотнях тысяч кейсов.
Ну заставьте модель угадать десятизначное число по двум известным цифрам. Можете обучить модель на 10 миллиардах кейсов.
Ты в своём примере исходишь из предположения, что цифры в этом числе абсолютно независимы и случайны, но в случае с медицинскими данными это не так. Причём вообще никогда. Существует просто вагон корреляций между различными кусками данных, и у среднего человека (или даже среднего врача) тупо не хватит времени в жизни все их выучить и держать в голове.
Поэтому да, если две цифры в этом числе коррелируют с остальными восемью, предсказать остальные с некоторой точностью будет вполне возможно.