Это не шутка. Крутой дед из настоящих сумел это сделать. Реальный программюга!
https://www.youtube.com/watch?v=OUE3FSIk46g
В этом ролике на ютубе он немного рассказывает про свою коллекцию старых компов, объясняет про работу нейросетей вообще и трансформеров в частности, как он написал простенький трансформер на ассемблере для PDP-11. На машине с 32 Кб RAM, сама программа, включая обучение с back propagation, занимает чуть более 6 Кб. Конечно что-то серьёзное на таких ресурсах не заработает, но всё же это настоящий трансформер. У нейросетки 1200+ параметров, одна голова внимания. Контекст из 8 символов (Или только цифр? Не совсем понял). Нейросетка за несколько минут обучается переворачивать в обратном порядке входное число из 8 цифр.
На видео всё есть: и машины и как панель PDP мигает лампочками и результат работы.
Дэйв Пламмер (Dave Plummer) - бывший программист из Microsoft, в частности, он написал Task Manager для NT.






