Если нужные функции в принципе готовы к распараллеливанию (т.е. не нужно ничего лочить, что довольно редко) — в теории реализуемо с помощью дизассемблера, ассемблера, бубна и удачи. На практике — вряд ли.
Ибо трудно представить как можно распилить последовательность команд процессора по разным потокам. Разве что действительно уж очень крутой дизассемблер и ассемблер, но вряд-ли такое счастье есть.