Я пытаюсь намекнуть, что производительность вообще - бессмысленна. Производительность реальна для каких-то задач, и для разных задач искомое может оказаться разным.
Не понятно про что ты спрашиваешь: про KVM или про эмуляцию.
В случае KVM, процессор очевидно доступен только один (хостовый), но cpuinfo, передаваемые в гостевую систему, можно настраивать. Наилучшую производительность можно получить скопировав всё с хостовой системы (-cpu host).
В случае эмуляции - только тестировать. Но подозреваю, что самая медленная эмуляция будет у жирных архитектур, вроде x86 и amd64, а самая быстрая - у каких-нибудь RISC, с небольшим количеством простых инструкций.
Пару дней назад MIPS ускорили на 7%. А вообще - пробовать надо. Редко кому всё равно, какой процессор, поэтому сравнительных тестов может и не быть. С дивана я подозреваю, что либо AArch64, либо power7 - с ними возятся больше всего.
Разница может существовать: например, что быстрее, съэмулировать инструкцию SSE, или обойтись в госте без неё? Поскольку TCG сначала транслирует в платформо-независимый код, подозреваю, что инструкции SSE там эмулируются не самым эффективным образом.
Смотри в каком 64х битном проце архитектуры x86 декларируется меньше всего расширений и пробуй его (не помню уже, но наверно, это какой-нибудь AMD из первых 64-битных). Заодно расскажешь, дало ли это что-нибудь. :-)