Essa questão do desempenho atualmente está interesse. Recentemente eu fiz um emulador de chip8 em Rust. Em alguns momentos eu precisei criar formas do código executar mais lento pra simular a velocidade do sistema emulado.
eita, eu tinha feito em c++!
github.com/jeffersonfr
Bacana.
Vou dar uma conferida.
Se quiser ver como fiz em rust, segue o link:
https://github.com/dedraks/rchip8