pesquise sobre cluster/ Rig para cuda/ cluster de performance e computação paralela. Computação paralela é o mais usado para projetos de geoprocessamento.

Eu sempre me confundo em como usar o multithread ou paralelismo no meu código.

Eu tenho um programa em python que executa vários comandos no linux (uso para coletar evidencias), os comandos executam um a um, na sequencia. Um comando não depende do outro... Como ficaria para eu conseguir paralelizar isto e diminuir o tempo de execução ?

na verdade vai depender do hardware que você tem. Tem vários computadores ou um com vários núcleos de procesamento e quantos núcleos? Um exemplo se tem um quadcore tem 4 núcleos, me informa isso por favor.
Tenho um AMD Ryzen 7 7840HS, ele possui 8 nucleos e 16 threads