Acho que ele fez assim, pegando a transcrição pronta da api do youtube.

api oficial nao oferece a transcrição do YouTube.