Acho que ele fez assim, pegando a transcrição pronta da api do youtube.
api oficial nao oferece a transcrição do YouTube.