Eu sempre fiz uma cópia simples da base de dados, porém para uma base grande como você disse (2tb?) se torna inviável.

Outra preocupação que tenho é que essa cópia nua e crua do banco acaba expondo os dados sensíveis a pessoas que não deveriam ter acesso a eles, por exemplo um programador pode ter acesso ao faturamento da empresa, e até salario dos colegas caso o sistema inclua informações de RH.

Portanto eu acho que a melhor solução é criar um script de seed da base de dados que alimenta o banco com dados fake.

É claro que essa solução nem sempre adianta, pois as vezes o bug só acontece nos dados em produção, por uma situação criada por um usuário. Mas para o desenvolvimento, ajuda bastante.