ideal é ter a distribuição de recursos por cliente e escalar os recursos do seu servidor sob demanda se possível uma separação a nível de cliente de forma totalmenteindependente porque isso vai garantir que o erro de um cliente não afete os demais, se você precisa de mais servidores, a regra a ser seguida é a mesma, você tem um cliente x, ele vai ter ser recursos em um servidor específico e sem distribuição ou compartilhamento entre eles, até porque se por algum motivo um deles cai, os recursos sendo compartilhados vai vai derrubar todos.