Excelente pergunta!
Ainda não pensei em uma estratégia sólida, mas o básico a ser implementado é descriptografar a entrada e criptografar a saída o mais proximo da execução do modelo.
As tecnologias WebML têm uma grande ênfase na privacidade, mas acho que não pensaram nesse caso de uso.
De qualquer forma, não investi nenhuma energia prática aqui, até pra acelerar o lançamento e manter a latência baixa.
Sei que isso vai se tornar vital para o mundo real, ao mesmo tempo quero entender se isso é um serviço obrigatório, ou se por exemplo algumas empresas abririam mão da criptografia por + velocidade e - preço.
Agora, sobre evitar manipulação dos dados retornados, tenho tentado me inspirar no blockchain pra captar algum conceito ou tecnica, mas a priori não consegui idealizar uma estratégia 100% eficaz.
Uma alternativa cara e não performática é analisar com uma llm (seja em outro navegador ou no servidor) se a resposta e o input combinam, ou pior ainda, disparar o input para mais de 1 cliente então pedir pra uma llm escolher dentre os resultados.
De qualquer forma é um ponto que precisa ganhar maturidade, obrigado por trazer a discussão!