Em teoria, a plataforma iria oferecer 3 modos: o mais comum, que é uma simples playlist de sons; outro de reconhecimento de voz explícito, onde o usuário poderia segurar um botão ou falar uma palavra-chave e, em seguida, dar o comando; e o modo implícito, que seria o mais complexo, tanto em termos de desenvolvimento quanto de ética. Nesse modo, a plataforma usaria o microfone em tempo real, processando os dados e enviando-os para um modelo de IA treinado para reconhecer, de forma implícita, sugestões de áudio e reproduzir os sons.
Entendo, essa questão ética realmente é o maior problema, mas a ideia é muito boa mano e mesmo que não de para fazer essa implementação no projeto da faculdade tenta fazer o projeto mesmo assim, acredito que seria muito bom e muito mestres usariam.