Olá, também estou desenvolvendo uma aplicação com foco na aprendizagem de idiomas, apesar que inicialmente iria me focar apenas no inglês.

Achei legal a ideia e já pensei até em algumas funções novas como transcrição de áudio e utilizar inteligência artificial para gerar frases semelhantes, mas incorretas.

Pelo que eu entendi para seu sistema funcionar, precisa que o usuário insira o áudio, a versão transcrita e as duas frases incorretas. Totalizando quatro inputs, cinco se contar o botão para rodar o teste?

A partir desse ponto, é que fica nebuloso para mim, será uma única tela que armazena os dados de maneira local ou haveria uma tela de login e uma tela de biblioteca com os uploads anteriores.

Posso te ajudar a montar o design, sua aplicação me parece simples e direta então não vejo necessidade de criar um design rebuscado. Porém ainda preciso de mais informações:

1 - Como funciona a dinâmica na plataforma? 2 - Que público deseja alcançar? Exemplo: infantil, infanto juvenil, jovens adultos ou adultos? 3 - Que estilo gostaria de aplicar? Tema dark, tema claro, infantil, sério ou sereno? 4 - Tem alguma referência? Seja visual ou de usabilidade.

Imagino que queira tornar o mais acessível para deficientes visuais, então seria algo a sempre ponderar se o que estivesse sendo adicionado, não atrapalha essa questão.

Se não for incomodo, poderia informar seu grau de deficiência visual e o tempo dele? Para que eu possa buscar a melhor maneira de traduzir suas idéias e as minhas idéias para o outro.

Olá.
Eu também fiz com a proposta de ser somente para o inglês, mas percebi que a plataforma pode ser usada em qualquer idioma rsrs.

Pelo que eu entendi, para o seu sistema funcionar, o usuário precisa inserir o áudio, a versão transcrita e duas frases incorretas. Totalizando quatro inputs, cinco se contarmos o botão para rodar o teste?

Não. Eu preciso apenas que o usuário escolha um áudio e a frase correta dele. Na hora de buscar um áudio aleatório, o sistema selecionará um áudio, a frase correspondente e buscará outras duas frases de outros áudios aleatoriamente. Assim, não é necessário adicionar frases falsas no sistema; ele reutiliza as de outros áudios.
É só lembrar que, para o áudio A.mp3, temos a frase 1; para o B, a frase 2; e para o C, a frase 3.
Para o áudio A, as frases 2 e 3 são falsas, então não precisamos pedir ao usuário que insira uma frase falsa.

A partir desse ponto, é que fica nebuloso para mim: será uma única tela que armazena os dados de maneira local, ou haverá uma tela de login e uma tela de biblioteca com os uploads anteriores?

Inicialmente, fiz a plataforma para salvar tudo localmente, mas, para lançá-la, modifiquei isso.
Agora, salvo os áudios no Supabase. Uso o banco de dados deles também para salvar dados do usuário, como login e etc.

Agora respondendo às perguntas separadamente:

Como funciona a dinâmica na plataforma?

R. Expliquei ali em cima. Se tiver mais alguma dúvida, é só perguntar.

Qual público deseja alcançar? Exemplo: infantil, infanto-juvenil, jovens adultos ou adultos?

R. Quero focar em jovens/adultos.

Qual estilo gostaria de aplicar? Tema dark, tema claro, infantil, sério ou sereno?

R. Sinceramente, isso para mim não é prioridade. Como não enxergo desde os 2 anos, não faço ideia do que são essas coisas visuais rsrs.
O que quero manter é a acessibilidade da plataforma. A ideia é que ela seja usável tanto por quem depende de leitores de tela, como eu, quanto por quem não precisa disso. Esse é outro problema que tento resolver com essa plataforma: acessibilidade desse tipo.

Versão de teste

Você pode testar a plataforma, eu já coloquei uma versão de teste online pra algumas pessoas testarem. mas vá preparado pra não ver nada bonito la rsrs.

Dados de acesso: URL: https://listenwise.com.br/ Usuário: cris@teste.com Senha: 12341234

Do jeito que estava falando, achava que iria encontrar uma ui toda bagunçada, mas está funcional. A aplicação de ícones, bordas arredondadas para deixar com um design atual, trocar a fonte, aplicar mais pesos na hierarquia de texto, expansão no uso de cores e feedback visual das interações realizadas, além do feedback via backend, já vai tornar sua aplicação mais agradável aos olhos. Encontrei alguns erros e melhorias a se fazer enquanto realizava alguns testes: Erro 1: Quando se clica no botão de adicionar áudio, a tela do questionário continua ativa, o inverso também ocorre. Então acaba uma tela que não está interagindo o tempo todo a mostra. Erro 2: A mensagem de sucesso de envio de áudio, o “á” de áudio não carrega, aparece um símbolo de erro, talvez seja pelo uso do acento. Melhoria 1: Na minha opinião, seria melhor modificar para que a tela de login aparecesse como modal, e apenas quando o usuário clicasse para subir um áudio. Melhoria 2: O áudio deve ter autoplay quando se carrega um novo questionário. Melhoria 3: Adicionar um FAQ, de preferência na mesma página com a qual o usuário interage com a dinâmica, esse FAQ precisa responder dúvidas de como funciona a dinâmica da plataforma, se há algum controle de qualidade sobre os áudios inseridos, limitação de formato de áudio que pode subir, limitação de duração de áudio e de caracteres para a frase. Uma conclusão que cheguei ao interagir com a plataforma, é que os usuários a usaria em momento breves, no transporte ou enquanto espera algo, então penso em desenvolver o design focado no mobile, que atualmente está com o maior déficit de qualidade, e de que ele será carregado com conexões de baixa velocidade de internet. Ou seja, será um design simples. Reparei que está usando o Bootstrap, qual é a versão dele? Queria construir o design pensando nos componentes dos quais serão originados. A menção de curiosidade, por que está utilizando jquery? As pessoas que conheço não costumam recomendar o uso dele, fiquei curioso o motivo por ter usado. Por fim gostaria que me esclarecesse alguns pontos, depois que fosse finalizado o design, passaria para outra pessoa implementar na aplicação ou eu também farei essa parte? Se sim, irá abrir o código para realizar as modificações via GitHub?
opa, valeu! estou usando o Bootstrap v5.1.0, é o padrão que veio no template web do dotnet. Sobre o jquery, eu passei a usar ele, pois eu achava que como eu vou depender de alguén para fazer o front, teria que retirar o máximo o C# do front. eu poderia fazer essas requests em C#, junto com o HTML. mas, não sei se quem fosse mexer entenderia, já que C# não é muito usado por quem mexe com front. mas, se você for entrar nesse projeto, pode modificar essa parte, se quiser. Por fim, eu posso pensar em abrir o código do projeto sin. atualmente o repositório é privado. Mas posso te incluir nele para conseguir ver os códigos.
Só avisando que estou ocupado com alguns assuntos da faculdade, então provavelmente apenas quarta feira ou quinta feira, envio um esboço das telas para que pessoas que confia possam fornecer um feedback.
Tranquilo! Me chama la no telegram, para manter um contato melhor. https://t.me/DjRafaelFernandes