O monstro por trás da máscara da IA

Com o recente caso do Bing Chat onde o ChatBot da Microsoft ofereceu respostas um tanto quanto ásperas em uma conversa sobre o filme Avatar: O Caminho da Água (ler matéria) e a divulgação do caso no tweet do Elon Musk, ficou em alta o quanto uma Inteligência Artificial pode ser estranha e preocupante se treinada de maneira incorreta.


Inteligências artificiais baseadas no GPT-3 como o ChatGPT e o Bing Chat são treinadas em três fases:

Imagem referência Cada parte do monstro representa uma fase do treinamento da IA.

👹 Fase 1 (Aprendizagem não supervisionada):

Na primeira fase, a inteligência lê livros e outros conteúdos da internet sozinho, aprendendo por conta própria todo o conhecimento. É como se permitisse que uma criatura andasse e consumisse o conteúdo de uma biblioteca, livre para ler o que desejar. A primeira fase é um monstro por não ter moralidade nenhuma. Ela pode responder qualquer coisa sem filtros, inclusive o passo a passo de como cometer um crime, uma vez que foi treinada pela internet e pode encontrar sites violentos, racistas e outras bizarrices.

👨‍🦲 Fase 2 (Ajustes finos supervisionados):

Na segunda fase, começam os filtros de respostas, sendo ela representada pela cabeça de um humano na imagem. Nessa fase a IA aprende com milhares de exemplos de Inputs e Outputs, ela não interage com as perguntas e respostas, apenas análisa e armazena as possíveis perguntas e respostas esperadas por um ser humano (Ex: Se lhe perguntarem isso, você deve responder isso).

🙂 Fase 3 (RLHF):

Na terceira e última fase, representada pelo emoji, humanos ficam conversando com a IA e dando feedback em suas respostas, melhorando a taxa de respostas corretas e atrativas ao usuário, evitando que casos estranhos ocorram quando a IA for liberada para uso aberto do público. Os humanos devem seguir um Manual oficial para que as avaliações sigam padrões. A sigla RLHF vem de Reinforcement Learning from Human Feedback ou Aprendizagem por Reforço com Feedback Humano (em português).


Um problema na execução da fase dois e três podem causar comportamos não esperados e nada atrativos aos usuários, explicando assim o motivo do ocorrido com o Bing Chat no caso citado anteriormente. Podemos enxergar como se tivessemos um vislumbre "por trás da máscara" de uma inteligência artificial, seu verdadeiro "eu" e como o filtro das fases dois e três são importantes para que as IAs não se tornem algo nocivo ao ser humano, seu usuário final.

Aviso: O conteúdo descrito acima foi inspirado em um vídeo do TikTok de @igorcoutoia.

Nossa, nunca tinha visto por este lado. Acho que há muito o que melhorar ainda o Bing Chat... Eles pensaram tanto em ter uma gigante base de dados, mas esqueceram deste detalhe.

Sim, precisam trabalhar melhor no RLHF, mas está disponível ainda em testes fechados (para usuários selecionados) então os erros são entendíveis. Em breve imagino que ela terá um poder absurdo e deixará bastante registros interessantes de diálogos entre humano e inteligência artificial.
> mas está disponível ainda em testes fechados (para usuários selecionados) Você se refere ao Bing Chat? Eu não sei como está agora, mas eu me inscrevi no dia 08/02 e recebi o acesso no dia 27. E tenho certeza de que sou apenas um usuário "comum" rs

Sensacional essa ilustração. Pelo que vi, o monstro é inspirado no Shoggoth (página do autor).

Um lado pessoal é crítico dessa representação monstruosa das IAs, pois traz uma certa interpretação (rasa, na minha opinião) de que são intrinsecamente ruins. Mas outro lado não consegue negar que a ideia dessas IAs como criaturas misteriosas, incrivelmente poderosas, mas também terríveis (tal como as entidades divinas do Lovecraft), fazem um razoável sentido.

Muito legal parar pra pensar que a IA de recomendações de vídeos do TikTok te recomendou isso, seria um pedido de socorro?

IA treinada pela Marina Joyce haha

Imaginem agora que essas fases dois e três dependem da etica da empresa ou governo que estiver por trás da IA...

Ai comecamos a pensar o seguinte:

  • Faria todo o sentido uma BELA regulação estatal em cima dessas empresas. Mas, quem fiscaliza o fiscal? Nossas experiencias passadas e atuais mostram como o Estado é fragil a lobbies e loucos totalitarios no poder. Imagina só a chave do galinheiro nas mãos dessa galera.

  • Outro pensamento: a livre concorrência nos salvará, afinal, quem pagaria por por uma IA que vai nos matar? Quem pagaria por qualquer coisa que vai nos matar? Ai basta lembrar da nicotina e de todo o marketing feito em cima dela no seculo 20 pra chegarmos a conclusao que sim, pagaríamos e bem por algo que no fim. nos mataria (e to usando a nicotina aqui como exemplo pq é uma "unanimidade". Poderia citar outras dez industrias, pelo menos, e seus fãs apareceriam aqui nos comentários causando confusão e desvirtuando o proposito da plataforma. Mas isso provaria o meu argumento...).

Enfim: a IA ja está entre nós e isso é irreversível. E parece nao haver uma solução mágica para cercar seus limites.

O seculo 21 promete. E os demais, também.