CriticGPT: nova ferramenta pode ajudar a corrigir erros do ChatGPT

#Compartilhar:

A OpenAI treinou um novo protótipo, o CriticGPT, fundamentado no GPT-4 para encontrar erros em respostas geradas pelo ChatGPT.

De convénio com a empresa, quando as pessoas contam com a ajuda do CriticGPT para revisar os códigos gerados pelo ChatGPT, elas conseguem superar os possíveis problemas sem ajuda suplementar em 60% das vezes

A série de modelos GPT-4 que alimenta o ChatGPT é corrigida através do que se labareda “aprendizagem de reforço a partir do feedback humano” (RLHF, na {sigla} em inglês), que significa que a plataforma melhora seu desempenho conforme os usuários, também chamados de treinadores de perceptibilidade sintético, classificam as respostas dadas pelo ChatGPT e indicam possíveis erros.

A medida que o ChatGPT vai se aperfeiçoando, seus erros também vão ficando mais sutis e especializados, o que pode dificultar que os treinadores de IA percebam as imprecisões quando elas ocorrem. E é nisso em que o CriticGPT pode ajudar.

O próximo passo, segundo a empresa, é incorporar modelos semelhantes ao CriticGPT ao processo de RLHF, para que os feedbacks humanos também contem com o auxílio dos feedbacks da IA.

Embora as sugestões do CriticGPT nem sempre estejam corretas também, elas podem ajudar os treinadores de IA a detectar problemas que passariam despercebidos. Outrossim, assim porquê o próprio protótipo do GPT-4, o CriticGPT também vai se aperfeiçoando conforme mais usuários forem utilizando a utensílio e dando feedbacks.

Exemplo da atuação do CriticGPT apontando possíveis erros do ChatGPT / Divulgação/OpenAI

De convénio com a OpenAI, os testes entre os dois modelos revelaram que os apontamentos feitos pelo CriticGPT foram considerados melhores do que aqueles feitos pelo próprio ChatGPT em 63% das vezes. Outrossim, a novidade utensílio também demonstrou menos alucinações — momentos nos quais a IA inventa um tanto que não é verdade e apresenta porquê se fosse.

Mesmo assim, o CriticGPT ainda possui algumas limitações e só pode ajudar até visível ponto de especialização. Se uma tarefa ou resposta for extremamente complexa, mesmo um profissional com a ajuda de um protótipo pode não ser capaz de avaliá-la corretamente.

FONTE:CNN

#Compartilhar:
error:
Rolar para cima