Os chatbots de IA são relativamente antigos para os padrões de tecnologia, mas a geração mais recente, liderada pelo ChatGPT da OpenAI e pelo Bard do Google, é muito mais poderosa que seus antecessores, e nem sempre por razões positivas. O recente boom da inteligência artificial já levantou preocupações sobre desinformação, desinformação, plágio e malware gerado por máquinas. Que problemas a inteligência artificial generativa poderia criar para a privacidade do usuário médio da Internet? Especialistas dizem que a resposta depende muito de como esses robôs são treinados e de quanto interagimos com eles. Para imitar as interações humanas, os chatbots de IA são treinados para usar grandes quantidades de dados, uma parte significativa dos quais vem de repositórios de dados como o Common Crawl. Como o nome sugere, o Common Crawl coletou anos e petabytes de dados simplesmente rastreando e raspando a web aberta. “Esses modelos são treinados em grandes conjuntos de dados que estão disponíveis publicamente na Internet”, disse Megha Srivastava, estudante de doutorado na Faculdade de Ciência da Computação de Stanford e ex-Microsoft Research AI Fellow. Embora o ChatGPT e o Bard usem a parte "filtrada" dos dados do Common Crawl, o tamanho do modelo torna "impossível para qualquer um filtrar e limpar os dados", de acordo com Srivastava.
Seja seu próprio descuido ou a falta de segurança de outras pessoas, pode estar em algum lugar no canto mais distante da Internet agora. Embora os dados possam ser difíceis de acessar para o usuário médio, é possível que os dados tenham sido extraídos do conjunto de treinamento e possam ser recuperados do chat no futuro. E um bot cuspindo as informações de contato reais de alguém dificilmente é uma preocupação teórica. O colunista da Bloomberg, Dave Lee, postou no Twitter que, quando alguém pediu ao ChatGPT para conversar na plataforma de mensagens criptografadas Signal, ele deu seu número de telefone correto. Esse tipo de interação é provavelmente um caso extremo, mas ainda vale a pena considerar os dados aos quais esses modelos de aprendizado têm acesso. “É improvável que a OpenAI queira coletar certos dados, como dados de saúde, e fornecê-los a indivíduos para treinar seus modelos”, disse David Hoelzer, do SANS Institute, uma organização de segurança, ao Engadget. "Mas poderia estar lá por acidente? Com certeza."
A Open AI, a empresa por trás do ChatGPT, não respondeu quando perguntamos quais etapas são necessárias para proteger a privacidade dos dados ou como ela lida com informações de identificação pessoal que podem estar incorporadas em sua série de treinamento. Então, fizemos a próxima melhor coisa e perguntamos ao próprio ChatGPT. Ele nos disse que está "programado para aderir a padrões éticos e legais que protegem a privacidade e as informações pessoais dos usuários" e que não tem "acesso a informações pessoais, a menos que sejam fornecidas a mim". De sua parte, o Google disse ao Engadget que programou proteções semelhantes no Bard para impedir o compartilhamento de informações de identificação pessoal durante as conversas. Felizmente, o ChatGPT introduziu outro vetor-chave por meio do qual a IA generativa pode representar um risco à privacidade: o uso do próprio software – diretamente nos logs de bate-papo ou por meio de dados compartilhados entre dispositivos e dados do usuário coletados durante o uso do serviço. A política de privacidade da OpenAI refere-se a várias categorias de dados padrão que ela coleta sobre os usuários que podem ser identificáveis, e o ChatGPT avisa desde o início que seus treinadores de IA podem revisar as conversas para melhorar os sistemas.
O Bard do Google, por outro lado, não possui uma política de privacidade separada, mas usa um documento geral de privacidade compartilhado por outros produtos do Google (que é bastante abrangente). As conversas com Bard não precisam ser salvas na conta do Google do usuário, e os usuários podem excluir conversas por meio do Google, disse a empresa ao Engadget. "Para construir e manter a confiança do usuário, eles precisam ser muito transparentes sobre suas práticas de privacidade de interface de usuário e procedimentos de privacidade", disse Rishi Jaitly, professor da Virginia Tech e notável estudioso de humanidades, ao Engadget. Apesar do recurso "limpar bate-papos", pressioná-lo não exclui seus dados, de acordo com a página de perguntas frequentes do serviço, e o OpenAI não pode excluir determinados convites. Embora a empresa desencoraje os usuários a compartilhar qualquer coisa sensível, aparentemente a única maneira de remover informações de identificação pessoal enviadas ao ChatGPT é excluir sua conta, que a empresa diz que excluirá permanentemente todas as informações associadas a ela.
Hoelzer disse ao Engadget que não está preocupado com o ChatGPT, que está fazendo conversas individuais para aprender. No entanto, esses dados de bate-papo são armazenados em algum lugar e, portanto, sua segurança se torna uma preocupação razoável. Além disso, o ChatGPT ficou brevemente offline em março devido a um bug de software que expôs informações sobre o histórico de bate-papo dos usuários. No início de sua adoção generalizada, não está claro se os logs de bate-papo desses tipos de IA se tornarão alvos valiosos para agentes mal-intencionados.
No futuro previsível, é melhor ver esses tipos de chatbots com o mesmo nível de suspeita que os usuários devem ver qualquer outro produto de tecnologia. “Um usuário que joga com esses modelos deve presumir que interagir com seu modelo é um jogo justo em favor da IA aberta ou de qualquer outra empresa”, disse Srivastava ao Engadget.

Postar um comentário