🍎 🍕 Menos maçãs, mais pizza 🤔 Já viu recentemente a carteira de Warren Buffett?Veja mais

Videogames como geradores de dados para treinamento de modelos de linguagem

Publicado 16.08.2024, 06:00

Com André Fonseca* e Rafael Dellamora**

A explosão da inteligência artificial está novamente dividindo o mundo entre o que Umberto Eco chamou de apocalípticos e integrados. De um lado, os que acham que tudo vai acabar e que seremos exterminados ou transformados em pilhas por máquinas oniscientes e onipresentes. Do outro, os que creem que poderemos passar o dia na praia, com a renda mínima garantida e sem nos preocupar com nada. No meio, em algum lugar deste continuum, estará a realidade. Não somos gurus nem acreditamos em adivinhação do futuro, mas sabemos que a tecnologia costuma ser cruel com os que a temem e beneficia os que conseguem enxergar estrategicamente as oportunidades.

Por exemplo, em um mundo no qual a inteligência artificial (IA) está remodelando setores inteiros, a indústria de games se encontra em uma encruzilhada onde inovação tecnológica e oportunidades de negócio convergem de maneira inédita. Sabe-se que um dos principais desafios a serem superados por quem ambiciona treinar do zero um grande modelo de linguagem (LLM), tal como o GPT-4o, é ter acesso a qualidade e quantidade necessária de dados. Esse será, por exemplo, um dos grandes desafios da inciativa anunciada recentemente pelo Governo Brasileiro. É preciso dados que representem tanto a informação factual que queremos que o modelo capture quanto o processo de arrazoamento humano que desejamos que ele reproduza. Ter essas duas coisas a tempo e a hora está longe de ser tarefa fácil e nem sempre dinheiro resolve. Nesse contexto, propomos um novo modelo de negócios para jogos que se baseiam na criação e comercialização de dados utilizáveis no treinamento de LLMs. 

Atualmente, as empresas de jogos dependem de modelos de negócio como vendas de cópias, assinaturas e microtransações para gerar receita. Contudo, com a possibilidade de personalização e de obtenção de experiências de jogo mais imersivas, o ato de jogar é produtor de dados comportamentais e discursivos que, de acordo com a perspectiva que utilizamos aqui, estão subaproveitados. Há pouca dúvida de que eles poderiam ser utilizados no treinamento dos LLMs que cada vez mais fazem parte do nosso dia a dia.

De fato, esses modelos são capazes de processar e gerar texto, imagens e até sons, simulando a criatividade humana com uma precisão impressionante. Isso ocorre porque utilizam redes neurais profundas para processar grandes volumes de dados, identificando padrões complexos. A demanda por dados em grande escala surge da necessidade desses modelos de serem expostos a uma variedade ampla de exemplos, permitindo-lhes desenvolver uma compreensão profunda e refinada dos padrões linguísticos ou visuais. Sem uma quantidade suficiente de dados, um LLM pode apresentar vieses ou falhas, comprometendo sua utilidade em aplicações práticas. Portanto, tais modelos demandam enormes volumes de dados para serem treinados – e é exatamente aí que essa proposta para a indústria de games entra em cena.

Cada ação do jogador, cada decisão tomada e cada interação com o ambiente virtual gera dados que podem ser inestimáveis para o treinamento desses modelos. Imagine, por exemplo, um RPG em que as interações sociais no jogo ajudam a refinar um LLM em comportamento humano. Sugerimos que esses dados, além de aprimorar os próprios jogos, também possam ser vendidos ou licenciados para a indústria de IA, criando uma nova e lucrativa fonte de receita para as desenvolvedoras. 

Considere, por exemplo, o mercado de treinamento empresarial. Dados coletados de jogos de estratégia poderiam ser utilizados para treinar uma IA em cenários de tomada de decisão corporativa, ajudando executivos a simular os impactos de diferentes decisões em um ambiente seguro. Um outro exemplo seria a área da saúde. Uma IA treinada com dados de interações humanas em jogos poderia ser usada para melhorar a comunicação entre pacientes e sistemas de diagnóstico automatizados, permitindo consultas virtuais mais naturais e eficazes. No campo da educação, os dados gerados dentro de videogames poderiam contribuir para a criação de tutores virtuais capazes de adaptar seu estilo de ensino com base nas interações de aprendizado dos alunos, oferecendo uma experiência de aprendizado mais personalizada e eficaz.

Nossa proposta de modelo de negócios deriva de um fato: a escassez de dados para treinar LLMs está se tornando uma preocupação crescente no setor. Pesquisas recentes indicam que a disponibilidade de dados de alta qualidade, essenciais para o treinamento desses modelos, pode se esgotar nos próximos anos, possivelmente até 2026. Isso ocorre porque os modelos consomem dados em um ritmo mais rápido do que a produção e o compartilhamento de novos conteúdos, resultando em um possível "teto" para o avanço dessas tecnologias.

É essa escassez de dados que torna nossa proposta ainda mais significativa. A coleta de dados gerados por jogos que são ricos em contexto pode não apenas atender à demanda crescente por dados de qualidade, mas também oferecer uma solução para afastar esse apagão que se aproxima. Em um cenário onde os dados estão se tornando um recurso cada vez mais escasso, jogos que geram dados úteis para treinar LLMs poderiam se posicionar como uma fonte valiosa e estratégica para a continuidade do desenvolvimento dessas tecnologias.

Dessa forma, a indústria de games pode desempenhar um papel crucial na manutenção e no avanço da inteligência artificial, transformando o entretenimento em uma poderosa ferramenta de inovação tecnológica e contribuindo significativamente para o ecossistema global de dados. Quem diria que o simples ato de jogar um videogame daria origem a um modelo de negócios inovador? 

Muito ainda há para ser feito até que essa ideia vingue.  A qualidade dos dados é fundamental. Dados bem curados, diversificados e livres de vieses são essenciais para garantir que os modelos de IA sejam precisos e úteis. No contexto dos games, isso significa não apenas coletar grandes volumes de dados, mas também garantir que esses dados sejam relevantes e representativos de uma ampla gama de cenários e interações. Empresas que adotarem essa abordagem inovadora não só poderão melhorar seus próprios produtos, mas também poderão liderar o mercado em termos de inovação tecnológica.

Além disso, questões de privacidade, segurança de dados e ética na coleta de informações dos jogadores são preocupações reais que precisam ser abordadas com seriedade. Dito isso, parece razoável supor que com regulamentações adequadas e práticas transparentes, essas barreiras podem ser superadas. 

Trouxemos aqui apenas um exemplo, há muitos mais emergindo a todo momento. A inovação novamente se apresenta como um trem em altíssima velocidade. Cabe a você decidir se vai ficar parado nos trilhos, pular para fora do caminho ou enxergar novas oportunidades e embarcar rumo ao futuro.

* Professor do MBA Executivo e Pesquisador no COPPEAD/UFRJ

** Mestrando no COPPEAD/UFRJ

Últimos comentários

Carregando o próximo artigo...
Instale nossos aplicativos
Divulgação de riscos: Negociar instrumentos financeiros e/ou criptomoedas envolve riscos elevados, inclusive o risco de perder parte ou todo o valor do investimento, e pode não ser algo indicado e apropriado a todos os investidores. Os preços das criptomoedas são extremamente voláteis e podem ser afetados por fatores externos, como eventos financeiros, regulatórios ou políticos. Negociar com margem aumenta os riscos financeiros.
Antes de decidir operar e negociar instrumentos financeiros ou criptomoedas, você deve se informar completamente sobre os riscos e custos associados a operações e negociações nos mercados financeiros, considerar cuidadosamente seus objetivos de investimento, nível de experiência e apetite de risco; além disso, recomenda-se procurar orientação e conselhos profissionais quando necessário.
A Fusion Media gostaria de lembrar que os dados contidos nesse site não são necessariamente precisos ou atualizados em tempo real. Os dados e preços disponíveis no site não são necessariamente fornecidos por qualquer mercado ou bolsa de valores, mas sim por market makers e, por isso, os preços podem não ser exatos e podem diferir dos preços reais em qualquer mercado, o que significa que são inapropriados para fins de uso em negociações e operações financeiras. A Fusion Media e quaisquer outros colaboradores/partes fornecedoras de conteúdo não são responsáveis por quaisquer perdas e danos financeiros ou em negociações sofridas como resultado da utilização das informações contidas nesse site.
É proibido utilizar, armazenar, reproduzir, exibir, modificar, transmitir ou distribuir os dados contidos nesse site sem permissão explícita prévia por escrito da Fusion Media e/ou de colaboradores/partes fornecedoras de conteúdo. Todos os direitos de propriedade intelectual são reservados aos colaboradores/partes fornecedoras de conteúdo e/ou bolsas de valores que fornecem os dados contidos nesse site.
A Fusion Media pode ser compensada pelos anunciantes que aparecem no site com base na interação dos usuários do site com os anúncios publicitários ou entidades anunciantes.
A versão em inglês deste acordo é a versão principal, a qual prevalece sempre que houver alguma discrepância entre a versão em inglês e a versão em português.
© 2007-2024 - Fusion Media Limited. Todos os direitos reservados.