Em 2024, a inteligência artificial deve se tornar muito mais confiável e equipar robôs inteligentes
Previsões apontam as redes neurais devem aprimorar ainda mais a forma como imitam o raciocínio humano este ano
Tecnologia e Ciência|Cade Metz
Em novembro, em um evento promovido em San Francisco, Sam Altman, CEO da empresa de inteligência artificial OpenAI, foi questionado sobre as surpresas que essa área apresentaria em 2024. "Os chatbots on-line, como o ChatGPT da OpenAI, vão dar um salto que ninguém esperava", Altman respondeu de imediato. Sentado ao seu lado, James Manyika, executivo do Google, acenou com a cabeça e disse: "Concordo."
Este ano, o setor de inteligência artificial (IA) deverá ser definido por uma característica principal: um aprimoramento muito rápido da tecnologia, à medida que avanços se acumulam, permitindo que a IA gere novos tipos de mídia, imite o raciocínio humano de novas maneiras e penetre no mundo físico por meio de uma nova geração de robôs. Nos próximos meses, geradores de imagens alimentados por IA, como o Dall-E e o Midjourney, vão fornecer vídeos e imagens estáticas em instantes e se fundir aos poucos com chatbots como o ChatGPT.
• Clique aqui e receba as notícias do R7 no seu WhatsApp
• Compartilhe esta notícia pelo WhatsApp
• Compartilhe esta notícia pelo Telegram
• Assine a newsletter R7 em Ponto
Isso significa que os chatbots se expandirão muito além do texto digital, lidando com fotos, vídeos, diagramas, gráficos e outros tipos de mídia. Vão apresentar um comportamento que se parece mais com o raciocínio humano, lidando com tarefas cada vez mais complexas em áreas como a matemática e as ciências. À medida que a tecnologia da robótica avançar, também vai ajudar a resolver problemas além do mundo digital.
Muitos desses avanços já começaram a se desenvolver nos principais laboratórios de pesquisa e em produtos de tecnologia. Mas, em 2024, o poder desses produtos aumentará significativamente e será usado por muito mais gente: "O progresso veloz da IA vai continuar. É inevitável", afirmou David Luan, CEO da Adept, startup de IA.
A OpenAI, o Google e outras empresas de tecnologia estão avançando muito mais depressa que outras, em razão da maneira como os sistemas subjacentes são construídos. A maioria dos aplicativos de software é criada por engenheiros, uma linha de código de computador por vez, o que costuma ser um processo lento e tedioso.
As empresas estão aprimorando a IA com maior rapidez porque a tecnologia se baseia em redes neurais, sistemas matemáticos que podem aprender habilidades por meio da análise de dados digitais. Assim, ao identificar padrões em dados como artigos da Wikipédia, livros e textos digitais retirados da internet, uma rede neural pode aprender a gerar textos por conta própria.
Apresentamos um guia das mudanças na IA este ano, começando com os avanços de curto prazo, que vão levar a um progresso maior em suas habilidades.
1) Vídeos instantâneos
Até agora, os aplicativos alimentados por IA geravam basicamente textos e imagens estáticas em resposta aos comandos. O Dall-E, por exemplo, pode criar imagens realistas em segundos, a partir de solicitações como "um rinoceronte mergulhando da Ponte Golden Gate".
Este ano, porém, é provável que empresas como a OpenAI, o Google, a Meta e a Runway, sediada em Nova York, implantem geradores de imagem que também permitirão a geração de vídeo. Elas já construíram protótipos de ferramentas que podem criar vídeos em poucos instantes a partir de breves comandos de texto. As empresas de tecnologia devem incorporar aos chatbots a capacidade de gerar imagens e vídeos, tornando-os mais poderosos.
2) Chatbots 'multimodais'
Chatbots e geradores de imagens, desenvolvidos originalmente como ferramentas separadas, estão se fundindo de maneira gradual. Quando a OpenAI lançou uma nova versão do ChatGPT no ano passado, o chatbot conseguia gerar imagem além de texto.
As empresas do setor estão construindo sistemas "multimodais" – o que significa que a IA pode lidar com vários tipos de mídia – que aprendem habilidades analisando fotos, textos e outros tipos de mídia em potencial, incluindo diagramas, gráficos, sons e vídeo, para que possam então produzir os próprios textos, imagens e sons.
Leia também
E tem mais: como os sistemas também estão aprendendo as relações entre diferentes tipos de mídia, eles serão capazes de entender um tipo e responder com outro. Em outras palavras, alguém pode inserir uma imagem em um chatbot e ele vai responder com um texto.
3) Melhor 'raciocínio'
Ao falar sobre o salto da IA, Altman está se referindo a chatbots que são melhores em "raciocinar", para que possam lidar com tarefas mais complexas, como resolver problemas matemáticos complicados e gerar programas de computador detalhados. O objetivo é construir sistemas que possam resolver, com cuidado e lógica, um problema mediante uma série de etapas, cada uma construída em justaposição a outra. É assim que o ser humano raciocina, pelo menos em alguns casos.
Os principais cientistas discordam de que os chatbots possam, de fato, desenvolver tal raciocínio. Alguns argumentam que esses sistemas apenas parecem raciocinar, repetindo comportamentos que captam por meio de dados da internet. Mas a OpenAI e outras empresas estão construindo sistemas que podem responder de maneira mais confiável a perguntas complexas, que envolvem temas como matemática, programação de computador, física e outras ciências.
"À medida que os sistemas se tornarem mais confiáveis, também vão se tornar mais populares", disse Nick Frosst, ex-pesquisador do Google que ajuda a liderar a Cohere, startup de IA. Se os chatbots raciocinarem melhor, vão poder se transformar em "Agentes de IA".
4) 'Agentes de IA'
Conforme ensinam os sistemas de IA a resolver problemas complexos, passo a passo, as empresas também podem aprimorar a capacidade dos chatbots de usar aplicativos de software e sites em seu nome.
Os pesquisadores estão essencialmente transformando os chatbots em um novo tipo de sistema autônomo chamado agente de IA, o que significa que os chatbots podem usar aplicativos de software, sites e outras ferramentas on-line, incluindo planilhas, calendários on-line e sites de viagens. As pessoas poderiam, assim, delegar o trabalho tedioso de escritório para os chatbots, mas estes acabariam de vez com muitos empregos.
Eles já operam em menor escala como agentes: conseguem agendar reuniões, editar arquivos, analisar dados e criar gráficos de barras. Mas essas ferramentas nem sempre funcionam tão bem quanto deveriam e falham completamente quando aplicadas a tarefas mais complexas.
Neste ano, as empresas de IA estão preparadas para revelar agentes mais confiáveis. "Você deveria ser capaz de delegar qualquer trabalho tedioso de computador do dia a dia a um agente", comentou Luan. Isso pode incluir o controle de despesas em um aplicativo como o QuickBooks ou o registro de dias de férias no Workday. A longo prazo, isso vai se estender além dos serviços de software e internet e vai entrar no mundo da robótica.
5) Robôs mais inteligentes
No passado, os robôs eram programados para executar a mesma tarefa repetidamente, como pegar caixas que sempre têm o mesmo tamanho e formato. Usando, porém, o mesmo tipo de tecnologia dos chatbots, os pesquisadores estão dando aos robôs o poder de lidar com tarefas mais complexas, inclusive aquelas que não tinham feito antes.
Assim como os chatbots podem aprender a prever a próxima palavra em uma frase analisando grandes quantidades de texto digital, um robô pode aprender a prever o que vai acontecer no mundo físico mediante a análise de inúmeros vídeos de objetos sendo cutucados, levantados e movidos.
Este ano, a IA vai turbinar os robôs que operam nos bastidores, como os braços mecânicos que dobram camisas em uma lavanderia ou organizam pilhas de objetos em um depósito. Gigantes da tecnologia como Elon Musk também estão trabalhando para levar robôs humanoides para a casa das pessoas.
c. 2024 The New York Times Company
Inteligência artificial e equipamentos de ponta podem acelerar a construção de edifícios