AGENTES DE IA
Apresentação NVIDIA GTC Keynote em 18 de março de 2024 Por Anderson Fedel Nas últimas semanas, algumas notícias do mundo da tecnologia chamaram a atenção com o anúncio de robôs humanoides para resolução de tarefas do cotidiano. A empresa Figure apresentou seu primeiro robô mecânico “powered by OpenAI”, ou seja, ele usa os sofisticados mecanismos de Inteligência Artificial (IA) do ChatGPT para interpretar o mundo ao seu redor e executar ações. Na semana seguinte (o que não parece ter sido uma coincidência), o CEO da NVIDIA, Jensen Huang, apresentou uma série de robôs do projeto GROOT que utilizam, vejam só, modelos de IA para interpretar o mundo à sua volta e realizar determinadas ações. Estes anúncios direcionaram a atenção para um conceito nem um pouco novo mas que pode atingir novos patamares de sofisticação com uso dos atuais modelos de IA: Agentes de Inteligência Artificial (Agentes de IA). Nas próximas linhas, vamos explorar essa ideia e analisar o motivo pelo qual empresas de tecnologia como NVIDIA e OpenAI estão investindo nessa área.
Aquele que age
É interessante colocar em perspectiva a etimologia da palavra “agente” para entender melhor a utilização desse conceito. Segundo o dicionário Priberam, o termo tem origem na palavra agens, que significa fazer, produzir efeito. Ou seja, um agente é uma entidade que produz alguma ação. Neste sentido, um robô aspirador é um agente, por exemplo. Ele identifica a área de abrangência e depois atua fazendo a limpeza. Mas, e se um agente contar com um sistema de inteligência artificial dentro do seu mecanismo? Ele pode utilizar sofisticados algoritmos para tomar decisões com alguma autonomia. É o que os carros autônomos são capazes de fazer, por exemplo. Eles utilizam diversos sensores e complexos sistemas de visão computacional para que o veículo seja capaz de dirigir sem a interferência humana.Certo, nenhum exemplo novo até agora. Porém há um outro nível de possibilidades: o uso de Large Language Models (LLMs) e Multimodal Large Language Models (MLLMs) dentro do sistema destes agentes. E aí as coisas podem ficar bem mais interessantes.
Agentes com o poder da linguagem
LLMs são modelos de IA que trabalham com linguagem e tornam possível a existência de chatbots inteligentes como ChatGPT e Google Gemini. Eles têm a capacidade de processar a linguagem humana de uma forma inovadora, atendendo às solicitações do usuário de forma bastante eficiente. Utilizando originalmente texto como entrada e retornando texto como saída, os LLMs têm evoluído e os modelos “estado da arte” já conseguem trabalhar também com imagens e áudios, tornando-se portanto, multimodais. Por isso passam a ser designados como MLLMs. Figure 01: Robô da Figure com modelo de linguagem da OpenAI incorporado Em um vídeo de exemplo mostrado pela empresa Figure, um robô foi capaz de entender a solicitação de um usuário que conversava com ele, interagindo com o ambiente que estava à sua frente. Em certo momento, o robô organiza objetos em uma prateleira e até entrega uma maçã após a solicitação desta pessoa. Isso mostra o quão sofisticados podem se tornar estas máquinas. Isso quer dizer que os Agentes de IA são robôs mecânicos, humanoides, que fazem aquilo que a gente pede? Não necessariamente. Na verdade, este conceito é bastante amplo. Um Agente de IA pode ser apenas um programa de computador que executa certas tarefas de forma autônoma, utilizando LLMs para atingir objetivos mais sofisticados. Imagine o seguinte exemplo: um programa que conversa com um usuário de um sistema de saúde e, através desta conversa, consegue identificar as suas necessidades médicas. Ao identificá-las, registra as informações em prontuário e sinaliza para o profissional que a acompanha as condições de atenção. Veja que não há nenhuma ação mecânica envolvida, neste caso. Porém o sistema foi autônomo o suficiente para interpretar a conversa e logo após realizar as ações de anotação e sinalização. Na verdade este é um exemplo real de Agente de IA, desenvolvido pela startup Hippocratic AI. A solução está em estudo fase III e só pode ser utilizada, por enquanto, com a supervisão de um profissional de saúde. O vídeo de demonstração pode ser conferido aqui: https://www.youtube.com/watch?v=yg0m8eR7k24 Assistente de saúde desenvolvido pela startup Hippocratic AI.
Aglomerado de agentes
Já deu pra ter uma ideia do que pode ser feito com um Agente de IA? Mas isso é só o começo de uma nova forma de pensar sistemas automatizados. E se, em vez de empregar apenas um único agente, formássemos uma equipe composta por múltiplos agentes? E se nesta equipe cada um tivesse seu papel, com devida autonomia? Estes agentes poderiam operar de forma coordenada, interagindo entre si. Essa é a ideia por trás do conceito de Agent Swarms, que pode ser traduzido como “enxames de agentes” ou “aglomerados de agentes”. Com essa abordagem, podemos pensar em equipes de agentes com diversos papeis especializados. Imagine, por exemplo, uma equipe de pesquisa. Um agente pode ficar responsável por pesquisar um determinado assunto na internet e registrar conteúdo relevante, enquanto outro pode ficar responsável por escrever no formato post a síntese do que foi encontrado pelo agente de pesquisa. Um terceiro agente pode ainda ficar responsável por supervisionar se aquilo que foi escrito pelo segundo agente condiz com a pesquisa realizada pelo primeiro. Um outro agente pode ficar responsável por traduzir o texto final para outra língua. É possível até mesmo estabelecer uma hierarquia entre eles, se necessário. Veja que começa a ficar difícil definir os limites do que pode ser realizado com essa abordagem.
Perspectivas
Tanto na versão de robôs humanoides mecânicos quanto na de algoritmos atuando exclusivamente em sistemas computacionais, o uso dos atuais modelos de IA em sistemas autônomos amplia significativamente o leque de tarefas executáveis com mínima ou nenhuma intervenção humana. Sem dúvidas, esta nova realidade levanta questões sobre como o trabalho humano se moldará no futuro. O que pode levantar várias reflexões. Vale destacar que certamente precisaremos de menos pessoas para fazer as tarefas que já são feitas atualmente. Por outro lado, imagine uma quantidade fixa de pessoas utilizando estas novas tecnologias. Será possível agora realizar uma quantidade de tarefas até então inimaginável, para elas. Neste contexto, nos cabe conhecer as ferramentas e suas possibilidades, para que possamos identificar os riscos, mas também as possibilidades que se abrem sob essas novas perspectivas.
Referências:
- https://dicionario.priberam.org/agente
- https://www.hippocraticai.com/
- https://www.cio.com/article/1297843/agent-swarms-an-evolutionary-leap-in-intelligent-automation.html
- https://www.youtube.com/watch?v=USlE2huSI_w
- https://www.youtube.com/watch?v=Sq1QZB5baNw
ODONTOLOGIA NEWs
Odontologia News tem como principal objetivo oferecer um conteúdo rico sobre o universo odontológico para os profissionais, pensando também nos pacientes e no público em geral.
Nossos artigos apresentam atualidades e dicas preciosas sobre tecnologia, inovação e gestão para seu consultório. Fique atento ao nosso blog para manter-se sempre bem-informado