De Chatbots a Agentes Autónomos: El futuro de la IA ya está aquí
Desde la predicción cerebral hasta la autonomía de software: cómo los agentes inteligentes transformarán nuestro mundo
En el libro Mil cerebros, el científico y emprendedor Jeff Hawkins, conocido por haber inventado la famosa PDA Palm Pilot, precursora de los smartphones, nos presenta una visión del cerebro de los seres humanos como máquinas de predicción. Nuestro cerebro cada momento se está anticipando a lo que podría suceder, inventando futuros cercanos, en busca de posibles riesgos.
Otros científicos nos hablan de cómo esta capacidad de anticipación puede ser la razón de que nuestra especie sobreviviera a lo largo del tiempo, mientras que otras especies del género homo se extinguieron. En su momento nos mantuvo con vida, pero ahora que la innovación tecnológica nos ha traído un mundo repleto de abundancia, comienzan a surgir otra serie de problemas.
El FOMO (Fear Of Missing Out) aplicado al ámbito de la innovación tecnológica, nos lleva a estar pensando en todo momento qué será lo siguiente, cuál será la próxima gran revolución, en este caso qué vendrá después de la Inteligencia Artificial Generativa, que tan entretenidos nos ha tenido en los últimos dos años.
Agentes que tomarán acciones: la próxima evolución tecnológica
Todo apunta a que la próxima gran evolución, al menos en lo que a Inteligencia Artificial se refiere, serán los Agentes. Se trata de una evolución de la tecnología que tenemos actualmente de Chatbots basados en LLM’s, llegado el momento de que los ChatGPT, Gemini o Claude sean tan inteligentes que desarrollen la capacidad de razonar para la resolución de problemas a nivel humano y se les podrá dar tal autonomía de tomar acciones por sí mismos.
Evolución y niveles de Inteligencia Artificial General
1. Chatbots | IA con lenguaje conversacional |
2. Reasoners | Resolución de problemas a nivel humano |
3. Agents | Sistemas que pueden tomar acciones |
4. Innovators | IA que puede ayudar en la invención |
5. Organizations | IA que puede realizar el trabajo de una organización |
¿Suena muy futurista? Sí. Sin embargo, hace un par de años, tampoco imaginábamos que íbamos a tener a nuestra disposición una herramienta con las capacidades de ChatGPT, que cuanto más la usamos, más útil nos resulta para todo tipo de tareas relacionadas con nuestro trabajo. Para entender de qué estamos hablando, veamos una primera aproximación a la idea de Agente a través de la iniciativa AgentGPT.
Planificar y ejecutar tareas para alcanzar objetivos
AgentGPT permite configurar y desplegar directamente desde el navegador lo que llaman agentes de IA autónomos. Estos agentes pueden ser personalizados con un objetivo específico, y se encargan de planificar y ejecutar tareas para alcanzar ese objetivo de manera autónoma. Utilizan modelos de lenguaje avanzados, como GPT-4, para entender y realizar las tareas sin intervención humana. Los usuarios podemos usar AgentGPT para todo tipo de objetivos, como desarrollar estrategias de marketing, construir aplicaciones web y crear contenidos. La plataforma se destaca por su capacidad de realizar múltiples iteraciones para mejorar continuamente sus resultados y por sus opciones de configuración avanzadas para tareas específicas.
Para que esto sea posible, lo que han hecho en AgentGPT es conectar varios GPT para que trabajen de manera coordinada. Un GPT analiza el objetivo, otro propone las tareas, otro las selecciona por relevancia, otro las ejecuta etc. Así se ha comprobado que se obtienen mejores resultados que si le pedimos a un único GPT que realice todo el proceso.
Agentes con autonomía
Por lo tanto, el concepto de autonomía es lo que toma protagonismo cuando hablamos de Agentes, pero, como podemos imaginar, para dar autonomía a un software, las personas deberemos tomar una serie de precauciones previas que consisten en la configuración previa formada por dos elementos:
- Lo primero es limitar su rango de actuación, ya que, en un inicio, estos Agentes no van a ser multipropósito, sino que se van a integrar dentro de un ámbito determinado, normalmente dentro de una web. Por ejemplo, para realizar la labor de atención al cliente. De esta forma podremos tener un Agente que puede hacer todo tipo de cosas que el usuario necesite, pero siempre que esté circunscrito a la temática de la propia web. En el caso de una web de viajes, podrá ayudar al cliente en todo el proceso, hasta contratar el propio viaje a través del chat, pero no podrá prestar asesoramiento psicológico o médico al usuario ya que, se habrán restringido todas las temáticas que no sean los viajes.
- El segundo elemento en esta configuración es dar acceso a la Inteligencia Artificial a los sistemas propios de la compañía, sobre todo a través de API’s para que esa autonomía sea real y el Agente pueda realizar acciones por sí mismo. No solo proveer la información con la que ha sido entrenado, sino, por ejemplo, realizar el proceso de contratación de vuelos y alojamientos, o conectarse con todo tipo de sistemas de alertas y mensajes a los usuarios. Gestión de facturación, contratación de seguros de viaje etc.
Es así como a través de los agentes se hace realidad la integración de la GenAI en todo Internet. No solo a través de los servicios concretos que hasta ahora se han estado ofreciendo para la generación de imagen, texto, vídeo etc.
Asimismo, la capacidad multimodal y multidispositivo también resultará de gran importancia para que los usuarios podamos acceder a todo el potencial de esta tecnología. De hecho, uno de los grandes retos que tienen en estos momentos los desarrolladores de los LLM´s (OpenAI, Google, Meta…) es adaptarlos para que puedan funcionar de manera fluida en todo tipo de dispositivos y de esta forma facilitar su escalabilidad.
Asistentes virtuales capaces de hacer todo tipo de tareas
Para hacernos una idea, llevamos menos de dos años con estas tecnología a nuestra disposición y aún muestran muchos problemas de consistencia, pero ya les estamos pidiendo ir un paso más allá. La multimodalidad ha sido un gran avance que ha llegado apenas en un año, un tiempo muy reducido;
Por ejemplo, se trata de hacer algo así como una foto de lo que hay dentro de mi nevera y pedirle que elabore una lista de menús y recetas con ello. Pero quizás el siguiente paso que estamos esperando es que, si faltan alimentos importantes para elaborar un menú saludable, el propio Agente se encargue de hacer un pedido online para que nos traigan a casa dichos alimentos.
Los Chatbots basados en Inteligencia Artificial podían principalmente responder todas nuestras dudas y ayudarnos a hacer todo tipo de tareas relacionadas con la creación de contenidos. Cuando esta tecnología esté integrada en todo tipo de webs, en forma de Agentes, además tendrá la capacidad de hacer funciones específicas relacionadas con el contenido de esa web. Y finalmente, cuando las propias webs den acceso a ChatGPT, Gemini, Claude y compañía a través de sus API’s, lo que tendremos serán verdaderos asistentes virtuales que pueden hacer todo tipo de tareas por nosotros. ¿Cómo? Navegando por Internet siguiendo unas órdenes preestablecidas.
Los Agentes como parte de nuestro día a día
En SNGULAR llevamos trabajando con Agentes desde la aparición de los LLM’s y ya hemos puesto en práctica este tipo de tecnología en varios proyectos para clientes. Por esto podemos decir que la tendencia es real y que muchísimas empresas van a querer tener integradas estas funciones dentro de su propio software y webs.
De momento no entraremos en la parte de “innovations” y “organizations” que predice OpenAI pero, ¿Qué duda cabe de que la tendencia sea esa? Ya hay muchas empresas y profesionales trabajando para hacer esto posible. Como recomendación general, parece buena idea que nos vayamos preparando para ello, aunque sólo sea mentalmente.
Dominar la Inteligencia Artificial
Al paso que evoluciona la Inteligencia Artificial, dominarla comienza a ser un requisito. En TecnoFor te ofrecemos estas formaciones para que desarrolles las habilidades necesarias para implementarla y aproveches sus capacidades en tu dinámica de trabajo:
- Fundamentos del Prompting en IA Generativa
- IA Generativa: Curso práctico para mejorar la productividad y creatividad