Los investigadores de Meta han desarrollado Husky, un agente lingüístico de código abierto que en lugar de centrarse en una sola tarea ha sido diseñado para realizar tareas de razonamiento complejas con distintas herramientas.
Los agentes lingüístico se caracteriza, en general, por el uso de modelos de lenguaje grande (LLM) propietarios o porque se dirigen a la realización de tareas dentro de un dominio concreto. En este panorama, investigadores de Meta junto con otros de la Universidad de Washington y el Instituto Allen para la inteligencia artificial, han presentado un enfoque diferente.
Su propuesta recibe el nombre de Husky y es un agente lingüístico de código abierto capaz de «razonar sobre un espacio de acción unificado para abordar un conjunto diverso de tareas complejas que involucran razonamiento numérico, tabular y basado en el conocimiento», como indican en el texto de la investigación publicado en Arxiv.org.
Para ello, utiliza un procedimiento en dos partes: la generación de la acción, que predice la acción, esto es, «el paso del nivel más alto a dar y la herramienta que lo ejecuta»; y la ejecución de la acción, por la que el modelo y la herramienta realizan la acción y «actualizan el estado de la solución» con una «ontología predefinida de acciones» hasta que adopta el estado final.
De una forma más clara, Husky descompone cada tarea en una serie de acciones, y en cada una de ellas utiliza una herramienta para su realización hasta que completa la tarea, o llega al estado final.
Los investigadores han destacado que utiliza modelos de lenguaje grande (LLM, por sus siglas en inglés) de 7.000 millones de parámetros, pero que su rendimiento «iguala o supera» al de otros modelos de lenguaje frontera como GPT-4 en las tareas que se han analizado.
«Nuestro trabajo presenta una receta sólida para la creación de agentes lingüísticos de código abierto que generalizan diferentes tipos de tareas de razonamiento de varios pasos», concluyen los investigadores.