Modelos fundacionales

Un modelo fundacional, o modelo de base, es un modelo de inteligencia artificial entrenado con una gran cantidad de datos de diferentes dominios no etiquetados (generalmente mediante aprendizaje autosupervisado) que da como resultado un modelo que se puede adaptar a una amplia gama de tareas .^[1]^[2] Los modelos fundacionales han transformado el desarrollo de los sistemas de IA desde su introducción en 2018. Los primeros ejemplos de modelos fundacionales fueron grandes modelos de lenguaje pre-entrenados tales como BERT y GPT-3 . Usando las mismas ideas, se han construido modelos específicos de dominio que usan secuencias de otros tipos de tokens, como códigos médicos.^[3] Posteriormente, se han producido modelos fundacionales multimodales, incluidos DALL-E, Flamingo,^[4] y Florence. El Centro de Investigación de Modelos Fundacionales (CRFM) del Institute for Human-Centered Artificial Intelligence de la Universidad de Stanford (HAI) popularizó el término.^[1]

[1]

[2]

[3]

[4]

Modelos fundacionales

Referencias

Related Articles