Inteligencia artificial de código abierto
From Wikipedia, the free encyclopedia
La inteligencia artificial de código abierto es un sistema de IA que se puede usar, estudiar, modificar y compartir libremente. [1] Estos atributos se extienden a cada uno de los componentes del sistema, incluidos los conjuntos de datos, el código y los parámetros del modelo, lo que promueve un enfoque colaborativo y transparente para el desarrollo de la IA. [1] Las licencias de software libre y de código abierto (FOSS), como la Licencia Apache, la Licencia MIT y la Licencia Pública General de GNU, establecen los términos bajo los cuales se puede acceder, modificar y redistribuir la inteligencia artificial de código abierto. [2]
El modelo de código abierto proporciona un acceso más amplio a la tecnología de IA, permitiendo que más personas y organizaciones participen en la investigación y el desarrollo de IA. [3] En contraste, la inteligencia artificial de código cerrado es propietaria, lo que restringe el acceso al código fuente y a los componentes internos. [3] Las empresas suelen desarrollar productos cerrados para mantener una ventaja competitiva en el mercado. Sin embargo, algunos expertos sugieren que las herramientas de IA de código abierto podrían tener una ventaja en el desarrollo sobre los productos de código cerrado y el potencial de superarlos en el mercado.[4][5]
Entre las categorías populares de proyectos de inteligencia artificial de código abierto se incluyen los grandes modelos de lenguaje, las herramientas de traducción automática y los chatbots . [6] Para que los desarrolladores de software creen recursos de inteligencia artificial (IA) de código abierto, deben confiar en los diversos componentes de software de código abierto que utilizan en su desarrollo. [7]
Década de 1990: Primeros pasos en el desarrollo de la IA y el software de código abierto
La historia de la inteligencia artificial de código abierto está intrínsecamente ligada tanto al desarrollo de las tecnologías de IA como al crecimiento del movimiento del software de código abierto. [8] La IA de código abierto ha evolucionado significativamente en las últimas décadas, gracias a las contribuciones de diversas instituciones académicas, laboratorios de investigación, empresas tecnológicas y desarrolladores independientes. [9] Esta sección explora los principales hitos en el desarrollo de la IA de código abierto, desde sus inicios hasta su estado actual.
El concepto de IA se remonta a mediados del siglo XX, cuando informáticos como Alan Turing y John McCarthy sentaron las bases de las teorías y algoritmos modernos de IA. [10] Una forma temprana de IA, el programa ELIZA, encargado del procesamiento del lenguaje natural, fue reimplementado y compartido en 1977 por Jeff Shrager como un programa en BASIC, y pronto traducido a muchos otros lenguajes. Las primeras investigaciones en IA se centraron en el desarrollo de sistemas de razonamiento simbólico y sistemas expertos basados en reglas . [11]
Durante este periodo, la idea del software de código abierto comenzó a tomar forma, con pioneros como Richard Stallman abogando por el software libre como medio para promover la colaboración y la innovación en la programación. [12] La Free Software Foundation, fundada en 1985 por Stallman, fue una de las primeras organizaciones importantes en promover la idea de un software que pudiera usarse, modificarse y distribuirse libremente. Las ideas de este movimiento influyeron posteriormente en el desarrollo de la IA de código abierto, a medida que más desarrolladores comenzaron a ver los beneficios potenciales de la colaboración abierta en la creación de software, incluyendo modelos y algoritmos de IA. [13] [14]
En la década de 1990, el software de código abierto comenzó a ganar mayor popularidad[15] el auge del aprendizaje automático y los métodos estadísticos también impulsó el desarrollo de herramientas de IA más prácticas. En 1993, se creó el Repositorio de Inteligencia Artificial de la CMU, con una variedad de software compartido abiertamente.[16]
Década de 2000: Surgimiento de la IA de código abierto
A principios de la década de 2000, la IA de código abierto comenzó a despegar, con el lanzamiento de bibliotecas y marcos fundamentales más fáciles de usar que estaban disponibles para que cualquiera los utilizara y contribuyera a ellos. [17]
OpenCV se lanzó en 2000 [18] con una variedad de algoritmos de IA tradicionales como árboles de decisión, k-vecinos más cercanos (kNN), Naive Bayes y máquinas de vectores de soporte (SVM). [19]
En 2007 se lanzó Scikit-learn . [20] Se convirtió en una de las bibliotecas más utilizadas para el aprendizaje automático de propósito general debido a su facilidad de uso y robusta funcionalidad, proporcionando implementaciones de algoritmos comunes como regresión, clasificación y agrupamiento. [21] [22] Theano también se lanzó ese mismo año. [23]
Auge de los marcos de IA de código abierto (década de 2010)
Torch, un marco de aprendizaje profundo de código abierto, se lanzó en 2002 y se convirtió en software libre con Torch7 en 2011. Posteriormente, se amplió con PyTorch y TensorFlow . [24] [25] Estos marcos permitieron a investigadores y desarrolladores crear y entrenar redes neuronales para tareas como el reconocimiento de imágenes, el procesamiento del lenguaje natural (PLN) y la conducción autónoma. [26]
AlexNet se lanzó en 2012, [27] y Word2vec para el procesamiento del lenguaje natural por Google en 2013. [28] [29]
En 2014, GloVe, [30] un competidor de Word2vec, publicó su código fuente bajo una licencia Apache 2.0, documentó los conjuntos de datos con los que se entrenó y publicó los pesos del modelo bajo una Dedicación y Licencia de Dominio Público . [31]
Inteligencia artificial generativa de código abierto (2020-Actualidad)
Tras el anuncio de GPT-2, OpenAI inicialmente planeó mantener el código fuente de sus modelos en privado, alegando preocupaciones sobre aplicaciones maliciosas. [32] Sin embargo, tras la reacción negativa del público, OpenAI publicó el código fuente de GPT-2 en GitHub tres meses después de su lanzamiento. [32] OpenAI no ha publicado el código fuente ni los pesos preentrenados de los modelos GPT-3 o GPT-4, aunque los desarrolladores pueden integrar sus funcionalidades mediante la API de OpenAI. [33] [34]
El auge de los grandes modelos de lenguaje (LLM) y la IA generativa, como GPT-3 de OpenAI (2020), impulsó aún más la demanda de marcos de IA de código abierto. [35] [36] Estos modelos se han utilizado en diversas aplicaciones, como chatbots, creación de contenido y generación de código, lo que demuestra las amplias capacidades de los sistemas de IA. [37] En el momento del lanzamiento de GPT-3, GPT-2 seguía siendo el modelo de lenguaje de código abierto más potente del mundo, lo que motivó a EleutherAI a entrenar y lanzar GPT-Neo [38] y GPT-J [38] [39] en 2021.
En febrero de 2022, EleutherAI lanzó GPT-NeoX-20B, recuperando el título de modelo de lenguaje de código abierto más potente del mundo, que ostentaba Meta, cuyo modelo FairSeq Dense 13B había superado a GPT-J a finales de 2021. [40] En 2022 también se produjo el surgimiento de modelos más grandes y potentes bajo diversas licencias no de código abierto, incluidos OPT de Meta [41] y Galactica, [42] [43] BLOOM del BigScience Research Workshop, [44] [45] y GLM de la Universidad de Tsinghua.
Durante las primeras negociaciones de 2021 y 2022 sobre la legislación de IA en Europa, se presentaron propuestas para evitar la sobrerregulación de la IA de código abierto. [46] Al observar que algunas organizaciones aplicaban erróneamente la etiqueta de "código abierto" a su trabajo, en 2022, la Open Source Initiative (OSI), creadora del estándar ampliamente aceptado para el software de código abierto en 1998, comenzó a trabajar con expertos en una definición de "código abierto" que se ajustara a las necesidades del software y los modelos de IA. El aspecto más controvertido se refiere al acceso a los datos, ya que algunos modelos se entrenan con datos sensibles que no pueden divulgarse. En 2024, finalizaron la Definición de IA de Código Abierto 1.0 (OSAID 1.0), con el respaldo de más de 20 organizaciones. [47] [48] Esta definición exige la divulgación completa del software para el procesamiento de datos, el entrenamiento del modelo y la obtención de inferencias a partir del mismo. Para los datos, solo se requiere "información suficientemente detallada sobre los datos utilizados para entrenar el sistema, de modo que una persona capacitada pueda construir un sistema sustancialmente equivalente". [48]
En 2023 se lanzaron Llama 1 y 2, MPT de MosaicML, [49] [50] y los modelos Mistral y Mixtral de Mistral AI .
En 2024, Meta lanzó una colección de grandes modelos de IA, incluyendo Llama 3.1 405B, comparable a los modelos de código cerrado más avanzados. [51] La empresa afirmó que su enfoque de la IA sería de código abierto, diferenciándose así de otras grandes empresas tecnológicas. [51] La Open Source Initiative y otras organizaciones declararon que Llama no es de código abierto, a pesar de que Meta lo describiera como tal, debido a que la licencia de software de Llama prohíbe su uso para ciertos fines. [52] [53] [54]
DeepSeek lanzó su LLM V3 en diciembre de 2024 y su modelo de razonamiento R1 el 20 de enero de 2025, ambos como modelos de pesos abiertos bajo la licencia MIT. [55] [56]
Desde el lanzamiento del modelo ChatGPT de OpenAI a finales de 2022, solo se han publicado unos pocos modelos de lenguaje grandes y totalmente abiertos (pesos, datos, código, etc.). Entre ellos se encuentra la serie de modelos OLMo [57] [58] publicada por el Allen Institute for AI . En septiembre de 2025, un consorcio suizo amplió esta lista con el lanzamiento de Apertus, un modelo totalmente abierto [59] [60] disponible en dos tamaños: uno de 8 mil millones de bytes y otro de 70 mil millones de bytes.[61] Latam-GPT, un modelo abierto de origen chileno con colaboradores de otros países hispanoamericanos, es otro ejemplo de iniciativa regional en curso en este ámbito .
Marcos de trabajo
La Fundación LF AI & Data, un proyecto de la Fundación Linux, ha influido significativamente en el panorama de la IA de código abierto al fomentar la colaboración y la innovación, y al apoyar proyectos de código abierto. [62] Al proporcionar una plataforma neutral, LF AI & Data reúne a desarrolladores, investigadores y organizaciones para crear soluciones de IA y datos de vanguardia, abordando desafíos técnicos críticos y promoviendo el desarrollo ético de la IA. [63]
En octubre de 2024, la fundación contaba con 77 empresas miembro de Norteamérica, Europa y Asia, y albergaba 67 proyectos de software de código abierto (OSS) aportados por una amplia gama de organizaciones, incluyendo gigantes de Silicon Valley como Nvidia, Amazon, Intel y Microsoft . [64] Otros grandes conglomerados como Alibaba, TikTok, AT&T e IBM también han contribuido. [64] Organizaciones de investigación como la Universidad de Nueva York (NYU), los laboratorios de IA de la Universidad de Michigan, la Universidad de Columbia y la Universidad Estatal de Pensilvania también son miembros asociados de la Fundación LF AI & Data. [64]
En 2024, mientras OSAID estaba en desarrollo, la Fundación Linux también elaboraba una rúbrica de componentes para un sistema de IA y publicó un borrador del Marco de Apertura de Modelos (MOF). [65] El MOF es un sistema para evaluar y clasificar la integridad y la apertura de los modelos de aprendizaje automático. Incluía tres clases de apertura, de mayor a menor: Clase I: Modelo de Ciencia Abierta; Clase II: Modelo de Herramientas Abiertas; y Clase III: Modelo Abierto. [65] [66] La Fundación Linux participó en el desarrollo de OSAID, y OSAID adoptó la misma rúbrica de componentes. [67]
En septiembre de 2022, se creó la Fundación PyTorch para supervisar el ampliamente utilizado marco de aprendizaje profundo PyTorch, donado por Meta. [68] La misión de la fundación es impulsar la adopción de herramientas de IA mediante el fomento y el mantenimiento de un ecosistema de proyectos de código abierto e independientes del proveedor, integrados con PyTorch, y democratizar el acceso a herramientas, bibliotecas y otros componentes de vanguardia, haciendo que estas innovaciones sean accesibles para todos. [69]
La Fundación PyTorch también separa la gobernanza empresarial de la técnica. El proyecto PyTorch mantiene su estructura de gobernanza técnica, mientras que la fundación gestiona la financiación, los gastos de alojamiento, los eventos y la administración de activos como el sitio web del proyecto, el repositorio de GitHub y las cuentas en redes sociales, garantizando así una gobernanza comunitaria abierta. [69] En sus inicios, la fundación formó un consejo de gobierno integrado por representantes de sus miembros fundadores: AMD, Amazon Web Services, Google Cloud, Hugging Face, IBM, Intel, Meta, Microsoft y NVIDIA. [69]
Ética
Paralelamente al desarrollo de modelos de IA, ha crecido el interés por garantizar estándares éticos en dicho desarrollo. [70] [71] Esto incluye abordar preocupaciones como los sesgos, la privacidad y el potencial de mal uso de los sistemas de IA. [70] [71] En consecuencia, los marcos para el desarrollo responsable de la IA y la creación de directrices para documentar consideraciones éticas, como el concepto de Tarjeta de Modelo introducido por Google, [72] han ganado popularidad, si bien los estudios demuestran la necesidad continua de su adopción para evitar consecuencias negativas no deseadas. [73]
Debates
Se ha especulado que el software de IA de código abierto presenta un riesgo potencialmente mayor en comparación con la IA de código cerrado, ya que los ciberdelincuentes podrían eliminar los protocolos de seguridad de los modelos públicos a su antojo. De manera similar, también se ha especulado que la IA de código cerrado presenta un mayor riesgo en comparación con la IA de código abierto debido a problemas de dependencia, privacidad, algoritmos opacos, control corporativo y disponibilidad limitada, lo que podría ralentizar la innovación beneficiosa. [74] [75] [76]
También existe un debate sobre la apertura de los sistemas de IA, ya que el concepto de apertura se diferencia.[77] Un artículo en Nature sugiere que algunos sistemas presentados como abiertos, como Llama 3 de Meta, «ofrecen poco más que una API o la posibilidad de descargar un modelo sujeto a restricciones de uso claramente no abiertas». Este tipo de software ha sido criticado por « lavado de imagen de apertura » [78] refiriéndose a sistemas que se entienden mejor como cerrados [75] Existen trabajos y marcos que evalúan la apertura de los sistemas de IA [77] así como una nueva definición de la Open Source Initiative sobre qué constituye la IA de código abierto.[79][80][81] Algunos modelos de lenguaje de gran tamaño se publican con pesos abiertos, lo que significa que sus parámetros entrenados están disponibles públicamente, aunque el código de entrenamiento y los datos no lo estén.[82][83]
Marcos para la mejora
Los esfuerzos para contrarrestar estos desafíos han dado como resultado la creación de marcos de documentación estructurados que guían el desarrollo y la implementación ética de la IA:
- Fichas de modelo : Presentadas en un artículo de investigación de Google, estas fichas ofrecen transparencia sobre el uso previsto, las limitaciones y las métricas de rendimiento de un modelo de IA en diferentes grupos demográficos. [84] [72] Sirven como herramienta estandarizada para destacar consideraciones éticas y facilitar un uso informado. [84] [72] Aunque aún es relativamente nuevo, Google cree que este marco desempeñará un papel crucial para aumentar la transparencia de la IA. [72]
- Modelado de medición: Este método combina enfoques cualitativos y cuantitativos desde una perspectiva de las ciencias sociales, proporcionando un marco que ayuda a los desarrolladores a verificar si un sistema de IA mide con precisión lo que afirma medir. El marco se centra en dos conceptos clave: la fiabilidad test-retest (fiabilidad de constructo) y la validez de constructo (si un modelo mide lo que pretende modelar). Mediante estos conceptos, este modelo permite a los desarrolladores desglosar ideas abstractas que no se pueden medir directamente (como el estatus socioeconómico) en componentes específicos y medibles, a la vez que detecta errores o discrepancias que podrían generar sesgos. Al clarificar estos supuestos, este marco contribuye a crear sistemas de IA más justos y fiables. [85]
- Hojas de datos para conjuntos de datos : Este marco de trabajo hace hincapié en la documentación de la motivación, la composición, el proceso de recopilación y los casos de uso recomendados de los conjuntos de datos. Al detallar el ciclo de vida del conjunto de datos, las hojas de datos permiten a los usuarios evaluar su idoneidad y limitaciones.[86]
- Apertura de ChatGPT: seguimiento de la apertura de los LLM ajustados a las instrucciones : un recurso público impulsado por la comunidad que evalúa la apertura de los modelos de generación de texto. [87]
- Marco de apertura de modelos : Este enfoque emergente incluye principios para el desarrollo transparente de la IA, centrándose en la accesibilidad tanto de los modelos como de los conjuntos de datos para permitir la auditoría y la rendición de cuentas.[88]
- Índice Europeo de IA de Código Abierto : Este índice recopila información sobre la apertura de modelos, las licencias y la regulación de la UE de los sistemas y proveedores de IA generativa. Es un recurso público sin ánimo de lucro alojado en la Universidad Radboud de Nimega, Países Bajos . [89]
A medida que crece el uso de la IA, la mayor transparencia y la reducción de los sesgos en los modelos se han convertido en una preocupación cada vez más importante. [90] Estos marcos pueden ayudar a capacitar a los desarrolladores y a las partes interesadas para identificar y mitigar los sesgos, fomentando la equidad y la inclusión en los sistemas de IA. [85] [90]