Qwen

inteligencia artificial creada por Alibaba From Wikipedia, the free encyclopedia


Qwen (también llamado Tongyi Qianwen, en chino: 通义千问) es una familia de grandes modelos de lenguaje desarrollados por Alibaba. En julio de 2024, fue clasificado como el mejor modelo de idioma chino en algunos puntos de referencia y el tercero a nivel mundial detrás de los mejores modelos de Anthropic y OpenAI.[1]

Desarrollador Alibaba Cloud
Lanzamiento inicial 1 de abril de 2023 (2 años, 11 meses y 14 días)
Datos rápidos Información general, Tipo de programa ...
Qwen
Información general
Tipo de programa Bot conversacional, Inteligencia artificial generativa
Desarrollador Alibaba Cloud
Lanzamiento inicial 1 de abril de 2023 (2 años, 11 meses y 14 días)
Licencia Apache-2.0
Información técnica
Plataformas admitidas
Versiones
Última versión estable 3 (28 de abril de 2025 (10 meses y 17 días))
Enlaces
Cerrar
Edición de imágenes usando Qwen
Imagen original de Wikipe-tan
Imagen editada con Qwen 3 al estilo del pintor Johannes Vermeer

Modelos

Alibaba lanzó por primera vez una versión beta de Qwen en abril de 2023 bajo el nombre de Tongyi Qianwen.[2] Se lanzó públicamente en septiembre de 2023 después de recibir la aprobación del gobierno chino.[3] En diciembre de 2023 lanzó sus modelos 72B y 1.8B como código abierto, mientras que Qwen 7B se lanzó como código abierto en agosto.[4][5]

En junio de 2024, Alibaba lanzó Qwen 2 y en septiembre lanzó algunos de sus modelos como código abierto, manteniendo sus modelos más avanzados como propietarios.[6][7] Qwen 2 emplea una mezcla de expertos.[8]

En noviembre de 2024, se lanzó QwQ-32B-Preview, un modelo centrado en el razonamiento similar al OpenAI o1, bajo la licencia Apache 2.0 , aunque solo se publicaron los pesos, no el conjunto de datos ni el método de entrenamiento.[9][10] QwQ tiene una longitud de contexto de 32 000 tokens y funciona mejor que o1 en algunos puntos de referencia.[11]

La serie Qwen-Vl es una línea de modelos de lenguaje visual que combina un transformador de visión con un LLM.[12][13] Alibaba lanzó Qwen-VL2 con variantes de 2 mil millones y 7 mil millones de parámetros.[14][15] Qwen-vl-max es el modelo de visión insignia de Alibaba a partir de 2024 y lo vende Alibaba Cloud a un coste de 0,00041 dólares por cada mil tokens de entrada.[16]

Alibaba ha lanzado varios otros tipos de modelos, como Qwen-Audio y Qwen2-Math.[17] En total, ha lanzado más de 100 modelos como código abierto, y sus modelos han sido descargados más de 40 millones de veces.[7][18] Se han desarrollado versiones optimizadas de Qwen, como "Liberated Qwen", desarrollado por Abacus AI con sede en San Francisco, que es una versión que responde a cualquier solicitud del usuario sin restricciones de contenido.[19]

En enero de 2025, Alibaba lanzó Qwen 2.5-Max. Según una entrada de blog de Alibaba, Qwen 2.5-Max supera a otros modelos como GPT-4o, DeepSeek-V3 y Llama-3.1-405B en pruebas de evaluación clave.[20] En febrero de 2025, Alibaba anunció en su cuenta oficial de X que el modelo 2.5-Max sería de código abierto.[21]

El 24 de marzo de 2025, Alibaba lanzó Qwen2.5-VL-32B-Instruct como sucesor del modelo Qwen2.5-VL. Se publicó bajo la licencia Apache 2.0.[22][23]

El 26 de marzo de 2025, Qwen2.5-Omni-7B se publicó bajo la licencia Apache 2.0 y se puso a disposición a través de chat.qwen.ai, así como de plataformas como Hugging Face, GitHub y ModelScope.[24] El modelo Qwen2.5-Omni acepta texto, imágenes, vídeos y audio como entrada y puede generar tanto texto como audio como salida, lo que permite utilizarlo para chatear por voz en tiempo real, de forma similar al GPT-4o de OpenAI.[24]

El 28 de abril de 2025, se publicó la familia de modelos Qwen 3,[25][26] con todos los modelos licenciados bajo la licencia Apache 2.0. La familia de modelos Qwen 3 incluye tanto modelos densos (0,6B, 1,7B, 4B, 8B, 14B y 32B, siendo B de miles de millones de parámetros) como modelos dispersos (30B con 3B de parámetros activados, 235B con 22B de parámetros activados). Se entrenaron con 36 billones de tokens en 119 lenguas y dialectos.[27] Todos los modelos, excepto las variantes 0,6B, 1,7B y 4B, tienen una ventana de contexto de 128 mil tokens. Al igual que los modelos o1 y QwQ 32B de OpenAI, los modelos Qwen 3 admiten razonamiento, que puede activarse o desactivarse a través del tokenizador. Los modelos Qwen 3 están disponibles a través de chat.qwen.ai y son de código abierto en Hugging Face y ModelScope.[28]

Más información Versión, Fecha de lanzamiento ...
Lista of modelos
Versión Fecha de lanzamiento ref
Tongyi Qianwen septiembre de 2023 [3]
Qwen-VL agosto de 2023 [29]
Qwen2 junio de 2024 [7]
Qwen2-Audio agosto de 2024 [30]
Qwen2-VL diciembre de 2024 [31]
Qwen2.5 septiembre de 2024 [18]
Qwen2.5-Coder 12 de noviembre de 2024 [32]
QvQ 26 de diciembre de 2024 [33]
Qwen2.5-VL 27 de enero de 2025 [34]
QwQ-32B 5 de marzo de 2025 [35]
Qwen2.5-Omni 27 de marzo de 2025 [24]
Qwen3 28 de abril de 2025 [26]
Qwen3-Coder 22 de julio de 2025 [36]
Qwen3-Max 8 de septiembre de 2025 [37]
Qwen3-Next 8 de septiembre de 2025 [38]
Qwen3-Omni 21 de septiembre de 2025 [39]
Qwen3-VL 22 de septiembre de 2025 [40]
Cerrar


Véase también

Referencias

Enlaces externos

Related Articles

Wikiwand AI