Databricks

plataforma moderna de datos en la nube From Wikipedia, the free encyclopedia

Databricks es una empresa tecnológica de software empresarial con sede en San Francisco (California), fundada por los creadores de Apache Spark.[1] Databricks desarrolla una plataforma basada en web para trabajar con Spark, que proporciona gestión automatizada de clústeres y cuadernos de estilo IPython. La empresa desarrolla Delta Lake, un proyecto de código abierto para aportar fiabilidad a los lagos de datos para el aprendizaje automático y otros casos de uso de la ciencia de datos.[2]

Datos rápidos Tipo, Industria ...
Databricks
Tipo negocio y software
Industria industria del software
Forma legal empresa privada
Fundación 2013
Fundador Ali Ghodsi
Ion Stoica
Reynold Xin
Matei Zaharia
Sede central San Francisco (Estados Unidos)
Presidente Ion Stoica
Personas clave Ali Ghodsi (director ejecutivo)
Ingresos 1 000 000 000 dólares estadounidenses
Empleados 4000
Miembro de Business Software Alliance
Sitio web databricks.com
Cerrar

Historia

Databricks surgió del proyecto AMPLab de la Universidad de California en Berkeley, que participó en la creación de Apache Spark, un marco de computación distribuida de código abierto construido sobre Scala. La empresa fue fundada por Ali Ghodsi, Andy Konwinski, Arsalan Tavakoli-Shiraji, Ion Stoica, Matei Zaharia,[3] Patrick Wendell y Reynold Xin.

En noviembre de 2017, la empresa fue anunciada como un servicio de primera parte en Microsoft Azure a través de la integración Azure Databricks.[4]

En junio de 2020, Databricks adquirió Redash, una herramienta de código abierto diseñada para ayudar a los científicos y analistas de datos a visualizar y construir cuadros de mando interactivos de sus datos.[5]

En febrero de 2021, junto con Google Cloud, Databricks proporcionó integración con el motor Kubernetes de Google y la plataforma BigQuery de Google.[6] Fortune clasificó a Databricks como uno de los mejores grandes "Lugares de trabajo para millennials" en 2021.[7] En ese momento, la compañía dijo que más de 5000 organizaciones utilizaban sus productos.[8]

En agosto de 2021, Databricks finalizó su octava ronda de financiación recaudando US$1 600 000 000 (equivalente a $1 799 042 122 en 2023) y valorando la empresa en US$38 000 000 000 (equivalente a $42 727 250 399 en 2023).[9]

En octubre de 2021, Databricks realizó su segunda adquisición de la empresa alemana no-code 8080 Labs, la cual fabrica bamboolib, una herramienta de exploración de datos que no requiere codificación para su uso.[10]

En respuesta a la popularidad de ChatGPT de OpenAI, en marzo de 2023, la empresa presentó un modelo de lenguaje de código abierto, llamado Dolly en honor a la oveja Dolly, que los desarrolladores podían utilizar para crear sus propios chatbots. Su modelo utiliza menos parámetros para producir resultados similares a los de ChatGPT, pero Databricks no había publicado pruebas comparativas formales para demostrar si su bot igualaba realmente el rendimiento de ChatGPT.[11][12][13]

Databricks adquirió la empresa emergente de seguridad de datos Okera en mayo de 2023 para ampliar sus capacidades de gobernanza de datos.[14] Al mes siguiente, adquirió la startup de inteligencia artificial generativa de código abierto MosaicML por US$1 400 000 000 (equivalente a $1 400 000 000 en 2023).[15][16]

Financiación

En septiembre de 2013, Databricks anunció que recaudó US$13 900 000 (equivalente a $18 181 200 en 2023) de Andreessen Horowitz y dijo que su objetivo era ofrecer una alternativa al sistema MapReduce de Google.[17][18] Microsoft fue un inversor destacado de Databricks en 2019, participando en la Serie E de la empresa con una cantidad no especificada.[19][20] La empresa ha recaudado US$1 900 000 000 (equivalente a $2 264 271 769 en 2023) en financiación, incluida una Serie G de US$1 000 000 000 (equivalente a $1 191 721 984 en 2023) liderada por Franklin Templeton con una valoración posterior al dinero de US$28 000 000 000 (equivalente a $31 483 237 136 en 2023) en febrero de 2021. Otros inversores son Amazon Web Services, CapitalG, una empresa de capital de crecimiento dependiente de Alphabet Inc. y Salesforce Ventures.[8]

Más información Serie, Fecha ...
Rondas de financiación
Serie Fecha Importe (millones de $) Inversores principales
A 2013 13.9[17] Andreessen Horowitz
B 2014 33[21] New Enterprise Associates
C 2016 60[22]
D 2017 140[23] Andreessen Horowitz
E Feb. 2019 250[24]
F Oct. 2019 400[25]
G Ene. 2021 1,000[26] Franklin Templeton Investments
H Ago. 2021 1,600[27] Morgan Stanley
Cerrar

Productos

Databricks desarrolla y vende una plataforma de datos en la nube utilizando el término de mercadotecnia "Lakehouse", un Portmanteau basado en los términos "data warehouse" y "data lake".[28] Lakehouse de Databricks se basa en el framework de código abierto Apache Spark, que permite realizar consultas analíticas contra datos semiestructurados sin un esquema de base de datos tradicional.[29] En octubre de 2022, Lakehouse recibió la autorización FedRAMP para su uso con el gobierno federal y los contratistas estadounidenses.[30]

Delta Engine de Databricks se lanzó en junio de 2020 como un nuevo motor de consulta que se superpone a Delta Lake para aumentar el rendimiento de las consultas.[31] Es compatible con Apache Spark y MLflow, que también son proyectos de código abierto de Databricks.[32]

En noviembre de 2020, se presentó Databricks SQL, antes conocido como SQL Analytics, para ejecutar informes de inteligencia empresarial y analítica sobre lagos de datos. Los analistas pueden consultar conjuntos de datos directamente con SQL estándar o utilizar conectores de productos para integrarlos directamente con herramientas de inteligencia empresarial como Tableau, Qlik, SigmaComputing, Looker y ThoughtSpot.[33]

Databricks ofrece una plataforma para otras cargas de trabajo, incluido el aprendizaje automático, el almacenamiento y procesamiento de datos, la analítica de streaming y la inteligencia empresarial.[34]

La empresa también ha creado Delta Lake, MLflow y Koalas, proyectos de código abierto que abarcan la ingeniería de datos, la ciencia de datos y el aprendizaje automático.[35] Además de construir la plataforma Databricks, la empresa ha coorganizado cursos online masivos y abiertos sobre Spark[36] y una conferencia para la comunidad Spark llamada Data + AI Summit,[37] antes conocida como Spark Summit.

Operaciones

Referencias

Related Articles

Wikiwand AI