MzML
Dateiformat in der Massenspektrometrie
From Wikipedia, the free encyclopedia
mzML ist ein XML-basiertes Dateiformat in der Proteomik, das die Vorgänger mzXML und mzData konsolidiert. Es dient als herstellerunabhängiges Austausch- und Archivierungsformat für massenspektrometrische Daten. Das XML Schema ist strikt festgelegt, aber es existiert ein erweiterbares kontrolliertes Vokabular, das den technischen Fortschritt in dem Gebiet abbilden soll. Die Projektgruppe stellt eine Referenzimplementierung und Validatoren zur Verfügung. Mit der Trans-Proteomic Pipeline ist eine weitergehende Datenanalyse möglich.[2] Der vollständige Lauf mitsamt allen Metadaten ist im Dateiformat enthalten. Das Format erlaubt den wahlfreien Zugriff: ein Programm muss die Datei nicht erst vollständig einlesen, um ein Massenspektrum aufzurufen. Es wird von ProteoWizard und OpenMS unterstützt. Zudem ist es im NCBI C++ Toolkit enthalten und durch jmzML in Java implementiert. Die Suchmaschinen X!Tandem und Myrimatch zählen zu den Unterstützern der ersten Stunde.[3] ChemClipse und das darauf aufbauende OpenChrom unterstützen mzML ebenfalls.[4] Nachteilig ist die 4–18 × höhere Dateigröße im Vergleich zu binären Herstellerformaten, was in durch Festplattenzugriff limitierten Szenarien zu längeren Verarbeitungszeiten führen kann.[5]
| mzML | |
|---|---|
| Dateiendung: | .mzML |
| Entwickelt von: | Proteomics Standards Initiative |
| Aktuelle Version | 1.1.0 (2009-06-01) |
| Erweitert von: | mzXML, mzData[1] |
| www.psidev.info/mzML | |