Back to Search Start Over

Chemometrics approaches for the automatic analysis of metabolomics GC-MS data

Authors :
BRO, RASMUS
Baccolo, G
ORLANDI, MARCO EMILIO
BALLABIO, DAVIDE
BACCOLO, GIACOMO
BRO, RASMUS
Baccolo, G
ORLANDI, MARCO EMILIO
BALLABIO, DAVIDE
BACCOLO, GIACOMO
Publication Year :
2022

Abstract

La metabolomica, che consiste nella identificazione di tutti i metaboliti presenti all’interno dei campioni biologici analizzati, è un approccio ampiamente applicato in diversi campi di ricerca quali: identificazione di biomarcatori, sviluppo di nuovi farmaci, scienze alimentari e ambientali. La metabolomica è strettamente legata alla capacità di tecniche analitiche fra queste una delle più applicate è la gas cromatografia accoppiata alla spettrometria di massa. Moderne piattaforme analitiche possono generare centinaia di migliaia di spettri, rilevando una quantità impressionante di molecole distinte. Nonostante i progressi tecnici raggiunti sul lato sperimentale, la conversione dei segnali misurati dagli strumenti in informazioni utili non è un passaggio scontato in studi metabolomici. Per ogni composto identificato, l’obbiettivo è ottenere la concentrazione relativa tra tutti i campioni analizzati e lo spettro di massa associato al composto, necessario per l’identificazione della molecola stessa. I software disponibili per l’analisi dei dati sperimentali sono stati ripetutamente indicati come una fonte importante di incertezza, limitando fortemente sia la quantità che la qualità delle informazioni estratte. Gli strumenti più applicati richiedono l’impostazione di diversi parametri da parte dell’operatore, influenzando il risultato dell’analisi. In questa tesi è descritto un nuovo approccio, chiamato AutoDise, per l’analisi dei dati GC-MS. L’elaborazione dei segnali sperimentali si basa su PARAFAC2. PARAFAC2 è un modello che scompone dati multidimensionali, discriminando tra i diversi segnali nei campioni. Grazie alle sue proprietà, PARAFAC2 non ha bisogno che i dati siano pretrattati e non richiede di impostare parametri, mentre software utilizzati in questo ambito richiedono di definire diversi parametri e un laborioso pretrattamento dei dati, richiedendo l’intervento di un utente esperto, inoltre la riproducibilità dei risultati è limitata, dipen<br />Metabolomics, which consists of identifying all the metabolites present in the biological samples analysed, is an approach widely applied in various research fields such as biomarker identification, new drug development, food and environmental sciences. Metabolomics is closely linked to the ability of analytical techniques, one of the most widely applied being gas chromatography coupled to mass spectrometry. Modern analytical platforms can generate hundreds of thousands of spectra, detecting an impressive number of distinct molecules. Despite the technical progress achieved on the experimental side, the conversion of signals measured by instruments into useful information is not an obvious step in metabolomic studies. For each identified compound, the goal is to obtain the relative concentration among all analysed samples and the mass spectrum associated with the compound needed to identify the molecule itself. The software available for analysing experimental data has repeatedly been cited as a major source of uncertainty, severely limiting both the quantity and quality of the information extracted. The most applied tools are based on univariate data analysis, considering each sample separately from the others and requiring the operator to set several parameters, affecting the result of the analysis. In this thesis, a new approach, called AutoDise, for the analysis of GC-MS data is described. The processing of the experimental signals is based on PARAFAC2. PARAFAC2 is a model that decomposes multidimensional data, discriminating between different signals in the samples. Due to its properties, PARAFAC2 does not need the data to be pre-processed and does not require parameters to be set, whereas software used in this field requires several parameters to be defined and laborious pre-processing of the data, requiring the intervention of an expert user, and the reproducibility of the results is limited, depending on the parameters chosen by the user. However, fitting PA

Details

Database :
OAIster
Notes :
English
Publication Type :
Electronic Resource
Accession number :
edsoai.on1364262016
Document Type :
Electronic Resource