Σκοπός της διατριβής ήταν η ανάπτυξη νέων μοντέλων Υπολογιστκής Νοημοσύνης με χαμηλές υπολογιστικές απαιτήσεις, για την αντιμετώπιση πραγματικών προβλημάτων από τον χώρο της Βιοπληροφορικής και της Επεξεργασίας Βιοσημάτων. Τα πραγματικά προβλήματα συνήθως δημιουργούν μεγάλα σύνολα δεδομένων και χαρακτηρίζονται από περίπλοκα όρια διαχωρισμού κλάσεων (class separation boundaries). Πρόσφατα, σχεδιασμένα μοντέλα όπως το μοντέλο των Support Vector Machines μπορούν να αντιμετωπίσουν περίπλοκα προβλήματα ταξινόμησης προτύπων (pattern classification problems), όμως ο τρόπος που χρησιμοποιούν είναι υπολογιστικά τόσο ατελέσφορος, που για μεγάλα σύνολα δεδομένων, η αριθμητική επίλυση (numerical evaluation) αυτών των μοντέλων καθίσταται σχεδόν απογορευτική. Τα μοντέλα μη-επιβλεπόμενης (unsupervised) μάθησης από την άλλη, αν και έχουν σημαντικά χαμηλότερες υπολογιστικές απαιτήσεις, έχουν μια εγγενή μειωμένη ικανότητα διαχωρισμού κλάσεων κοντά στα όρια των κλάσεων. Η διατριβή αυτή αποσκοπώντας στον συνδυασμό και των δυο μοντέλων (μη επιβλεπόμενων και επιβλεπόμενών) εισήγαγε μια νέα προσέγγιση που στηρίχθηκε σε ένα απλό γεγονός: ο χώρος καταστάσεων για πολλά περίπλοκα προβλήματα ταξινόμησης προτύπων, αποτελείται από περιοχές που βρίσκονται κοντά στα όρια διαχωρισμού κλάσεων και απαιτούν την κατασκευή περίπλοκων διαχωριστών (discriminants), ενώ για τις υπόλοιπες περιοχές το πρόβλημα της ταξινόμησης είναι αρκετά πιο απλό. Σύμφωνα με τα προηγούμενα, στο πρώτο μέρος της διατριβής σχεδιάστηκε το μοντέλο Supervised Network Self-Organizing Map (sNet-SOM) που εκμεταλλεύεται την ύπαρξη του ανομοιόμορφου χώρου καταστάσεων: Το μοντέλο sNetSOM χρησιμοποιεί μη-επιβλεπόμενη μάθηση για την ταξινόμηση στις απλές περιοχές και επιβλεπόμενη για τις περίπλοκες περιοχές (δηλαδή σε αυτές που είναι κοντά στα όρια διαχωρισμού κλάσεων). Ο αλγόριθμος μάθησης του sNetSOM διατυπώνεται επομένως σε δύο στάδια: Η μη-επιβλεπόμενη μάθηση επεκτείνει και προσαρμόζει τον αλγόριθμο SOM του Kohonen, ενώ η επιβλεπόμενη βασίζεται στα μοντέλα Generalized Radial Basis Functions Networks (GRBFN) και σε Support Vector Machines (SVM’s). Η απόδοση του sNet-SOM υπολογίστηκε κατά την εφαρμογή του σε συνθετικά δεδομένα, σε δεδομένα προσομοίωσης και σε πρόβλημα ανίχνευσης ισχαιμικών επεισοδίων με δεδομένα από την European ST-T βάση δεδομένων (καταγραφές Ηλεκτροκαρδιογραφημάτων). Σε όλες τις περιπτώσεις η χρήση του sNet-SOM, με επιβλεπόμενη μάθηση βασιζόμενη σε GRBFN και σε SVM’s, βελτίωσε σημαντικά τα αποτελέσματα που προκύπτουν μόνο από την χρήση του μη-επιβλεπόμενού SOM και μείωσε δραστικά της υπολογιστικές απαιτήσεις των επιβλεπόμενων μοντέλων, λόγω της λειτουργία τους στον σημαντικά μειωμένο χώρο των διφορούμενων περιοχών. Το δεύτερο μέρος της διατριβής αποσκοπούσε στην εφαρμογή του μοντέλου sNet- SOM για την ανάλυση δεδομένων γονιδιακής έκφρασης από μικροσυστοιχίες. Τώρα που το έργο της αλληλούχισης του ανθρώπινου γονιδιώματος οδεύει προς την πλήρη ολοκλήρωσή του (προγραμματισμένο για το 2003), η τεχνολογία των μικροσυστοιχιών ανοίγει νέους ορίζοντες για την μελέτη της πολυπλοκότητας του γονιδιώματος. Επιτρέποντας την μέτρηση της έκφρασης χιλιάδων γονιδίων ταυτόχρονα, βοηθάει στην ανακάλυψη της λειτουργίας των γονιδίων και αποσαφηνίζει σημαντικά βιολογικά μονοπάτια (biological pathways). Η ανάλυση των τεράστιων ποσοτήτων δεδομένων που προκύπτουν από αυτά τα πειράματα όμως, απαιτεί την χρήση προηγμένων υπολογιστικών εργαλείων. Το μοντέλο του sNet- SOM πληρούσε σε γενικές γραμμές τις προϋποθέσεις, έπρεπε όμως να επανασχεδιασθεί για να εναρμονιστεί με τις ιδιαιτερότητες των δεδομένων γονιδιακής έκφρασης. Επιπρόσθετα, επειδή προς το παρόν η αποκάλυψη της δομής των δεδομένων παραμένει βασικός στόχος της ανάλυσης των δεδομένων και όχι απλά η ταξινόμηση των γονιδίων, η δυνατότητα ομαδοποίησης του sNet-SOM ενισχύθηκε, προσθέτοντας, στη μη-επιβλεπόμενης φάση του, μια επιπλέον δυνατότητα επέκτασης. Η εφαρμογή του sNet-SOM για την ανάλυση δεδομένων γονιδιακής έκφρασης είχε απόδοση ταξινόμησης παρόμοια με αυτές άλλων προηγμένων μοντέλων ταξινόμησης, που έχουν χρησιμοποιηθεί πρόσφατα. Επιπλέον όμως είχε και το σημαντικό πλεονέκτημα των χαμηλών υπολογιστικών απαιτήσεων και την ικανότητα της αντιμετώπισης του γεγονότος, ότι τα γονίδια ανήκουν σε περισσότερες της μίας κλάσης (multi-labeling), το οποίο είτε αμελείται, είτε δεν μπορεί να αντιμετωπιστεί από τις περισσότερες άλλες μεθόδους. Επίσης, συγκρίνοντας με μοντέλα που είτε χρησιμοποιούν επιβλεπόμενη μάθηση και ταξινομούν τα δεδομένα, είτε χρησιμοποιούν μη-επιβλεπόμενη μάθηση και αποκαλύπτουν την δομή των δεδομένων, το σχεδιασμένο μοντέλο sNet-SOM καταφέρνει και συνδυάζει και τις δύο διεργασίες, γιατί παράλληλα με την ταξινόμηση παρέχει ένα εργαλείο εκτενούς εξερεύνησης των δεδομένων στο πλαίσιο της μη-επιβλεπόμενης ανάλυσης.