1. Deep Learning on Point Clouds for 3D Protein Classification Based on Secondary Structure
- Author
-
KALIMERIS ALEXANDROS
- Subjects
Τεχνολογία – Πληροφορική ,Technology - Computer science - Abstract
Οι πρωτεΐνες είναι μακρομόρια που ρυθμίζουν πληθώρα βιολογικών διεργασιών. Η χωρική δομή των πρωτεϊνών είναι ο κύριος καθοριστικός παράγοντας της βιολογικής λειτουργίας τους. Συνεπώς, η εύρεση νέων αποτελεσματικών μεθόδων ταξινόμησης πρωτεϊνών με βάση την τρισδιάστατη δομή τους είναι ένα σημαντικό έργο με εφαρμογές σε πολλά επιστημονικά πεδία. Στο πλαίσιο αυτής της πτυχιακής εργασίας, εξερευνούμε και εξετάζουμε τις δυνατότητες των Βαθιών Νευρωνικών Δικτύων όσον αφορά την εκτέλεση εργασιών ταξινόμησης σε σύνθετα τρισδιάστατα σχήματα πρωτεϊνών. Για τους σκοπούς αυτούς, αναλύσαμε υπάρχουσες αρχιτεκτονικές βαθιάς μάθησης που έδειξαν πολλά υποσχόμενα αποτελέσματα. Επιπλέον, δοκιμάζουμε την αποτελεσματικότητα αυτών των αρχιτεκτονικών με την εκτέλεση μιας σειράς πειραμάτων ταξινόμησης πρωτεϊνών. Στα πειράματά μας, αντιπροσωπεύουμε το γεωμετρικό τρισδιάστατο σχήμα των πρωτεϊνών ως νέφη σημείων, μια ευέλικτη γεωμετρική αναπαράσταση δεδομένων. Ακόμα, λόγω του ότι οι πρωτεΐνες διαφέρουν μεταξύ τους ως προς το μέγεθος και οι αρχιτεκτονικές βαθιάς μάθησης που εξερευνούμε δεν μπορούν να δεχθούν είσοδο δυναμικού μεγέθους, δοκιμάζουμε τρόπους για την κανονικοποίηση των πρωτεϊνών σε ένα κοινό σταθερό μέγεθος. Τέλος, παρουσιάζουμε ολοκληρωμένα τα αποτελέσματα της δουλειάς μας και τα αξιολογούμε. Proteins are macromolecules that regulate a vast amount of biological processes. The spatial structure of proteins is the main determinant of their biological function. Consequently, discovering and researching new efficient methods for classifying proteins based on their 3D shape is an important task with applications in many scientific fields. In the context of this thesis, we explore and examine the capabilities of Deep Neural Networks in performing classification tasks on the complex 3D shapes of proteins. For these purposes, we analyze existing deep learning architectures that showed promising results. Additionally, we test the effectiveness of these architectures by performing a series of protein classification experiments. In our experiments, we represent the geometric 3D shape of proteins as point clouds, a flexible geometric data representation. Also since proteins have different sizes and the deep learning architectures we explore do not consume dynamic size input, we test ways of normalizing the proteins into the same constant size. Finally, we comprehensively present and evaluate the results of our work.
- Published
- 2019