Διδάσκων: Νικόλαος Χρηστάκης, Ε-309. E-mail: nchristakis [at] tem uoc gr
Ώρες διαλέξεων (διαδικτυακά):
Τετάρτη και Παρασκευή: 20:00-22:00
Ώρες εργαστηρίων (διαδικτυακά): Όποτε
απαιτείται, θα γίνονται μετά από συνεννόηση με τον διδάσκοντα
Ώρες γραφείου: Μετά από συνεννόηση με το
διδάσκοντα
Σκοπός αυτής της σειράς διαλέξεων είναι η εισαγωγή στην επεξεργασία και ανάλυση Μεγάλων Δεδομένων, χρησιμοποιώντας το λογισμικό Apache Hadoop για την προεπεξεργασία των δεδομένων και Τεχνητά Νευρωνικά Δίκτυα (ΤΝΔ) για την ανάλυση και επεξεργασία τους. Πιο συγκεκριμένα, η ύλη του μαθήματος χωρίζεται στις παρακάτω ενότητες:
- Εισαγωγή στα Μεγάλα Δεδομένα
- - Ιστορική αναδρομή
- - Ιδιότητες και τύποι Μεγάλων Δεδομένων
- Εισαγωγή στο λογισμικό Apache Hadoop
- - Δομή και κύριες συνιστώσες Hadoop
- - Εγκατάσταση και εξοικείωση με το λογισμικό
- Τεχνητά Νευρωνικά Δίκτυα
- - Εισαγωγή στη θεωρία των ΤΝΔ
- - Εφαρμογές και ανάλυση προβλημάτων με τη χρήση ΤΝΔ
Προαπαιτούμενα: Ο Απειροστικός Λογισμός ΙΙΙ,
η Παραμετρική Στατιστική, καθώς και καλή γνώση προγραμματισμού
σε κάποια γλώσσα (Python, Java, C++, C) συνιστώνται ισχυρά.
Διδακτικό υλικό
Ως βοηθητικά συγγράμματα συνιστώνται τα παρακάτω:
- Β. Κομπουλάζος, Γ. Παπακώστας, Εισαγωγή
στην Υπολογιστική Νοημοσύνη, Κάλλιπος 2015
- Β. Βερύκιος, Β. Καγκλής, Η. Σταυρόπουλος, Η επιστήμη των δεδομένων μέσα από τη γλώσσα R, Κάλλιπος 2015
- J. Lin, C. Dyer, Data-Intensive
Text Processing with MapReduce, University of
Maryland, 2010
- Ιστοσελίδα Apache Hadoop
- Ιστοσελίδα Hive