Παρουσίαση/Προβολή
(ΓΦΓ16) - Γεώργιος Μαρκόπουλος
Περιγραφή Μαθήματος
Το μάθημα αποτελεί μια εισαγωγή στην Υπολογιστική Γλωσσολογία, έναν σύνθετο επιστημονικό κλάδο της Γλωσσολογίας και της Πληροφορικής, ο οποίος ερευνά την ανάπτυξη υπολογιστικών μοντέλων της γλωσσικής παραγωγής και αντίληψης. Οι τεχνολογικές εφαρμογές των μοντέλων αυτών οδηγούν με τη σειρά τους στην κατασκευή υπολογιστικών συστημάτων επεξεργασίας φυσικής γλώσσας.
Ημερομηνία δημιουργίας
Τρίτη 2 Δεκεμβρίου 2
-
Περιεχόμενο μαθήματος - Θεματικές Ενότητες
- Εισαγωγή στην Υπολογιστική Γλωσσολογία
- Ορισμός, ιστορία και στόχος της έρευνας
- Βασικές έννοιες της πληροφορίας: Bits και Bytes
- Κατανόηση των βασικών μονάδων της ψηφιακής πληροφορίας
- Η εποχή των Μεγαδεδομένων (Big Data)
- Η σημασία των μεγαδεδομένων στην επεξεργασία φυσικής γλώσσας
- Διασταύρωση με άλλα γνωστικά πεδία
- Διεπιστημονική προσέγγιση με στόχο την φυσικότερη επικοινωνία ανθρώπου και μηχανής
- Το τοπίο της Γλωσσικής Τεχνολογίας
- Περιγραφή των διαφορετικών τεχνολογιών που εφαρμόζονται σε γλωσσικά δεδομένα
- Εφαρμογές της Υπολογιστικής Γλωσσολογίας
- Φωνητικές και κειμενικές εφαρμογές επεξεργασίας φυσικής γλώσσας
- Εισαγωγή στον προγραμματισμό με Python
- Βασικές έννοιες της Python, λειτουργίες, δεδομένα και μεταβλητές
- Δομές ελέγχου στην Python
- Βασικές εντολές if, for και while
- Επεξεργασία κειμένων στην Python
- Χειρισμός κειμένων, tokenization, TTR, διαχείριση αρχείων
- Βιβλιοθήκες επεξεργασίας κειμένου στην Python
- Εισαγωγή στις βασικές βιβλιοθήκες για την επεξεργασία φυσικής γλώσσας, όπως NLTK και spaCy
- Γραμματική ανάλυση (Parsing)
- Χαρακτηρισμός μερών του λόγου (Part-of-Speech tagging), μορφολογική και συντακτική ανάλυση, δενδροτράπεζες, γραμματικές εξαρτήσεων
- Μορφοσυντακτική ανάλυση με τις βιβλιοθήκες NLTK και spaCy
- Διάφορα παραδείγματα ανάλυσης και ασκήσεις
- Εισαγωγή στην Υπολογιστική Γλωσσολογία