Παρουσίαση/Προβολή
Υπολογιστική Γλωσσολογία
(ILL137) - Γεώργιος Μικρός
Περιγραφή Μαθήματος
Στόχος του μαθήματος είναι η ανάπτυξη βασικών δεξιοτήτων σχετικά με τη χρήση υπολογιστικών και στατιστικών τεχνικών στην ανάλυση γλωσσικών δεδομένων. Το μάθημα θα δομηθεί μέσα από τρεις βασικούς θεματικούς άξονες:
α) Ποσοτική γλωσσολογία: Θα παρουσιαστούν τα σημαντικότερα πορίσματα της ποσοτικής έρευνας στη γλώσσα όπως: Ο νόμος του Zipf, ο νόμος του Menzerath-Altmann, η κατανομή του μήκους των λέξεων κ.ά. Επιπλέον, θα εξετασθούν οι πρακτικές προεκτάσεις της ποσοτικής έρευνας στη γλώσσα, τόσο στη γλωσσική θεωρία, όσο και στις εφαρμογές της γλωσσικής τεχνολογίας.
β) Υπολογιστική επεξεργασία γλωσσικών δεδομένων: Θα παρουσιαστούν οι βασικές τεχνικές υπολογιστικής επεξεργασίας γλωσσικών δεδομένων όπως η ανάλυση σε γλωσσικές μονάδες (tokenization), η αυτόματη μορφολογική και συντακτική ανάλυση (tagging, parsing) και η ανάπτυξη γλωσσικών πόρων για υπολογιστική επεξεργασία γλώσσας (corpora, μορφολογικά λεξικά κ.ά.). Θα δοθεί έμφαση στη χρήση των παραπάνω υπολογιστικών τεχνικών σε σύγχρονες εφαρμογές της υπολογιστικής γλωσσολογίας, όπως η ανάλυση συναισθήματος σε κείμενα (sentiment analysis) και η αυτόματη αναγνώριση συγγραφέα (automatic authorship attribution).
β) Στατιστική: Θα καλυφθούν θέματα όπως: Θεωρία πιθανοτήτων, περιγραφική στατιστική ανάλυση, πολυπαραγοντικές στατιστικές μέθοδοι κ.ά. Ιδιαίτερη έμφαση θα δοθεί στις προϋποθέσεις χρήσης των στατιστικών τεχνικών και την εφαρμογή τους στη γλωσσική ανάλυση.
Για κάθε μία από τις στατιστικές τεχνικές θα χρησιμοποιηθούν τα πιο γνωστά πακέτα στατιστικής ανάλυσης, όπως το SPSS και η R. Το μάθημα θα αξιολογηθεί μέσα από ομαδικές εργασίες με θεματολογία σχετική με την θεωρία και την πρακτική που έχει παρουσιαστεί στην τάξη.
Ημερομηνία δημιουργίας
Τετάρτη 28 Φεβρουαρίου 2018
-
Δεν υπάρχει περίγραμμα