Μάθημα : Ειδικά Θέματα Επικοινωνιών & Επεξεργασίας Σήματος - Ψηφιακή Επεξεργασία και Αναγνώριση Εγγράφων
Κωδικός : D77
Περιγραφή Μαθήματος
Στο μάθημα αυτό θα μελετηθούν τα βασικά στάδια ενός συστήματος επεξεργασίας και κατανόησης εγγράφων. Το πρώτο στάδιο αφορά την προεπεξεργασία της εικόνας. Περιλαμβάνει την δυαδική μετατροπή (μετατροπή της gray scale εικόνας σε ασπρόμαυρης), την βελτίωση της ποιότητας (εξάλειψη θορύβου, βελτίωση της ποιότητας του κειμένου) και την διόρθωση της στροφής της εικόνας (διόρθωση στροφής της εικόνας η οποία έχει προκύψει λόγω μη ευθυγραμμισμένης τοποθέτησης του εγγράφου στον σαρωτή). Το επόμενο στάδιο αφορά την κατάτμηση της εικόνας του εγγράφου, δηλαδή τον εντοπισμό των βασικών συστατικών του εγγράφου (εικόνες, γραφικά, τμήματα κειμένου, παράγραφοι, γραμμές κειμένου, λέξεις, γράμματα). Ακολουθεί το στάδιο της κατανόησης της δομής της σελίδας το οποίο αναφέρεται στον χαρακτηρισμός των βασικών συστατικών του εγγράφου καθώς και εντοπισμός της ροής του κειμένου. Για παράδειγμα, αν το έγγραφο είναι εφημερίδα τα βασικά συστατικά μπορεί να χαρακτηρίζονται ως τίτλος, υπότιτλος, υπέρτιτλος, συγγραφέας, στήλη, εικόνα, λεζάντα κ.λ.π. ενώ αν το έγγραφο είναι σελίδα τεχνικού περιοδικού τα βασικά συστατικά μπορεί να χαρακτηρίζονται ως ονομασία περιοδικού, τίτλος, συγγραφέας, περίληψη, στήλες κειμένου κ.λ.π. Το τελικό στάδιο αφορά την αναγνώριση των χαρακτήρων. Περιλαμβάνει την εξαγωγή αξιόπιστων χαρακτηριστικών για κάθε χαρακτήρα και την κατάστρωση ενός ταξινομητή για την κατάταξη του κάθε χαρακτήρα σε γνωστή κλάση γράμματος.
Ημερολόγιο
Ανακοινώσεις
Όλες...-
Παρασκευή 15 Μαρτίου 2019 - 2:00 μ.μ.
-
Τετάρτη 18 Απριλίου 2018 - 3:53 μ.μ.
-
Τετάρτη 14 Μαρτίου 2018 - 1:25 μ.μ.