Ειδικά Θέματα Επικοινωνιών & Επεξεργασίας Σήματος - Ψηφιακή Επεξεργασία και Αναγνώριση Εγγράφων (ΕΠ21)

Θεοδωρίδης Σέργιος - Γάτος Βασίλειος

Περιγραφή

Στο μάθημα αυτό θα μελετηθούν τα βασικά στάδια ενός συστήματος επεξεργασίας και κατανόησης εγγράφων. Το πρώτο στάδιο αφορά την προεπεξεργασία της εικόνας. Περιλαμβάνει την δυαδική μετατροπή (μετατροπή της gray scale εικόνας σε ασπρόμαυρης), την βελτίωση της ποιότητας (εξάλειψη θορύβου, βελτίωση της ποιότητας του κειμένου) και την διόρθωση της στροφής της εικόνας (διόρθωση στροφής της εικόνας η οποία έχει προκύψει λόγω μη ευθυγραμμισμένης τοποθέτησης του εγγράφου στον σαρωτή). Το επόμενο στάδιο αφορά την κατάτμηση της εικόνας του εγγράφου, δηλαδή τον εντοπισμό των βασικών συστατικών του εγγράφου (εικόνες, γραφικά, τμήματα κειμένου, παράγραφοι, γραμμές κειμένου, λέξεις, γράμματα). Ακολουθεί το στάδιο της κατανόησης της δομής της σελίδας το οποίο αναφέρεται στον χαρακτηρισμός των βασικών συστατικών του εγγράφου καθώς και εντοπισμός της ροής του κειμένου. Για παράδειγμα, αν το έγγραφο είναι εφημερίδα τα βασικά συστατικά μπορεί να χαρακτηρίζονται ως τίτλος, υπότιτλος, υπέρτιτλος, συγγραφέας

Περισσότερα