Σκεπτικό
|
Τα Συστήματα Ανάκτησης Πληροφοριών (Information Retrieval systems) επιτρέπουν
την πρόσβαση σε μεγάλους όγκους πληροφοριών αποθηκευμένων με τη μορφή κειμένου,
φωνής, video, ή σε σύνθετη μορφή όπως Ιστοσελίδες. Σκοπός των συστημάτων αυτών
είναι η ανάκτηση μόνο εκείνων των εγγράφων που είναι συναφή με αυτό που
αναζητεί ο χρήστης. Για να το επιτύχουν πρέπει να αντιμετωπίσουν την
αβεβαιότητα ως προς το τι πραγματικά αναζητεί ο χρήστης και ποιο το θέμα ενός
εγγράφου.
|
Σκοπός του μαθήματος
|
Σκοπός του μαθήματος είναι η εισαγωγή στην περιοχή των συστημάτων ανάκτησης
πληροφοριών και η εξέταση των θεωρητικών και πρακτικών ζητημάτων που
σχετίζονται με την σχεδίαση, υλοποίηση και αξιολόγηση τέτοιων συστημάτων..
|
Στόχοι του μαθήματος
|
Το μάθημα θα επιτρέψει στους φοιτητές:
-
να κατανοήσουν τη θεωρητική βάση των καθιερωμένων μοντέλων ανάκτησης (Boolean,
Vector-space, Probabilistic, Logical models),
-
να κατανοήσουν τη δυσκολία παράστασης και ανάκτησης εγγράφων, εικόνων, ομιλίας,
κλπ.,
-
να μάθουν να υλοποιούν και να αξιολογούν IR συστήματα,
-
να κατανοήσουν τους καθιερωμένους τρόπους ευρετηρίασης και ανάκτησης του
Παγκόσμιου Ιστού,
-
να κατανοήσουν πως άλλες τεχνικές από το χώρο της επεξεργασία φυσικής γλώσσας,
τεχνητής νοημοσύνης και αλληλεπίδρασης ανθρώπου-μηχανής, σχετίζονται με την
Ανάκτηση Πληροφοριών,
-
να γνωρίσουν διάφορους αλγόριθμους και συστήματα.
|
Μεθοδολογία
|
Κατά πρώτο λόγο διαλέξεις και συζητήσεις Η προσωπική μελέτη και η επίλυση των
ασκήσεων και εργασιών είναι εξίσου σημαντικά για την επίτευξη των στόχων του
μαθήματος. Ένα έργο υλοποίησης θα ανατεθεί κατά τη διάρκεια του μαθήματος..
|
Οργάνωση περιεχομένου
|
Οργάνωση περιεχομένου
-
Εισαγωγή
-
Τι είναι η Ανάκτηση Πληροφοριών / Βασικές έννοιες
-
Ιστορική αναδρομή
-
Μοντέλα Ανάκτησης Πληροφοριών
-
Boolean
-
Διανυσματικό
-
Πιθανοκρατικό
-
Εναλλακτικά μοντέλα
-
Αξιολόγηση Αποτελεσματικότητας Συστημάτων Ανάκτησης Πληροφορίας
-
Ακρίβεια και Ανάκληση
-
Εναλλακτικά μέτρα
-
Συλλογές αναφοράς και αξιολόγηση συστημάτων
-
Γλώσσες Επερώτησης για Ανάκτηση Πληροφοριών
-
Λέξεις κλειδιά
-
Λογικές επερωτήσεις
-
Επερωτήσεις συμφραζομένων
-
Επερωτήσεις φυσικής γλώσσας
-
Δομημένες επερωτήσεις
-
Προχωρημένες Λειτουργίες Επερώτησης
-
Ανάδραση συνάφειας
-
Επέκταση επερώτησης
-
Αυτόματη τοπική/καθολική ανάλυση
-
Ευρετηριασμός, Προεπεξεργασία και Οργάνωση Αρχείων Κειμένου
-
Λέξεις αποκλεισμού (stopwοrds), stemming (στελέχωση κειμένου) , θησαυροί όρων
-
Οργάνωση αρχείων (ανεστραμμένα αρχεία, δένδρα καταλήξεων, αρχεία υπογραφών)
-
Στατιστικά κειμένου
-
Συμπίεση κειμένου
-
Αναζήτηση σε Κείμενα
-
Knuth-Morris-Pratt
-
Boyer-Moore
-
Αυτόματο καταλήξεων (suffix automaton)
-
Φράσεις και εγγύτητα
-
Ομαδοποίηση Εγγράφων (Clustering)
-
Ανάκτηση Πολυμέσων
-
Επερωτήσεις Ομοιότητας
-
Ευρετηρίαση και Αναζήτηση βάσει Χαρακτηριστικών (Features)
-
Χωρικές Δομές Πρόσβασης και Αναζήτηση σε Πολυδιάστατους Χώρους
-
Παράλληλη και Κατανεμημένη Ανάκτηση Πληροφοριών
-
Αρχιτεκτονικές MIMD και SIMD
-
Διαμερισμός συλλογών
-
Επιλογή πηγής
-
Επεξεργασία επερωτήσεων
-
Αρχιτεκτονικές Peer-2-Peer
-
Τεχνικές μετα-Διάταξης (meta-ranking)
-
Ενοποιημένες και απομονωμένες μέθοδοι
-
Παρεμβολή, Ψηφοφορία
-
Αναζήτηση στον Παγκόσμιο Ιστό
-
Ιστορική αναδρομή
-
Ευρετηριασμός ιστοσελίδων
-
Διάσχιση του ιστού (crawling)
-
Τεχνικές ανάλυσης συνδέσμων (link analysis)
-
Διεπαφές Χρήσης και Οπτικοποίηση
|