Λεπτομέρειες

ΕίδοςΔιπλωματική
ΚωδικόςDIPL-2006-1
ΤίτλοςΜοντελοποίηση της πλοήγησης των χρηστών στον Παγκόσμιο Ιστό με χρήση μεθόδων Συμπερασμού Γραμματικών
ΣυγγραφέαςΓεώργιος Κορφιάτης
Έτος2006
Λέξεις κλειδιάΜηχανική Μάθηση, Μοντελοποίηση της Χρήσης του Ιστού, Συμπερασμός Γραμματικών, Ανάκτηση Πληροφοριών, Ομαδοποίηση
ΠερίληψηΗ έλλειψη δομής του Παγκόσμιου Ιστού και το πρόβλημα της υπερσυσσώρευσης πληροφοριών καθιστούν δυσχερή την πλοήγηση σε αυτόν. Στην παρούσα εργασία προτείνεται μία μέθοδος μοντελοποίησης της πλοήγησης των χρηστών στον Παγκόσμιο Ιστό, με στόχο τη διευκόλυνση του χρήστη μέσω της πρότασης ενδιαφερουσών σελίδων σε αυτόν. Για το σκοπό αυτό, επεκτάθηκαν οι μέθοδοι Συμπερασμού Γραμματικών Alergia και Blue Fringe με την εισαγωγή ενός επιπλέον κριτηρίου, που ελέγχει την ομοιότητα των ιστοσελίδων ως προς το περιεχόμενό τους. Επίσης χρησιμοποιήθηκε μία τεχνική μείωσης διαστασιμότητας πριν την εφαρμογή της επαγωγικής μεθόδου. Στο πλαίσιο του Συμπερασμού Γραμματικών, οι ιστοσελίδες θεωρούνται σύμβολα μίας πιθανοτικής κανονικής γραμματικής και οι αλληλουχίες σελίδων συμβολοσειρές της αντίστοιχης γλώσσας. Επιπλέον, το περιεχόμενο της κάθε σελίδας εκφράζεται με το διάνυσμα των λέξεων- κλειδιών της. Από τα δεδομένα χρήσης που λαμβάνονται από αρχεία καταγραφής μιας εταιρείας παροχής υπηρεσιών διαδικτύου κατασκευάζεται αρχικά μία δενδρική δομή, τέτοια ώστε κάθε σύνοδος χρήσης των υπαρχόντων δεδομένων να αντιστοιχεί σε ένα μονοπάτι στο δέντρο. Στη συνέχεια, η μέθοδος επάγει από το αρχικό δέντρο ένα γράφο μικρότερης τάξης, που επιχειρεί να μοντελοποιήσει την πλοήγηση των χρηστών. Αυτό επιτυγχάνεται με τη συγχώνευση καταστάσεων (κόμβων του γράφου) που είναι συμβατές τόσο ως προς τη χρήση (όμοιες μεταβάσεις) όσο και ως προς το περιεχόμενο (ομοιότητα του περιεχομένου των σελίδων). Ο τελικός γράφος χρησιμοποιείται για την πρόταση ενδιαφερόντων συνδέσμων σελίδων σε χρήστες που περιηγούνται στον Παγκόσμιο Ιστό. Τα πειραματικά αποτελέσματα έδειξαν ότι η γνώση της σειράς με την οποία ένας χρήστης επισκέπτεται ορισμένες σελίδες του Παγκόσμιου Ιστού δε συμβάλλει στη διαδικασία πρότασης σελίδων, κάτι που οφείλεται στη μεγάλη ανομοιογένεια των δεδομένων χρήσης. Γενικά, φαίνεται ότι η πλοήγηση ενός χρήστη στον Παγκόσμιο Ιστό περιορίζεται κατά κύριο λόγο σε ένα σύνολο σελίδων της ίδιας θεματικής κατηγορίας, ενώ οι λίγες μεταβάσεις σε άλλες θεματικές κατηγορίες είναι δύσκολο να προβλεφθούν. Εκτιμάται πάντως ότι μία προσέγγιση που θα βασίζεται στην ομοιότητα περιεχομένου και θα χρησιμοποιεί τα δεδομένα χρήσης σε επιλεκτική βάση ενδέχεται να αποδίδει καλύτερα. Επίσης, προέκυψε ότι η μέθοδος που βασίζεται στην Blue Fringe αποδίδει καλύτερα, καθότι αυτή επιλέγει με πιο έξυπνο τρόπο τις καλύτερες συγχωνεύσεις καταστάσεων. Η μείωση διαστασιμότητας δε φάνηκε τέλος να βελτιώνει τη διαδικασία πρότασης σελίδων.
ΚατηγορίαData Mining
Αρχείο Επισκόπηση


Επιστροφή στην αρχική σελίδα