Στατιστική Επιλογή από Σημαντικούς Υποχώρους για Εύρεση Εκτόπων

Η εύρεση εκτόπων είναι ένα σημαντικό μέρος της ανάλυσης δεδομένων. Διακρίνει εξαιρετικά αντικείμενα (έκτοπα) από τα υπόλοιπα δεδομένα. Για την εύρεση εκτόπων στον ολικό χώρο των δεδομένων υπάρχουν μέθοδοι που προτείνουν τη μέτρηση του βαθμού εκτοπικότητας. Σε καινούργιες εφαρμογές, αυτές οι παραδοσιακές μέθοδοι δεν μπορούν να ανακαλύψουν τα έκτοπα που είναι κρυμμένα σε υποχώρους των δεδομένων. Ειδικότερα, οι μέθοδοι που χρησιμοποιούν όλα τα διαθέσιμα στοιχεία αποτυγχάνουν στις πολυδιάστατες βάσεις δεδομένων.

Προτείνουμε μια νέα μέθοδο για την εύρεση εκτόπων που βασίζεται σε στατιστική επιλογή των σημαντικών υποχωρών. Η μέθοδος εξασφαλίζει την εύρεση δεδομένων που διαφέρουν σε πολλούς σημαντικούς υποχώρους. Αποκλείουμε άσχετους υποχώρους που δεν δείχνουν σαφή αντίθεση μεταξύ των εκτόπων και των υπόλοιπων δεδομένων. Έτσι, αντιμετωπίζουμε τις γενικές προκλήσεις για την εύρεση εκτόπων κρυμμένων σε υποχώρους των πολυδιάστατων δεδομένων. Παρουσιάζουμε μια στατιστική επιλογή από υποχώρους με υψηλή αντίθεση δεδομένων και προτείνουμε μια προσαρμοστική μέτρηση του βαθμού εκτοπικότητας σε υποχώρους. Τα εμπειρικά αποτελέσματα αποδεικνύουν ότι η μέθοδός μας έχει υψηλή ποιότητα στην εύρεση εκτόπων σε υποχώρους των δεδομένων.

Authors: Müller E., Schiffer M., Seidl T.
Published in: Proc. Hellenic Data Management Symposium (HDMS 2011), Athens, Greece
Language:
Year: 2011
Conference: HDMS
Url:HDMS 2011
Type: Conference papers (peer reviewed)
Research topic: Data Analysis and Knowledge Extraction