CYC’s quality and relevance for the Semantic Web (Ελληνικό ποστ για Τεχνητή Νοημοσύνη στο Web)

Ο Paul Haley είναι ειδικός στην Τεχνητή Νοημοσύνη και στην Εξόρυξη Πληροφορίας για εμπορικούς σκοπούς (Commercial Intelligence). Πρόσφατα επισκέφτηκε την εταιρεία Cycorp στο Ωστιν του Τέξας, την εταιρεία που έφτιαξε τη “CYC“, τη μεγαλύτερη Έξυπνη Βάση Δεδομένων στον κόσμο. Μίλησε με τον ιδρυτή της εταιρείας, τον Doug Lenat.

Doug Lenat (κλικ για βιογραφικό)

Η Cycorp είναι μια πολύ ενδιαφέρουσα εταιρεία, για πολλούς λόγους. Κυρίως επειδή έχει δουλέψει εντατικά, επί δυόμιση δεκαετίες, περισσότερο από οποιονδήποτε άλλο, για την ανάπτυξη ενός ολοκληρωμένου Λογικού μοντέλου προσομείωσης της βαθύτερης γνώσης του Κόσμου. Αυτό το μοντέλο στη βάση δεδομένων της Cycorp είναι διαφορετικό (και πιο εξελιγμένο) από το σημερινό Σημασιολογικό Δίκτυο (Semantic Web) -όπως το αναπτύσσουν νέες εταιρείες. Π.χ. αντίθετα με την Freebase (ένα δημιούργημα της Metaweb) η Cycorp ασχολείται με ορισμούς της κοινής λογικής του κόσμου. Δεν ασχολείται ιδιαίτερα (όπως η Freebase) με το να γεμίζει βάσεις δεδομένων. Αυτή η υπερ-απλούστευση αδικεί βέβαια, κάπως, τη Freebase, παρόλ’ αυτά φαίνεται σχετικά δίκαιη αν συγκρίνει κανείς τη Freebase με τα πολύ πιο εξελιγμένα “οντολογικά διαγράμματα” της CYC: Πρόκειται για τη μεγαλύτερη και πρακτικότερη Οντολογία στον πλανήτη, που περιλαμβάνει έναν τεράστιο αριθμό λογικών προτάσεων, οι οποίες περιγράφουν και ορίζουν τον κόσμο (δηλαδή την πραγματικότητα που ζούμε). Μέσα στη βάση CYC, οι λογικές προτάσεις της ορίζουν επακριβώς πολλά που εμείς (οι άνθρωποι) θεωρούμε δεδομένα, όπως π.χ. το ότι “τα πουλιά πετούν” ή το ότι “αντικείμενα χωρίς στήριγμα πέφτουν κάτω».

Η CYC χειρίζεται με ιδιαίτερη επιτυχία και τις εξαιρέσεις σε αυτές τις λογικές παραδοχές. Για παράδειγμα, τίποτα δεν πέφτει αν δεν υπάρχει βαρύτητα (π.χ. στο Διάστημα) και οι πιγκουΐνοι δεν πετούν (εκτός αν είναι… κάτω από το νερό).

Η CYC ξέρει ήδη τόσα πολλά για τον κόσμο, ώστε μπορεί να πλημμυρίσει το χρήστη με χιονοστιβάδα απαντήσεων. Αν ρωτήσει κανείς μια φαινομενικά απλή ερώτηση, η βάση μπορεί να συμπεράνει περισσότερες αληθοφανείς ερμηνείες απ ‘όσες θα μπορούσατε ποτέ να φανταστείτε!

Τέλος, η CYC μαθαίνει και να… διαβάζει. Ο Paul Haley διηγείται (στο blog του) πως βρήκε στη Cycorp μερικούς πανέξυπνους ερευνητές στην Τεχνητή Νοημοσύνη, με εξειδίκευση στη Γλωσσολογία. Το συμπέρασμά του, είναι πολύ ενδιαφέρον (σε ελεύθερη μετάφραση δική μου):

Προσέξτε την CYC. Ο Σημασιολογικός Ιστός καθυστέρησε πολύ. Σήμερα όμως (που ήρθε επιτέλους) αρχίζει να απαιτεί όχι μόνο την ανάπτυξη καλύτερης τεχνολογίας για Επεξεργασία Φυσικής Γλώσσας (NLP), αλλά και μία μεγαλύτερη ανάπτυξη στην ίδια τη Λογική και τη Γνώση.

Οι σημερινές τεχνολογίες του Σημασιολογικού Ιστού ασχολούνται μόνο με οντολογίες. Το νέο Πρωτόκολλο Ανταλλαγής Λογικών Κανόνων (RIF, Rule Interchange Format) θα αρχίσει κάποια στιγμή να ασχολείται και αυτό με τη Λογική, την οποία -όμως- η CYC έχει ΗΔΗ ξεπεράσει: - Κανένας δεν έχει καταφέρει να πλησιάσει καν τη Συσσωρευμένη Γνώση που περιέχει η CYC, ήδη έτοιμη…

Related articles
  • ΣΗΜΕΙΩΣΗ: αυτό το κείμενο βασίστηκε σε ελεύθερη μετάφρασή (που έκανα) όσων εξιστόρησε ο Paul Haley στο ποστ Cyc is more than encyclopedic. Ο σκοπός μου είναι μία εκλαϊκευτική ενημέρωση, σαν προϋπόθεση για άλλα ποστ, που (ελπίζω) να ακολουθήσουν στο μέλλον.

.

About these ads

One thought on “CYC’s quality and relevance for the Semantic Web (Ελληνικό ποστ για Τεχνητή Νοημοσύνη στο Web)

Υποβολή απάντησης

Εισάγετε τα παρακάτω στοιχεία ή επιλέξτε ένα εικονίδιο για να συνδεθείτε:

WordPress.com Logo

Σχολιάζετε χρησιμοποιώντας τον λογαριασμό WordPress.com. Log Out / Αλλαγή )

Twitter picture

Σχολιάζετε χρησιμοποιώντας τον λογαριασμό Twitter. Log Out / Αλλαγή )

Facebook photo

Σχολιάζετε χρησιμοποιώντας τον λογαριασμό Facebook. Log Out / Αλλαγή )

Google+ photo

Σχολιάζετε χρησιμοποιώντας τον λογαριασμό Google+. Log Out / Αλλαγή )

Σύνδεση με %s