Η ικανότητα ανάγνωσης και κατανόησης ενός κειμένου βασίζεται στη γνωστική λειτουργία του ανθρώπινου εγκεφάλου, και κάποτε ήταν μια μοναδικά ανθρώπινη νοητική δραστηριότητα. Το 2018 σηματοδοτεί το έτος που οι μηχανές ξεπέρασαν τις ικανότητες της ανθρώπινης νοημοσύνης ως προς την ανάγνωση και κατανόηση κειμένων.
Στην προκειμένη περίπτωση, αντιστοιχεί στην ανάγνωση και κατανόηση χιλιάδων διαφορετικών κειμένων από συστήματα τεχνητής νοημοσύνης, τα οποία έχουν τη δυνατότητα να δώσουν σωστές και αναλυτικές απαντήσεις σε οποιοδήποτε ερώτημα που σχετίζεται με τα κείμενα.
Τόσο η Alibaba όσο και η Microsoft εξέτασαν πρόσφατα τα τεχνητά νευρωνικά τους δίκτυα με το SQuAD (Stanford Question Answering Dataset), το οποίο είναι μια εξαιρετικά δύσκολη δοκιμασία για τις δεξιότητες επεξεργασίας και κατανόησης μιας φυσικής γλώσσας, από μία μηχανή. Είναι ένα σύνολο δεδομένων που αποτελείται από πάνω από 100.000 ερωτήσεις που προέρχονται από χιλιάδες άρθρα της Wikipedia. Ένα τεστ που προκαλεί τους αλγόριθμους της τεχνητής νοημοσύνης να αναλύσουν κείμενα και να δώσουν απαντήσεις σε δύσκολες ερωτήσεις που βασίζονται σε αυτά τα κείμενα.
Οι τεχνητές νοημοσύνες, για παράδειγμα, θα μπορούσαν να διαβάσουν ένα απόσπασμα σχετικά με τη γεωλογία και να απαντήσουν σε ερωτήσεις όπως: "Μία πυριγενής πέτρα είναι μία πέτρα που κρυσταλλώνει από τι;" ή "Τι αλλάζει το ορυκτό περιεχόμενο μίας πέτρας;". Αυτά τα ερωτήματα είναι σε υψηλότερο επίπεδο από μία απλή ανάγνωση του κειμένου για άντληση βασικών πληροφοριών, και απαιτούν αλγόριθμους επεξεργασίας μεγάλου όγκου πληροφοριών, τις ακολουθίες και τις σχέσεις πριν από την παροχή μιας ακριβούς απάντησης.
Ο αλγόριθμος που αναπτύχθηκε από το Ινστιτούτο Τεχνολογίας και Επιστήμης Δεδομένων της Alibaba (SLQA+), πέτυχε βαθμολογία 82,44, η οποία ήταν λίγο καλύτερη από το 82,304 που βαθμολογήθηκε ο μέσος όρος των ανθρώπων. Η Alibaba ισχυρίζεται ότι είναι η πρώτη φορά που μια μηχανή έχει αποδώσει καλύτερα από τους ανθρώπους στη μέτρηση ExactMatch του Stanford. Το σύστημα τεχνητής νοημοσύνης του κλάδου ερευνών της Microsoft στην Ασία (R-NET+) ξεπέρασε τους ανθρώπους και το R-NET+ σημείωσε βαθμολογία 82.650.
Ο Pranav Rajpurkar, ερευνητής Τεχνητής Νοημοσύνης του πανεπιστημίου Stanford και σχεδιαστής της δοκιμασίας, έγραψε στο Twitter πως το επίτευγμα είναι ένα δυνατό ξεκίνημα για το 2018, με το πρώτο μοντέλο (SLQA+) να ξεπερνάει την δυνατότητα των ανθρώπων στο συγκεκριμένο τεστ, με την αμέσως επόμενη δοκιμασία να είναι το F1 metric, όπου οι άνθρωποι είναι προς το παρόν καλύτεροι για περίπου 2,5 πόντους:
A strong start to 2018 with the first model (SLQA+) to exceed human-level performance on @stanfordnlp SQuAD's EM metric! Next challenge: the F1 metric, where humans still lead by ~2.5 points!https://t.co/Uq10Dm2Ss5
— Pranav Rajpurkar (@pranavrajpurkar) January 11, 2018
Μια μηχανή τεχνητής νοημοσύνης που μπορεί να προσφέρει χρήσιμες απαντήσεις σε περίπλοκες ερωτήσεις θα μπορούσε να τεθεί σε λειτουργία σε μια ευρεία ποικιλία εφαρμογών. Η Alibaba, για παράδειγμα, χρησιμοποιεί ήδη το σύστημα ανάγνωσης για να απαντήσει σε ερωτήσεις εξυπηρέτησης πελατών την "Ημέρα των Ελεύθερων", που διοργανώνεται κάθε χρόνο στις 11/11. Ένα φεστιβάλ διασκέδασης και αγοράς προϊόντων το οποίο είναι δημοφιλές ανάμεσα σε νεαρά άτομα στην Κίνα.
Ο Luo Si, επικεφαλής επιστήμονας στο ινστιτούτο της Alibaba, δήλωσε πως: "Αυτή η τεχνολογία μπορεί να εφαρμοστεί σταδιακά σε πολλές εφαρμογές όπως η εξυπηρέτηση πελατών, τα σεμινάρια μουσείων και οι ηλεκτρονικές απαντήσεις σε ιατρικές ερωτήσεις ασθενών, μειώνοντας την ανάγκη για ανθρώπινη παρέμβαση, με πρωτοφανή τρόπο".
Βλέπουμε ξεκάθαρα λοιπόν πως η τεχνητή νοημοσύνη προοδεύει με αμείωτους ρυθμούς, και το μέλλον προβλέπεται να φέρει κι άλλες εκπλήξεις με θέματα που έως τώρα βρίσκονταν μόνο στη φαντασία μας.
Παραπομπή:
Engelking, Carl. “Machines Best Humans in Stanford's Grueling Reading Test.” Discover Magazine, 15 Jan. 2018, blogs.discovermagazine.com/d-brief/2018/01/15/stanford-reading-test.
Διαβάστε επίσης: Η θαυμάσια πρόοδος της τεχνητής νοημοσύνης και της Ρομποτικής (+15 βίντεο)