Η τεχνητή νοημοσύνη είναι ικανή σε πολλούς τομείς, αλλά η βασική κοινή λογική και άλλες έμφυτες ανθρώπινες αισθήσεις αποτελούν περισσότερο πρόκληση.
Βασικά Takeaways
- Η κοινή λογική είναι η ικανότητα κατανόησης και αντίδρασης σε καθημερινές καταστάσεις χωρίς υπεραναλύσεις. Αποκτάται μέσω εμπειριών ζωής και παρατηρήσεων, καθώς και κοινωνικών και πολιτισμικών κανόνων.
- Οι υπολογιστές παλεύουν με την κοινή λογική επειδή δεν έχουν εμπειρίες από τον πραγματικό κόσμο και την ικανότητα προσαρμογής σε νέα περιβάλλοντα. Παλεύουν επίσης με άρρητους κανόνες και υποθέσεις που οι άνθρωποι κατανοούν διαισθητικά.
- Οι ερευνητές διερευνούν διαφορετικές προσεγγίσεις, όπως η δημιουργία εκτεταμένων βάσεων γνώσης, crowdsourcing κοινής λογικής και διδασκαλία της τεχνητής νοημοσύνης μέσω προσομοιωμένων κόσμων, για την εκπαίδευση των υπολογιστών στην απόκτηση ΚΟΙΝΗ ΛΟΓΙΚΗ. Έχει σημειωθεί πρόοδος, αλλά υπάρχει ακόμη δουλειά να γίνει.
ΚΟΙΝΗ ΛΟΓΙΚΗ. Όλοι νομίζουμε ότι το έχουμε. Τι είναι όμως ακριβώς; Μπορούν ποτέ οι υπολογιστές ή τα τεχνητά ευφυή συστήματα να το αποκτήσουν πραγματικά;
Τι είναι η κοινή λογική και πώς την αποκτούν οι άνθρωποι;
Η κοινή λογική είναι η βασική ικανότητα αντίληψης, κατανόησης και κρίσης πραγμάτων που αναμένεται να έχουν οι περισσότεροι άνθρωποι. Είναι η συλλογή γεγονότων, πληροφοριών και εμπειρικών κανόνων που συγκεντρώνουμε μέσα από εμπειρίες ζωής και παρατηρήσεις. Η κοινή λογική μας επιτρέπει να επεξεργαζόμαστε αποτελεσματικά και να αντιδρούμε σε καθημερινές καταστάσεις χωρίς να τις αναλύουμε πολύ βαθιά.
Οι άνθρωποι αρχίζουν να αποκτούν την κοινή λογική νωρίς στην παιδική ηλικία. Ως μωρά, αρχίζουμε να μαθαίνουμε σχέσεις αιτίας-αποτελέσματος—όπως το κλάμα οδηγεί σε σίτιση ή αλλαγή. Μέσα από επαναλαμβανόμενες εμπειρίες, αποκτούμε πρακτική γνώση για τον κόσμο. Για παράδειγμα, το να αγγίξετε μια καυτή σόμπα έχει ως αποτέλεσμα να καείτε. Έτσι μαθαίνουμε να μην αγγίζουμε καυτές επιφάνειες.
Ως παιδιά, συνεχίζουμε να επεκτείνουμε την κοινή μας λογική μέσω δοκιμής και λάθους και παρατηρώντας και αλληλεπιδρώντας με μέλη της οικογένειας. Για παράδειγμα, συνειδητοποιούμε ότι τα ρούχα πρέπει να πλένονται τακτικά, δεν πρέπει να μιλάτε με το στόμα γεμάτο, και το να χτυπάτε το ποτήρι με το γάλα σας οδηγεί σε χάος. Γονείς, αδέρφια, δάσκαλοι και άλλοι ενήλικες μας διορθώνουν όταν παραβιάζουμε τους κοινωνικούς κανόνες και προσδοκίες. Με την πάροδο του χρόνου, αυτά τα μαθήματα είναι ριζωμένα ως βασική κοινή λογική.
Εκτός από τις προσωπικές εμπειρίες, η κοινή λογική διαμορφώνεται από ευρύτερα κοινωνικά και πολιτισμικά πρότυπα. Αυτό που μπορεί να είναι κοινή λογική σε μια κουλτούρα (όπως το να βγάζετε παπούτσια όταν μπαίνετε σε ένα σπίτι) μπορεί να μην ισχύει σε μια άλλη κουλτούρα.
Η κοινή μας λογική προσαρμόζεται καθώς ωριμάζουμε και εκτιθέμεθα σε περισσότερους ανθρώπους και περιβάλλοντα. Έτσι, ένα παιδί που μεγαλώνει σε μια μικρή πόλη αποκτά βασική κοινή λογική για τη ζωή σε αυτό το περιβάλλον. Ένας ενήλικας που μετακομίζει σε μια μεγάλη μητροπολιτική πόλη πρέπει να προσαρμόσει την κοινή λογική του για να ταιριάζει στο νέο περιβάλλον.
Η κοινή λογική συνεχίζει να εξελίσσεται καθώς έχουμε νέες εμπειρίες σε όλη μας τη ζωή.
Γιατί η κοινή λογική είναι προκλητική για τους υπολογιστές;
Υπάρχουν μερικοί λόγοι για τους οποίους η κοινή λογική είναι δύσκολο να προγραμματιστεί.
Πρώτον, οι άνθρωποι μαθαίνουν την κοινή λογική σταδιακά με τα χρόνια που βιώνουν τον κόσμο. Δοκιμάζουμε πράγματα, βλέπουμε τι λειτουργεί και τι όχι και θυμόμαστε τα μαθήματα. Οι υπολογιστές δεν έχουν τέτοιου είδους εμπειρίες από τον πραγματικό κόσμο για να αντλήσουν. Ξέρουν μόνο αυτό που τους λένε ρητά οι άνθρωποι.
Για παράδειγμα, έκανα την εξής ερώτηση στο ChatGPT (GPT 3.5):
Janet runs a laundry business. She washes clothes for customers and hangs them outside on clotheslines to dry in the sun. One day, Janet washed five shirts and hung them on the clotheslines in the morning. It took the shirts five hours to dry. How long will it take to dry 30 shirts?
Αποδείχθηκε με αυτή την απάντηση:
Ένα άλλο ζήτημα είναι ότι η κοινή λογική εξαρτάται από το πλαίσιο. Εάν ένας υπολογιστής έχει προγραμματισμένους μόνο συγκεκριμένους κανόνες, δεν μπορεί να τους προσαρμόσει σε νέα περιβάλλοντα με τον τρόπο που μπορούν διαισθητικά οι άνθρωποι.
Για παράδειγμα, ας υποθέσουμε ότι δίδαξατε σε έναν υπολογιστή τι να κάνει αν αρχίσει να βρέχει όταν είναι έξω. Φαίνεται απλό, σωστά; Τι γίνεται όμως αν αντί για βροχή, ανάβει ένας καταιωνιστής; Ή τι γίνεται αν είναι μέσα σε ένα μπακάλικο και οι σωλήνες αρχίζουν να διαρρέουν νερό από την οροφή; Θα ξέραμε αμέσως πώς να χειριστούμε αυτές τις παραλλαγές, αλλά ένας υπολογιστής θα ακολουθούσε τυφλά τον κανόνα του "όταν βρέχει έξω, πηγαίνετε μέσα", που πλέον δεν έχει νόημα.
Υπάρχουν επίσης ανείπωτοι κανόνες και υποθέσεις που οι άνθρωποι απορροφούν χωρίς καν να το συνειδητοποιούν. Όπως πόσο κοντά μπορείτε να σταθείτε δίπλα σε κάποιον πριν αισθανθεί άβολα; Οι άνθρωποι γνωρίζουν διαισθητικά την απάντηση, αλλά μπορεί να μην μπορούν εύκολα να εξηγήσουν τους ακριβείς κανόνες. Αυτά τα σιωπηρά κοινωνικά πρότυπα μπορεί να είναι ιδιαίτερα δύσκολο για τους υπολογιστές να τα συλλάβουν μόνο από δεδομένα.
Έτσι, προς το παρόν, η κοινή λογική παραμένει μια από τις μεγαλύτερες αδυναμίες της τεχνητής νοημοσύνης σε σύγκριση με την ανθρώπινη νοημοσύνη. Έρχεται φυσικά στους ανθρώπους αλλά όχι τόσο στις μηχανές.
Πώς οι υπολογιστές μπορούν να μάθουν την κοινή λογική
Μετά από πρώιμη αισιοδοξία στις δεκαετίες του 1970 και του 1980, οι ερευνητές συνειδητοποίησαν πόσο δύσκολη θα ήταν η διδασκαλία της κοινής λογικής στους υπολογιστές. Ωστόσο, οι νέες προσεγγίσεις δείχνουν υπόσχεση στην εκπαίδευση συστημάτων τεχνητής νοημοσύνης ώστε να έχουν βασική κοινή λογική για τον καθημερινό φυσικό και κοινωνικό κόσμο.
Μια προσέγγιση είναι να δημιουργηθούν εκτενείς βάσεις γνώσης με το χέρι, που περιγράφουν λεπτομερώς γεγονότα και κανόνες σχετικά με το πώς λειτουργεί ο κόσμος. Το έργο Cyc, που ξεκίνησε το 1984 από τον Doug Lenat, αντιπροσωπεύει μια φιλόδοξη προσπάθεια αυτού του είδους.
Εκατοντάδες λογικοί έχουν κωδικοποιήσει εκατομμύρια λογικά αξιώματα στο Cyc εδώ και δεκαετίες. Ενώ είναι χρονοβόρο, το αποτέλεσμα είναι ένα σύστημα με σημαντική γνώση του πραγματικού κόσμου. Το Cyc μπορεί προφανώς να αιτιολογήσει ότι μια ντομάτα είναι τεχνικά ένα φρούτο, αλλά δεν πρέπει να μπαίνει σε φρουτοσαλάτα, χάρη στη γνώση της γαστρονομικής γεύσης.
Crowdsourcing κοινή λογική με το ConceptNet
Πιο σύγχρονες βάσεις γνώσεων όπως ConceptNet ακολουθήστε μια προσέγγιση crowdsourcing για να δημιουργήσετε ισχυρισμούς κοινής λογικής. Η ιδέα είναι ότι αντί να προσπαθούν ειδικοί ή τεχνητή νοημοσύνη να καταλήξουν σε όλα τα βασικά γεγονότα και τις σχέσεις στον κόσμο, να το ανοίξουν ώστε ο καθένας να μπορεί να συνεισφέρει αποσπάσματα κοινής λογικής.
Αυτή η προσέγγιση crowdsourcing επιτρέπει σε αυτές τις βάσεις γνώσεων να αξιοποιήσουν τη συλλογική νοημοσύνη πολλών διαφορετικών ανθρώπων στο διαδίκτυο. Συσσωρεύοντας χιλιάδες και χιλιάδες από αυτά τα μικρά ψήγματα κοινής λογικής από το πλήθος, το ConceptNet δημιούργησε μερικά εκπληκτικά μεγάλα αποθετήρια βασικής, καθημερινής γνώσης. Και επειδή οι νέοι συνεισφέροντες πάντα προσθέτουν σε αυτό, η γνώση συνεχίζει να αυξάνεται.
Διδασκαλία της κοινής λογικής μέσω της εμπειρίας
Μια άλλη πολλά υποσχόμενη προσέγγιση είναι η δημιουργία λεπτομερών προσομοιωμένων κόσμων όπου οι πράκτορες AI μπορούν να πειραματιστούν και να μάθουν για τη φυσική και τις διαισθήσεις μέσω της εμπειρίας.
Οι ερευνητές δημιουργούν τρισδιάστατα εικονικά περιβάλλοντα γεμάτα με καθημερινά αντικείμενα που μιμούνται τον πραγματικό κόσμο, όπως το ψηφιακό σπίτι "AI2 THOR" που κατασκευάστηκε από το Ινστιτούτο Allen. Μέσα σε αυτούς τους χώρους, τα ρομπότ AI μπορούν να δοκιμάσουν όλα τα είδη αλληλεπιδράσεων για να αναπτύξουν μια διαισθητική κατανόηση των εννοιών που οι άνθρωποι θεωρούν δεδομένες.
Για παράδειγμα, ένα bot τεχνητής νοημοσύνης μπορεί να λάβει ένα εικονικό σώμα και να δοκιμάσει να μαζέψει μπλοκ, να τα στοιβάσει, να τα ανατρέψει κ.λπ. Βλέποντας τα μπλοκ να πέφτουν και να συγκρούονται ρεαλιστικά, το bot μαθαίνει βασικές έννοιες σχετικά με τη στερεότητα, τη βαρύτητα και τη φυσική δυναμική. Δεν χρειάζονται κανόνες - μόνο εμπειρία.
Το bot μπορεί επίσης να δοκιμάσει ενέργειες όπως να ρίξει ένα γυάλινο αντικείμενο και να το δει να θρυμματίζεται όταν χτυπάει στο έδαφος. Ή μπορεί να πειραματιστεί με τις ιδιότητες του νερού ρίχνοντας υγρά και παρατηρώντας πώς ρέουν και λιμνάζουν. Αυτά τα πρακτικά μαθήματα βασίζουν τις γνώσεις του AI στην αισθητηριακή εμπειρία και όχι μόνο στα μοτίβα δεδομένων.
Τεχνικές που βασίζονται σε δεδομένα, όπως η προεκπαίδευση ισχυρά μεγάλα γλωσσικά μοντέλα έχουν επίσης αποδειχθεί εκπληκτικά αποτελεσματικές στην ανάληψη προτύπων κοινής λογικής. Τα μοντέλα AI όπως GPT-3.5 και GPT-4 μπορεί να δημιουργήσει εντυπωσιακά κείμενο που μοιάζει με άνθρωπο αφού «διαβάσει» τεράστιες ποσότητες δεδομένων Διαδικτύου.
Ενώ μερικές φορές κάνουν παράλογες προτάσεις (αλλιώς γνωστή ως ψευδαίσθηση AI), η προσέγγιση στατιστικής μάθησης τους επιτρέπει να μιμούνται ορισμένα είδη κοινής λογικής. Ωστόσο, εξακολουθεί να υπάρχει διαφωνία σχετικά με το εάν αυτό συνιστά κοινή λογική ή έξυπνη εκμετάλλευση των μεροληψιών στα δεδομένα.
Πώς να δοκιμάσετε υπολογιστές για κοινή λογική
Καθώς τα συστήματα τεχνητής νοημοσύνης αναλαμβάνουν πιο σύνθετες εργασίες στον πραγματικό κόσμο, η αξιολόγηση του εάν έχουν «κοινή λογική» γίνεται κρίσιμη.
Φυσική Κοινή Λογική
Ένας τομέας που πρέπει να δοκιμάσετε είναι η φυσική κοινή λογική - η διαίσθηση για τα αντικείμενα, τις δυνάμεις και τις βασικές ιδιότητες του κόσμου.
Για παράδειγμα, δείξτε α σύστημα όρασης υπολογιστή μια φωτογραφία με ένα βιβλίο που αιωρείται στον αέρα και ζητήστε του να περιγράψει τη σκηνή. Σημειώνει κάτι ασυνήθιστο για το πλωτό βιβλίο; Ή τροφοδοτήστε το σύστημα τεχνητής νοημοσύνης με ασυνήθιστα σενάρια όπως "ο άντρας έκοψε μια πέτρα με ένα καρβέλι ψωμί" και ελέγξτε αν τα επισημαίνει ως απίθανα.
Το περιβάλλον AI2 THOR του Ινστιτούτου Allen προσομοιώνει μπλοκ πύργους, χυμένες κούπες και άλλες σκηνές για να δοκιμάσει αυτές τις φυσικές διαισθήσεις.
Κοινωνική κοινή λογική
Οι άνθρωποι έχουν επίσης κοινωνική κοινή λογική - μια σιωπηρή κατανόηση των κινήτρων, των σχέσεων και των κανόνων των ανθρώπων. Για να το αξιολογήσετε στην τεχνητή νοημοσύνη, θέστε καταστάσεις με διφορούμενες αντωνυμίες ή κίνητρα και δείτε εάν το σύστημα τις ερμηνεύει εύλογα.
Για παράδειγμα, ρώτησα το ChatGPT εάν το "αυτό" αναφερόταν στη βαλίτσα ή στο τρόπαιο στην παρακάτω προτροπή:
The trophy could not fit into the suitcase because it was too small.
Απέτυχε στο τεστ. Εν τω μεταξύ, ένας άνθρωπος προφανώς θα ήξερε ότι αναφερόμουν στη βαλίτσα.
Αυτό το είδος δοκιμής ονομάζεται Πρόκληση Σχήματος Winograd, που στοχεύει συγκεκριμένα την κοινωνική κοινή λογική.
Ασφάλεια και Ηθική
Ο έλεγχος εάν τα συστήματα τεχνητής νοημοσύνης έχουν μάθει μη ασφαλή ή ανήθικα μοτίβα είναι κρίσιμης σημασίας. Αναλύστε εάν η τεχνητή νοημοσύνη εμφανίζει επιβλαβείς προκαταλήψεις με βάση το φύλο, τη φυλή ή άλλα χαρακτηριστικά όταν κάνετε κρίσεις.
Ελέγξτε εάν κάνει εύλογες ηθικές διακρίσεις. Η δολοφονία μιας αρκούδας για να σωθεί ένα παιδί μπορεί να θεωρηθεί δικαιολογημένη ενώ η πυροδότηση μιας πυρηνικής βόμβας για τον ίδιο σκοπό δεν θα ήταν δικαιολογημένη. Επισημάνετε τυχόν συστάσεις για σαφώς ανήθικες πράξεις.
Πραγματικές επιδόσεις
Αξιολογήστε την κοινή λογική παρατηρώντας πώς λειτουργούν τα συστήματα AI σε πραγματικές ρυθμίσεις. Για παράδειγμα, κάντε τα αυτόνομα αυτοκίνητα εντοπίζουν σωστά και ανταποκρίνονται σε αντικείμενα και πεζούς? Μπορεί ένα ρομπότ να κινείται μέσα από ποικίλα οικιακά περιβάλλοντα χωρίς να σπάει πολύτιμα αντικείμενα ή να βλάπτει τα κατοικίδια;
Οι πραγματικές δοκιμές αποκαλύπτουν κενά στην κοινή λογική που μπορεί να μην εμφανίζονται σε περιορισμένες εργαστηριακές συνθήκες.
Σημειώθηκε πρόοδος, αλλά η δουλειά παραμένει στο Common Sense AI
Ορισμένοι ειδικοί υποστηρίζουν ότι η τεχνητή νοημοσύνη μπορεί να μην φτάσει ποτέ στην ανθρώπινη κοινή λογική χωρίς να αναπτύξει εγκεφαλικές δομές και σώματα σαν τα δικά μας. Από την άλλη πλευρά, τα ψηφιακά μυαλά δεν περιορίζονται από ανθρώπινες προκαταλήψεις και νοητικές συντομεύσεις, οπότε θεωρητικά, θα μπορούσαν να μας ξεπεράσουν! Αν και πιθανότατα δεν χρειάζεται να ανησυχούμε ακόμα για το υπερ-έξυπνο AI.
Βραχυπρόθεσμα, το καλύτερο στοίχημα είναι η τεχνητή νοημοσύνη που συνδυάζει την κοινή λογική με κάποιο καλό παλιομοδίτικο προγραμματισμό. Με αυτόν τον τρόπο, ανόητα λάθη, όπως το να μπερδέψετε μια χελώνα με ένα τουφέκι, ελπίζουμε να αποφευχθούν.
Δεν είμαστε ακόμα εκεί, αλλά η κοινή λογική δεν είναι πλέον η σκοτεινή ύλη της τεχνητής νοημοσύνης – η πρόοδος συμβαίνει! Ωστόσο, θα χρειαστεί μια υγιής δόση ανθρώπινης κοινής λογικής για την εφαρμογή αυτών των τεχνολογιών για κάποιο χρονικό διάστημα.