Πριν από περισσότερα από 70 χρόνια, όταν η τεχνητή νοημοσύνη έγινε αντιληπτή, ο Άλαν Τούρινγκ δημοσίευσε μια εργασία που περιέγραφε πώς να την αναγνωρίσει. Αργότερα έγινε γνωστό ως το τεστ Turing και χρησιμοποιήθηκε εδώ και δεκαετίες για τη διάκριση μεταξύ ανθρώπου και τεχνητής νοημοσύνης.
Ωστόσο, με την εισαγωγή προηγμένων chatbot AI, όπως το ChatGPT και το Google Bard, γίνεται όλο και πιο δύσκολο να καταλάβετε εάν μιλάτε με AI. Θέτει το ερώτημα. είναι ξεπερασμένο το τεστ Turing; Και αν είναι, ποιες είναι οι εναλλακτικές;
Είναι ξεπερασμένο το τεστ Turing;
Για να προσδιορίσετε εάν το τεστ Turing είναι ξεπερασμένο, πρέπει πρώτα καταλάβετε πώς λειτουργεί. Για να περάσει μια τεχνητή νοημοσύνη στο τεστ Turing, πρέπει να πείσει έναν άνθρωπο που ανακρίνει ότι είναι άνθρωπος. Αλλά υπάρχει μια αιχμή - η τεχνητή νοημοσύνη αξιολογείται παράλληλα με έναν άνθρωπο και πρέπει να ανταποκριθεί χρησιμοποιώντας κείμενο.
Σκεφτείτε το έτσι. εάν είστε ο ανακριτής και κάνετε ερωτήσεις σε δύο συμμετέχοντες στο διαδίκτυο χρησιμοποιώντας κείμενο, αλλά ο ένας από αυτούς είναι μοντέλο τεχνητής νοημοσύνης — θα τους ξεχωρίζατε μετά από πέντε λεπτά; Λάβετε υπόψη ότι ο στόχος του τεστ Turing δεν είναι να προσδιορίσει το μοντέλο AI με βάση τις σωστές απαντήσεις, αλλά να αξιολογήσει εάν το AI μπορεί να σκέφτεται ή να συμπεριφέρεται σαν άνθρωπος.
Το πρόβλημα με την προσέγγιση της δοκιμής Turing που εντοπίζει μόνο τις ανθρώπινες αποκρίσεις είναι ότι δεν λαμβάνει υπόψη άλλους παράγοντες. Για παράδειγμα, η ευφυΐα του μοντέλου AI ή η γνώση του ανακριτή. Εκτός αυτού, το τεστ Turing περιορίζεται μόνο σε κείμενο και γίνεται όλο και πιο δύσκολος ο εντοπισμός μιας τεχνητής νοημοσύνης που παράγει ανθρώπινη φωνή ή Deepfake βίντεο που μιμούνται την ανθρώπινη συμπεριφορά.
Ωστόσο, τα τρέχοντα μοντέλα τεχνητής νοημοσύνης όπως το ChatGPT-4 και το Google Bard δεν έχουν προχωρήσει ακόμη σε σημείο που να μπορούν να περάσουν με συνέπεια τη δοκιμή Turing. Στην πραγματικότητα, αν είστε εξοικειωμένοι με την τεχνητή νοημοσύνη, μπορείτε εντοπίστε κείμενο που δημιουργείται από AI.
Οι 5 καλύτερες εναλλακτικές δοκιμές Turing
Είναι πιθανό αυτό μελλοντικά μοντέλα AI όπως το ChatGPT-5 μπορούσε να περάσει το τεστ Turing. Εάν συμβεί αυτό, θα χρειαζόμασταν διαφορετικές δοκιμές σε συνδυασμό με τη δοκιμή Turing για να προσδιορίσουμε αν μιλάμε με τεχνητή νοημοσύνη ή άνθρωπο. Εδώ είναι οι καλύτερες εναλλακτικές δοκιμές Turing:
1. Το τεστ Μάρκους
Ο Gary Marcus, ένας διάσημος γνωστικός επιστήμονας και ερευνητής τεχνητής νοημοσύνης, πρότεινε μια εναλλακτική λύση στο τεστ Turing που δημοσιεύτηκε στο Νεοϋορκέζος να προσδιορίσει τη γνωστική ικανότητα ενός AI. Το τεστ είναι απλό — κρίνετε ένα μοντέλο AI με βάση την ικανότητά του να παρακολουθεί και να κατανοεί βίντεο και τηλεοπτικές εκπομπές YouTube χωρίς υπότιτλους ή κείμενο. Για να περάσει το τεστ Marcus το AI, θα πρέπει να κατανοεί τον σαρκασμό, το χιούμορ, την ειρωνεία και την ιστορία όταν παρακολουθεί τα βίντεο και να το εξηγεί σαν άνθρωπος.
Αυτή τη στιγμή, Το GPT-4 μπορεί να περιγράψει εικόνες, αλλά μέχρι στιγμής, δεν υπάρχει επί του παρόντος μοντέλο τεχνητής νοημοσύνης που να μπορεί να κατανοήσει τα βίντεο σαν άνθρωπος. Αυτοοδηγούμενα οχήματα πλησιάζουν, αλλά δεν είναι εντελώς αυτόνομα και απαιτούν αισθητήρες αφού δεν μπορούν να κατανοήσουν τα πάντα στο περιβάλλον τους.
2. Το Visual Turing Test
Σύμφωνα με μια ερευνητική εργασία που δημοσιεύτηκε στις PNAS, το οπτικό τεστ Turing μπορεί να χρησιμοποιηθεί για να προσδιορίσει εάν μιλάτε με έναν άνθρωπο ή με μια τεχνητή νοημοσύνη χρησιμοποιώντας ερωτηματικά εικόνας. Λειτουργεί όπως το τεστ Turing, αλλά αντί να απαντούν σε ερωτήσεις χρησιμοποιώντας κείμενα, στους συμμετέχοντες εμφανίζονται εικόνες και αναμένεται να απαντήσουν σε απλές ερωτήσεις ενώ σκέφτονται σαν άνθρωποι. Ωστόσο, το Το οπτικό τεστ Turing είναι διαφορετικό από τα CAPTCHA αφού όλες οι απαντήσεις είναι σωστές — αλλά για να περάσει το τεστ, το AI πρέπει να επεξεργαστεί τις εικόνες παρόμοια με έναν άνθρωπο.
Πέρα από αυτό, εάν σε ένα AI και έναν άνθρωπο δείξουν πολλές εικόνες δίπλα-δίπλα και τους ζητηθεί να αναγνωρίσουν ρεαλιστικές εικόνες, ο άνθρωπος θα έχει τη γνωστική ικανότητα να περάσει το τεστ. Αυτό συμβαίνει επειδή τα μοντέλα τεχνητής νοημοσύνης δυσκολεύονται να διακρίνουν εικόνες που δεν μοιάζουν να τραβήχτηκαν στον πραγματικό κόσμο. Στην πραγματικότητα, αυτός είναι ο λόγος που μπορείτε ταυτοποίηση εικόνων που δημιουργούνται από AI χρησιμοποιώντας ανωμαλίες που δεν έχουν νόημα.
3. Το τεστ Lovelace 2.0
Η θεωρία ότι ένας υπολογιστής δεν μπορεί να δημιουργήσει πρωτότυπες ιδέες πέρα από αυτό που είχε προγραμματιστεί να κάνει, εννοιώθηκε για πρώτη φορά από την Ada Lovelace πριν από το τεστ Turing. Ωστόσο, ο Άλαν Τούρινγκ αντιτάχθηκε σε αυτή τη θεωρία υποστηρίζοντας ότι η τεχνητή νοημοσύνη μπορεί ακόμα να εκπλήξει τους ανθρώπους. Μόλις το 2001 αναπτύχθηκαν οι κατευθυντήριες γραμμές για το τεστ Lovelace για να ξεχωρίσουν μια τεχνητή νοημοσύνη από έναν άνθρωπο - και, σύμφωνα με το thekurzweillibrary οι κανόνες αναθεωρήθηκαν αργότερα το 2014.
Για να περάσει ένα AI το τεστ Lovelace, πρέπει να αποδείξει ότι μπορεί να δημιουργήσει πρωτότυπες ιδέες που ξεπερνούν την εκπαίδευσή του. Τα τρέχοντα μοντέλα τεχνητής νοημοσύνης όπως το GPT-4 δεν έχουν τη δυνατότητα να επινοήσουν νέες εφευρέσεις πέρα από τις υπάρχουσες γνώσεις μας. Ωστόσο, τεχνητή γενική νοημοσύνη μπορεί να επιτύχει αυτή την ικανότητα και να περάσει το τεστ Lovelace.
4. Αντίστροφη δοκιμή Turing
Τι θα λέγατε για τη δοκιμή Turing, αλλά γίνεται αντίστροφα; Αντί να προσπαθείτε να μάθετε αν μιλάτε σε άνθρωπο, ο στόχος του αντίστροφη δοκιμή Turing είναι να ξεγελάσεις το AI ώστε να πιστέψει ότι είσαι AI. Ωστόσο, χρειάζεστε επίσης ένα άλλο μοντέλο AI για να απαντήσετε στις ίδιες ερωτήσεις χρησιμοποιώντας κείμενο.
Για παράδειγμα, εάν το ChatGPT-4 είναι ο ανακριτής, θα μπορούσατε να εγγράψετε το Google Bard και έναν άλλο άνθρωπο ως συμμετέχοντες. Εάν το μοντέλο AI μπορεί να αναγνωρίσει σωστά τον άνθρωπο που συμμετέχει με βάση τις απαντήσεις, έχει περάσει τη δοκιμή.
Το μειονέκτημα της αντίστροφης δοκιμής Turing είναι ότι είναι αναξιόπιστο, ειδικά αν σκεφτεί κανείς ότι μερικές φορές Το AI δεν μπορεί να διαφοροποιήσει το AI που δημιουργείται και ανθρώπινο γραπτό περιεχόμενο.
5. Πλαίσιο ταξινόμησης AI
Σύμφωνα με το πλαίσιο ταξινόμησης AI που αναπτύχθηκε από Κρις Σάαντ, το τεστ Turing είναι μόνο μια μέθοδος αξιολόγησης για να γνωρίζετε εάν μιλάτε με τεχνητή νοημοσύνη. Πιο συνοπτικά, το πλαίσιο ταξινόμησης AI βασίζεται στη θεωρία της πολλαπλής νοημοσύνης, η οποία απαιτεί από την ανθρώπινη νοημοσύνη να ικανοποιεί τουλάχιστον οκτώ διαφορετικά κριτήρια, τα οποία περιλαμβάνουν: μουσικό ρυθμό, λογική-μαθηματική νοημοσύνη, οπτική ταύτιση, συναισθηματική νοημοσύνη, αυτοανακλαστική νοημοσύνη, ικανότητα υπαρξιακής σκέψης και σώμα κίνηση.
Δεδομένου ότι η τεχνητή νοημοσύνη αξιολογείται σε οκτώ διαφορετικές παραμέτρους, είναι απίθανο να περάσει για έναν άνθρωπο, ακόμη και αν έχει καλύτερη απόδοση από το μέσο όρο σε ορισμένα σημεία αναφοράς. Για παράδειγμα, Το ChatGPT μπορεί να λύσει μαθηματικά προβλήματα, περιγράφει εικόνες και συνομιλεί σε μια φυσική γλώσσα όπως ο άνθρωπος, αλλά θα αποτύχει σε άλλες κατηγορίες που ορίζονται στο πλαίσιο ταξινόμησης AI.
Το τεστ Turing δεν είναι οριστικό
Το τεστ Turing προοριζόταν να είναι περισσότερο ένα πείραμα σκέψης παρά μια οριστική δοκιμή για τη διαφοροποίηση μεταξύ ανθρώπων και τεχνητής νοημοσύνης. Όταν προτάθηκε αρχικά, ήταν το βασικό σημείο αναφοράς για τη μέτρηση της νοημοσύνης των μηχανών.
Ωστόσο, με την πρόσφατη ανάπτυξη μοντέλων τεχνητής νοημοσύνης με διαδραστικές δυνατότητες ομιλίας, οπτικής και ακοής, το τεστ Turing υπολείπεται καθώς περιορίζεται στη συνομιλία κειμένου. Η πιο αποτελεσματική λύση θα ήταν η εισαγωγή εναλλακτικών δοκιμών Turing που διαφοροποιούν περαιτέρω τα μοντέλα τεχνητής νοημοσύνης από τους ανθρώπους.