Ψάχνετε να ελέγξετε αν κάτι έχει δημιουργηθεί από την τεχνητή νοημοσύνη; Οι ανιχνευτές συχνά δεν λειτουργούν και αυτό είναι άσχημα νέα για την ασφάλειά σας.
Η Τεχνητή Νοημοσύνη (AI) θα μεταμορφώσει ολόκληρα τμήματα της κοινωνίας μας είτε μας αρέσει είτε όχι, και αυτό περιλαμβάνει τον Παγκόσμιο Ιστό.
Με λογισμικό όπως το ChatGPT διαθέσιμο σε οποιονδήποτε έχει σύνδεση στο διαδίκτυο, γίνεται όλο και πιο δύσκολος ο διαχωρισμός του περιεχομένου που δημιουργείται από AI, από αυτό που δημιουργείται από έναν άνθρωπο. Καλά που έχουμε ανιχνευτές περιεχομένου AI, σωστά;
Λειτουργούν οι ανιχνευτές περιεχομένου AI;
Οι ανιχνευτές περιεχομένου AI είναι εξειδικευμένα εργαλεία που καθορίζουν αν κάτι γράφτηκε από πρόγραμμα υπολογιστή ή από άνθρωπο. Αν απλώς αναζητήσετε στο Google τις λέξεις "AI content detector", θα δείτε υπάρχουν δεκάδες ανιχνευτές εκεί έξω, όλοι ισχυρίζονται ότι μπορούν να διαφοροποιήσουν αξιόπιστα μεταξύ ανθρώπινου και μη ανθρώπινου κειμένου.
Ο τρόπος που λειτουργούν είναι αρκετά απλός: επικολλάτε ένα κομμάτι γραφής και το εργαλείο σας λέει αν δημιουργήθηκε από AI ή όχι. Με πιο τεχνικούς όρους, χρησιμοποιώντας έναν συνδυασμό τεχνικών επεξεργασίας φυσικής γλώσσας και μηχανής αλγόριθμοι εκμάθησης, ανιχνευτές περιεχομένου AI αναζητούν μοτίβα και προβλεψιμότητα και πραγματοποιούν κλήσεις με βάση ότι.
Αυτό ακούγεται υπέροχο στα χαρτιά, αλλά αν έχετε χρησιμοποιήσει ποτέ ένα εργαλείο ανίχνευσης τεχνητής νοημοσύνης, ξέρετε πολύ καλά ότι είναι τυχαίο, για να το θέσω ήπια. Τις περισσότερες φορές, ανιχνεύουν περιεχόμενο που έχει γραφτεί από ανθρώπους ως τεχνητή νοημοσύνη ή κείμενο που δημιουργείται από ανθρώπινα όντα ως τεχνητή νοημοσύνη. Στην πραγματικότητα, κάποιοι είναι ενοχλητικά κακοί σε αυτό που υποτίθεται ότι πρέπει να κάνουν.
Πόσο ακριβείς είναι οι ανιχνευτές περιεχομένου AI;
Εάν βρίσκεστε στις Ηνωμένες Πολιτείες, το πρώτο αποτέλεσμα αναζήτησης Google για τον "AI content detector" είναι το writer.com (παλαιότερα γνωστό ως Qordoba. αυτή είναι μια πλατφόρμα περιεχομένου τεχνητής νοημοσύνης που έχει επίσης τον δικό της ανιχνευτή). Αλλά όταν επικολλάτε ένα τμήμα αυτού του τυχαίου Associated Press άρθρο στο εργαλείο, ισχυρίζεται ότι υπάρχει πολύ καλή πιθανότητα να δημιουργήθηκε από τεχνητή νοημοσύνη.
Λοιπόν, το writer.com έχει κάνει λάθος.
Για να είμαστε δίκαιοι, άλλοι ανιχνευτές περιεχομένου AI δεν είναι σχεδόν καθόλου καλύτεροι. Όχι μόνο παράγουν ψευδώς θετικά στοιχεία, αλλά επισημαίνουν επίσης το περιεχόμενο AI ως ανθρώπινο. Και ακόμη και όταν δεν το κάνουν, αρκεί να κάνετε μικρές τροποποιήσεις σε κείμενο που δημιουργείται από την τεχνητή νοημοσύνη για να περάσετε καλά.
Τον Φεβρουάριο του 2023, ο Λέκτορας του Πανεπιστημίου του Wollongong Armin Alimardani και η αναπληρώτρια καθηγήτρια στο UNSW Sydney Emma A. Η Jane δοκίμασε μια σειρά από δημοφιλείς ανιχνευτές περιεχομένου AI, διαπιστώνοντας ότι κανένας από αυτούς δεν είναι αξιόπιστος. Στην ανάλυσή τους, που δημοσιεύτηκε στο Η συζήτηση, Alimardani και Jane κατέληξαν στο συμπέρασμα ότι αυτός ο «αγώνας όπλων» AI μεταξύ γεννητριών κειμένου και ανιχνευτών θα αποτελέσει μια σημαντική πρόκληση στο μέλλον, ειδικά για τους εκπαιδευτικούς.
Αλλά δεν είναι μόνο οι εκπαιδευτικοί και οι δάσκαλοι που έχουν λόγους ανησυχίας: όλοι έχουν. Καθώς το κείμενο που δημιουργείται από την τεχνητή νοημοσύνη γίνεται πανταχού παρόν, έχοντας τη δυνατότητα να διαφοροποιήσουμε μεταξύ του τι είναι «πραγματικό» και τι δεν είναι, δηλ. στην πραγματικότητα εντοπίζω όταν κάτι γράφεται από AI, θα γίνει πιο δύσκολο. Αυτό θα έχει τεράστιο αντίκτυπο σε όλους σχεδόν τους κλάδους και τομείς της κοινωνίας, ακόμη και στις προσωπικές σχέσεις.
Επιπτώσεις του AI για την κυβερνοασφάλεια και το απόρρητο
Το γεγονός ότι δεν υπάρχουν αξιόπιστοι μηχανισμοί για να προσδιοριστεί εάν κάτι δημιουργήθηκε από λογισμικό ή από άνθρωπο έχει σοβαρές επιπτώσεις για την ασφάλεια στον κυβερνοχώρο και το απόρρητο.
Οι ηθοποιοί απειλούν ήδη χρησιμοποιώντας το ChatGPT για να γράψετε κακόβουλο λογισμικό, δημιουργήστε μηνύματα ηλεκτρονικού ψαρέματος, γράψτε ανεπιθύμητα μηνύματα, δημιουργήστε ιστότοπους απάτης και πολλά άλλα. Και ενώ υπάρχουν τρόποι άμυνας έναντι αυτού, είναι σίγουρα ανησυχητικό ότι δεν υπάρχει λογισμικό ικανό να διαφοροποιήσει αξιόπιστα μεταξύ οργανικού και bot περιεχομένου.
Τα fake news, επίσης, είναι ήδη ένα τεράστιο πρόβλημα. Με τη γενετική τεχνητή νοημοσύνη στην εικόνα, οι πράκτορες παραπληροφόρησης είναι σε θέση να κλιμακώσουν τις δραστηριότητές τους με άνευ προηγουμένου τρόπο. Ένας κανονικός άνθρωπος, εν τω μεταξύ, δεν έχει κανέναν τρόπο να γνωρίζει εάν κάτι που διαβάζει στο διαδίκτυο δημιουργήθηκε από λογισμικό ή από άνθρωπο.
Το απόρρητο είναι εντελώς διαφορετικό θέμα. Πάρτε το ChatGPT, για παράδειγμα. Ήταν τροφοδότησε περισσότερες από 300 δισεκατομμύρια λέξεις πριν την έναρξή του. Αυτό το περιεχόμενο αφαιρέθηκε από βιβλία, αναρτήσεις ιστολογίου και φόρουμ, άρθρα και μέσα κοινωνικής δικτύωσης. Συγκεντρώθηκε χωρίς τη συγκατάθεση κανενός, και με φαινομενικά πλήρη αδιαφορία για την προστασία του απορρήτου και των πνευματικών δικαιωμάτων.
Έπειτα, υπάρχει επίσης το θέμα των ψευδών θετικών. Εάν το περιεχόμενο επισημαίνεται εσφαλμένα ως δημιουργημένο από AI, δεν θα μπορούσε αυτό να οδηγήσει σε λογοκρισία, το οποίο είναι ούτως ή άλλως ένα τεράστιο ζήτημα; Για να μην αναφέρουμε τη ζημιά που μπορεί να προκαλέσει στη φήμη κάποιου που κατηγορείται για τη χρήση κειμένου που δημιουργήθηκε από AI, τόσο στο διαδίκτυο όσο και στην πραγματική ζωή.
Εάν υπάρχει πράγματι ένας αγώνας εξοπλισμών μεταξύ γενετικής τεχνητής νοημοσύνης και ανιχνευτών περιεχομένου, ο πρώτος κερδίζει. Το χειρότερο είναι ότι δεν φαίνεται να υπάρχει λύση. Όλα έχουμε τα μισοψημένα προϊόντα μας που δεν λειτουργούν ούτε τις μισές φορές ή μπορούν να ξεγελαστούν πολύ εύκολα.
Πώς να ανιχνεύσετε περιεχόμενο AI: Πιθανές λύσεις
Το ότι επί του παρόντος δεν φαίνεται να έχουμε πραγματικές απαντήσεις σε αυτό το πρόβλημα δεν σημαίνει ότι δεν θα έχουμε στο μέλλον. Μάλιστα, υπάρχουν ήδη αρκετές σοβαρές προτάσεις που θα μπορούσαν να λειτουργήσουν. Η υδατογράφηση είναι μία.
Όταν πρόκειται για μοντέλα τεχνητής νοημοσύνης και βαθιάς γλώσσας, η υδατογράφηση αναφέρεται στην ενσωμάτωση ενός μυστικού κώδικα σε κείμενο που δημιουργείται από AI (π.χ. μοτίβο λέξεων, στυλ στίξης). Ένα τέτοιο υδατογράφημα θα ήταν αόρατο με γυμνό μάτι, και επομένως σχεδόν αδύνατο να αφαιρεθεί, αλλά εξειδικευμένο λογισμικό θα μπορούσε να το ανιχνεύσει.
Μάλιστα, το 2022, Πανεπιστήμιο του Μέριλαντ Οι ερευνητές ανέπτυξαν μια νέα μέθοδο υδατογράφησης για τεχνητά νευρωνικά δίκτυα. Ο επικεφαλής ερευνητής Tom Goldstein είπε τότε ότι η ομάδα του είχε καταφέρει να «αποδείξει μαθηματικά» ότι το υδατογράφημά τους δεν μπορεί να αφαιρεθεί εντελώς.
Προς το παρόν, αυτό που μπορεί να κάνει ένας κανονικός άνθρωπος είναι να βασίζεται στο ένστικτό του και στην κοινή λογική του. Αν υπάρχει κάτι άσχετο με το περιεχόμενο που διαβάζετε —αν φαίνεται αφύσικο, επαναλαμβανόμενο, χωρίς φαντασία, κοινότοπο— μπορεί να έχει δημιουργηθεί από λογισμικό. Φυσικά, θα πρέπει επίσης να επαληθεύσετε τυχόν πληροφορίες που βλέπετε στο διαδίκτυο, να ελέγξετε ξανά την πηγή και να μείνετε μακριά από σκιερούς ιστότοπους.
Η επανάσταση της τεχνητής νοημοσύνης βρίσκεται σε εξέλιξη
Κάποιοι υποστηρίζουν ότι η πέμπτη βιομηχανική επανάσταση είναι ήδη εδώ, καθώς η τεχνητή νοημοσύνη βρίσκεται στο επίκεντρο σε αυτό που περιγράφεται ως σύγκλιση του ψηφιακού και του φυσικού. Είτε συμβαίνει αυτό στην πραγματικότητα είτε όχι, το μόνο που μπορούμε να κάνουμε είναι να προσαρμοστούμε.
Τα καλά νέα είναι ότι η βιομηχανία της κυβερνοασφάλειας προσαρμόζεται σε αυτή τη νέα πραγματικότητα και εφαρμόζει νέες αμυντικές στρατηγικές με την τεχνητή νοημοσύνη και τη μηχανική μάθηση στην πρώτη γραμμή.