Το αγαπημένο σας chatbot γενετικής τεχνητής νοημοσύνης φαίνεται καλοήθης, αλλά με τη σωστή τεχνογνωσία, θα μπορούσε να γίνει για να αποκαλύψει ευαίσθητες πληροφορίες για εσάς.

Βασικά Takeaways

  • Οι επιθέσεις αντιστροφής μοντέλων νευρωνικών δικτύων χρησιμοποιούν chatbots AI για να αποκαλύψουν και να ανακατασκευάσουν προσωπικές πληροφορίες από ψηφιακά αποτυπώματα.
  • Οι χάκερ δημιουργούν μοντέλα αντιστροφής που προβλέπουν τις εισόδους με βάση τις εξόδους ενός νευρωνικού δικτύου, αποκαλύπτοντας ευαίσθητα δεδομένα.
  • Τεχνικές όπως το διαφορικό απόρρητο, ο υπολογισμός πολλών μερών και η ομοσπονδιακή μάθηση μπορούν να βοηθήσουν στην προστασία από επιθέσεις αντιστροφής, αλλά είναι μια συνεχής μάχη. Οι χρήστες θα πρέπει να μοιράζονται επιλεκτικά, να ενημερώνουν το λογισμικό και να είναι προσεκτικοί όσον αφορά την παροχή προσωπικών πληροφοριών.

Φανταστείτε ότι βρίσκεστε σε ένα εστιατόριο και μόλις δοκιμάσατε το καλύτερο κέικ που έχετε φάει ποτέ. Πίσω στο σπίτι σας, είστε αποφασισμένοι να αναδημιουργήσετε αυτό το γαστρονομικό αριστούργημα. Αντί να ζητάτε τη συνταγή, βασίζεστε στους γευστικούς κάλυκες και τις γνώσεις σας για να αποδομήσετε το γλυκό και να φτιάξετε το δικό σας.

instagram viewer

Τώρα, τι θα γινόταν αν κάποιος μπορούσε να το κάνει αυτό με τα προσωπικά σας στοιχεία; Κάποιος γεύεται το ψηφιακό αποτύπωμα που αφήνετε πίσω σας και αναδομεί τα προσωπικά σας στοιχεία.

Αυτή είναι η ουσία μιας επίθεσης αντιστροφής μοντέλου νευρωνικών δικτύων, μια τεχνική που θα μπορούσε να μετατρέψει ένα chatbot τεχνητής νοημοσύνης σε εργαλείο συλλήψεων στον κυβερνοχώρο.

Κατανόηση των επιθέσεων αντιστροφής μοντέλων νευρωνικών δικτύων

ΕΝΑ νευρικό σύστημα είναι ο «εγκέφαλος» πίσω από τη σύγχρονη τεχνητή νοημοσύνη (AI). Είναι υπεύθυνοι για την εντυπωσιακή λειτουργικότητα πίσω από την αναγνώριση φωνής, τα ανθρωποποιημένα chatbots και τη γενετική τεχνητή νοημοσύνη.

Τα νευρωνικά δίκτυα είναι ουσιαστικά μια σειρά αλγορίθμων που έχουν σχεδιαστεί για να αναγνωρίζουν μοτίβα, να σκέφτονται και ακόμη και να μαθαίνουν σαν ανθρώπινος εγκέφαλος. Το κάνουν σε κλίμακα και ταχύτητα που ξεπερνά κατά πολύ τις οργανικές μας δυνατότητες.

Το Βιβλίο των Μυστικών του AI

Ακριβώς όπως ο ανθρώπινος εγκέφαλος μας, τα νευρωνικά δίκτυα μπορούν να κρύψουν μυστικά. Αυτά τα μυστικά είναι τα δεδομένα που τους έχουν τροφοδοτήσει οι χρήστες του. Σε μια επίθεση αντιστροφής μοντέλου, ένας χάκερ χρησιμοποιεί τις εξόδους ενός νευρωνικού δικτύου (όπως τις απαντήσεις από ένα chatbot) για να αντίστροφος μηχανικός τις εισροές (τις πληροφορίες που έχετε δώσει).

Για να εκτελέσουν την επίθεση, οι χάκερ χρησιμοποιούν το δικό τους μοντέλο μηχανικής εκμάθησης που ονομάζεται «μοντέλο αντιστροφής». Αυτό το μοντέλο είναι σχεδιασμένο να είναι ένα είδος κατοπτρικής εικόνας, εκπαιδευμένο όχι στα αρχικά δεδομένα αλλά στις εξόδους που παράγονται από το στόχος.

Ο σκοπός αυτού του μοντέλου αντιστροφής είναι να προβλέψει τις εισόδους—τα αρχικά, συχνά ευαίσθητα δεδομένα που έχετε τροφοδοτήσει στο chatbot.

Δημιουργία του μοντέλου αντιστροφής

Η δημιουργία της αντιστροφής μπορεί να θεωρηθεί ως ανακατασκευή ενός τεμαχισμένου εγγράφου. Αλλά αντί να συνενώνει λωρίδες χαρτιού, συνδυάζει την ιστορία που ειπώθηκε στις απαντήσεις του μοντέλου-στόχου.

Το μοντέλο αντιστροφής μαθαίνει τη γλώσσα των εξόδων του νευρωνικού δικτύου. Αναζητά ενδεικτικά σημάδια που, με τον καιρό, αποκαλύπτουν τη φύση των εισροών. Με κάθε νέο κομμάτι δεδομένων και κάθε απάντηση που αναλύει, προβλέπει καλύτερα τις πληροφορίες που παρέχετε.

Αυτή η διαδικασία είναι ένας συνεχής κύκλος υποθέσεων και δοκιμών. Με αρκετές εξόδους, το μοντέλο αντιστροφής μπορεί να συναγάγει με ακρίβεια ένα λεπτομερές προφίλ σας, ακόμη και από τα πιο αβλαβή δεδομένα.

Η διαδικασία του μοντέλου αντιστροφής είναι ένα παιχνίδι σύνδεσης των κουκκίδων. Κάθε τμήμα δεδομένων που διαρρέει μέσω της αλληλεπίδρασης επιτρέπει στο μοντέλο να σχηματίσει ένα προφίλ και με αρκετό χρόνο, το προφίλ που σχηματίζει είναι απροσδόκητα λεπτομερές.

Τελικά, αποκαλύπτονται πληροφορίες για τις δραστηριότητες, τις προτιμήσεις και την ταυτότητα του χρήστη. Πληροφορίες που δεν επρόκειτο να αποκαλυφθούν ή να δημοσιοποιηθούν.

Τι το κάνει δυνατό;

Μέσα στα νευρωνικά δίκτυα, κάθε ερώτημα και απάντηση είναι ένα σημείο δεδομένων. Οι ειδικευμένοι επιτιθέμενοι αναπτύσσουν προηγμένες στατιστικές μεθόδους για να αναλύσουν αυτά τα σημεία δεδομένων και να αναζητήσουν συσχετισμούς και μοτίβα ανεπαίσθητα για την ανθρώπινη κατανόηση.

Τεχνικές όπως η ανάλυση παλινδρόμησης (εξέταση της σχέσης μεταξύ δύο μεταβλητών) για την πρόβλεψη των τιμών της εισόδου με βάση τις εξόδους που λαμβάνετε.

Οι χάκερ χρησιμοποιούν αλγόριθμους μηχανικής μάθησης στα δικά τους μοντέλα αντιστροφής για να βελτιώσουν τις προβλέψεις τους. Παίρνουν τις εξόδους από το chatbot και τις τροφοδοτούν στους αλγόριθμους τους για να τους εκπαιδεύσουν να προσεγγίζουν την αντίστροφη συνάρτηση του νευρωνικού δικτύου στόχου.

Με απλοποιημένους όρους, η "αντίστροφη συνάρτηση" αναφέρεται στον τρόπο με τον οποίο οι χάκερ αντιστρέφουν τη ροή δεδομένων από την έξοδο στην είσοδο. Ο στόχος του εισβολέα είναι να εκπαιδεύσει τα μοντέλα αντιστροφής του ώστε να εκτελούν την αντίθετη εργασία από το αρχικό νευρωνικό δίκτυο.

Ουσιαστικά, έτσι δημιουργούν ένα μοντέλο που, λαμβάνοντας υπόψη μόνο την έξοδο, προσπαθεί να υπολογίσει ποια πρέπει να ήταν η είσοδος.

Πώς οι επιθέσεις αναστροφής μπορούν να χρησιμοποιηθούν εναντίον σας

Φανταστείτε ότι χρησιμοποιείτε ένα δημοφιλές διαδικτυακό εργαλείο αξιολόγησης υγείας. Πληκτρολογείτε τα συμπτώματά σας, τις προηγούμενες καταστάσεις, τις διατροφικές συνήθειες, ακόμη και τη χρήση ναρκωτικών για να αποκτήσετε κάποια εικόνα για την ευημερία σας.

Αυτό είναι ευαίσθητες και προσωπικές πληροφορίες.

Με μια επίθεση αντιστροφής που στοχεύει το σύστημα AI που χρησιμοποιείτε, ένας χάκερ μπορεί να λάβει τις γενικές συμβουλές που σας δίνει το chatbot και να τις χρησιμοποιήσει για να συναγάγει το ιδιωτικό σας ιατρικό ιστορικό. Για παράδειγμα, μια απάντηση από το chatbot μπορεί να είναι κάπως έτσι:

Το αντιπυρηνικό αντίσωμα (ANA) μπορεί να χρησιμοποιηθεί για να υποδείξει την παρουσία αυτοάνοσων ασθενειών όπως ο Λύκος.

Το μοντέλο αναστροφής μπορεί να προβλέψει ότι ο χρήστης-στόχος έκανε ερωτήσεις που σχετίζονται με μια αυτοάνοση κατάσταση. Με περισσότερες πληροφορίες και περισσότερες απαντήσεις, οι χάκερ μπορούν να συμπεράνουν ότι ο στόχος έχει σοβαρή κατάσταση υγείας. Ξαφνικά, το χρήσιμο διαδικτυακό εργαλείο γίνεται ψηφιακό ματάκι στην προσωπική σας υγεία.

Τι μπορεί να γίνει για τις επιθέσεις αναστροφής;

Μπορούμε να χτίσουμε ένα οχυρό γύρω από τα προσωπικά μας δεδομένα? Λοιπόν, είναι περίπλοκο. Οι προγραμματιστές νευρωνικών δικτύων μπορούν να καταστήσουν πιο δύσκολη την πραγματοποίηση επιθέσεων μοντέλων αντιστροφής προσθέτοντας επίπεδα ασφάλειας και αποκρύπτοντας τον τρόπο λειτουργίας τους. Ακολουθούν ορισμένα παραδείγματα τεχνικών που χρησιμοποιούνται για την προστασία των χρηστών:

  • Διαφορικό απόρρητο: Αυτό διασφαλίζει ότι οι έξοδοι τεχνητής νοημοσύνης είναι αρκετά "θορυβώδεις" ώστε να συγκαλύπτουν μεμονωμένα σημεία δεδομένων. Είναι λίγο σαν να ψιθυρίζεις σε ένα πλήθος - τα λόγια σου χάνονται στη συλλογική φλυαρία των γύρω σου.
  • Υπολογισμός πολλών μερών: Αυτή η τεχνική είναι σαν μια ομάδα που εργάζεται σε ένα εμπιστευτικό έργο μοιράζοντας μόνο τα αποτελέσματα των επιμέρους εργασιών της, όχι τις ευαίσθητες λεπτομέρειες. Επιτρέπει σε πολλαπλά συστήματα να επεξεργάζονται δεδομένα μαζί χωρίς να εκτίθενται μεμονωμένα δεδομένα χρήστη στο δίκτυο—ή το ένα στο άλλο.
  • Ομοσπονδιακή μάθηση: Περιλαμβάνει εκπαίδευση τεχνητής νοημοσύνης σε πολλές συσκευές, διατηρώντας ταυτόχρονα τα δεδομένα του μεμονωμένου χρήστη τοπικά. Είναι λίγο σαν μια χορωδία που τραγουδάει μαζί. μπορείτε να ακούσετε κάθε φωνή, αλλά καμία φωνή δεν μπορεί να απομονωθεί ή να αναγνωριστεί.

Ενώ αυτές οι λύσεις είναι σε μεγάλο βαθμό αποτελεσματικές, η προστασία από επιθέσεις αντιστροφής είναι ένα παιχνίδι γάτας με ποντίκι. Όσο βελτιώνονται οι άμυνες, τόσο βελτιώνονται οι τεχνικές για να τις παρακάμψεις. Η ευθύνη, λοιπόν, βαρύνει τις εταιρείες και τους προγραμματιστές που συλλέγουν και αποθηκεύουν τα δεδομένα μας, αλλά υπάρχουν τρόποι με τους οποίους μπορείτε να προστατευτείτε.

Πώς να προστατεύσετε τον εαυτό σας από επιθέσεις αντιστροφής

Πίστωση εικόνας: Mike MacKenzie/Flickr

Σχετικά μιλώντας, τα νευρωνικά δίκτυα και οι τεχνολογίες τεχνητής νοημοσύνης βρίσκονται ακόμη στα σπάργανα. Μέχρι τα συστήματα να είναι αλάνθαστα, το βάρος βαρύνει τον χρήστη να είναι η πρώτη γραμμή άμυνας όταν προστασία των δεδομένων σας.

Ακολουθούν μερικές συμβουλές για το πώς να μειώσετε τον κίνδυνο να πέσετε θύμα επίθεσης αντιστροφής:

  • Γίνετε Επιλεκτικός Κοινοποιητής: Αντιμετωπίστε τα προσωπικά σας στοιχεία σαν μια μυστική οικογενειακή συνταγή. Να είστε επιλεκτικοί σχετικά με το με ποιους το μοιράζεστε, ειδικά όταν συμπληρώνετε φόρμες στο διαδίκτυο και αλληλεπιδράτε με chatbot. Αμφισβητήστε την αναγκαιότητα κάθε στοιχείου που σας ζητείται. Εάν δεν θα μοιράζεστε τις πληροφορίες με έναν άγνωστο, μην τις μοιραστείτε με ένα chatbot.
  • Διατήρηση ενημερωμένου λογισμικού: Ενημερώσεις για το λογισμικό διεπαφής, τα προγράμματα περιήγησης, ακόμη και το λειτουργικό σας σύστημα έχει σχεδιαστεί για να σας κρατά ασφαλείς. Ενώ οι προγραμματιστές είναι απασχολημένοι με την προστασία των νευρωνικών δικτύων, μπορείτε επίσης να μειώσετε τον κίνδυνο υποκλοπής δεδομένων εφαρμόζοντας τακτικά ενημερώσεις κώδικα και ενημερώσεις.
  • Διατηρήστε προσωπικά στοιχεία: Κάθε φορά που μια εφαρμογή ή chatbot ζητά προσωπικά στοιχεία, κάντε παύση και εξετάστε την πρόθεση. Εάν οι ζητούμενες πληροφορίες φαίνονται άσχετες με την παρεχόμενη υπηρεσία, πιθανότατα να είναι.

Δεν θα παρείχατε ευαίσθητες πληροφορίες όπως υγεία, οικονομικά ή ταυτότητα σε μια νέα γνωριμία μόνο και μόνο επειδή είπαν ότι το απαιτούσαν. Ομοίως, μετρήστε ποιες πληροφορίες είναι πραγματικά απαραίτητες για να λειτουργήσει μια εφαρμογή και εξαιρεθείτε από την κοινή χρήση περισσότερων.

Προστασία των προσωπικών μας πληροφοριών στην εποχή της τεχνητής νοημοσύνης

Τα προσωπικά μας στοιχεία είναι το πολυτιμότερο περιουσιακό μας στοιχείο. Η φύλαξή του απαιτεί επαγρύπνηση, τόσο στον τρόπο με τον οποίο επιλέγουμε να μοιραζόμαστε πληροφορίες όσο και στην ανάπτυξη μέτρων ασφαλείας για τις υπηρεσίες που χρησιμοποιούμε.

Η επίγνωση αυτών των απειλών και η λήψη μέτρων όπως αυτά που περιγράφονται σε αυτό το άρθρο συμβάλλουν σε μια ισχυρότερη άμυνα ενάντια σε αυτούς τους φαινομενικά αόρατους φορείς επίθεσης.

Ας δεσμευτούμε για ένα μέλλον όπου οι προσωπικές μας πληροφορίες θα παραμένουν ακριβώς αυτό: ιδιωτικές.