Αναγνώστες σαν εσάς βοηθούν στην υποστήριξη του MUO. Όταν κάνετε μια αγορά χρησιμοποιώντας συνδέσμους στον ιστότοπό μας, ενδέχεται να κερδίσουμε μια προμήθεια θυγατρικών. Διαβάστε περισσότερα.

Το ChatGPT είναι το chatbot τεχνητής νοημοσύνης του OpenAI που αλλάζει το παιχνίδι και κρατά το διαδίκτυο έκπληκτο. Ενάντια σε όλες τις καθιερωμένες τάσεις της τεχνολογίας, δεν χρειάστηκε πολύς χρόνος για να βρει το ChatGPT το δρόμο του σε σχεδόν κάθε τομέα της ψηφιακής μας ζωής.

Πολύ λίγες τεχνολογικές καινοτομίες έχουν συγκεντρώσει τόσο μεγάλο ενδιαφέρον όσο το ChatGPT έχει επιτύχει σε τόσο σύντομο χρονικό διάστημα. Δεν φαίνεται να ξεμένει ποτέ από τα ωραία κόλπα—κάθε μέρα μαθαίνουμε για συναρπαστικά νέα πράγματα που δεν γνωρίζαμε ότι μπορεί να κάνει.

Αλλά πώς μπορεί το ChatGPT να κάνει τα πράγματα που μπορεί να κάνει; Πώς λειτουργεί το ChatGPT;

Πώς κατασκευάστηκε το ChatGPT;

Για να κατανοήσετε πώς λειτουργεί το ChatGPT, αξίζει να εξετάσετε την προέλευσή του και τον εγκέφαλο πίσω από το πρωτοποριακό chatbot AI.

instagram viewer

Πρώτον, όσο μαγικό κι αν φαίνεται το ChatGPT, κατασκευάστηκε από την ιδιοφυΐα των ανθρώπων, όπως κάθε αξιόλογη τεχνολογία λογισμικού εκεί έξω. Η OpenAI δημιούργησε την ChatGPT, την επαναστατική εταιρεία έρευνας και ανάπτυξης AI πίσω από άλλα ισχυρά εργαλεία τεχνητής νοημοσύνης όπως το DALL-E, το InstructGPT και το Codex. Έχουμε απαντήσει προηγουμένως μερικές ερωτήσεις που μπορεί να έχετε σχετικά με το ChatGPT, οπότε ρίξτε μια ματιά.

Ενώ το ChatGPT έγινε viral προς τα τέλη του 2022, το μεγαλύτερο μέρος της υποκείμενης τεχνολογίας που τροφοδοτεί το ChatGPT υπάρχει εδώ και πολύ καιρό, αν και με πολύ λιγότερη δημοσιότητα. Το μοντέλο ChatGPT είναι χτισμένο πάνω από το GPT-3 (ή, πιο συγκεκριμένα, το GPT-3.5). Το GPT σημαίνει "Generative Pre-trained Transformer 3".

Το GPT-3 είναι η τρίτη επανάληψη της σειράς GPT μοντέλων AI και προηγήθηκαν τα GPT-2 και GPT. Οι προηγούμενες επαναλήψεις των μοντέλων GPT είναι εξίσου χρήσιμες, αλλά το GPT-3 και η λεπτομερώς συντονισμένη επανάληψη GPT-3.5 είναι πολύ πιο ισχυρά. Τα περισσότερα από αυτά που μπορεί να κάνει το ChatGPT οφείλεται στην υποκείμενη τεχνολογία GPT-3.

Τι είναι το GPT;

Έτσι, διαπιστώσαμε ότι το ChatGPT βασίζεται στην τρίτη γενιά του μοντέλου GPT. Τι είναι όμως το GPT;

Ας ξεκινήσουμε αποσυσκευάζοντας τα ακρωνύμια με τρόπο εύπεπτο και μη τεχνικό.

  • Το "Generative" στο GPT αντιπροσωπεύει την ικανότητά του να δημιουργεί κείμενο φυσικής ανθρώπινης γλώσσας.
  • Το "Pre-trained" αντιπροσωπεύει το γεγονός ότι το μοντέλο έχει ήδη εκπαιδευτεί σε κάποιο πεπερασμένο σύνολο δεδομένων. Σαν να είχατε διαβάσει ένα βιβλίο ή ίσως πολλά βιβλία πριν σας ζητηθεί να απαντήσετε σε ερωτήσεις σχετικά με αυτό.
  • Το "Transformer" αντιπροσωπεύει την υποκείμενη αρχιτεκτονική μηχανικής μάθησης που τροφοδοτεί το GPT.

Τώρα, συνδυάζοντας τα όλα μαζί, το Generative Pre-trained Transformer (GPT) είναι ένα μοντέλο γλώσσας που έχει εκπαιδεύονται χρησιμοποιώντας δεδομένα από το διαδίκτυο με στόχο τη δημιουργία κειμένου ανθρώπινης γλώσσας όταν παρουσιάζεται με α προτροπή. Έτσι, έχουμε πει επανειλημμένα ότι το GPT εκπαιδεύτηκε, αλλά πώς εκπαιδεύτηκε;

Πώς εκπαιδεύτηκε το ChatGPT;

Το ίδιο το ChatGPT δεν εκπαιδεύτηκε από την αρχή. Αντίθετα, είναι μια τελειοποιημένη έκδοση του GPT-3.5, η οποία είναι μια τελειοποιημένη έκδοση του GPT-3. Το μοντέλο GPT-3 εκπαιδεύτηκε με τεράστιο όγκο δεδομένων που συλλέχθηκαν από το διαδίκτυο. Σκεφτείτε τη Wikipedia, το Twitter και το Reddit—τροφοδοτήθηκε με δεδομένα και ανθρώπινο κείμενο από όλες τις γωνιές του Διαδικτύου.

Αν αναρωτιέστε πώς λειτουργεί η εκπαίδευση GPT, το GPT-3 εκπαιδεύτηκε χρησιμοποιώντας έναν συνδυασμό εποπτευόμενης μάθησης και Ενισχυτικής μάθησης μέσω της ανθρώπινης ανατροφοδότησης (RLHF). Η εποπτευόμενη μάθηση είναι το στάδιο όπου το μοντέλο εκπαιδεύεται σε ένα μεγάλο σύνολο δεδομένων κειμένου που έχει αφαιρεθεί από το διαδίκτυο. Το στάδιο της ενισχυτικής μάθησης είναι όπου εκπαιδεύεται να παράγει καλύτερες αποκρίσεις που ευθυγραμμίζονται με αυτό που οι άνθρωποι θα αποδέχονταν ως ανθρώπινα και σωστά.

Εκπαίδευση με εποπτευόμενη μάθηση

Για να κατανοήσετε καλύτερα πώς εφαρμόζεται η εποπτευόμενη και η ενισχυτική μάθηση στο ChatGPT, φανταστείτε ένα σενάριο όπου ένας μαθητής διδάσκεται να γράφει ένα δοκίμιο από έναν δάσκαλο. Η μάθηση με επίβλεψη θα ισοδυναμούσε με το να δώσει ο δάσκαλος στο μαθητή εκατοντάδες δοκίμια για ανάγνωση. Ο στόχος εδώ είναι να μάθει ο μαθητής πώς πρέπει να γράφεται ένα δοκίμιο, συνηθίζοντας τον τόνο, το λεξιλόγιο και τη δομή εκατοντάδων δοκιμίων.

Ωστόσο, θα υπάρχουν καλά και κακά μεταξύ αυτών των εκατοντάδων δοκιμίων. Δεδομένου ότι ο μαθητής εκπαιδεύτηκε τόσο σε καλά όσο και σε κακά αντίγραφα, μερικές φορές, ο μαθητής μπορεί να γράψει ένα κακό δοκίμιο επειδή ο μαθητής είχε επίσης τροφοδοτηθεί με κακά δοκίμια κάποια στιγμή. Αυτό σημαίνει ότι όταν του ζητηθεί να γράψει ένα δοκίμιο, ο μαθητής μπορεί να γράψει ένα αντίγραφο που δεν είναι αποδεκτό ή αρκετά καλό για τον δάσκαλο. Εδώ μπαίνει η ενισχυτική μάθηση.

Εκπαίδευση με Ενισχυτική Μάθηση

Μόλις ο δάσκαλος διαπιστώσει ότι ο μαθητής κατανοεί τους γενικούς κανόνες της δοκιμιακής συγγραφής διαβάζοντας εκατοντάδες δοκίμια, ο δάσκαλος θα έδινε στον μαθητή συχνή εργασία για το γράψιμο του δοκιμίου. Στη συνέχεια, ο δάσκαλος θα παρείχε ανατροφοδότηση σχετικά με την εργασία για το δοκίμιο, λέγοντας στους μαθητές τι έκαναν καλά και τι μπορούσαν να βελτιώσουν. Ο μαθητής χρησιμοποιεί την ανατροφοδότηση για να καθοδηγήσει τις επόμενες εργασίες συγγραφής του δοκιμίου, βοηθώντας τον μαθητή να βελτιωθεί με την πάροδο του χρόνου.

Αυτό είναι παρόμοιο με το στάδιο ενίσχυσης εκμάθησης της εκπαίδευσης του μοντέλου GPT. Αφού τροφοδοτηθεί με τεράστιο όγκο κειμένου από το διαδίκτυο, το μοντέλο μπορεί να απαντήσει σε ερωτήσεις. Ωστόσο, η ακρίβειά του δεν πρόκειται να είναι αρκετά καλή. Οι ανθρώπινοι εκπαιδευτές θέτουν στο μοντέλο μια ερώτηση και παρέχουν ανατροφοδότηση σχετικά με το ποια απάντηση είναι πιο κατάλληλη για κάθε ερώτηση.

Το μοντέλο χρησιμοποιεί ανατροφοδότηση για να βελτιώσει την ικανότητά του να απαντά σε ερωτήσεις με μεγαλύτερη ακρίβεια και να μοιάζει περισσότερο με το πώς θα απαντούσε ένας άνθρωπος. Αυτός είναι ο τρόπος με τον οποίο το ChatGPT μπορεί να δημιουργήσει ανθρώπινες αποκρίσεις που είναι συνεκτικές, ελκυστικές και γενικά ακριβείς.

Πώς μπορεί το ChatGPT να απαντά σε ερωτήσεις;

Έτσι, επισκέπτεστε τον ιστότοπο ChatGPT και συνδέεστε. Προτρέπετε το ChatGPT: "γράψτε ένα τραγούδι ραπ στο στυλ του Snoop Dogg." Απαντά με στίχους σε ένα τραγούδι ραπ που μοιάζει εντυπωσιακά με αυτό που θα έγραφε ο Snoop Dogg. Πώς είναι αυτό δυνατόν?

Λοιπόν, η «μαγεία» πίσω από το ChatGPT συνδέεται άψογα με την εκπαίδευσή του.

Αφού καλύψετε κάθε ίντσα του σχολικού σας βιβλίου Physics 101, υπάρχει μεγάλη πιθανότητα να μπορέσετε να απαντήσετε σε οποιαδήποτε ερώτηση από αυτό που σας πέσει. Γιατί; Γιατί το έχεις διαβάσει και το έχεις μάθει. Είναι το ίδιο πράγμα με το ChatGPT — μαθαίνει. Και όπως έχει δείξει ο ανθρώπινος πολιτισμός, με αρκετή εκπαίδευση, η επίλυση σχεδόν κάθε προβλήματος είναι δυνατή.

Ενώ πιθανότατα μπορείτε να διαχειριστείτε εκατοντάδες βιβλία στη διάρκεια της ζωής σας, το ChatGPT ή το GPT έχουν ήδη καταναλώσει ένα τεράστιο κομμάτι του Διαδικτύου. Αυτός είναι ένας τεράστιος πλούτος πληροφοριών. Εκεί, κάπου, είναι πιθανώς στίχοι στα πολυάριθμα τραγούδια του Snoop Dogg. Οπότε, φυσικά, το ChatGPT πρέπει να το έχει καταναλώσει (θυμηθείτε, είναι προ-εκπαιδευμένο) και να έχει αναγνωρίσει μοτίβα στους στίχους του Snoop Dogg. Στη συνέχεια θα χρησιμοποιούσε μια «γνώση» αυτού του μοτίβου για να «πρόβλεψει» τους στίχους ενός τραγουδιού που μοιάζει με αυτό που θα έγραφε ο Snoop Dogg.

Η έμφαση εδώ είναι στο «πρόβλεψε». Το ChatGPT δεν απαντά στις ερωτήσεις με τον ίδιο τρόπο που απαντάμε εμείς ως άνθρωποι. Για παράδειγμα, όταν αντιμετωπίζετε μια ερώτηση όπως "Ποια είναι η πρωτεύουσα της Πορτογαλίας;" θα μπορούσατε να πείτε τη Λισαβόνα και να το πείτε για ένα «γεγονός». Ωστόσο, το ChatGPT δεν απαντά σε ερωτήσεις με 100% βεβαιότητα. Αντίθετα, προσπαθεί να προβλέψει τη σωστή απάντηση δεδομένων των δεδομένων που έχει καταναλώσει στο σύνολο δεδομένων εκπαίδευσης.

Η προσέγγιση του ChatGPT για την απάντηση σε ερωτήσεις

Για να κατανοήσετε καλύτερα την έννοια της πρόβλεψης απαντήσεων, φανταστείτε το ChatGPT να είναι ένας ντετέκτιβ που έχει επιφορτιστεί με την επίλυση ενός φόνου. Ο ντετέκτιβ παρουσιάζεται με στοιχεία, αλλά δεν γνωρίζουν ποιος διέπραξε το φόνο και πώς συνέβη. Ωστόσο, με αρκετά στοιχεία, ο ντετέκτιβ μπορεί να «προβλέψει» με μεγάλη ακρίβεια ποιος ευθύνεται για τη δολοφονία και πώς διαπράχθηκε το έγκλημα.

Μετά την κατανάλωση δεδομένων από το Διαδίκτυο, το ChatGPT απορρίπτει τα αρχικά δεδομένα και αποθηκεύει νευρωνικές συνδέσεις ή μοτίβα που έχει μάθει από τα δεδομένα. Αυτές οι συνδέσεις ή τα μοτίβα είναι σαν αποδεικτικά στοιχεία που αναλύει το ChatGPT όταν επιχειρεί να ανταποκριθεί σε οποιαδήποτε προτροπή.

Έτσι, θεωρητικά, το ChatGPT είναι σαν ένας πολύ καλός ντετέκτιβ. Δεν ξέρει με σιγουριά ποια πρέπει να είναι τα δεδομένα μιας απάντησης, αλλά προσπαθεί, με εντυπωσιακό ακρίβεια, να προβλέψει μια λογική ακολουθία κειμένου ανθρώπινης γλώσσας που θα απαντούσε καταλληλότερα στο ερώτηση. Έτσι παίρνετε απαντήσεις στις ερωτήσεις σας.

Και αυτός είναι επίσης ο λόγος που μερικές από αυτές τις απαντήσεις φαίνονται πολύ πειστικές αλλά είναι τρομερά λάθος.

ChatGPT: Απαντάει σαν άνθρωπος, σκέφτεται σαν μηχανή

Οι υποκείμενες τεχνικές λεπτομέρειες του ChatGPT είναι πολύπλοκες. Ωστόσο, από μια στοιχειώδη σκοπιά, λειτουργεί μαθαίνοντας και αναπαράγοντας όσα έμαθε όταν του ζητηθεί, όπως ακριβώς κάνουμε ως άνθρωποι.

Καθώς το ChatGPT εξελίσσεται μέσω της έρευνας, ο τρόπος που λειτουργεί μπορεί να αλλάξει. Ωστόσο, οι θεμελιώδεις αρχές λειτουργίας του θα παραμείνουν οι ίδιες για λίγο, τουλάχιστον μέχρι να εμφανιστεί μια ανατρεπτική νέα τεχνολογία.