Το GPT-4 είναι εδώ, και αυτές είναι οι νέες δυνατότητες που πρέπει να ελέγξετε.

Το OpenAI κυκλοφόρησε επιτέλους την πολυαναμενόμενη ενημέρωση GPT, GPT-4. Το Large Language Model (LLM) έρχεται με μερικά ισχυρά νέα χαρακτηριστικά και δυνατότητες που έχουν ήδη σοκάρει τους χρήστες σε όλο τον κόσμο.

Εκτός από το ότι είναι σημαντικά καλύτερο από το GPT-3.5, το υπάρχον LLM που τροφοδοτεί το ιογενές chatbot ChatGPT του OpenAI, το GPT-4 μπορεί κατανοεί πιο σύνθετες εισόδους, έχει πολύ μεγαλύτερο όριο εισαγωγής χαρακτήρων, έχει δυνατότητες πολλαπλών τρόπων και σύμφωνα με πληροφορίες είναι πιο ασφαλές για χρήση.

1. Το GPT-4 μπορεί να κατανοήσει πιο σύνθετες εισόδους

Ένα από τα μεγαλύτερα νέα χαρακτηριστικά του GPT-4 είναι η ικανότητά του να κατανοεί πιο περίπλοκες και διαφοροποιημένες προτροπές. Σύμφωνα με OpenAI, GPT-4 "επιδεικνύει επιδόσεις σε ανθρώπινο επίπεδο σε διάφορα επαγγελματικά και ακαδημαϊκά σημεία αναφοράς."

Αυτό αποδείχθηκε με την υποβολή του GPT-4 μέσω πολλών εξετάσεων σε ανθρώπινο επίπεδο και τυποποιημένων δοκιμών, όπως το SAT, το BAR και το GRE, χωρίς ειδική εκπαίδευση. Όχι μόνο το GTP-4 κατανόησε και έλυσε αυτές τις δοκιμές με σχετικά υψηλή βαθμολογία σε γενικές γραμμές, αλλά ξεπέρασε και τον προκάτοχό του, το GPT-3.5, κάθε φορά.

instagram viewer

Πίστωση εικόνας: OpenAI

Η ικανότητα κατανόησης πιο διαφοροποιημένων προτροπών εισαγωγής υποβοηθάται επίσης από το γεγονός ότι το GPT-4 έχει πολύ μεγαλύτερο όριο λέξεων. Το νέο μοντέλο μπορεί να χειριστεί προτροπές εισαγωγής έως και 25.000 λέξεων (για το περιβάλλον, το GPT-3.5 περιορίστηκε σε 8.000 λέξεις). Αυτό θα επηρεάσει άμεσα τη λεπτομέρεια που οι χρήστες μπορούν να πιέσουν στις προτροπές τους, δίνοντας έτσι στο μοντέλο πολύ περισσότερες πληροφορίες για να εργαστεί και παράγουν μεγαλύτερες εκροές.

Το GPT-4 υποστηρίζει επίσης περισσότερες από 26 γλώσσες, συμπεριλαμβανομένων γλωσσών χαμηλών πόρων όπως τα λετονικά, τα ουαλικά και τα σουαχίλι. Όταν συγκριθεί με την ακρίβεια τριών βολών στο σημείο αναφοράς MMLU, το GPT-4 κέρδισε το GPT-3,5 καθώς και άλλα κορυφαία LLM όπως το PaLM και το Chinchilla όσον αφορά την απόδοση στην αγγλική γλώσσα σε 24 γλώσσες.

2. Πολυτροπικές Δυνατότητες

Η προηγούμενη έκδοση του ChatGPT περιοριζόταν μόνο σε προτροπές κειμένου. Αντίθετα, ένα από τα νεότερα χαρακτηριστικά του GPT-4 είναι οι πολυτροπικές του δυνατότητες. Το μοντέλο μπορεί να δεχτεί μηνύματα κειμένου και εικόνας.

Αυτό σημαίνει ότι η τεχνητή νοημοσύνη μπορεί να δεχθεί μια εικόνα ως είσοδο και να την ερμηνεύσει και να την κατανοήσει ακριβώς όπως μια προτροπή κειμένου. Αυτή η δυνατότητα καλύπτει όλα τα μεγέθη και τους τύπους εικόνων και κειμένου, συμπεριλαμβανομένων εγγράφων που συνδυάζουν τα δύο, σκίτσα που σχεδιάζονται με το χέρι, ακόμη και στιγμιότυπα οθόνης.

Ωστόσο, οι δυνατότητες ανάγνωσης εικόνων του GPT-4 υπερβαίνουν την απλή ερμηνεία τους. Το OpenAI το παρουσίασε στη ροή προγραμματιστών του (παραπάνω), όπου παρείχαν στο GPT-4 μια χειροποίητη μακέτα ενός αστείου ιστότοπου. Το μοντέλο ανατέθηκε να γράψει κώδικα HTML και JavaScript για να μετατρέψει το mockup σε ιστότοπο αντικαθιστώντας τα αστεία με πραγματικά.

Το GPT-4 έγραψε τον κώδικα ενώ χρησιμοποιούσε τη διάταξη που καθορίζεται στο mockup. Μετά τη δοκιμή, ο κώδικας παρήγαγε μια τοποθεσία εργασίας με, όπως μπορείτε να μαντέψετε, πραγματικά αστεία. Αυτό σημαίνει Οι εξελίξεις της τεχνητής νοημοσύνης θα σημαίνουν το τέλος του προγραμματισμού? Όχι ακριβώς, αλλά εξακολουθεί να είναι μια δυνατότητα που θα είναι χρήσιμη για να βοηθήσετε τους προγραμματιστές.

Όσο πολλά υποσχόμενη κι αν φαίνεται αυτή η δυνατότητα, εξακολουθεί να βρίσκεται σε προεπισκόπηση έρευνας και δεν είναι διαθέσιμη δημόσια. Επιπλέον, το μοντέλο χρειάζεται πολύ χρόνο για να επεξεργαστεί οπτικές εισόδους, με το ίδιο το OpenAI να δηλώνει ότι μπορεί να χρειαστεί δουλειά και χρόνος για να γίνει πιο γρήγορο.

3. Μεγαλύτερη Διεύθυνση

Το OpenAI ισχυρίζεται επίσης ότι το GPT-4 έχει υψηλό βαθμό διεύθυνσης. Έχει επίσης κάνει πιο δύσκολο για την τεχνητή νοημοσύνη να σπάσει χαρακτήρα, πράγμα που σημαίνει ότι είναι λιγότερο πιθανό να αποτύχει όταν εφαρμόζεται σε μια εφαρμογή για να παίξει έναν συγκεκριμένο χαρακτήρα.

Οι προγραμματιστές μπορούν να ορίσουν το στυλ και την εργασία του AI τους περιγράφοντας την κατεύθυνση στο μήνυμα "σύστημα". Αυτά τα μηνύματα επιτρέπουν στους χρήστες API να προσαρμόζουν σε μεγάλο βαθμό την εμπειρία χρήστη εντός συγκεκριμένων ορίων. Δεδομένου ότι αυτά τα μηνύματα είναι επίσης ο ευκολότερος τρόπος "jailbreak" του μοντέλου, εργάζονται επίσης για να τα κάνουν πιο ασφαλή. Η επίδειξη για το GPT-4 κατέληξε σε αυτό το σημείο κάνοντας έναν χρήστη να προσπαθήσει να σταματήσει το GPT-4 από το να είναι εκπαιδευτής Socratic και να απαντήσει στο ερώτημά του. Ωστόσο, το μοντέλο αρνήθηκε να σπάσει χαρακτήρα.

4. Ασφάλεια

Το OpenAI πέρασε έξι μήνες για να φτιάξει το GPT-4 ασφαλέστερη και πιο ευθυγραμμισμένη. Η εταιρεία ισχυρίζεται ότι είναι 82% λιγότερο πιθανό να ανταποκριθεί σε αιτήματα για ακατάλληλο ή άλλως μη επιτρεπόμενο περιεχόμενο, 29% περισσότερες πιθανότητες να ανταποκρίνεται σύμφωνα με τις πολιτικές του OpenAI σε ευαίσθητα αιτήματα και 40% είναι πιθανότερο να παράγει πραγματικές απαντήσεις σε σύγκριση με GPT-3.5.

Δεν είναι τέλειο, και μπορείτε ακόμα να περιμένετε ότι θα «παραισθάνεται» από καιρό σε καιρό και μπορεί να κάνει λάθος στις προβλέψεις του. Σίγουρα, το GPT-4 έχει καλύτερες αντιλήψεις και ισχύ πρόβλεψης, αλλά και πάλι δεν πρέπει να εμπιστεύεστε τυφλά την τεχνητή νοημοσύνη.

5. Βελτιώσεις απόδοσης

Εκτός από την αξιολόγηση της απόδοσης του μοντέλου στις ανθρώπινες εξετάσεις, το OpenAI αξιολόγησε επίσης το bot σε παραδοσιακά σημεία αναφοράς που έχουν σχεδιαστεί για μοντέλα μηχανικής μάθησης.

Ισχυρίζεται ότι το GPT-4 «υπερέχει σημαντικά» τα υπάρχοντα LLM και τα «περισσότερα μοντέλα τελευταίας τεχνολογίας». Αυτά τα σημεία αναφοράς περιλαμβάνουν το τα προαναφερθέντα MMLU, AI2 Reasoning Challenge (ARC), WinoGrande, HumanEval και Drop, τα οποία δοκιμάζουν όλες τις μεμονωμένες δυνατότητες.

Θα βρείτε παρόμοια αποτελέσματα όταν συγκρίνετε τις επιδόσεις σε κριτήρια αξιολόγησης ακαδημαϊκής όρασης. Οι δοκιμές που εκτελούνται περιλαμβάνουν τα VQAv2, TextVQA, ChartQA, AI2 Diagram (AI2D), DocVQA, Infographic VQA, TVQA και LSMDC, τα οποία είναι όλα στην κορυφή του GPT-4. Ωστόσο, το OpenAI δήλωσε ότι τα αποτελέσματα του GPT-4 σε αυτές τις δοκιμές «δεν αντιπροσωπεύουν πλήρως την έκταση των δυνατοτήτων του», καθώς οι ερευνητές συνεχίζουν να βρίσκουν νέα και πιο δύσκολα πράγματα που μπορεί να αντιμετωπίσει το μοντέλο.

Small Step για GPT-4, Giant Leap για AI

Με μεγαλύτερη ακρίβεια, ασφάλεια χρήσης και προηγμένες δυνατότητες, το GPT-4 κυκλοφόρησε στο κοινό μέσω του μηνιαίου προγράμματος συνδρομής ChatGPT+ που κοστίζει 20 το μήνα. Επιπλέον, το OpenAI έχει συνεργαστεί με διάφορους οργανισμούς για να ξεκινήσει την κατασκευή προϊόντων που απευθύνονται στους καταναλωτές με το GPT-4. Οι Microsoft Bing, Duolingo, Stripe, Be My Eyes και Khan Academy, μεταξύ άλλων, έχουν ήδη εφαρμόσει το GPT-4 στα προϊόντα τους.

Το GPT-4 μπορεί να είναι μια σταδιακή ενημέρωση σε σχέση με το GPT-3.5, αλλά είναι μια τεράστια νίκη για την τεχνητή νοημοσύνη συνολικά. Καθώς το μοντέλο γίνεται πιο προσιτό, τόσο για τον μέσο χρήστη όσο και για τους προγραμματιστές μέσω του API του, φαίνεται ότι θα είναι μια καλή περίπτωση για εφαρμογές LLM σε όλα τα πεδία.