Το PaLM 2 φέρνει τεράστιες αναβαθμίσεις στο LLM της Google, αλλά αυτό σημαίνει ότι μπορεί πλέον να είναι από τα δάχτυλα των ποδιών με το GPT-4 του OpenAI;

Η Google αποκάλυψε την επόμενη γενιά του Μοντέλου Γλωσσών Pathways (PaLM 2) στις 10 Μαΐου 2023, στο Google I/O 2023. Το νέο μοντέλο μεγάλης γλώσσας (LLM) μπορεί να υπερηφανεύεται για πολλές βελτιώσεις σε σχέση με τον προκάτοχό του (PaLM) και μπορεί τελικά να είναι έτοιμο να αντιμετωπίσει τον μεγαλύτερο αντίπαλό του, το GPT-4 του OpenAI.

Αλλά πόση βελτίωση έχει κάνει η Google; Είναι το PaLM 2 η διαφορά που ελπίζει η Google ότι θα είναι, και το πιο σημαντικό, με τόσες πολλές παρόμοιες δυνατότητες, σε τι διαφέρει το PaLM 2 από το GPT-4 του OpenAI;

PalM 2 vs. GPT-4: Επισκόπηση απόδοσης

Το PaLM 2 είναι γεμάτο με νέες και βελτιωμένες δυνατότητες έναντι του προκατόχου του. Ένα από τα μοναδικά πλεονεκτήματα που έχει το PaLM 2 έναντι του GPT-4 είναι το γεγονός ότι διατίθεται σε μικρότερα μεγέθη ειδικά για ορισμένες εφαρμογές που δεν έχουν τόση ενσωματωμένη ισχύ επεξεργασίας.

instagram viewer

Όλα αυτά τα διαφορετικά μεγέθη έχουν τα δικά τους μικρότερα μοντέλα που ονομάζονται Gecko, Otter, Bison και Unicorn, με το Gecko να είναι το μικρότερο, ακολουθούμενο από το Otter, το Bison και, τέλος, το Unicorn, το μεγαλύτερο μοντέλο.

Η Google ισχυρίζεται επίσης μια βελτίωση στις δυνατότητες συλλογιστικής σε σχέση με το GPT-4 στα WinoGrande και DROP, με το πρώτο να τραβάει ένα στενό περιθώριο στο ARC-C. Ωστόσο, υπάρχει σημαντική βελτίωση σε γενικές γραμμές όσον αφορά το PaLM και το SOTA.

Το PaLM 2 είναι επίσης καλύτερο στα μαθηματικά, σύμφωνα με την 91-σελίδα της Google Ερευνητική εργασία PalM 2 [PDF]. Ωστόσο, ο τρόπος με τον οποίο η Google και το OpenAI έχουν δομήσει τα αποτελέσματα των δοκιμών τους καθιστά δύσκολη την απευθείας σύγκριση των δύο μοντέλων. Η Google παρέλειψε επίσης ορισμένες συγκρίσεις, πιθανότατα επειδή το PaLM 2 δεν είχε την ίδια απόδοση με το GPT-4.

Στο MMLU, το GPT-4 σημείωσε 86,4, ενώ το PaLM 2 σημείωσε 81,2. Το ίδιο ισχύει και για την HellaSwag, όπου το GPT-4 σκόραρε 95,3, αλλά το PaLM 2 μπορούσε να συγκεντρώσει μόνο 86,8 και το ARC-E, όπου το GPT-4 και το PaLM 2 πήραν 96,3 και 89,7, αντίστοιχα.

Το μεγαλύτερο μοντέλο στην οικογένεια PaLM 2 είναι το PaLM 2-L. Αν και δεν γνωρίζουμε το ακριβές μέγεθός του, γνωρίζουμε ότι είναι σημαντικά μικρότερο από το μεγαλύτερο μοντέλο PaLM, αλλά χρησιμοποιεί περισσότερους υπολογιστές εκπαίδευσης. Σύμφωνα με την Google, το PaLM έχει 540 δισεκατομμύρια παραμέτρους, επομένως το "σημαντικά μικρότερο" θα πρέπει να τοποθετήσει το PaLM 2 μεταξύ 10 και 300 δισεκατομμυρίων παραμέτρων. Λάβετε υπόψη ότι αυτοί οι αριθμοί είναι απλώς υποθέσεις που βασίζονται σε όσα είπε η Google στο έγγραφο PalM 2.

Εάν αυτός ο αριθμός είναι οπουδήποτε κοντά στα 100 δισεκατομμύρια ή κάτω, το PalM 2 είναι πιθανότατα μικρότερο ως προς τις παραμέτρους από GPT-3.5. Θεωρώντας ότι ένα μοντέλο δυνητικά κάτω των 100 δισεκατομμυρίων μπορεί να πάει από τα πόδια μέχρι τα νύχια με το GPT-4 και ακόμη και να το νικήσει σε ορισμένες εργασίες είναι ΕΝΤΥΠΩΣΙΑΚΟ. Το GPT-3.5 αρχικά φύσηξε τα πάντα έξω από το νερό, συμπεριλαμβανομένου του PaLM, αλλά το PaLM 2 έχει κάνει αρκετά την ανάκαμψη.

Διαφορές στα δεδομένα εκπαίδευσης GPT-4 και PaLM 2

Ενώ η Google δεν έχει αποκαλύψει το μέγεθος του συνόλου δεδομένων εκπαίδευσης του PaLM 2, η εταιρεία αναφέρει στην ερευνητική της εργασία ότι το σύνολο δεδομένων εκπαίδευσης του νέου LLM είναι σημαντικά μεγαλύτερο. Το OpenAI ακολούθησε επίσης την ίδια προσέγγιση κατά την αποκάλυψη του GPT-4, χωρίς να κάνει ισχυρισμούς σχετικά με το μέγεθος του συνόλου δεδομένων εκπαίδευσης.

Ωστόσο, η Google ήθελε να επικεντρωθεί σε μια βαθύτερη κατανόηση των μαθηματικών, της λογικής, του συλλογισμού και της επιστήμης, πράγμα που σημαίνει ότι ένα μεγάλο μέρος των δεδομένων εκπαίδευσης του PaLM 2 επικεντρώνεται στα προαναφερθέντα θέματα. Η Google αναφέρει στο έγγραφό της ότι το σώμα προεκπαίδευσης του PaLM 2 αποτελείται από πολλαπλές πηγές, συμπεριλαμβανομένων εγγράφων ιστού, βιβλία, κώδικας, μαθηματικά και δεδομένα συνομιλίας, δίνοντάς τους βελτιώσεις σε γενικές γραμμές, τουλάχιστον σε σύγκριση με Παλάμη.

Οι δεξιότητες συνομιλίας του PalM 2 θα πρέπει επίσης να είναι σε άλλο επίπεδο, δεδομένου ότι το μοντέλο έχει εκπαιδευτεί σε περισσότερες από 100 γλώσσες για καλύτερη κατανόηση των συμφραζομένων και καλύτερη μετάφραση δυνατότητες.

Όσον αφορά την επιβεβαίωση των δεδομένων εκπαίδευσης του GPT-4, η OpenAI μας είπε ότι έχει εκπαιδεύσει το μοντέλο χρησιμοποιώντας δημόσια διαθέσιμα δεδομένα και τα δεδομένα που αδειοδοτήθηκαν. Σελίδα έρευνας του GPT-4 δηλώνει, "Τα δεδομένα είναι ένα σύνολο δεδομένων κλίμακας ιστού που περιλαμβάνει σωστές και λανθασμένες λύσεις σε μαθηματικά προβλήματα, αδύναμα και ισχυρή συλλογιστική, αυτοαντιφατικές και συνεπείς δηλώσεις και αντιπροσωπεύει μια μεγάλη ποικιλία ιδεολογιών και ιδέες."

Όταν τίθεται μια ερώτηση στο GPT-4, μπορεί να παράγει μια μεγάλη ποικιλία απαντήσεων, οι οποίες μπορεί να μην είναι όλες σχετικές με το ερώτημά σας. Για να το ευθυγραμμίσει με την πρόθεση του χρήστη, το OpenAI βελτίωσε τη συμπεριφορά του μοντέλου χρησιμοποιώντας ενισχυτική μάθηση με ανθρώπινη ανατροφοδότηση.

Αν και μπορεί να μην γνωρίζουμε τα ακριβή δεδομένα εκπαίδευσης στα οποία εκπαιδεύτηκε κανένα από αυτά τα μοντέλα, γνωρίζουμε ότι η πρόθεση εκπαίδευσης ήταν πολύ διαφορετική. Θα πρέπει να περιμένουμε και να δούμε πώς αυτή η διαφορά στην πρόθεση εκπαίδευσης διαφοροποιεί τα δύο μοντέλα σε μια πραγματική ανάπτυξη.

Chatbots και υπηρεσίες PaLM 2 και GPT-4

Η πρώτη πύλη για πρόσβαση και στα δύο LLM χρησιμοποιεί τα αντίστοιχα chatbot τους, το Bard του PaLM 2 και το ChatGPT του GPT-4. Τούτου λεχθέντος, το GPT-4 βρίσκεται πίσω από ένα paywall με το ChatGPT Plus και οι δωρεάν χρήστες έχουν πρόσβαση μόνο στο GPT-3.5. Το Bard, από την άλλη πλευρά, είναι δωρεάν για όλους και διαθέσιμο σε 180 χώρες.

Αυτό δεν σημαίνει ότι δεν μπορείτε να έχετε δωρεάν πρόσβαση στο GPT-4. Το Bing AI Chat της Microsoft χρησιμοποιεί GPT-4 και είναι εντελώς δωρεάν, ανοιχτό σε όλους και διαθέσιμο ακριβώς δίπλα στην Αναζήτηση Bing, τον μεγαλύτερο αντίπαλο της Google στον χώρο.

Το Google I/O 2023 ήταν γεμάτο με ανακοινώσεις σχετικά με τον τρόπο με τον οποίο το PaLM 2 και η γενετική ενσωμάτωση AI θα βελτιώσουν το Google Workspace εμπειρία με λειτουργίες AI που έρχονται στα Έγγραφα Google, τα Υπολογιστικά φύλλα, τις Παρουσιάσεις, το Gmail και σχεδόν κάθε υπηρεσία που προσφέρει ο γίγαντας αναζήτησης. Επιπλέον, η Google επιβεβαίωσε ότι το PaLM 2 έχει ήδη ενσωματωθεί σε περισσότερα από 25 προϊόντα Google, συμπεριλαμβανομένων των Android και YouTube.

Συγκριτικά, η Microsoft έχει ήδη φέρει χαρακτηριστικά AI στη σουίτα προγραμμάτων του Microsoft Office και σε πολλές από τις υπηρεσίες της. Προς το παρόν, μπορείτε να ζήσετε και τα δύο LLM στις δικές τους εκδόσεις παρόμοιων προσφορών από δύο αντίπαλες εταιρείες που πηγαίνουν πρόσωπο με πρόσωπο στη μάχη της τεχνητής νοημοσύνης.

Ωστόσο, δεδομένου ότι το GPT-4 κυκλοφόρησε νωρίς και φρόντισε να αποφύγει πολλές από τις γκάφες που έκανε η Google με τον αρχικό Bard, ήταν de facto LLM για τρίτους προγραμματιστές, startups και σχεδόν οποιονδήποτε άλλο θέλει να ενσωματώσει ένα ικανό μοντέλο AI στην υπηρεσία τους, μακριά. Εχουμε ένα λίστα εφαρμογών GPT-4 αν θέλετε να τις ελέγξετε.

Αυτό δεν σημαίνει ότι οι προγραμματιστές δεν θα αλλάξουν ή τουλάχιστον θα δοκιμάσουν το PaLM 2, αλλά η Google πρέπει να συνεχίσει να ανταποκρίνεται στο OpenAI σε αυτό το μέτωπο. Και το γεγονός ότι το PaLM 2 είναι ανοιχτού κώδικα, αντί να είναι κλειδωμένο πίσω από ένα πληρωμένο API, σημαίνει ότι έχει τη δυνατότητα να υιοθετηθεί ευρύτερα από το GPT-4.

Μπορεί το PalM 2 να λάβει το GPT-4;

Το PaLM 2 είναι ακόμα πολύ καινούργιο, επομένως η απάντηση για το αν μπορεί να λάβει ή όχι στο GPT-4 μένει να απαντηθεί. Ωστόσο, με όλα όσα υπόσχεται η Google και τον επιθετικό τρόπο που έχει αποφασίσει να χρησιμοποιήσει για να το διαδώσει, φαίνεται ότι το PaLM 2 μπορεί να δώσει στο GPT-4 μια καλή προσπάθεια.

Ωστόσο, το GPT-4 εξακολουθεί να είναι ένα αρκετά ικανό μοντέλο και, όπως αναφέρθηκε προηγουμένως, ξεπερνά το PaLM 2 σε αρκετές συγκρίσεις. Τούτου λεχθέντος, τα πολλαπλά μικρότερα μοντέλα του PaLM 2 του δίνουν ένα αδιαμφισβήτητο πλεονέκτημα. Το ίδιο το Gecko είναι τόσο ελαφρύ που μπορεί να λειτουργήσει σε κινητές συσκευές, ακόμη και όταν είναι εκτός σύνδεσης. Αυτό σημαίνει ότι το PaLM 2 μπορεί να υποστηρίξει μια εντελώς διαφορετική κατηγορία προϊόντων και συσκευών που ενδέχεται να δυσκολεύονται να χρησιμοποιήσουν το GPT-4.

Ο αγώνας AI Race θερμαίνεται

Με το λανσάρισμα του PaLM2, ο αγώνας για την κυριαρχία της τεχνητής νοημοσύνης έχει θερμανθεί, καθώς αυτός μπορεί να είναι απλώς ο πρώτος άξιος αντίπαλος που θα αντιμετωπίσει το GPT-4. Με ένα νεότερο πολυτροπικό μοντέλο τεχνητής νοημοσύνης που ονομάζεται "Gemini" επίσης σε εκπαίδευση, η Google δεν δείχνει σημάδια επιβράδυνσης εδώ.