Πιθανότατα έχετε ακούσει για το GPT του OpenAI, αλλά δεν είναι τα μόνα LLM στο μπλοκ.

Βασικά Takeaways

  • Το GPT-4 του OpenAI είναι το πιο προηγμένο και ευρέως χρησιμοποιούμενο μοντέλο μεγάλων γλωσσών, με 1,76 τρισεκατομμύρια παραμέτρους και πολυτροπικές ικανότητες.
  • Το Claude 2 της Anthropic ανταγωνίζεται το GPT-4 σε εργασίες δημιουργικής γραφής και διατηρεί τη δική του θέση παρά το γεγονός ότι έχει λιγότερους πόρους.
  • Το PaLM 2 της Google, αν και δεν είναι δολοφόνος GPT-4, είναι ένα ισχυρό μοντέλο γλώσσας με ισχυρές πολυγλωσσικές και δημιουργικές ικανότητες. Το Falcon-180B είναι ένα μοντέλο ανοιχτού κώδικα που ανταγωνίζεται τους εμπορικούς γίγαντες και μπορεί να σταθεί από τα δάχτυλα στα νύχια με το GPT-3.5.

Είναι η εποχή της τεχνητής νοημοσύνης και οι εταιρείες τεχνολογίας δημιουργούν μεγάλα μοντέλα γλώσσας όπως ψωμί από αρτοποιείο. Νέα μοντέλα κυκλοφορούν γρήγορα και γίνεται πολύ δύσκολο να παρακολουθείς.

Όμως, εν μέσω της αναταραχής των νέων εκδόσεων, μόνο λίγα μοντέλα έχουν ανέβει στην κορυφή και έχουν αποδειχθεί αληθινοί διεκδικητές στον μεγάλο χώρο γλωσσικών μοντέλων. Καθώς πλησιάζουμε στο τέλος του 2023, συγκεντρώσαμε τα έξι πιο εντυπωσιακά μοντέλα μεγάλων γλωσσών που πρέπει να δοκιμάσετε.

instagram viewer

1. Το GPT-4 του OpenAI

Το GPT-4 είναι το πιο προηγμένο μοντέλο μεγάλης γλώσσας που είναι διαθέσιμο στο κοινό μέχρι σήμερα. Αναπτύχθηκε από την OpenAI και κυκλοφόρησε τον Μάρτιο του 2023, Το GPT-4 είναι η πιο πρόσφατη επανάληψη της σειράς Generative Pre-trained Transformer που ξεκίνησε το 2018. Με τις τεράστιες δυνατότητές του, το GPT-4 έχει γίνει ένα από τα πιο ευρέως χρησιμοποιούμενα και πιο δημοφιλή μοντέλα μεγάλων γλωσσών στον κόσμο.

Αν και δεν έχει επιβεβαιωθεί επίσημα, οι πηγές εκτιμούν ότι το GPT-4 μπορεί να περιέχει 1,76 τρισεκατομμύρια παραμέτρους. περίπου δέκα φορές περισσότερο από τον προκάτοχό του, GPT-3.5, και πέντε φορές μεγαλύτερο από το ναυαρχίδα της Google, το PaLM 2. Αυτή η τεράστια κλίμακα επιτρέπει τις πολυτροπικές ικανότητες του GPT-4, επιτρέποντάς του να επεξεργάζεται κείμενο και εικόνες ως είσοδο. Ως αποτέλεσμα, το GPT-4 μπορεί να ερμηνεύει και να περιγράφει οπτικές πληροφορίες όπως διαγράμματα και στιγμιότυπα οθόνης εκτός από το κείμενο. Η πολυτροπική φύση του παρέχει μια πιο ανθρώπινη κατανόηση των δεδομένων του πραγματικού κόσμου.

Σε επιστημονικά σημεία αναφοράς, το GPT-4 ξεπερνά σημαντικά τα άλλα σύγχρονα μοντέλα σε διάφορες δοκιμές. Ενώ τα σημεία αναφοράς από μόνα τους δεν καταδεικνύουν πλήρως τα δυνατά σημεία ενός μοντέλου, οι περιπτώσεις χρήσης του πραγματικού κόσμου έχουν δείξει ότι το GPT-4 είναι εξαιρετικά ικανό στην επίλυση πρακτικών προβλημάτων διαισθητικά. Το GPT-4 χρεώνεται επί του παρόντος με 20 $ το μήνα και προσβάσιμο μέσω του προγράμματος ChatGPT Plus.

2. Anthropic's Claude 2

Πίστωση εικόνας: Ανθρωπικό

Αν και δεν είναι τόσο δημοφιλές όσο το GPT-4, το Claude 2, που αναπτύχθηκε από την Anthropic AI, μπορεί να ταιριάζει με τα τεχνικά σημεία αναφοράς του GPT -4 και τις πραγματικές επιδόσεις σε πολλούς τομείς. Σε ορισμένες τυποποιημένες δοκιμές, συμπεριλαμβανομένων επιλεγμένων εξετάσεων, ο Claude 2 ξεπερνά το GPT-4. Το μοντέλο γλώσσας AI έχει επίσης ένα εξαιρετικά ανώτερο παράθυρο περιβάλλοντος με περίπου 100.000 tokens, σε σύγκριση με τα μοντέλα 8k και 32k token του GPT -4. Αν και το μεγαλύτερο μήκος περιβάλλοντος δεν μεταφράζεται πάντα σε καλύτερη απόδοση, η διευρυμένη χωρητικότητα του Claude 2 παρέχει σαφή πλεονεκτήματα, όπως η αφομοίωση ολόκληρων βιβλίων 75.000 λέξεων για ανάλυση.

Σε συνολική απόδοση, το GPT-4 παραμένει ανώτερο, αλλά Οι εσωτερικές δοκιμές μας δείχνουν ότι ο Claude 2 το ξεπερνά σε διάφορες εργασίες δημιουργικής γραφής. Ο Claude 2 ακολουθεί επίσης το GPT-4 στις δεξιότητες προγραμματισμού και μαθηματικών με βάση τις αξιολογήσεις μας, αλλά διαπρέπει στο να παρέχει ανθρώπινες, δημιουργικές απαντήσεις. Όταν ζητήσαμε από όλα τα μοντέλα αυτής της λίστας να γράψουν ή να ξαναγράψουν ένα δημιουργικό κομμάτι, έξι φορές στις δέκα, επιλέξαμε το αποτέλεσμα του Claude 2 για τα φυσικά αποτελέσματα που μοιάζουν με τον άνθρωπο. Επί του παρόντος, Το Claude 2 είναι διαθέσιμο δωρεάν μέσω του Claude AI chatbot. Υπάρχει επίσης ένα πρόγραμμα επί πληρωμή 20 $ για πρόσβαση σε επιπλέον λειτουργίες.

Παρά το γεγονός ότι έχει λιγότερη οικονομική υποστήριξη από γίγαντες όπως το OpenAI και η Microsoft, το μοντέλο Claude 2 AI της Anthropic συγκρατείται έναντι των δημοφιλών μοντέλων GPT και της σειράς PaLM της Google. Για ένα AI με λιγότερους πόρους, το Claude 2 είναι εντυπωσιακά ανταγωνιστικό. Αν αναγκαστεί να στοιχηματίσει σε ποιο υπάρχον μοντέλο έχει τις καλύτερες πιθανότητες να ανταγωνιστεί το GPT στο εγγύς μέλλον, το Claude 2 φαίνεται το πιο ασφαλές στοίχημα. Αν και ξεπερασμένος σε χρηματοδότηση, οι προηγμένες δυνατότητες του Claude 2 υποδηλώνουν ότι μπορεί να πάει από τα δάχτυλα στα νύχια ακόμη και καλά χρηματοδοτούμενα μεγαθήρια (αν και αξίζει να σημειωθεί ότι η Google έχει κάνει πολλές μεγάλες συνεισφορές σε Ανθρωπικό). Το μοντέλο χτυπάει πάνω από την κατηγορία βάρους του και δείχνει υπόσχεση ως αναδυόμενος αμφισβητίας.

3. Το GPT-3.5 του OpenAI

Πίστωση εικόνας: Marcelo Mollaretti/Shutterstock

Αν και επισκιάζεται από την κυκλοφορία του GPT-4, το GPT-3.5 και οι 175 δισεκατομμύρια παράμετροί του δεν πρέπει να υποτιμηθούν. Μέσω της επαναληπτικής λεπτομέρειας και των αναβαθμίσεων που επικεντρώνονται στην απόδοση, την ακρίβεια και την ασφάλεια, το GPT-3.5 έχει προχωρήσει πολύ από το αρχικό μοντέλο GPT-3. Παρόλο που στερείται των πολυτροπικών δυνατοτήτων του GPT -4 και υστερεί σε μήκος περιβάλλοντος και μέτρηση παραμέτρων, Το GPT-3.5 παραμένει εξαιρετικά ικανό, με το GPT-4 να είναι το μόνο μοντέλο που μπορεί να ξεπεράσει την συνολική του απόδοση αποφασιστικά.

Παρά το γεγονός ότι είναι μοντέλο δεύτερης κατηγορίας στην οικογένεια GPT, το GPT-3.5 μπορεί να διατηρήσει τη δική του απόδοση και ακόμη και να ξεπεράσει τα κορυφαία μοντέλα της Google και της Meta σε πολλά σημεία αναφοράς. Σε δοκιμές δίπλα-δίπλα μαθηματικών και προγραμματιστικών δεξιοτήτων έναντι του PaLM 2 της Google, οι διαφορές δεν ήταν έντονες, με το GPT-3.5 να έχει ακόμη και ένα μικρό πλεονέκτημα σε ορισμένες περιπτώσεις. Πιο δημιουργικές εργασίες, όπως το χιούμορ και η αφήγηση, είδαν το GPT-3.5 να προχωρά αποφασιστικά.

Έτσι, ενώ το GPT-4 σηματοδοτεί ένα νέο ορόσημο στην τεχνητή νοημοσύνη, το GPT-3.5 παραμένει ένα εντυπωσιακά ισχυρό μοντέλο, ικανό να ανταγωνιστεί και μερικές φορές να ξεπεράσει ακόμη και τις πιο προηγμένες εναλλακτικές λύσεις. Η συνεχής βελτίωσή του διασφαλίζει ότι παραμένει επίκαιρο ακόμα και σε πιο εντυπωσιακά μοντέλα επόμενης γενιάς.

4. Το PalM 2 της Google

Πίστωση εικόνας: Google

Κατά την αξιολόγηση των δυνατοτήτων ενός μοντέλου τεχνητής νοημοσύνης, ο αποδεδειγμένος τύπος είναι να διαβάσετε την τεχνική έκθεση και ελέγξτε τις βαθμολογίες αναφοράς, αλλά πάρτε όλα όσα μάθατε με λίγο αλάτι και δοκιμάστε το μοντέλο ο ίδιος. Όσο αντιφατικό κι αν φαίνεται, τα αποτελέσματα των κριτηρίων αναφοράς δεν ευθυγραμμίζονται πάντα με την απόδοση του πραγματικού κόσμου για ορισμένα μοντέλα τεχνητής νοημοσύνης. Στα χαρτιά, το PaLM 2 της Google υποτίθεται ότι ήταν το GPT-4 killer, με τα επίσημα αποτελέσματα δοκιμών να υποδηλώνουν ότι ταιριάζει με το GPT-4 σε ορισμένα σημεία αναφοράς. Ωστόσο, στην καθημερινή χρήση, προκύπτει μια διαφορετική εικόνα.

Στον λογικό συλλογισμό, τα μαθηματικά και τη δημιουργικότητα, το PaLM 2 υπολείπεται του GPT-4. Υστερεί επίσης από τον Claude του Anthropic σε μια σειρά εργασιών δημιουργικής γραφής. Ωστόσο, παρόλο που αποτυγχάνει να ανταποκριθεί στη τιμολόγησή του ως δολοφόνος GPT-4, Το PalM 2 της Google παραμένει ένα ισχυρό μοντέλο γλώσσας από μόνο του, με τεράστιες δυνατότητες. Μεγάλο μέρος του αρνητικού συναισθήματος γύρω από αυτό προέρχεται από συγκρίσεις με μοντέλα όπως το GPT-4 και όχι από εντελώς κακή απόδοση.

Με 340 δισεκατομμύρια παραμέτρους, το PaLM 2 συγκαταλέγεται στα μεγαλύτερα μοντέλα στον κόσμο. Διαπρέπει ιδιαίτερα σε πολύγλωσσες εργασίες και διαθέτει ισχυρές μαθηματικές και προγραμματιστικές ικανότητες. Αν και δεν είναι το καλύτερο σε αυτό, το PaLM 2 είναι επίσης αρκετά αποτελεσματικό σε δημιουργικές εργασίες όπως το γράψιμο. Έτσι, ενώ τα σημεία αναφοράς ζωγράφισαν μια αισιόδοξη εικόνα που δεν υλοποιήθηκε πλήρως, το PaLM 2 εξακολουθεί να επιδεικνύει εντυπωσιακές δεξιότητες τεχνητής νοημοσύνης, ακόμη και αν δεν ξεπερνά όλους τους ανταγωνιστές σε όλο τον πίνακα.

5. TII's Falcon-180B

Αν δεν συμβαδίζετε με τον γρήγορο ρυθμό των εκδόσεων μοντέλων γλώσσας AI, πιθανότατα δεν έχετε συναντήσει ποτέ το Falcon-180B. Αναπτύχθηκε από το Ινστιτούτο Καινοτομίας Τεχνολογίας των ΗΑΕ, η παράμετρος Falcon-180 των 180 δισεκατομμυρίων είναι μια από τις πιο ισχυρές μοντέλα γλώσσας ανοιχτού κώδικα εκεί έξω, ακόμα κι αν δεν έχει την αναγνώριση ονομάτων των μοντέλων GPT ή την ευρεία χρήση του Meta's Λάμα 2. Αλλά μην κάνετε λάθος - το Falcon-180B μπορεί να αντέξει τα δάχτυλα των ποδιών με τους καλύτερους στην κατηγορία.

Τα αποτελέσματα συγκριτικής αξιολόγησης αποκαλύπτουν ότι το Falcon-180B υπερτερεί των περισσότερων μοντέλων ανοιχτού κώδικα και ανταγωνίζεται εμπορικούς τζάγκερναυτ όπως PalM 2 και GPT-3.5. Κατά τη δοκιμή εργασιών μαθηματικών, κωδικοποίησης, συλλογισμού και δημιουργικής γραφής, ξεπέρασε ακόμη και το GPT-3.5 και το PaLM 2 στο φορές. Αν κατατάξουμε τα GPT-4, GPT-3.5 και Falcon-180B, θα τοποθετούσαμε το Falcon-180B ακριβώς μεταξύ GPT-4 και GPT-3.5 για τα δυνατά του σημεία σε πολλές περιπτώσεις χρήσης.

Παρόλο που δεν μπορούμε να πούμε με σιγουριά ότι είναι καλύτερο από το GPT-3.5 σε συνολική απόδοση, κάνει λόγο για τον εαυτό του. Αν και είναι σκοτεινό, αυτό το μοντέλο αξίζει προσοχής για την αντιστοίχιση ή την υπέρβαση των δυνατοτήτων των πιο γνωστών εναλλακτικών. Μπορείτε να δοκιμάσετε το μοντέλο Falcon-180B Αγκαλιασμένο πρόσωπο (μια πλατφόρμα LLM ανοιχτού κώδικα).

Το Llama 2, το μοντέλο μεγάλης γλώσσας 70 δισεκατομμυρίων παραμέτρων της Meta AI, βασίζεται στον προκάτοχό του, το Llama 1. Αν και είναι μικρότερο από τα κορυφαία μοντέλα, το Llama 2 ξεπερνά σημαντικά τα περισσότερα δημόσια διαθέσιμα ανοιχτού κώδικα LLM σε σημεία αναφοράς και χρήση σε πραγματικό κόσμο. Εξαίρεση θα ήταν το Falcon-180B.

Δοκιμάσαμε το Llama 2 έναντι των GPT-4, GPT-3.5, Claude 2 και PaLM 2 για να μετρήσουμε τις δυνατότητές του. Όπως ήταν αναμενόμενο, το GPT-4 ξεπέρασε το Llama 2 σε όλες σχεδόν τις παραμέτρους. Ωστόσο, το Llama 2 αντιμετώπισε το GPT-3.5 και το PaLM 2 σε αρκετές αξιολογήσεις. Αν και θα ήταν ανακριβές να ισχυριστεί κανείς ότι το Llama 2 είναι ανώτερο από το PaLM 2, το Llama 2 έλυσε πολλά προβλήματα που παρακώλυσαν το PaLM 2, συμπεριλαμβανομένων των εργασιών κωδικοποίησης. Ο Claude 2 και το GPT-3.5 ξεπέρασαν το Llama 2 σε ορισμένους τομείς, αλλά ήταν αποφασιστικά καλύτεροι μόνο σε περιορισμένο αριθμό εργασιών.

Έτσι, ενώ δεν υπερβαίνει τις δυνατότητες των μεγαλύτερων ιδιόκτητων μοντέλων, ανοιχτού κώδικα Llama 2 χτυπάει πάνω από την κατηγορία βάρους του. Για ένα ανοιχτά διαθέσιμο μοντέλο, επιδεικνύει εντυπωσιακές επιδόσεις, συναγωνίζοντας γίγαντες τεχνητής νοημοσύνης όπως το PaLM 2 σε επιλεγμένες αξιολογήσεις. Το Llama 2 παρέχει μια ματιά στις μελλοντικές δυνατότητες των μοντέλων γλώσσας ανοιχτού κώδικα.

Το χάσμα απόδοσης μεταξύ μοντέλων τεχνητής νοημοσύνης μειώνεται

Παρόλο που το τοπίο της Τεχνητής Νοημοσύνης εξελίσσεται με τρομερούς ρυθμούς, το GPT-4 του OpenAI παραμένει ο ηγέτης του πακέτου. Ωστόσο, ενώ το GPT-4 παραμένει απαράμιλλο σε κλίμακα και απόδοση, μοντέλα όπως το Claude 2 δείχνουν ότι με αρκετή ικανότητα, τα μικρότερα μοντέλα μπορούν να ανταγωνιστούν σε επιλεγμένους τομείς. Το PaLM 2 της Google, παρά το γεγονός ότι υπολείπεται ορισμένων υψηλών προσδοκιών, εξακολουθεί να παρουσιάζει βαθιές δυνατότητες. Και το Falcon-180B αποδεικνύει ότι οι πρωτοβουλίες ανοιχτού κώδικα μπορούν να σταθούν ώμο με ώμο με τους τιτάνες της βιομηχανίας με τους επαρκείς πόρους.