Τα μεγάλα γλωσσικά μοντέλα (LLM) διατίθενται σε όλα τα σχήματα και μεγέθη και θα σας βοηθήσουν με όποιον τρόπο κρίνετε κατάλληλο. Αλλά ποιο είναι το καλύτερο; Δοκιμάζουμε τα κυρίαρχα AI από το Alphabet, το OpenAI και το Meta.

Τι πρέπει να γνωρίζετε για τα AI Chatbots

Η τεχνητή γενική νοημοσύνη είναι στόχος των επιστημόνων υπολογιστών για δεκαετίες και η τεχνητή νοημοσύνη έχει χρησιμεύσει ως στήριγμα για τους συγγραφείς επιστημονικής φαντασίας και τους δημιουργούς ταινιών για ακόμη περισσότερο.

Το AGI εμφανίζει νοημοσύνη παρόμοια με τις ανθρώπινες γνωστικές ικανότητες και το τεστ Turing—μια δοκιμή της ικανότητας μιας μηχανής να επιδεικνύει ευφυή συμπεριφορά που δεν διακρίνεται από εκείνη ενός ανθρώπου—παρέμεινε σχεδόν αδιαμφισβήτητη τις επτά δεκαετίες από την πρώτη της κατασκευής.

Η πρόσφατη σύγκλιση εξαιρετικά μεγάλης κλίμακας υπολογιστών, τεράστιες ποσότητες χρημάτων και ο εκπληκτικός όγκος πληροφοριών ελεύθερα διαθέσιμο στο ανοιχτό διαδίκτυο επέτρεψε σε τεχνολογικούς γίγαντες να εκπαιδεύσουν μοντέλα που μπορούν να προβλέψουν την επόμενη ενότητα λέξης —ή διακριτικό— με μια ακολουθία μάρκες.

Τη στιγμή της γραφής και τα δύο Ο Βάρδος της Google και ChatGPT του OpenAI είναι διαθέσιμα για χρήση και δοκιμή μέσω των διεπαφών ιστού τους.

Το μοντέλο γλώσσας της Meta, LLaMa, δεν είναι διαθέσιμο στο διαδίκτυο, αλλά μπορείτε εύκολα κατεβάστε και εκτελέστε το LLaMa στο δικό σας υλικό και χρησιμοποιήστε το μέσω μιας γραμμής εντολών ή τρέξτε το Dalai στο δικό σας μηχάνημα—μία από τις πολλές εφαρμογές με φιλική προς το χρήστη διεπαφή.

Για τους σκοπούς της δοκιμής, θα τρέξουμε το μοντέλο Alpaca 7B του Πανεπιστημίου Στάνφορντ—μια προσαρμογή του LLaMa—και θα το βάλουμε σε σχέση με το Bard και το ChatGPT.

Οι ακόλουθες συγκρίσεις και δοκιμές δεν προορίζονται να είναι εξαντλητικές, αλλά μάλλον σας δίνουν μια ένδειξη βασικών σημείων και δυνατοτήτων.

Ποιο είναι το πιο εύκολο μοντέλο μεγάλων γλωσσών στη χρήση;

Τόσο το Bard όσο και το ChatGPT απαιτούν λογαριασμό για να χρησιμοποιήσουν την υπηρεσία. Τόσο οι λογαριασμοί Google όσο και οι λογαριασμοί OpenAI δημιουργούνται εύκολα και δωρεάν και μπορείτε να αρχίσετε αμέσως να κάνετε ερωτήσεις.

Ωστόσο, για να εκτελέσετε το LLaMa τοπικά, θα χρειαστεί να έχετε κάποιες εξειδικευμένες γνώσεις ή την ικανότητα να ακολουθήσετε ένα σεμινάριο. Θα χρειαστείτε επίσης σημαντικό αποθηκευτικό χώρο.

Ποιο είναι το πιο Private Large Language Model;

Τόσο το Bard όσο και το ChatGPT έχουν εκτεταμένες πολιτικές απορρήτου και η Google τονίζει επανειλημμένα στα έγγραφά της ότι δεν πρέπει «να συμπεριλάβετε πληροφορίες που μπορούν να χρησιμοποιηθούν για την ταυτοποίηση εσάς ή άλλων στο Bard σας συνομιλίες».

Από προεπιλογή, η Google συλλέγει τις συνομιλίες σας και τη γενική τοποθεσία σας με βάση τη διεύθυνση IP, τα σχόλιά σας και τις πληροφορίες χρήσης. Αυτές οι πληροφορίες αποθηκεύονται στον λογαριασμό σας Google για έως και 18 μήνες. Αν και μπορείτε να διακόψετε την αποθήκευση της δραστηριότητάς σας στο Bard, θα πρέπει να γνωρίζετε ότι "για να βοηθήσουμε στην ποιότητα και να βελτιώσουμε τα προϊόντα μας, οι άνθρωποι που σχολιάζουν τα προϊόντα μας διαβάζουν, σχολιάζουν και επεξεργάζονται τις συνομιλίες Bard".

Η χρήση του Bard υπόκειται επίσης στο πρότυπο Πολιτική απορρήτου της Google.

Η πολιτική απορρήτου του OpenAI είναι σε γενικές γραμμές παρόμοια και συλλέγει τη διεύθυνση IP και τα δεδομένα χρήσης. Σε αντίθεση με τη χρονικά περιορισμένη διατήρηση της Google, το OpenAI "θα διατηρήσει τα προσωπικά σας στοιχεία μόνο για όσο χρονικό διάστημα χρειαζόμαστε για να παρέχουμε Εξυπηρέτηση προς εσάς ή για άλλους νόμιμους επιχειρηματικούς σκοπούς, όπως η επίλυση διαφορών, οι λόγοι ασφάλειας ή η συμμόρφωση με τους νομικούς μας υποχρεώσεις».

Αντίθετα, ένα τοπικό μοντέλο στον δικό σας υπολογιστή δεν απαιτεί λογαριασμό ή κοινή χρήση δεδομένων χρήστη με κανέναν.

Ποιο LLM έχει τις καλύτερες γενικές γνώσεις;

Για να ελέγξουμε ποιο LLM έχει τις καλύτερες γενικές γνώσεις, θέσαμε τρεις ερωτήσεις.

Η πρώτη ερώτηση, "Ποια εθνική σημαία έχει πέντε πλευρές;" απαντήθηκε σωστά μόνο από τον Bard, ο οποίος προσδιόρισε την εθνική σημαία του Νεπάλ ως με πέντε πλευρές.

Το ChatGPT ισχυρίστηκε με βεβαιότητα ότι «Δεν υπάρχει εθνική σημαία που να έχει πέντε πλευρές. Οι εθνικές σημαίες έχουν τυπικά ορθογώνιο ή τετράγωνο σχήμα, που χαρακτηρίζονται από τα διαφορετικά χρώματα, τα σχέδια και τα σύμβολά τους».

Το τοπικό μας μοντέλο έφτασε κοντά, δηλώνοντας ότι «Η Ινδική Εθνική Σημαία έχει πέντε πλευρές και σχεδιάστηκε το 1916 για να αντιπροσωπεύει τη σημαία της Ινδίας κίνημα ανεξαρτησίας." Ενώ αυτή η σημαία υπήρχε και είχε πέντε πλευρές, ήταν η σημαία του Ινδικού Κινήματος Εσωτερικού Κανονισμού - όχι Εθνική σημαία.

Κανένα από τα μοντέλα μας δεν μπορούσε να απαντήσει ότι ο σωστός όρος για ένα αντικείμενο σε σχήμα μπιζελιού είναι "pisiform", με το ChatGPT στο βαθμό που υποδηλώνει ότι τα μπιζέλια έχουν ένα «τρισδιάστατο γεωμετρικό σχήμα που είναι τέλεια στρογγυλό και συμμετρικός."

Και τα τρία chatbots προσδιόρισαν σωστά τον Franco Malerba ως Ιταλό αστροναύτη και μέλος του Ευρωπαϊκό Κοινοβούλιο, με τον Μπαρντ να δίνει μια απάντηση με την ίδια διατύπωση σε ένα τμήμα της Βικιπαίδειας του Μαλέρμπα είσοδος.

Ποιο LLM είναι καλό για τεχνικές οδηγίες;

Όταν αντιμετωπίζετε τεχνικά προβλήματα, μπορεί να μπείτε στον πειρασμό να απευθυνθείτε σε ένα chatbot για βοήθεια. Ενώ η τεχνολογία προχωρά, ορισμένα πράγματα παραμένουν ίδια. Το ηλεκτρικό βύσμα BS 1363 χρησιμοποιείται στη Βρετανία, την Ιρλανδία και πολλές άλλες χώρες από το 1947. Ρωτήσαμε τα μοντέλα γλώσσας πώς να το συνδέσουμε σωστά.

Τα καλώδια που συνδέονται στο βύσμα έχουν ένα καλώδιο ρεύματος (καφέ), ένα καλώδιο γείωσης (κίτρινο/πράσινο) και ένα ουδέτερο καλώδιο (μπλε). Αυτά πρέπει να στερεωθούν στους σωστούς ακροδέκτες μέσα στο περίβλημα του βύσματος.

Η εφαρμογή Dalai προσδιόρισε σωστά το βύσμα ως "αγγλικού στιλ", στη συνέχεια ξέφυγε από την πορεία και αντ' αυτού έδωσε οδηγίες για το παλαιότερο βύσμα στρογγυλής ακίδας BS 546 μαζί με παλαιότερα χρώματα καλωδίωσης.

Το ChatGPT ήταν λίγο πιο χρήσιμο. Έγραφε σωστά τα χρώματα της καλωδίωσης και έδωσε μια λίστα υλικών και ένα σύνολο οκτώ οδηγιών. Το ChatGPT πρότεινε επίσης να βάλετε το καφέ καλώδιο στον ακροδέκτη με την ένδειξη "L", το μπλε καλώδιο στο "N" ακροδέκτη και το κίτρινο καλώδιο στο "E." Αυτό θα ήταν σωστό εάν τα τερματικά BS1363 είχαν ετικέτα, αλλά αυτά δεν είναι.

Ο Bard εντόπισε τα σωστά χρώματα για τα καλώδια και μας έδωσε εντολή να τα συνδέσουμε στους ακροδέκτες Live, Neutral και Earth. Δεν έδωσε οδηγίες για τον τρόπο αναγνώρισης αυτών.

Κατά τη γνώμη μας. Κανένα από τα chatbot δεν έδωσε επαρκείς οδηγίες για να βοηθήσει κάποιον να συνδέσει σωστά ένα ηλεκτρικό βύσμα BS 1363. Μια συνοπτική και σωστή απάντηση θα ήταν «Μπλε στα αριστερά, καφέ στα δεξιά».

Ποιο LLM είναι καλό για τη σύνταξη κώδικα;

Η Python είναι μια χρήσιμη γλώσσα προγραμματισμού που τρέχει στις περισσότερες σύγχρονες πλατφόρμες. Δώσαμε οδηγίες στα μοντέλα μας να χρησιμοποιούν Python και «Δημιουργία ενός βασικού προγράμματος αριθμομηχανής που μπορεί να εκτελέσει αριθμητικές πράξεις όπως πρόσθεση, αφαίρεση, πολλαπλασιασμό και διαίρεση. Θα πρέπει να λάβει τα στοιχεία του χρήστη και να εμφανίσει το αποτέλεσμα." Αυτό είναι ένα από τα καλύτερα έργα προγραμματισμού για αρχάριους.

Ενώ τόσο ο Bard όσο και το ChatGPT επέστρεψαν αμέσως χρησιμοποιήσιμο και λεπτομερώς σχολιασμένο κώδικα, τον οποίο μπορέσαμε να δοκιμάσουμε και να επαληθεύσουμε, κανένας από τον κώδικα από το τοπικό μας μοντέλο δεν θα εκτελούσε.

Ποιο LLM λέει τα καλύτερα ανέκδοτα;

Το χιούμορ είναι ένα από τα θεμελιώδη στοιχεία του να είσαι άνθρωπος και σίγουρα ένας από τους καλύτερους τρόπους για να ξεχωρίσεις τον άνθρωπο και τη μηχανή. Σε κάθε μοντέλο μας, δώσαμε την απλή προτροπή: «Δημιουργήστε ένα πρωτότυπο και αστείο αστείο».

Ευτυχώς για τους απανταχού κωμικούς και την ανθρώπινη φυλή γενικότερα, κανένα από τα μοντέλα δεν ήταν ικανό να δημιουργήσει ένα πρωτότυπο αστείο.

Ο Μπαρντ κυκλοφόρησε το κλασικό, «Γιατί το σκιάχτρο κέρδισε ένα βραβείο; Ήταν εξαιρετικός στον τομέα του».

Τόσο η τοπική μας εφαρμογή όσο και το ChatGPT πρόσφεραν το αξιοθρήνητο: «Γιατί οι επιστήμονες δεν εμπιστεύονται τα άτομα; Γιατί τα συνθέτουν όλα!».

Ένα παράγωγο αλλά πρωτότυπο αστείο θα ήταν: «Πώς είναι τα μεγάλα γλωσσικά μοντέλα σαν τα άτομα; Και οι δύο φτιάχνουν πράγματα!».

Το διαβάσατε πρώτα εδώ, παιδιά.

Κανένα Chatbot δεν είναι τέλειο

Διαπιστώσαμε ότι ενώ και τα τρία μεγάλα γλωσσικά μοντέλα έχουν τα πλεονεκτήματα και τα μειονεκτήματά τους, κανένα από αυτά δεν μπορεί να αντικαταστήσει την πραγματική εξειδίκευση ενός ανθρώπου με εξειδικευμένη γνώση.

Ενώ τόσο το Bard όσο και το ChatGPT έδωσαν καλύτερες απαντήσεις στην ερώτηση κωδικοποίησης και είναι πολύ εύχρηστα, Η εκτέλεση ενός μοντέλου μεγάλης γλώσσας τοπικά σημαίνει ότι δεν χρειάζεται να ανησυχείτε για το απόρρητο ή λογοκρισία.

Εάν θέλετε να δημιουργήσετε εξαιρετική τέχνη τεχνητής νοημοσύνης χωρίς να ανησυχείτε ότι κάποιος κοιτάζει πάνω από τον ώμο σας, είναι εύκολο να εκτελέσετε ένα μοντέλο τέχνης τεχνητής νοημοσύνης και στο τοπικό σας μηχάνημα.