Ενώ το ChatGPT είναι ένα από τα πιο δημοφιλή chatbot AI, μπορεί να μην είναι πλέον το καλύτερο. Το Claude AI προσφέρει ορισμένες δυνατότητες που ξεπερνούν το GPT. Αλλά ποιο είναι καλύτερο;
Από την κυκλοφορία του τον Νοέμβριο του 2022, το ChatGPT παραμένει η κυρίαρχη δύναμη στον χώρο chatbot της AI. Παρά τις εκτεταμένες προσπάθειες πολλών εταιρειών τεχνητής νοημοσύνης, κανείς δεν μπόρεσε πραγματικά να δημιουργήσει ένα chatbot που πραγματικά προκαλεί το ChatGPT στη συνολική ποιότητα απόκρισης. Ο Βάρδος της Google; Το Bing AI της Microsoft; Οχι δεν είναι πραγματικά.
Ωστόσο, το Claude AI, ένα chatbot που δημιουργήθηκε από την εκκίνηση AI Anthropic, δείχνει τις ιδιότητες ενός chatbot που μπορεί να εκθρονίσει το ChatGPT. Ένας σημαντικός αριθμός χρηστών λένε ήδη ότι ο Claude είναι η καλύτερη επιλογή. Είναι όμως έτσι τα πράγματα; Ας πάρουμε και τα δύο chatbot για μια περιστροφή.
ChatGPT vs. Claude AI: Common-Sense and Logical Reasoning
Υπάρχει μια ενδιαφέρουσα αντίθεση όταν εργάζεστε με chatbots AI. Από τη μία πλευρά, μπορούν να ξεπεράσουν πολύπλοκες εργασίες που οι άνθρωποι μπορεί να κοπιάσουν για μέρες για να λύσουν. Από την άλλη πλευρά, μερικές φορές παλεύουν με στοιχειώδη προβλήματα που απαιτούν μόνο λίγη κοινή λογική ή λογική λογική. Έτσι, δοκιμάσαμε τόσο το ChatGPT όσο και το Claude AI για να δούμε ποιο chatbot AI ήταν καλύτερο σε εργασίες κοινής λογικής και λογικής συλλογιστικής.
Το ChatGPT χώρισε το πρόβλημα σε κομμάτια και το έλυσε με την πρώτη προσπάθεια. Ο Claude AI τα κατάφερε επίσης και έλυσε το πρόβλημα, αλλά με διαφορετική προσέγγιση.
Για την πρώτη εργασία, και τα δύο chatbots κατάφεραν να λύσουν το πρόβλημα. Έτσι, προχωρήσαμε σε άλλου είδους πρόβλημα. Αναθέσαμε και στα δύο chatbots να απαντήσουν σε μια ερώτηση κόλπο.
Το ChatGPT μπόρεσε να εντοπίσει αμέσως το κόλπο - δεν μπορείτε να θάψετε τους επιζώντες επειδή δεν είναι νεκροί. Ο Claude AI, από την άλλη πλευρά, φαινόταν να καταλαβαίνει ότι ήταν μια ερώτηση τέχνασμα, αλλά δεν κατάφερε να εντοπίσει το πιο συνηθισμένο ζήτημα που δεν θάβετε τους επιζώντες.
Αντίθετα, ανέλυσε υπερβολικά την ερώτηση και κατέληξε στο συμπέρασμα ότι «δεν θα υπήρχαν επιζώντες για να ταφούν», επειδή η συντριβή από τον Άρη στη Γη θα ήταν μοιραία. Δεν είναι η απάντηση που περιμέναμε, αλλά αν δεις τα πράγματα από διαφορετική οπτική γωνία, υπάρχει κάποια αλήθεια σε αυτό.
Σε αυτήν την εργασία, το δίνουμε στο ChatGPT, αλλά δεν μπορούμε να αποκλείσουμε εντελώς την προσέγγιση του Claude AI. Για την τελική μας εργασία σε αυτήν τη μέτρηση, ρωτήσαμε και τα δύο chatbot πόσα μήλα θα έμεναν σε μια μηλιά μετά από πέντε και 10 ημέρες αντίστοιχα, αν ξεκινούσαμε με 10 μήλα και πέντε από αυτά κόπηκαν σε φέτες όσο ήταν ακόμα στο δέντρο. Το ChatGPT είπε ότι θα απομένουν ακόμα 10 μήλα.
Ο Claude AI, από την άλλη πλευρά, έδωσε μια πιο κοινή λογική απάντηση αναγνωρίζοντας ότι τα πέντε μήλα σε φέτες είναι πιθανό να σαπίσουν.
Ο Claude AI το πήρε ξεκάθαρα. Δοκιμάσαμε μερικά ακόμη δύσκολα προβλήματα και και τα δύο chatbots είχαν ένα μερίδιο επιτυχιών και αποτυχιών στην αντιμετώπισή τους. Λαμβάνοντας υπόψη το αποτέλεσμα που παρατηρήσαμε, θα ήταν δίκαιο να πούμε ότι ενώ το ChatGPT έχει ένα πλεονέκτημα, και τα δύο chatbot δεν απέχουν πολύ μεταξύ τους στην κοινή λογική και τις ικανότητες λογικής συλλογιστικής.
ChatGPT vs. Claude AI: Math Skills
Ακόμα κι αν δεν σκοπεύετε ποτέ να χρησιμοποιήσετε το ChatGPT ή το Claude AI για να λύσετε την εργασία σας στην Άλγεβρα, οι μαθηματικές τους ικανότητες έχουν εκτεταμένες επιπτώσεις. Για τα chatbots τεχνητής νοημοσύνης, τα μαθηματικά είναι το κλειδί για την κατανόηση της λογικής του πραγματικού κόσμου, τον εντοπισμό ελαττωματικών σκέψεων και την παραδοχή λαθών.
Ουσιαστικά, η επάρκεια στα μαθηματικά είναι μια βασική μέτρηση της τεχνητής νοημοσύνης. Λοιπόν, μεταξύ ChatGPT και Claude AI, ποιο chatbot είναι πιο ικανό στα μαθηματικά; Αναθέσαμε και στα δύο chatbots να λύσουν ένα περιστροφικό μαθηματικό πρόβλημα παραγωγικότητας. Ξεκινήσαμε με τον Claude AI και το chatbot έλυσε το πρόβλημα.
Το ChatGPT έσπασε επίσης το πρόβλημα.
Προχωρώντας, ζητήσαμε να λύσουν και τα δύο chatbot 8/α-1 = 20/3α-1, ένα αρκετά απλό μαθηματικό πρόβλημα με ένα εκπληκτικά υψηλό ποσοστό αποτυχίας μεταξύ των chatbot AI. Το ChatGPT μπόρεσε να το λύσει, παρέχοντας μια σωστή απάντηση -3 στην πρώτη προσπάθεια.
Ο Claude AI απέτυχε στην πρώτη προσπάθεια, αλλά όταν του ζητήσαμε να λύσει το πρόβλημα βήμα προς βήμα (πράγμα που τον αναγκάζει να σκεφτεί κάθε βήμα της λογικής του), κατάφερε να το σπάσει.
Δοκιμάσαμε μερικά ακόμη μαθηματικά προβλήματα. Ενώ και τα δύο chatbot τα κατάφεραν σωστά με την πρώτη προσπάθεια σε ορισμένες περιπτώσεις, σε αρκετές περιπτώσεις, ο Claude AI χρειαζόταν μια δεύτερη ή τρίτη προσπάθεια για να παράσχει τη σωστή απάντηση. Όσον αφορά τις μαθηματικές δεξιότητες, θα δώσουμε το στέμμα στο ChatGPT.
ChatGPT vs. Claude AI: Δημιουργικότητα
Ένα από τα μεγαλύτερα διαφημιστικά κύματα του Claude AI είναι οι δημιουργικές του ικανότητες. Μπορεί όμως να ταιριάζει με τη δημιουργικότητα του ChatGPT; Ή, θα μπορούσε ενδεχομένως να ξεπεράσει το ChatGPT; Για να δοκιμάσουμε και τα δύο chatbot, τους αναθέσαμε να γράψουν στίχους για ένα ραπ τραγούδι που έχει ομοιοκαταληξία.
Επιλέξαμε ένα τεστ ραπ με ομοιοκαταληξία γιατί είναι κάτι με το οποίο παλεύουν πολλά γλωσσικά μοντέλα. Τα περισσότερα μοντέλα συνήθως δεν παίρνουν τη σωστή ομοιοκαταληξία ή τη σωστή ομοιοκαταληξία, ενώ οι ίδιοι οι στίχοι δεν έχουν νόημα. Για να γίνουν τα πράγματα πιο ενδιαφέροντα, το τραγούδι ραπ θα αφορά την καλλιέργεια αγγουριών.
Έτσι, ζητήσαμε από το ChatGPT και τον Claude AI να "γράψουν ένα ραπ με ομοιοκαταληξία για την καλλιέργεια αγγουριών ως αγρότης και έγινε εκατομμυριούχος από αυτό." στίχοι.
Στη συνέχεια δώσαμε την ίδια προτροπή στον Claude AI, και του έδωσε επίσης μια καλή ευκαιρία.
Και οι δύο στίχοι είναι καλοί, αλλά το ChatGPT φαινόταν να έχει ένα πλεονέκτημα εδώ. Είχε καλύτερη ομοιοκαταληξία και είχαμε το αποτέλεσμα που χρειαζόμασταν στην πρώτη δοκιμή. Χρειάστηκε να προσπαθήσουμε τρεις φορές προτού ο Claude AI μπορέσει να δημιουργήσει στίχους με ομοιοκαταληξία. Θα το δώσουμε στο ChatGPT.
Αφού δοκίμασε μερικές ακόμη δημιουργικές εργασίες, ο Claude AI φαινόταν να υπερέχει σε εργασίες που σχετίζονται με τη γραφή και ήταν σε θέση να γράψει περιεχόμενο με πιο φυσικό ήχο όπως θα έκανε ένας άνθρωπος συγγραφέας. Αν και Το ChatGPT ήταν καλύτερο στο να ξεπερνά πιο περίπλοκες δημιουργικές εργασίες, μερικές φορές δεν μπορούσε να αποτινάξει την αίσθηση του chatbot AI στο κείμενο που δημιούργησε. Η ετυμηγορία μας; Τόσο το ChatGPT όσο και το Claude AI είναι δημιουργικά από μόνα τους.
ChatGPT vs. Claude AI: Coding Skills
Ακριβώς όπως οι δεξιότητες στα μαθηματικά, οι δεξιότητες κωδικοποίησης είναι μια άλλη πολύ σημαντική μέτρηση για την κρίση των ικανοτήτων ενός chatbot AI. Ενώ η πλειοψηφία των χρηστών πιθανότατα δεν θα το κάνει ποτέ χρησιμοποιήστε ένα chatbot για κωδικοποίηση, υπάρχουν σημαντικές υποκείμενες συνέπειες για τις ικανότητες ενός chatbot να γράφει και να κατανοεί σωστά τον κώδικα.
Ενώ τα chatbots είναι επί του παρόντος εξελιγμένα, απέχουν πολύ από αυτό που θα μπορούσαν πραγματικά να γίνουν εάν και όταν είναι σε θέση να γράφουν σωστά τον κώδικα. Για να εξελιχθούν πραγματικά τα chatbot AI σε ισχυρούς βοηθούς τεχνητής νοημοσύνης που μπορούν να κάνουν περισσότερα από τη δημιουργία κειμένου, πρέπει να μπορούν να γράφουν κώδικα που λύνει προβλήματα κατά παραγγελία. Έχουμε συζητήσει προηγουμένως πόσο σημαντικές είναι οι δεξιότητες κωδικοποίησης για τα chatbot AI στο δικό μας Επεξήγηση του Διερμηνέα Κώδικα ChatGPT.
Τούτου λεχθέντος, τοποθετήσαμε και τα δύο chatbot σε δύο εργασίες κωδικοποίησης. Ζητήσαμε από το ChatGPT και τον Claude AI να γράψουν λειτουργικό κώδικα για μια εφαρμογή λίστας υποχρεώσεων. Ξεκινώντας με το ChatGPT, το chatbot AI ήταν σε θέση να προσφέρει μια λειτουργική εφαρμογή λίστας υποχρεώσεων με την πρώτη προσπάθεια. Το αντιγράψαμε και το τρέξαμε σε πρόγραμμα περιήγησης και λειτούργησε τέλεια χωρίς σφάλματα. Εδώ είναι η έξοδος σε ένα πρόγραμμα περιήγησης.
Προχωρώντας στο Claude AI, το chatbot έγραψε σαφώς κατανοητό κώδικα. Η δομή και η λογική όλα φαίνονταν καλά. Δυστυχώς, παρά τις επανειλημμένες προσπάθειες, ο Claude AI συνέχιζε να χάνει κάποια κρίσιμη λογική για να κάνει τον κώδικα να εκτελείται πραγματικά σε ένα πρόγραμμα περιήγησης. Είναι μια αποτυχία σε αυτό.
Αφού ο Claude AI απέτυχε στην τελευταία δοκιμή, δοκιμάσαμε ένα διαφορετικό είδος εργασίας κωδικοποίησης, που αφορούσε περισσότερο την ανάλυση κώδικα και λιγότερο τη σύνταξη νέου κώδικα. Ανεβάσαμε πέντε αρχεία PHP που αντιπροσωπεύουν το πλήρες backend για έναν ιστότοπο και ρωτήσαμε τόσο τον Claude AI όσο και το ChatGPT όπου θα πρέπει να επεξεργαστούμε όλα τα μεταφορτωμένα αρχεία για να διασφαλίσουμε ότι θα λάβουμε ένα μήνυμα όταν ένας νέος χρήστης εγγραφεί στο ιστοσελίδα.
Παραδόξως, το ChatGPT, παρόλο που φαινομενικά είχε ανώτερες δεξιότητες κωδικοποίησης, απέτυχε σε αυτό παρά τις επανειλημμένες προσπάθειες. Ο Claude AI, από την άλλη πλευρά, ήταν σε θέση να αναλύσει τον κώδικα με επιδεξιότητα, ενώ εντόπισε τα σωστά μέρη που έπρεπε να επεξεργαστούν για να επιτευχθούν τα επιθυμητά αποτελέσματα.
Φυσικά, αυτή δεν ήταν μια μεμονωμένη περίπτωση, το επαναλάβαμε με πολλά άλλα αρχεία κώδικα, αλλά το ChatGPT σκόνταψε και σταμάτησε στην πλειονότητα των περιπτώσεων, ενώ ο Claude AI συνέχιζε να προσφέρει εντυπωσιακά αποτελέσματα. Όσον αφορά τις δεξιότητες κωδικοποίησης, ο νικητής δεν είναι εντελώς απλός.
Το ChatGPT είναι σαφώς πολύ καλύτερο στη σύνταξη νέου κώδικα και μπορεί να διαχειριστεί πολύπλοκο κώδικα με εντυπωσιακή επάρκεια. Ωστόσο, ο Claude AI είναι σημαντικά καλύτερος στην ανάλυση μεγάλων βάσεων κώδικα. Έτσι, αν θέλετε να γράψετε κώδικα για κάποια νέα ιδέα που έχετε, το ChatGPT είναι το εργαλείο στο οποίο μπορείτε να στραφείτε. Αν θέλετε να αναλύσετε ή να κατανοήσετε μια βάση κώδικα με χιλιάδες γραμμές σε πολλά αρχεία, τότε σίγουρα θα συνιστούσαμε το Claude AI.
Ο Claude AI είναι ένας ισχυρός ανταγωνιστής στο μπλοκ
Το Claude AI αντιπροσωπεύει έναν ισχυρό ανταγωνισμό για το ChatGPT -- έναν που μπορεί να ανταγωνιστεί και ενδεχομένως να ξεπεράσει το ChatGPT κάποια μέρα. Δεδομένου ότι ο Claude είναι ένα σχετικά νέο μοντέλο τεχνητής νοημοσύνης, είναι αξιοζήλευτο ότι μπορεί να αντιμετωπίσει το ChatGPT με τον τρόπο που κάνει αυτή τη στιγμή. Η εμφάνιση του Claude AI και η ποιότητα που προσφέρει απόδειξη ότι ο ανταγωνισμός θερμαίνεται.