Ανακαλύψτε τη δύναμη του API του OpenAI και όλες τις δυνατότητες που δίνει.
Η παραγωγική δύναμη του ChatGPT έχει προκαλέσει φρενίτιδα στον κόσμο της τεχνολογίας από τότε που κυκλοφόρησε. Για να μοιραστεί τη διαίσθηση του AI, το OpenAI κυκλοφόρησε τα ChatGPT και Whisper API την 1η Μαρτίου 2023, προκειμένου οι προγραμματιστές να εξερευνήσουν και να καταναλώσουν εντός εφαρμογής.
Τα API του OpenAI διαθέτουν πολλά πολύτιμα τελικά σημεία που κάνουν την ενσωμάτωση της τεχνητής νοημοσύνης εύκολη. Ας εξερευνήσουμε τη δύναμη των OpenAI API για να δούμε πώς μπορούν να σας ωφελήσουν.
Τι μπορεί να κάνει το OpenAI API;
ο OpenAI API πακέτα σε μια δέσμη βοηθητικών προγραμμάτων για προγραμματιστές. Εάν σκοπεύετε να παρέχετε καθημερινά AI εντός εφαρμογής, το OpenAI θα κάνει τη ζωή σας πιο εύκολη με τις ακόλουθες ικανότητες.
Κουβέντα
Το τελικό σημείο ολοκλήρωσης συνομιλίας OpenAI API βοηθά τον τελικό χρήστη να δημιουργήσει μια φυσική, φιλική προς τον άνθρωπο διαδραστική περίοδο λειτουργίας με έναν εικονικό βοηθό χρησιμοποιώντας το μοντέλο GPT-3.5-turbo.
Στα παρασκήνια, η κλήση API χρησιμοποιεί μια σειρά μηνυμάτων ρόλων και περιεχομένου. Από την πλευρά του χρήστη, το περιεχόμενο είναι ένα σύνολο οδηγιών για τον εικονικό βοηθό, που προσελκύει τον χρήστη, ενώ για το μοντέλο, το περιεχόμενο είναι η απάντησή του.
Ο ρόλος ανώτατου επιπέδου είναι το σύστημα, όπου ορίζετε τη συνολική λειτουργία του εικονικού βοηθού. Για παράδειγμα, όταν ο προγραμματιστής λέει στο σύστημα κάτι σαν "είσαι ένας χρήσιμος εικονικός βοηθός", αναμένετε να απαντήσει σε διάφορες ερωτήσεις εντός της μαθησιακής του ικανότητας.
Αφού του είπαμε ότι είναι "ένας χρήσιμος εικονικός βοηθός", δείτε πώς πήγε μια από τις συνομιλίες μας στη γραμμή εντολών με το μοντέλο GPT-3.5-turbo:
Μπορείτε ακόμη να βελτιώσετε την απόδοση του μοντέλου παρέχοντας παραμέτρους όπως θερμοκρασία, ποινή παρουσίας, ποινή συχνότητας και άλλα. Εάν έχετε χρησιμοποιήσει ποτέ το ChatGPT, γνωρίζετε ήδη πώς λειτουργεί το μοντέλο ολοκλήρωσης συνομιλίας του OpenAI.
Συμπλήρωση κειμένου
Το API συμπλήρωσης κειμένου παρέχει λειτουργίες συνομιλίας, εισαγωγής κειμένου και συμπλήρωσης κειμένου που βασίζονται σε προηγμένα μοντέλα GPT-3.5.
Το μοντέλο πρωταθλητή στο τελικό σημείο ολοκλήρωσης κειμένου είναι το text-davinci-003, το οποίο είναι πολύ πιο διαισθητικό από τα μοντέλα φυσικής γλώσσας GPT-3. Το τελικό σημείο δέχεται μια προτροπή χρήστη, επιτρέποντας στο μοντέλο να ανταποκρίνεται φυσικά και να συμπληρώνει απλές έως πολύπλοκες προτάσεις χρησιμοποιώντας κείμενο φιλικό προς τον άνθρωπο.
Αν και το τελικό σημείο ολοκλήρωσης κειμένου δεν είναι τόσο διαισθητικό όσο το τελικό σημείο συνομιλίας, γίνεται καλύτερο—καθώς αυξάνετε τα διακριτικά κειμένου που παρέχονται στο μοντέλο text-davinci-003.
Για παράδειγμα, είχαμε κάποιες μισοψημένες ολοκληρώσεις όταν τοποθετήσαμε το μοντέλο σε max_tokens των επτά:
Ωστόσο, η αύξηση των max_tokens σε 70 δημιούργησε πιο συνεκτικές σκέψεις:
Ομιλία σε κείμενο
Μπορείτε να μεταγράψετε και να μεταφράσετε ηχητική ομιλία χρησιμοποιώντας τα τελικά σημεία μεταγραφής και μετάφρασης OpenAI. Τα τελικά σημεία ομιλίας σε κείμενο βασίζονται στο μοντέλο Whisper v2-large, που αναπτύχθηκε μέσω αδύναμης εποπτείας μεγάλης κλίμακας.
Ωστόσο, το OpenAI λέει ότι δεν υπάρχει διαφορά μεταξύ του μοντέλου Whisper και αυτού του ανοιχτού κώδικα. Έτσι, προσφέρει ατελείωτες ευκαιρίες για την ενσωμάτωση ενός πολυγλωσσικού μεταγραφέα και μεταφραστή AI στην εφαρμογή σας σε κλίμακα.
Η χρήση του τελικού σημείου είναι απλή. Το μόνο που έχετε να κάνετε είναι να δώσετε στο μοντέλο ένα αρχείο ήχου και να καλέσετε το openai. Ήχος.μετάφραση ή openai. Ήχος.μεταγραφή τελικό σημείο για να το μεταφράσετε ή να το μεταγράψετε αντίστοιχα. Αυτά τα τελικά σημεία δέχονται μέγιστο μέγεθος αρχείου 25 MB και υποστηρίζουν τους περισσότερους τύπους αρχείων ήχου, συμπεριλαμβανομένων των mp3, mp4, MPEG, MPGA, m4a, wav και webm.
Σύγκριση κειμένου
Το τελικό σημείο σύγκρισης κειμένου OpenAI API μετρά τη σχέση μεταξύ κειμένων χρησιμοποιώντας το μοντέλο text-embedding-ada-002, ένα μοντέλο ενσωμάτωσης δεύτερης γενιάς. Το API ενσωμάτωσης χρησιμοποιεί αυτό το μοντέλο για να αξιολογήσει τη σχέση μεταξύ κειμένων με βάση την απόσταση μεταξύ δύο διανυσματικών σημείων. Όσο μεγαλύτερη είναι η διαφορά, τόσο λιγότερο σχετικά είναι τα υπό σύγκριση κείμενα.
Το τελικό σημείο ενσωμάτωσης περιλαμβάνει ομαδοποίηση κειμένου, διαφορές, συνάφεια, προτάσεις, συναισθήματα και ταξινόμηση. Επιπλέον, χρεώνει ανά τόμο συμβολικού.
Αν και η τεκμηρίωση του OpenAI λέει ότι μπορείτε να χρησιμοποιήσετε τα άλλα μοντέλα ενσωμάτωσης πρώτης γενιάς, το πρώτο είναι καλύτερο με φθηνότερη τιμή. Ωστόσο, το OpenAI προειδοποιεί ότι το μοντέλο ενσωμάτωσης μπορεί να δείξει κοινωνική προκατάληψη προς ορισμένα άτομα, όπως αποδεικνύεται σε δοκιμές.
Συμπλήρωση κώδικα
Το τελικό σημείο ολοκλήρωσης κώδικα βασίζεται στον OpenAI Codex, ένα σύνολο μοντέλων που εκπαιδεύονται χρησιμοποιώντας φυσική γλώσσα και δισεκατομμύρια γραμμές κώδικα από δημόσια αποθετήρια.
Το τελικό σημείο είναι σε περιορισμένη έκδοση beta και δωρεάν από τη στιγμή της γραφής, προσφέροντας υποστήριξη για πολλές σύγχρονες γλώσσες προγραμματισμού, συμπεριλαμβανομένων των JavaScript, Python, Go, PHP, Ruby, Shell, TypeScript, Swift, Perl και SQL.
Με το μοντέλο code-davinci-002 ή code-cushman-001, το τελικό σημείο ολοκλήρωσης κώδικα μπορεί να εισάγει αυτόματα γραμμές κώδικα ή να περιστρέφει μπλοκ κώδικα από το μήνυμα προτροπής ενός χρήστη. Ενώ το τελευταίο μοντέλο είναι πιο γρήγορο, το πρώτο είναι η δύναμη του τελικού σημείου, καθώς διαθέτει εισαγωγές κώδικα για αυτόματη συμπλήρωση κώδικα.
Για παράδειγμα, μπορείτε να δημιουργήσετε ένα μπλοκ κώδικα στέλνοντας μια προτροπή στο τελικό σημείο στο σχόλιο της γλώσσας προορισμού.
Ακολουθούν ορισμένες απαντήσεις που λάβαμε όταν προσπαθήσαμε να δημιουργήσουμε ορισμένα μπλοκ κώδικα σε Python και JavaScript μέσω του τερματικού:
Δημιουργία εικόνων
Αυτό είναι ένα από τα πιο διαισθητικά χαρακτηριστικά του OpenAI API. Με βάση το μοντέλο εικόνας DALL.E, η λειτουργικότητα εικόνας του OpenAI API διαθέτει τελικά σημεία για τη δημιουργία, την επεξεργασία και τη δημιουργία παραλλαγών εικόνας από προτροπές φυσικής γλώσσας.
Παρόλο που δεν διαθέτει ακόμη προηγμένες δυνατότητες όπως η αναβάθμιση, καθώς είναι ακόμα σε έκδοση beta, οι μη κλιμακωμένες έξοδοί του είναι πιο εντυπωσιακές από αυτές του παραγωγικού μοντέλα τέχνης όπως το Midjourney και Σταθερή Διάχυση.
Ενώ βρίσκεστε στο τελικό σημείο δημιουργίας εικόνας, χρειάζεται μόνο να δώσετε ένα μήνυμα προτροπής, το μέγεθος εικόνας και τον αριθμό εικόνων. Αλλά το τελικό σημείο επεξεργασίας εικόνας απαιτεί να συμπεριλάβετε την εικόνα που θέλετε να επεξεργαστείτε και μια μάσκα RGBA που επισημαίνει το σημείο επεξεργασίας εκτός από τις άλλες παραμέτρους.
Το τελικό σημείο παραλλαγής, από την άλλη πλευρά, απαιτεί μόνο την εικόνα-στόχο, τον αριθμό παραλλαγών και το μέγεθος εξόδου. Κατά τη στιγμή της γραφής, τα τελικά σημεία εικόνων beta του OpenAI μπορούν να δέχονται μόνο τετράγωνα πλαίσια στην περιοχή 256x256, 512x512 και 1024x1024 pixel.
Δημιουργήσαμε μια απλή εφαρμογή δημιουργίας εικόνων χρησιμοποιώντας αυτό το τελικό σημείο, και παρόλο που έχασε κάποιες λεπτομέρειες, έδωσε ένα απίστευτο αποτέλεσμα:
Πώς να χρησιμοποιήσετε το OpenAI API
Η χρήση του OpenAI API είναι απλή και ακολουθεί το συμβατικό μοτίβο κατανάλωσης API.
- Εγκαταστήστε το openai πακέτο με χρήση pip: pip εγκατάσταση openai.Εάν χρησιμοποιείτε το Node, μπορείτε να το κάνετε χρησιμοποιώντας το npm: npm εγκατάσταση openai.
- Πιάστε τα κλειδιά API σας: Συνδεθείτε στον πίνακα ελέγχου OpenAI και κάντε κλικ στο εικονίδιο του προφίλ σας επάνω δεξιά. Παω σε Προβολή κλειδιών API και κάντε κλικ Δημιουργήστε νέο μυστικό κλειδί για να δημιουργήσετε το μυστικό κλειδί API σας.
- Πραγματοποιήστε κλήσεις API στα τελικά σημεία του μοντέλου που έχετε επιλέξει μέσω μιας γλώσσας διακομιστή, όπως η Python ή η JavaScript (Node). Τροφοδοτήστε τα στα προσαρμοσμένα API σας και δοκιμάστε τα τελικά σημεία σας.
- Επειτα ανάκτηση προσαρμοσμένων API μέσω JavaScript πλαίσια όπως το React, το Vue ή το Angular.
- Παρουσιάστε δεδομένα (αιτήματα χρηστών και αποκρίσεις μοντέλου) σε μια οπτικά ελκυστική διεπαφή χρήστη και η εφαρμογή σας είναι έτοιμη για χρήση σε πραγματικό κόσμο.
Τι μπορείτε να δημιουργήσετε με το OpenAI API;
Τα OpenAI API δημιουργούν σημεία εισόδου για την πραγματική χρήση της μηχανικής μάθησης και της ενισχυτικής μάθησης. Αν και υπάρχουν πολλές ευκαιρίες για δημιουργικότητα, εδώ είναι μερικά από αυτά που μπορείτε να δημιουργήσετε με τα OpenAI API:
- Ενσωματώστε ένα διαισθητικό εικονικό βοηθό chatbot στον ιστότοπο ή την εφαρμογή σας χρησιμοποιώντας το τελικό σημείο ολοκλήρωσης συνομιλίας.
- Δημιουργήστε μια εφαρμογή επεξεργασίας και χειρισμού εικόνας που μπορεί φυσικά να εισάγει ένα αντικείμενο σε μια εικόνα σε οποιοδήποτε καθορισμένο σημείο χρησιμοποιώντας τα τελικά σημεία δημιουργίας εικόνας.
- Δημιουργήστε ένα προσαρμοσμένο μοντέλο μηχανικής εκμάθησης από την αρχή χρησιμοποιώντας το τελικό σημείο τελειοποίησης του μοντέλου του OpenAI.
- Διορθώστε υπότιτλους και μεταφράσεις για βίντεο, ήχο και ζωντανές συνομιλίες χρησιμοποιώντας το τελικό σημείο του μοντέλου ομιλίας σε κείμενο.
- Προσδιορίστε τα αρνητικά συναισθήματα στην εφαρμογή σας χρησιμοποιώντας το τελικό σημείο του μοντέλου ενσωμάτωσης OpenAI.
- Δημιουργήστε πρόσθετα συμπλήρωσης κώδικα για συγκεκριμένες γλώσσες προγραμματισμού για επεξεργαστές κώδικα και ολοκληρωμένα περιβάλλοντα ανάπτυξης (IDE).
Δημιουργήστε ατελείωτα με τα OpenAI API
Η καθημερινή μας επικοινωνία συχνά περιλαμβάνει την ανταλλαγή γραπτού περιεχομένου. Το OpenAI API επεκτείνει μόνο τις δημιουργικές του τάσεις και τις δυνατότητές του, με φαινομενικά απεριόριστες περιπτώσεις χρήσης φυσικής γλώσσας.
Είναι ακόμη νωρίς για το OpenAI API. Αλλά περιμένετε να εξελίσσεται με περισσότερες δυνατότητες όσο περνάει ο καιρός.