Θέλετε να παρέχετε στο ChatGPT τα προσαρμοσμένα δεδομένα σας; Εδώ είναι ένα βήμα προς βήμα για το πώς να το κάνετε αυτό!

Παρέχοντας τεχνολογία GPT σε ένα ισχυρό και εύχρηστο chatbot, το ChatGPT έχει γίνει το πιο δημοφιλές εργαλείο AI στον κόσμο. Πολλοί άνθρωποι χρησιμοποιούν το ChatGPT για να παρέχουν συναρπαστικές συνομιλίες, να απαντούν σε ερωτήματα, να προσφέρουν δημιουργικές προτάσεις και να βοηθούν στην κωδικοποίηση και τη γραφή. Ωστόσο, το ChatGPT είναι περιορισμένο καθώς δεν μπορείτε να αποθηκεύσετε τα δεδομένα σας για μακροπρόθεσμη προσωπική χρήση και το σημείο αποκοπής δεδομένων γνώσης του Σεπτεμβρίου 2021.

Ως λύση, μπορούμε να χρησιμοποιήσουμε το API του OpenAI και το LangChain για να παρέχουμε στο ChatGPT προσαρμοσμένα δεδομένα και ενημερωμένες πληροφορίες μετά το 2021 για να δημιουργήσουμε μια προσαρμοσμένη παρουσία ChatGPT.

Γιατί να παρέχετε στο ChatGPT προσαρμοσμένα δεδομένα;

Η τροφοδοσία του ChatGPT με προσαρμοσμένα δεδομένα και η παροχή ενημερωμένων πληροφοριών πέρα ​​από την ημερομηνία λήξης της γνώσης παρέχει πολλά οφέλη από τη χρήση του ChatGPT ως συνήθως. Εδώ είναι μερικά από αυτά:

  • Εξατομικευμένες αλληλεπιδράσεις: Παρέχοντας προσαρμοσμένα δεδομένα στο ChatGPT, οι χρήστες μπορούν να δημιουργήσουν μια πιο προσαρμοσμένη εμπειρία. Το μοντέλο μπορεί να εκπαιδευτεί σε συγκεκριμένα σύνολα δεδομένων που σχετίζονται με μεμονωμένους χρήστες ή οργανισμούς, με αποτέλεσμα απαντήσεις προσαρμοσμένες στις μοναδικές ανάγκες και προτιμήσεις τους.
  • Εμπειρογνωμοσύνη σε συγκεκριμένο τομέα: Η προσαρμοσμένη ενοποίηση δεδομένων επιτρέπει στο ChatGPT να εξειδικεύεται σε συγκεκριμένους τομείς ή κλάδους. Μπορεί να εκπαιδευτεί σε ειδικές γνώσεις, ορολογία και τάσεις του κλάδου, επιτρέποντας πιο ακριβείς και διορατικές απαντήσεις σε αυτούς τους συγκεκριμένους τομείς.
  • Τρέχουσες και ακριβείς πληροφορίες: Η πρόσβαση σε ενημερωμένες πληροφορίες διασφαλίζει ότι το ChatGPT παραμένει ενημερωμένο με τις τελευταίες εξελίξεις και γνώσεις. Μπορεί να παρέχει ακριβείς απαντήσεις με βάση πρόσφατα γεγονότα, ειδήσεις ή έρευνες, καθιστώντας το μια πιο αξιόπιστη πηγή πληροφοριών.

Τώρα που καταλαβαίνετε τη σημασία της παροχής προσαρμοσμένων δεδομένων στο ChatGPT, ακολουθεί βήμα προς βήμα πώς να το κάνετε στον τοπικό σας υπολογιστή.

Βήμα 1: Εγκατάσταση και λήψη λογισμικού και προκατασκευασμένου σεναρίου

Λάβετε υπόψη ότι οι παρακάτω οδηγίες αφορούν μηχανήματα Windows 10 ή Windows 11.

Για να παρέχετε προσαρμοσμένα δεδομένα στο ChatGPT, θα πρέπει να εγκαταστήσετε και να κατεβάσετε τα πιο πρόσφατα Python3, Git, Microsoft C++ και το σενάριο ανάκτησης ChatGPT από το GitHub. Εάν έχετε ήδη εγκατεστημένο μέρος του λογισμικού στον υπολογιστή σας, βεβαιωθείτε ότι είναι ενημερωμένο με την πιο πρόσφατη έκδοση για να αποφύγετε τυχόν λόξυγκα κατά τη διαδικασία.

Ξεκινήστε εγκαθιστώντας:

  • Κατεβάστε:Python3 (Ελεύθερος)
  • Κατεβάστε:Git (Ελεύθερος)
  • Κατεβάστε:Microsoft Visual Build Tools (Ελεύθερος)

Σημειώσεις εγκατάστασης Python3 και Microsoft C++

Κατά την εγκατάσταση της Python3, βεβαιωθείτε ότι έχετε σημειώσει το Προσθέστε το python.exe στο PATH επιλογή πριν κάνετε κλικ Εγκατάσταση τώρα. Αυτό είναι σημαντικό καθώς σας επιτρέπει να έχετε πρόσβαση στην Python σε οποιονδήποτε κατάλογο στον υπολογιστή σας.

Κατά την εγκατάσταση του Microsoft C++, θα θέλετε να το εγκαταστήσετε Εργαλεία δημιουργίας Microsoft Visual Studio πρώτα. Μόλις εγκατασταθεί, μπορείτε να επιλέξετε το Ανάπτυξη επιτραπέζιου υπολογιστή με C++ επιλογή και κάντε κλικ Εγκαθιστώ με όλα τα προαιρετικά εργαλεία αυτόματα στη δεξιά πλαϊνή γραμμή.

Τώρα που έχετε εγκαταστήσει τις πιο πρόσφατες εκδόσεις των Python3, Git και Microsoft C++, μπορείτε να κάνετε λήψη του σεναρίου Python για να υποβάλετε εύκολα ερωτήματα σε προσαρμοσμένα τοπικά δεδομένα.

Κατεβάστε: ChatGPT-σενάριο ανάκτησης (Ελεύθερος)

Για να κατεβάσετε το σενάριο, κάντε κλικ στο Κώδικας, στη συνέχεια επιλέξτε Λήψη ZIP. Αυτό θα πρέπει να κατεβάσει το σενάριο Python στον προεπιλεγμένο ή στον επιλεγμένο κατάλογο.

Μετά τη λήψη, μπορούμε πλέον να δημιουργήσουμε ένα τοπικό περιβάλλον.

Βήμα 2: Ρύθμιση του τοπικού περιβάλλοντος

Για να ρυθμίσετε το περιβάλλον, θα χρειαστεί να ανοίξετε ένα τερματικό στον κύριο φάκελο chatgpt-retrieval-main που κατεβάσατε. Για να το κάνετε αυτό, ανοίξτε chatgpt-retrieval-main φάκελο, κάντε δεξί κλικ και επιλέξτε Άνοιγμα στο τερματικό.

Μόλις ανοίξει το τερματικό, αντιγράψτε και επικολλήστε αυτήν την εντολή:

pip install langchain openai chromadb tiktoken unstructured

Αυτή η εντολή χρησιμοποιεί τον διαχειριστή πακέτων της Python για να δημιουργία και διαχείριση του εικονικού περιβάλλοντος Python απαιτείται.

Μετά τη δημιουργία του εικονικού περιβάλλοντος, πρέπει να παρέχουμε ένα κλειδί OpenAI API για πρόσβαση στις υπηρεσίες τους. Θα χρειαστεί πρώτα να δημιουργήσουμε ένα κλειδί API από το Ιστότοπος κλειδιών OpenAI API κάνοντας κλικ στο Δημιουργήστε νέο μυστικό κλειδί, προσθέτοντας ένα όνομα για το κλειδί και μετά πατώντας το Κουμπί δημιουργίας μυστικού κλειδιού.

Θα σας δοθεί μια σειρά χαρακτήρων. Αυτό είναι το κλειδί OpenAI API σας. Αντιγράψτε το κάνοντας κλικ στο εικονίδιο αντιγραφής στο πλάι του κλειδιού API. Λάβετε υπόψη ότι αυτό το κλειδί API θα πρέπει να παραμείνει μυστικό. Μην το μοιράζεστε με άλλους εκτός και αν σκοπεύετε πραγματικά να το χρησιμοποιήσουν μαζί σας.

Μόλις αντιγραφεί, επιστρέψτε στον κύριο φάκελο chatgpt-retrieval-main και ανοίξτε τις σταθερές με Μπλοκ ΣΗΜΕΙΩΣΕΩΝ. Τώρα αντικαταστήστε το σύμβολο κράτησης θέσης με το κλειδί API σας. Θυμηθείτε να αποθηκεύσετε το αρχείο!

Τώρα που ρυθμίσατε με επιτυχία το εικονικό σας περιβάλλον και προσθέσατε το κλειδί OpenAI API ως μεταβλητή περιβάλλοντος. Τώρα μπορείτε να παρέχετε τα προσαρμοσμένα δεδομένα σας στο ChatGPT.

Βήμα 3: Προσθήκη προσαρμοσμένων δεδομένων

Για να προσθέσετε προσαρμοσμένα δεδομένα, τοποθετήστε όλα τα προσαρμοσμένα δεδομένα κειμένου στο δεδομένα φάκελο μέσα στο chatgpt-retrieval-main. Η μορφή των δεδομένων κειμένου μπορεί να έχει τη μορφή PDF, TXT ή DOC.

Όπως μπορείτε να δείτε από το παραπάνω στιγμιότυπο οθόνης, έχω προσθέσει ένα αρχείο κειμένου που περιέχει ένα φτιαγμένο προσωπικό πρόγραμμα, ένα άρθρο στο οποίο έγραψα Οι Instinct Accelerators της AMDκαι ένα έγγραφο PDF.

Βήμα 4: Ερώτημα ChatGPT μέσω τερματικού

Το σενάριο Python μας επιτρέπει να ρωτάμε δεδομένα από τα προσαρμοσμένα δεδομένα που έχουμε προσθέσει στο φάκελο δεδομένων και στο διαδίκτυο. Με άλλα λόγια, θα έχετε πρόσβαση στο συνηθισμένο backend ChatGPT και σε όλα τα δεδομένα που είναι αποθηκευμένα τοπικά στο φάκελο δεδομένων.

Για να χρησιμοποιήσετε το σενάριο, εκτελέστε την python chatgpt.py script και, στη συνέχεια, προσθέστε την ερώτηση ή το ερώτημά σας ως όρισμα.

Πύθων chatgpt.py "Η ΕΡΩΤΗΣΗ ΣΟΥ"

Φροντίστε να βάλετε τις ερωτήσεις σας σε εισαγωγικά.

Για να ελέγξω εάν έχουμε τροφοδοτήσει με επιτυχία τα δεδομένα μας στο ChatGPT, θα κάνω μια προσωπική ερώτηση σχετικά με το Προσωπικό Sched.txt αρχείο.

Δούλεψε! Αυτό σημαίνει ότι το ChatGPT μπόρεσε να διαβάσει το Personal Sched.txt που δόθηκε νωρίτερα. Τώρα ας δούμε αν έχουμε τροφοδοτήσει με επιτυχία το ChatGPT με πληροφορίες που δεν γνωρίζει λόγω της ημερομηνίας λήξης της γνώσης.

Όπως μπορείτε να δείτε, περιέγραψε σωστά το AMD Instinct MI250x, το οποίο κυκλοφόρησε μετά την ημερομηνία λήξης της γνώσης του ChatGPT -3.

Περιορισμοί προσαρμοσμένου ChatGPT

Αν και η τροφοδοσία του GPT-3.5 με προσαρμοσμένα δεδομένα ανοίγει περισσότερους τρόπους εφαρμογής και χρήσης του LLM, υπάρχουν μερικά μειονεκτήματα και περιορισμοί.

Πρώτον, πρέπει να παρέχετε όλα τα δεδομένα μόνοι σας. Μπορείτε ακόμα να έχετε πρόσβαση σε όλες τις γνώσεις του GPT-3.5 μέχρι την ημερομηνία λήξης της γνώσης. Ωστόσο, πρέπει να παρέχετε όλα τα επιπλέον δεδομένα. Αυτό σημαίνει ότι εάν θέλετε το τοπικό σας μοντέλο να γνωρίζει ένα συγκεκριμένο θέμα στο διαδίκτυο που το GPT-3.5 δεν γνωρίζει ήδη, θα πρέπει να μεταβείτε στο διαδίκτυο και να ξύσετε τα δεδομένα μόνοι σας και να τα αποθηκεύσετε ως κείμενο στον φάκελο δεδομένων του chatgpt-retrieval-main.

Ένα άλλο ζήτημα είναι ότι το ερώτημα ChatGPT όπως αυτό απαιτεί περισσότερο χρόνο για φόρτωση σε σύγκριση με το ερώτημα απευθείας στο ChatGPT.

Τέλος, το μόνο μοντέλο που διατίθεται αυτή τη στιγμή είναι το GPT-3.5 Turbo. Έτσι, ακόμα κι αν έχετε πρόσβαση στο GPT-4, δεν θα μπορείτε να το χρησιμοποιήσετε για να τροφοδοτήσετε την προσαρμοσμένη παρουσία σας ChatGPT.

Το προσαρμοσμένο ChatGPT είναι φοβερό αλλά περιορισμένο

Η παροχή προσαρμοσμένων δεδομένων στο ChatGPT είναι ένας ισχυρός τρόπος για να αξιοποιήσετε περισσότερο το μοντέλο. Μέσω αυτής της μεθόδου, μπορείτε να τροφοδοτήσετε το μοντέλο με οποιαδήποτε δεδομένα κειμένου θέλετε και να το ζητήσετε όπως το κανονικό ChatGPT, αν και με ορισμένους περιορισμούς. Ωστόσο, αυτό θα αλλάξει στο μέλλον καθώς γίνεται ευκολότερη η ενοποίηση των δεδομένων μας με το LLM, μαζί με την πρόσβαση στο πιο πρόσφατο μοντέλο GPT-4.