Πολλοί από εμάς έχουμε ακούσει το όνομα DALL-E να επιπλέει, αλλά ίσως να μην είστε σίγουροι τι είναι. Εν ολίγοις, είναι ένα μοντέλο παραγωγής τεχνητής νοημοσύνης που μπορεί να δημιουργήσει εικόνες που δεν υπήρχαν ποτέ πριν, το μόνο που έχετε να κάνετε είναι να του πείτε τι θέλετε να δημιουργήσετε.
Όταν κυκλοφόρησε η επόμενη έκδοση, που ονομάζεται DALL-E 2, έγινε πραγματικά γνωστή. Οι εικόνες που μπορούσε να παράγει ήταν τόσο υψηλής ποιότητας και τόσο καλά δημιουργημένες, που δύσκολα θα μπορούσες να πεις ότι το έφτιαξε μια μηχανή.
Εδώ είναι τι πρέπει να γνωρίζετε για το DALL-E και πώς λειτουργεί.
Τι είναι το DALL-E;
DALL-E είναι ένα μοντέλο παραγωγής τεχνητής νοημοσύνης που αναπτύχθηκε από την Open AI που μπορεί να δημιουργήσει εικόνες και έργα τέχνης από μια προτροπή κειμένου. Με άλλα λόγια, μπορείτε να γράψετε μια πρόταση που να περιγράφει ακριβώς αυτό που θέλετε να δείτε και το DALL-E να δημιουργήσει αυτήν την εικόνα για εσάς μέσα σε λίγα δευτερόλεπτα.
Το DALL-E κυκλοφόρησε για πρώτη φορά τον Ιανουάριο του 2021 και έκτοτε έχει αναβαθμιστεί σημαντικά στη δεύτερη έκδοσή του που ονομάζεται DALL-E 2. Ήταν μια από τις λίγες διαφορετικές γεννήτριες τέχνης τεχνητής νοημοσύνης που έγινε εξαιρετικά δημοφιλής για την ικανότητά της να δημιουργεί όμορφες εικόνες και τέχνη από την αρχή.
Δεδομένου ότι χρειάζεται να γράψετε μόνο μερικές περιγραφικές λέξεις για να δημιουργήσετε μια εικόνα, προσελκύει πολλούς μη καλλιτέχνες που βρίσκουν το εργαλείο απίστευτα διασκεδαστικό και εύκολο στη χρήση.
Οι εικόνες που παράγει το DALL-E είναι τόσο πειστικές που εύκολα θεωρούνται τέχνη που φτιάχτηκε από άνθρωπο. Εκτός από τη δυνατότητα απεικόνισης αντικειμένων και τοπίων από τον κόσμο γύρω μας, μπορεί να αποδώσει αυτές τις εικόνες με ένα συγκεκριμένο στυλ, όπως ψηφιακή τέχνη, ακουαρέλα ή ιμπρεσιονισμό.
Το DALL-E πήρε το όνομά του από τον καλλιτέχνη Salvador Dalí και ένα ρομπότ που ονομάζεται WALL-E από μια ταινία κινουμένων σχεδίων της Pixar. Το όνομα του DALL-E μας δίνει σίγουρα μια ιδέα για το πώς η εταιρεία στόχευε να συνδυάσει την τέχνη και την τεχνολογία AI.
Μπορείτε να μάθετε τα πάντα για πώς να χρησιμοποιήσετε το Dall-E 2 για τη δημιουργία εικόνων AI στον αναλυτικό οδηγό μας, συμπεριλαμβανομένου του τρόπου πρόσβασης και του τρόπου επεξεργασίας συγκεκριμένων τμημάτων της εικόνας.
Πώς λειτουργεί το DALL-E;
Υπάρχουν αρκετές διαφορετικές τεχνολογίες πίσω από το DALL-E. Αλλά χωρίς να βουτήξουμε στα πολύπλοκα μαθηματικά, ας ξεκινήσουμε με το πώς το DALL-E εκπαιδεύτηκε σε εκατομμύρια εικόνες από όλο το Διαδίκτυο.
Οι εικόνες που χρησιμοποιούνται για την εκπαίδευση προέρχονται από σύνολα δεδομένων που περιέχουν έναν τεράστιο αριθμό εικόνων που έχουν λεζάντα κειμένου. Όπως μπορείτε να φανταστείτε, με αρκετά δεδομένα το μοντέλο AI μπορεί να μάθει πώς να αναγνωρίζει τι είναι ένα αντικείμενο και πώς μπορεί να μοιάζει σε μια εικόνα.
Το σύνολο δεδομένων που χρησιμοποιήθηκε για την εκπαίδευση του DALL-E δεν έχει αποκαλυφθεί, ωστόσο, μπορείτε ακόμα μάθετε αν οι εικόνες σας έχουν εκπαιδεύσει ένα μοντέλο AI και εξαιρεθείτε.
Το DALL-E κατασκευάστηκε επίσης χρησιμοποιώντας ένα μοντέλο γλώσσας που ονομάζεται GPT-3, ή Generative Pre-trained Transformer. Διαδόθηκε σε μεγάλο βαθμό όταν το Open AI κυκλοφόρησε το ChatGPT, ένα chatbot AI στο οποίο μπορείτε εύκολα να μιλήσετε σε φυσική ανθρώπινη γλώσσα. Αυτή η τεχνολογία γεφυρώνει το χάσμα μεταξύ κειμένου και εικόνας και βοηθά στη μετατροπή των λέξεων που πληκτρολογείτε σε εικόνα στην οθόνη που αποτελείται από pixel.
Ένα άλλο βασικό μέρος του DALL-E είναι η χρήση ενός μοντέλου Diffusion. Αυτό το μοντέλο λαμβάνει μια θορυβώδη εικόνα—σκεφτείτε μια εικόνα με πολύ pixil που δεν είναι αναγνωρίσιμη—και λειτουργεί προς τα πίσω για να δημιουργήσει μια καθαρή εικόνα που ταιριάζει με την περιγραφή κειμένου που καταχωρίσατε.
Τι μπορείτε να κάνετε με το DALL-E;
Οι άνθρωποι χρησιμοποιούν το DALL-E για όλα τα είδη των πραγμάτων. Μπορείτε να δοκιμάσετε τις δυνάμεις σας να είστε καλλιτέχνης τεχνητής νοημοσύνης, να το χρησιμοποιήσετε για να αναμιγνύετε ένα διάσημο έργο τέχνης ή να πάρετε ένα πρωτότυπο έργο τέχνης και να το επεκτείνετε με τις λειτουργίες επεξεργασίας του DALL-E.
Το Outpainting είναι μια δυνατότητα στο DALL-E που σας επιτρέπει να δημιουργείτε ακόμα μεγαλύτερα έργα επιτρέποντάς σας να επισυνάψετε πάνελ εικόνων που δημιουργήθηκαν πρόσφατα σε ένα υπάρχον έργο τέχνης. Μαθαίνω πώς να χρησιμοποιήσετε το outpainting στο Dall-E 2 για να δείτε πόσο μακριά μπορείτε να επεκτείνετε τις εικόνες που δημιουργούνται από AI.
Δημιουργήστε εικόνες που δημιουργούνται από AI με το DALL-E
Το DALL-E είναι ένα εύκολα προσβάσιμο εργαλείο τεχνητής νοημοσύνης που μπορείτε να χρησιμοποιήσετε για να δημιουργήσετε έργα τέχνης ή να δημιουργήσετε εικόνες, καμία από τις οποίες δεν έχει υπάρξει ποτέ πριν. Χρησιμοποιεί απίστευτες προόδους στη μηχανική μάθηση, συμπεριλαμβανομένων των μοντέλων GPT-3 και διάχυσης. Η γνώση του DALL-E για τον ανθρώπινο κόσμο, συμπεριλαμβανομένης της ιστορίας της τέχνης, προέρχεται από εκατομμύρια εικόνες που πιθανότατα συγκεντρώθηκαν από το διαδίκτυο.
Ο συνδυασμός πολλών νέων τεχνολογιών στη γενετική τεχνητή νοημοσύνη σημαίνει ότι θα απολαμβάνετε να ζωντανεύετε τη φαντασία σας χρησιμοποιώντας μόνο λέξεις για να ζωγραφίσετε μια εικόνα.