Λίγους μήνες πριν, αν ήθελες να δημιουργήσεις μια εικόνα για κάτι, έπρεπε να μπορείς να σκιτσάρεις, να ζωγραφίσεις ή να χρησιμοποιήσεις ένα από τα εργαλεία photoshopping για τα οποία μιλούν συνέχεια οι άλλοι. Μετά το 2022, όμως, όλα άλλαξαν, όλα χάρη στην τεχνητή νοημοσύνη — ναι, όπως στην «τεχνητή νοημοσύνη».

Αντί να προσπαθούν να κυριαρχήσουν στον κόσμο, τα εργαλεία τεχνητής νοημοσύνης με καλλιτεχνική κλίση μπορούν να μετατρέψουν οτιδήποτε τους περιγράφεις σε εικόνα.

Ελάτε μαζί μας καθώς εισερχόμαστε στον κόσμο της οπτικοποίησης κειμένου με τεχνητή νοημοσύνη και δείτε πώς μπορείτε να χρησιμοποιήσετε τέτοια εργαλεία για να μετατρέψετε τις σκέψεις σας σε πραγματικές εικόνες πληκτρολογώντας απλώς αυτό που έχετε στο μυαλό σας.

Dall-E: Η καλλιτεχνική πλευρά του GPT-3 του OpenAI

Τα πρώτα εργαλεία με τεχνητή νοημοσύνη που έγιναν δημοφιλή βασίστηκαν στο GPT-3 του OpenAI. Ένας από τους λόγους ήταν το άνοιγμα του έργου στην εξωτερική πρόσβαση, κάτι που οδήγησε σε ορισμένες προτάσεις που Το GPT-3 είναι το μέλλον της δημιουργικής εργασίας.

instagram viewer

Σήμερα μπορείτε να χρησιμοποιήσετε τα επίσημα εργαλεία που μπορείτε να βρείτε στο Ο ιστότοπος beta του OpenAI ή λύσεις τρίτων που εκμεταλλεύονται τις γλωσσικές υπερδυνάμεις του. Για παράδειγμα, μπορείτε να ζητήσετε από το GPT-3 να δημιουργήσει ένα προσχέδιο για μια ανάρτηση, να απαντήσει σε απλές ερωτήσεις ή ακόμα και να αναθεωρήσει ή να μεταφράσει κάποιο κείμενο.

Το 2022 το OpenAI αποκάλυψε ότι το GPT-3 ήταν εξίσου καλό στη δημιουργία εικόνων. Το έργο DALL-E, ένα παιχνίδι για την ταινία WALL-E της Pixar και το όνομα του Νταλί, χρησιμοποιεί το GPT-3 όχι για εργασία με κείμενο αλλά ως μηχανή δημιουργίας εικόνων.

Ακριβώς όπως με το GPT-3 και το κείμενο, το DALL-E δεν είναι πραγματικά μια δημιουργική ιδιοφυΐα, που υλοποιεί εικόνες από τον αέρα. Αντίθετα, έχει «εκπαιδευτεί» σε εκατομμύρια εικόνες που υπάρχουν ήδη στο διαδίκτυο. Η τεχνητή νοημοσύνη του έγκειται στην ανάλυση αυτών των εικόνων, τη λήψη στοιχείων από αυτές, την προσαρμογή, τη διαμόρφωση, την προσαρμογή και, τέλος, τον συνδυασμό τους σε νέες εικόνες.

Τουλάχιστον, αυτή είναι μια απλοποιημένη εκδοχή του τι συμβαίνει στο παρασκήνιο. Οι περισσότεροι άνθρωποι νοιάζονται μόνο για αυτό που βλέπουν μπροστά τους, και αυτό είναι ένα πλαίσιο κειμένου όπου μπορείτε να πληκτρολογήσετε κάτι και να το δείτε να μετατρέπεται σε εικόνα μετά από λίγα λεπτά.

Απάντηση Imagen της Google

Η Google είναι ένας από τους τρεις κορυφαίους «παίκτες» στην έρευνα AI. Ωστόσο, η πρόοδός τους δεν είναι εύκολα αντιληπτή, ούτε οι υλοποιήσεις τους σε προϊόντα είναι τόσο προσβάσιμες όσο οι προσφορές του OpenAI.

Μία από τις πρώτες ευρέως διαθέσιμες εφαρμογές της Google AI ήταν στα Έγγραφα Google και στο Gmail, με τη μορφή πιο έξυπνης αυτόματης συμπλήρωσης και προτάσεων, γνωστών ως Έξυπνη Σύνταξη. Δεν θα βουτήξουμε σε λεπτομέρειες αφού έχουμε καλύψει προηγουμένως Έξυπνη σύνταξη (και πώς μπορείτε να τη χρησιμοποιήσετε).

Όταν αυτές οι λειτουργίες είναι ενεργές, οι εφαρμογές ιστού της Google συγκρίνουν αυτό που πληκτρολογεί ο χρήστης με αυτό που έγραψαν εκατομμύρια άλλοι στο παρελθόν. Στη συνέχεια, προτείνει τι πληκτρολόγησαν μετά.

Είναι απόδειξη ότι παρά το τι μας αρέσει να πιστεύουμε, δεν είμαστε τόσο διαφορετικοί. Αν 99 στα 100 άτομα πληκτρολογήσουν "αργότερα" μετά το "τα λέμε", μάλλον αυτό θα συνεχίζαμε να πληκτρολογούμε επίσης.

Όλοι έχουμε χρησιμοποιήσει κάποια μορφή αυτόματης συμπλήρωσης, ακόμη και από πίσω στο σύστημα πρόβλεψης κειμένου T9 της εποχής των "χαζών". Γι' αυτό τα εργαλεία τεχνητής νοημοσύνης της Google δεν φαίνονταν τόσο έξυπνα όσο το GPT-3 του OpenAI. Δεν ένιωθαν τόσο περισσότερο σε χρήση από ένα καλύτερο σύστημα T9 που βελτιώθηκε για τον 21ο αιώνα. Και αυτός είναι επίσης ο λόγος που η αποκάλυψη της Imagen ήταν λίγο σοκ.

Όπως ένα DALL-E στα στεροειδή, το Imagen είναι ένα εργαλείο οπτικοποίησης κειμένου. Με βάση αυτά που είναι διαθέσιμα σήμερα, το Imagen μπορεί να παράγει "καθαρότερες" και πιο ζωντανές εικόνες, ενώ γνωρίζει επίσης πώς να αντιμετωπίζει προηγμένες λειτουργίες όπως η διάχυση και η διαφάνεια.

Δυστυχώς, τη στιγμή της σύνταξης, η πρόσβαση στο Imagen παραμένει περιορισμένη, επομένως δεν μπορέσαμε να το δοκιμάσουμε.

DALL-E Mini and Friends: Open for Business

Δεν μπορείτε να έχετε ελεύθερη πρόσβαση στο DALL-E και στο Imagen—ακόμη. Ωστόσο, πολλές εναλλακτικές λύσεις είναι ήδη διαθέσιμες εάν θέλετε να ξεγελαστείτε με τη δημιουργία κειμενικών εικόνων με τεχνητή νοημοσύνη.

Έχοντας υπόψη ότι αυτές είναι οι πρώτες μέρες και τα αποτελέσματα ή η εμπειρία χρήστη που προσφέρουν μπορεί να απέχει πολύ από το βέλτιστο, αξίζει ακόμα να ελέγξετε μερικά από τα παρακάτω.

Δημιουργία μιμιδίων με το Dall-E Mini

Χάρη σε έναν συνδυασμό περισσότερων από επαρκών αποτελεσμάτων και μιας φιλικής προς τον χρήστη διεπαφής, αλλά το πιο σημαντικό, της ευρείας διαθεσιμότητάς του, το DALL-E mini έγινε ένας από τους πιο δημοφιλείς οπτικοποιητές κειμένου AI.

Μακριά από τέλεια, μερικές φορές τα αποτελέσματα του DALL-E mini θα μπορούσαν να είναι πιο αφηρημένα από τα αναμενόμενα.

Άλλες φορές μπορεί να αποτύχει να δημιουργήσει αυτό που είχατε στο μυαλό σας, αλλά μπορεί να πλησιάσει αρκετά.

Μετά την έκρηξη της δημοτικότητάς του, οι δημιουργοί του DALL-E mini το μετέφεραν σε ένα νέο σπίτι με νέα επωνυμία. Τώρα μπορείτε να βρείτε την πιο πρόσφατη έκδοση του DALL-E mini ως Craiyon στον δικό της ιστότοπο.

Η χρήση του Craiyon σήμερα είναι τόσο εύκολη όσο η αναζήτηση στο διαδίκτυο για μια υπάρχουσα εικόνα. Μπορείτε να επισκεφτείτε τον ιστότοπό του, να πληκτρολογήσετε μια περιγραφή της εικόνας σας στο πεδίο κειμένου και να πατήσετε Enter. Μετά από λίγο, θα δείτε τα αποτελέσματα στην οθόνη σας.

Αυτό που είναι εντυπωσιακό είναι πόσο καλά είναι το Craiyon και παρόμοια εργαλεία στο να μιμούνται οπτικά στυλ. Για παράδειγμα, του ζητήσαμε να δημιουργήσει εικόνες ενός κουταβιού σε ένα skateboard:

Στη συνέχεια, χρησιμοποιήσαμε την ακριβή φράση αλλά προσθέσαμε ένα "στυλ Pixar" μετά από αυτήν. Μετά από λίγο, ο Craiyon έδειξε ένα πλέγμα πιο «καρτούν» εικόνων, πιο κοντά σε αυτό που αντιλαμβανόμαστε ως γραφικά της Pixar με ακτινοβολία στις αγαπημένες τους ταινίες.

Το Craiyon μας έδωσε ακόμα καλύτερα αποτελέσματα όταν αντικαταστήσαμε το "Pixar style" με το "anime style" στην ίδια προτροπή.

Το anime είναι πιο στυλιζαρισμένο στην εμφάνισή του από τις πιο ρεαλιστικές εικόνες της Pixar, οι οποίες φαίνεται ότι βοήθησαν τον Craiyon να παράγει μερικές σχεδόν έτοιμες προς χρήση εικόνες.

Χαζεύουμε με λανθάνουσα διάχυση

Το μοντέλο λανθάνουσας διάχυσης που εκπαιδεύεται στο σύνολο δεδομένων LAION-400M είναι ένα άλλο ενδιαφέρον πρόγραμμα οπτικοποίησης κειμένου AI. Ωστόσο, είναι επίσης πιο περίπλοκο στη χρήση του. Πρέπει να το εκτελέσετε online σε μια εικονική μηχανή και να παίξετε με τις διάφορες παραμέτρους του αντί να πληκτρολογείτε απλώς σε ένα πεδίο κειμένου. Ωστόσο, είναι πιο εύκολο από όσο ακούγεται.

  1. Επισκεφθείτε το Χώρος συνεργασίας Google Latent Diffusion αυτό είναι το σπίτι του αυτή τη στιγμή.
  2. Κάντε κύλιση λίγο προς τα κάτω και παρατηρήστε το Προτροπή πεδίο κάτω Παράμετροι. Αντικαταστήστε την προεπιλεγμένη προτροπή με αυτό που θέλετε να απεικονίζει η εικόνα σας.
  3. Επιλέγω Εκτέλεση όλων από το Χρόνος εκτέλεσης μενού ή πατήστε CTRL + F9.
  4. Εάν θέλετε να μπορείτε να εξάγετε τις παραγόμενες εικόνες απευθείας από το εργαλείο, απαντήστε θετικά όταν ρωτηθείτε εάν θέλετε να τις συνδέσετε με τον λογαριασμό σας στο Google Drive. Το εργαλείο χρειάζεται λίγο χρόνο για να ολοκληρώσει τη διαμόρφωσή του και πρέπει να πραγματοποιήσει λήψη ορισμένων αρχείων κατά τη διάρκεια της διαδικασίας.

Αύξηση των τιμών για Βήματα, Επαναλήψεις, και Δείγματα_σε_παράλληλα, μπορεί να οδηγήσει σε πιο λεπτομερή αποτελέσματα. Ωστόσο, το εργαλείο είναι εξαιρετικά απαιτητικό σε πόρους στους διακομιστές της Google. Ως αποτέλεσμα, μπορεί να διακοπεί εάν αυξήσετε υπερβολικά αυτές τις τιμές ή η διαδικασία δημιουργίας μιας συγκεκριμένης εικόνας γίνει πιο περίπλοκη από το αναμενόμενο.

Ενδιαφέρουσες εναλλακτικές λύσεις

Αφιερώσαμε σημαντικό χρόνο δοκιμάζοντας το DALL-E mini και το Latent Diffusion. Η επιστημονική μας μέθοδος αποτελούνταν από δύο διακριτά μέρη. Πρώτα, έπρεπε να καταλήξουμε σε έννοιες που θα μπορούσαν να περιγραφούν επακριβώς ως απατεώνες. Στη συνέχεια, ζητήστε από αυτούς τους οπτικοποιητές AI να τους μετατρέψουν σε εικόνες. Πιο συχνά απ' ό, τι αναμενόταν, τα κατάφεραν, πλησιάζοντας το γενικό στήσιμο που είχαμε οραματιστεί.

Δοκιμάσαμε επίσης μερικές από τις διαθέσιμες εναλλακτικές για αυτό το άρθρο. Ακόμη περιμένουμε πρόσβαση σε άλλους. Μερικά από αυτά που αξίζει να ελέγξετε είναι (χωρίς ιδιαίτερη σειρά):

  • Μεσοταξίδι
  • MindsEye beta
  • StarryAI
  • Ονειρο
  • Disco Diffusion

Θα αντικαταστήσει τις Εικαστικές Τέχνες που δημιουργείται από AI;

Η αφθονία και η συνεχώς αυξανόμενη δημοτικότητα των εργαλείων τεχνητής νοημοσύνης που δημιουργούν εικόνα, οδηγεί πολλούς στο συμπέρασμα ότι οι εικαστικές τέχνες σύντομα θα πεθάνουν. Τι νόημα έχει να επενδύσετε χρόνο και ενέργεια για να μάθετε πώς να σχεδιάζετε ή να χρησιμοποιείτε περίπλοκο λογισμικό για να οπτικοποιείτε τα πράγματα όταν μια τεχνητή νοημοσύνη μπορεί να το κάνει πιο γρήγορα (και σύντομα καλύτερα) από εσάς;

Εάν προσέξατε, όλα αυτά τα εργαλεία είναι "εκπαιδευμένα σε σύνολα δεδομένων". Σε απλά αγγλικά, αυτό σημαίνει ότι κάνουν αυτό που κάνουν χάρη στο ότι οι άνθρωποι έχουν ήδη κάνει το ίδιο πράγμα στο παρελθόν.

Αυτός είναι ο υπαινιγμός για το γιατί αυτά τα εργαλεία δεν μπορούν να αντικαταστήσουν την ανθρώπινη τέχνη, τη δημιουργικότητα και την εφευρετικότητα. Είναι μιμητές, έξυπνοι αντιγραφείς. Χωρίς τα ανθρώπινα πρωτότυπα στα οποία έχουν εκπαιδευτεί, δεν θα μπορούσαν να παράγουν κανένα αποτέλεσμα.

Ωστόσο, αυτό είναι το τώρα, και παραδεχόμαστε ότι δεν ξέρουμε τι επιφυλάσσει το μέλλον. Προς το παρόν, οι εικαστικοί καλλιτέχνες μπορούν να κοιμούνται με ασφάλεια. Με τον ρυθμό που εξελίσσεται η τεχνητή νοημοσύνη, ωστόσο, πολλοί ειδικοί στο θέμα συμφωνούν ότι δεν είναι θέμα αν θα αντικαταστήσει ποτέ την εργασία ανθρώπων σαν τη δική σας. Είναι μόνο θέμα πότε.

Αλλά hey, δεν είναι όλα καταστροφή και κατήφεια. Ενώ το Skynet ετοιμάζεται να πάρει τις δουλειές μας, τουλάχιστον μπορούμε να φτιάξουμε τη διάθεσή μας δημιουργώντας αβίαστα εικόνες κουταβιών σε skateboards!