Οι γεννήτριες τέχνης τεχνητής νοημοσύνης έχουν μια κακή ραπ για την παραγωγή ανακριβών απεικονίσεων χεριών. Ας βάλουμε το Midjourney v5 εναντίον του Dall-E 2 για να δούμε ποιο το κάνει καλύτερα.
Οι γεννήτριες τέχνης AI συνεχίζουν να εντυπωσιάζουν, επιτρέποντάς μας να δημιουργούμε σχεδόν οτιδήποτε μπορούμε να φανταστούμε. Ωστόσο, η τεχνολογία φαίνεται να έχει χτυπήσει έναν τοίχο από τούβλα όταν πρόκειται να δημιουργήσει χέρια με ρεαλιστική εμφάνιση.
Εδώ, εξετάζουμε δύο από τις κορυφαίες εφαρμογές γενετικής τέχνης και τις ρίχνουμε πρόσωπο με πρόσωπο —ή χέρι με χέρι— για να δούμε ποιες μπορούν να δημιουργήσουν καλύτερα χέρια, το Midjourney v5 ή το Dall-E 2. Έχετε κάποια από αυτές τις εφαρμογές κυριαρχικά χέρια; Ας ανακαλύψουμε!
Το πρόβλημα του AI με τα χέρια
Από τότε που η τέχνη που δημιουργήθηκε από την τεχνητή νοημοσύνη έγινε ευρέως διαδεδομένη στο διαδίκτυο, υπήρξε κριτική σχετικά με το ποιότητα των χεριών που σχεδιάζονται από AI. Παρά τις πρόσφατες ενημερώσεις, όπως φαίνεται στις παράπλευρες συγκρίσεις μας, τα αποτελέσματα δεν ήταν ικανοποιητικά.
Και οι δύο υποψήφιοι βελτιώνουν τις δυνατότητές τους και την ποιότητα των αποτελεσμάτων τους με κάθε επανάληψη. Η τελευταία ενημέρωση, Έκδοση 5 του Midjourney, έχει επιδείξει εντυπωσιακή πρόοδο. Ωστόσο, το πρόβλημα με τα χέρια που σχεδιάζονται από την AI παραμένει άλυτο και δεν μπορεί να αγνοηθεί.
Σύγκριση 1: Χρήση των προτροπών "Χέρι" και "Χέρια"
Οι συγκρίσεις μας θα περιέχουν τις ίδιες ακριβώς προτροπές τόσο για το Dall-E 2 όσο και για το Midjourney v5. Θα σχεδιάσουμε τα μηνύματα προτροπής ώστε να είναι ειδικά για τα χέρια αντί να δημιουργούμε απλά άτομα για να δουν πώς φαίνονται τα χέρια. Επίσης, δίνουμε σε κάθε εφαρμογή μόνο μία ευκαιρία (roll) για κάθε προτροπή.
Χέρι
Ας ξεκινήσουμε τα πράγματα με την πιο βασική και σχετική προτροπή: «χέρι».
Midjourney v5:
Dall-E 2:
Δεν ξεκινάμε καλά!
Το Midjourney πήρε την ασυνήθιστη διαδρομή να συσχετίσει ένα χέρι με μάλλον δημιουργικές καταστάσεις. Αντί να εστιάσουμε μόνο σε ένα χέρι, βλέπουμε έναν μάγο, γάντια, έναν σκελετό και ένα μικροσκοπικό ειδώλιο. Στην εικόνα των γαντιών λείπει και ένα δάχτυλο.
Το Dall-E 2 ακολουθεί την αντίθετη προσέγγιση και μας προσφέρει μόνο ένα χέρι σε ένα απλό φόντο. Αλλά παραδόξως, υπάρχουν μερικές περίεργες στάσεις, ιδιαίτερα με τους αντίχειρες, που δεν φαίνονται φυσικές ή άνετες. Κάθε χέρι είναι επίσης κομμένο σε μία από τις πλευρές των εικόνων.
Ποιος κερδίζει αυτόν τον γύρο; Θα το δώσουμε στο Dall-E 2 για συνολική ακρίβεια.
Χέρια
Τώρα, ας κάνουμε τον πληθυντικό προτροπής, "χέρια" και ας δούμε τι βρίσκουν οι AI.
Midjourney v5:
Dall-E 2:
Η προσπάθεια του Midjourney για «χέρια» αποδεικνύεται καλύτερη αυτή τη φορά. Αλλά και οι τέσσερις εικόνες είναι ασπρόμαυρες και μας λείπουν μερικά δάχτυλα. Μετά από προσεκτικότερη εξέταση, μπορείτε επίσης να δείτε ότι ορισμένα από τα ψηφία έχουν περίεργο σχήμα ή μεταμορφώνονται το ένα με το άλλο.
Το Dall-E 2 συνεχίζει να διαθέτει χέρια με απλό φόντο. Δεν λείπουν ψηφία, αλλά τα χέρια είναι περικομμένα στην τρίτη εικόνα και οι άλλες εκδόσεις φαίνονται κάπως αδέξιες στη σύνθεση και στερούνται εντελώς δημιουργικότητας.
Ας ονομάσουμε αυτή τη σύγκριση ισοπαλία. Το Dall-E 2 θα κέρδιζε για ακρίβεια εάν αυτός ήταν ο μόνος παράγοντας, αλλά το Midjourney καταφέρνει να δημιουργήσει μερικά όμορφες εικόνες στις ασπρόμαυρες αποδόσεις του, ακόμα κι αν και οι τέσσερις εκδόσεις δεν είναι πολύ ρεαλιστικός.
Μπορείτε πάντα χρησιμοποιήστε το Photoshop για να διορθώσετε το Midjouney art σας, συμπεριλαμβανομένων των χεριών.
Σύγκριση 2: Χειρονομίες
Ας συγκρίνουμε μερικές χειρονομίες που είναι σχεδόν παγκοσμίως αναγνωρισμένες.
Σταυρωμένα δάχτυλα
Αρχικά, ας δοκιμάσουμε το «δάχτυλα σταυρωμένα».
Midjourney v5:
Dall-E 2:
Είναι ασφαλές να πούμε ότι το Midjourney απέτυχε εντελώς αυτήν την προτροπή. Μας λείπουν τα δάχτυλα και καμία από τις εκδόσεις δεν φαίνεται καθόλου φυσική.
Καπέλο για άλλη μια φορά στο Dall-E 2 για τη σωστή μέτρηση των δακτύλων, αλλά αυτό είναι το μόνο καλό νέο. Κάθε έκδοση μοιάζει σαν τα δάχτυλα να χτυπούν τις δικές τους στάσεις γιόγκα σε ένα παιχνίδι Twister.
Δεν υπάρχει νικητής σε αυτή τη σύγκριση.
Μπράβο
Στη συνέχεια, πάμε με "μπράβο".
Midjourney v5:
Dall-E 2:
Το Midjourney παίρνει τον σωστό αριθμό δακτύλων, ενώ αντιμετωπίζει κάθε μήνυμα με δημιουργικό τρόπο. Παρατηρήστε την εισαγωγή ενός εικονογραφικού στυλ;
Το Dall-E 2 λαμβάνει επίσης πόντους για ακρίβεια, ενώ δεν προσπαθεί να ταρακουνήσει το σκάφος με οτιδήποτε δημιουργικό προστίθεται σε κάθε αποτέλεσμα.
Δεν υπάρχει ξεκάθαρος νικητής εδώ.
Σύγκριση 3: Χέρια με αντικείμενα
Τώρα, θα αυξήσουμε την πολυπλοκότητα προτρέποντας τα χέρια να αλληλεπιδράσουν με αντικείμενα.
Κρυστάλλινη μπάλα που κρατά το χέρι
Ας ξεκινήσουμε με ένα τυχαίο αντικείμενο, χρησιμοποιώντας την προτροπή "hand holding crystal ball".
Midjourney v5:
Dall-E 2:
Καθώς αυξάνουμε την πολυπλοκότητα, το Midjourney αρχίζει να λάμπει. Εκτός από μερικές από τις ερμηνείες που φαίνονται αφύσικές, τα χέρια και οι κρυστάλλινες μπάλες φαίνονται όμορφα. Το Midjourney παίρνει ακόμη χρόνο για να δημιουργήσει αντανακλάσεις στο ποτήρι που σίγουρα προσθέτουν στη συνολική δημιουργικότητα.
Αλλά για πρώτη φορά, βλέπουμε στο Dall-E 2 να λείπει ένα ψηφίο σε τουλάχιστον ένα από τα χέρια, με το τέταρτο χέρι να φαίνεται απλά περίεργο. Οι κρυστάλλινες μπάλες επίσης δεν φαίνονται τόσο εντυπωσιακές σε σύγκριση με αυτές του Midjourney.
Το Midjourney παίρνει την πρώτη του νίκη.
Νερό που κρατά το χέρι
Ας δοκιμάσουμε κάτι ακόμα πιο σύνθετο με την προτροπή «το χέρι κρατά το νερό».
Midjourney v5:
Dall-E 2:
Το Midjourney καταφέρνει να ρίξει μόνο μία εικόνα με τον σωστό αριθμό ψηφίων. Αν και αποδοθεί όμορφα, για άλλη μια φορά αρχίζουμε να βλέπουμε τις ρωγμές στο τμήμα πιστότητας.
Το Dall-E 2 δυσκολεύεται επίσης να πετύχει φυσικά χέρια, αλλά κάνει πολύ καλύτερη δουλειά. Αλλάζει επίσης το χρώμα στο φόντο για κάποια ποικιλία.
Θα δώσουμε αυτόν τον γύρο στο Dall-E 2.
Σύγκριση 4: Εργαζόμενα Χέρια
Για αυτήν τη σύγκριση, θα δημιουργήσουμε μηνύματα προτροπής που έχουν τα χέρια που εμπλέκονται σε δραστηριότητες.
Πηλός καλουπώματος με χέρια
Ας δούμε πώς τα καταφέρνουν τα μοντέλα τεχνητής νοημοσύνης με το "hands molding clay".
Midjourney v5:
Dall-E 2:
Το Midjourney έχασε ένα δάχτυλο σε δύο εικόνες, αλλά όλα τα άλλα φαίνονται υπέροχα.
Οι εικόνες του Dall-E 2 φαίνονται συγκεχυμένες και γεμάτες κόσμο, καταφεύγοντας στην προσθήκη των χεριών ενός άλλου ατόμου στις μισές εκδόσεις.
Η άκρη πηγαίνει στο Midjourney.
Χέρια Πιέζοντας Ζύμη
Ας δοκιμάσουμε μια παρόμοια δραστηριότητα, «χέρια πιέζοντας ζύμη».
Midjourney v5:
Dall-E 2:
Οι εικόνες του Midjourney φαίνονται υπέροχες συνολικά. Αλλά για άλλη μια φορά, οι μισοί από αυτούς λείπουν ψηφία. Αλλά οι εικόνες δεν μπορούν να κατηγορηθούν για το καλλιτεχνικό τους στυλ.
Στις εκδόσεις του Dall-E 2 λείπουν τα δάχτυλα στις μισές ερμηνείες και μάλιστα προσθέτουν ένα στο τελευταίο χέρι στο σετ.
Ας το πούμε αυτό ισοπαλία.
Αν θέλετε να δοκιμάσετε αυτές τις συγκρίσεις μόνοι σας, σας παρουσιάζουμε πώς να χρησιμοποιήσετε το Midjourney για τη δημιουργία τέχνης AI.
Τι μας λένε τα αποτελέσματα;
Είναι διασκεδαστικό να πηγαίνεις να κάνεις συγκρίσεις και να προσδιορίζεις έναν γενικό νικητή. Και αν έπρεπε να διαλέξουμε, θα το λέγαμε υπέρ του Midjourney v5. Αν και το Dall-E 2 δημιουργούσε πιο συχνά χέρια με τον σωστό αριθμό δακτύλων, ήταν το Midjourney που δημιούργησε πιο καλλιτεχνικά αποδιδόμενες και ελκυστικές εικόνες.
Αλλά και οι δύο εφαρμογές έχουν μια θέση στην αγορά για καλλιτέχνες που επαναχρησιμοποιούν τις εικόνες Dall-E 2 και Midjourney για τη δουλειά τους. Και τα δύο είναι ικανά να δημιουργήσουν χέρια που μπορούν να χρησιμοποιηθούν ως εγκοπές ή σε σύνθετα για καλλιτεχνική, εκδοτική και εμπορική χρήση. Είναι απλώς θέμα προσωπικής προτίμησης.
Το AI θα κατακτήσει τελικά τα χέρια
Οι παραγωγικές εφαρμογές τέχνης όπως το Dall-E 2 και το Midjourney έχουν προχωρήσει πολύ στην ικανότητά τους να δημιουργούν ρεαλιστική και φανταστική τέχνη. Εξακολουθούν να παλεύουν με τα χέρια παραγωγής, αλλά δεδομένης της επιτάχυνσης της γενετικής τεχνολογίας, μπορούμε μόνο να περιμένουμε βελτίωση στο εγγύς μέλλον.