Η τεχνητή νοημοσύνη μπορεί να μας παραπλανήσει και να μπερδέψουμε την παραγόμενη τέχνη με πραγματικές φωτογραφίες. Γιατί λοιπόν τα χέρια είναι τόσο μεγάλη πρόκληση;

Οι γεννήτριες AI εξελίσσονται μπροστά στα μάτια μας με τρομακτικό ρυθμό, αλλά εξακολουθούν να έχουν ελαττώματα. Ο εντοπισμός περίεργων λεπτομερειών σε εικόνες AI είναι πραγματικά πολύ αστείο. Αυτός είναι ο λόγος για τον οποίο τα χέρια Midjourney έγιναν ένα καυτό θέμα, ένα πρόβλημα κοινό σε πολλούς κινητήρες.

Ας αναλύσουμε γιατί τα χέρια προκαλούν τόσο πολύ τις γεννήτριες εικόνων AI. Οι προγραμματιστές τους επιδιορθώνουν ήδη αυτό το ζήτημα που αξίζει τα meme, αλλά είναι ενδιαφέρον να σκεφτούμε πώς μαθαίνει η τεχνητή νοημοσύνη, για να μην αναφέρουμε τι μπαίνει στο δρόμο της.

Γιατί τα χέρια που δημιουργήθηκαν από την AI ανακατεύτηκαν

Οποιοσδήποτε χρησιμοποιεί μηχανές τεχνητής νοημοσύνης για τη δημιουργία εικόνων μπορεί να έχει παρατηρήσει ότι τα χέρια σπάνια βγαίνουν σωστά, αλλά το πρόβλημα ανατράπηκε όταν ένα σωρό «φωτογραφίες» εμφανίστηκαν στο Twitter.

instagram viewer

Σε μια πιο προσεκτική εξέταση, τα παράξενα χέρια των ανθρώπων τα έδωσαν ως εικόνες που δημιουργήθηκαν από AI. Το γεγονός ότι αυτή ήταν η προσπάθεια του Midjourney έκανε την κατάσταση πιο ενδιαφέρουσα.

Ένας από τους καλύτερους κινητήρες τεχνητής νοημοσύνης δεν μπορούσε να αντιμετωπίσει την πολυπλοκότητα των ανθρώπινων χεριών, έτσι οι δυνατότητες του Midjourney και των ανταγωνιστών του τέθηκαν σε δοκιμασία. Είναι αλήθεια ότι ακόμη και το DALL-E είναι επιρρεπές σε μη ρεαλιστικά δάχτυλα και νύχια.

Η διαφημιστική εκστρατεία ήταν δυσανάλογη, λαμβάνοντας υπόψη ότι τα χέρια που δημιουργήθηκαν από την τεχνητή νοημοσύνη ήταν πάντα πρόβλημα, αλλά η πρόσθετη προσοχή οδήγησε την κυκλοφορία του Midjourney v5 για βελτίωση στο v4.

Η νέα έκδοση έκανε το σημείο να βελτιώσει τη σχεδίαση των χεριών, μια σαφής ένδειξη ότι οι μηχανικοί της τεχνητής νοημοσύνης έδωσαν προσοχή στο ξεκαρδιστικό σάλο και αποφάσισαν να αναβαθμίσουν τις δυνατότητες του λογισμικού.

Άλλοι κινητήρες αργούν να ακολουθήσουν το παράδειγμα του Midjourney, έτσι επιδιόρθωση τέχνης AI με το Photoshop παραμένει μια ανεκτίμητη δεξιότητα. Το κύριο εμπόδιο για τους προγραμματιστές είναι το πόσο περίπλοκο είναι να εκπαιδεύσουν την τεχνητή νοημοσύνη για να τραβήξουν πειστικά χέρια.

Γιατί οι γεννήτριες εικόνων AI παλεύουν με τα χέρια;

Οι μηχανές τεχνητής νοημοσύνης χρησιμοποιούν δίκτυα παραγωγής αντιπάλου (GAN) ή Σταθερή Διάχυση για την παραγωγή εικόνων. Και οι δύο τεχνολογίες απαιτούν εκτεταμένα υλικά πηγής, εκπαίδευση και ισχύ επεξεργασίας για τη δημιουργία ακόμη και των πιο βασικών έργων τέχνης.

Δεδομένου ότι οι προϋπάρχουσες εικόνες είναι κεντρικές για την εκπαίδευση ενός AI, οι προγραμματιστές πρέπει να τροφοδοτήσουν το λογισμικό τους χιλιάδες, αν όχι εκατομμύρια, εικόνες παράλληλα με προτροπές—επανάληψη της διαδικασίας ξανά και ξανά μέχρι ο κινητήρας να καταλάβει σε τι αναφέρεται μια συγκεκριμένη λέξη και πώς να το αντιπροσωπεύει αντικείμενο.

Αλλά οι εικόνες πηγής από τις οποίες μαθαίνει ένα AI είναι κυρίως 2D, όπου τα χέρια απεικονίζονται σε διάφορες θέσεις. Είτε ίσια είτε κατσαρά, δείχνοντας πέντε ή τρία δάχτυλα.

Στο τέλος της ημέρας, ένα μηχάνημα δεν κατανοεί πραγματικά την έννοια των χεριών και οι εικόνες από τις οποίες μαθαίνει δεν παρουσιάζουν πάντα τα χέρια με σαφήνεια ή συνέπεια. Γι' αυτό τα χέρια του Midjourney μπορεί να είναι τόσο άσχημα: σύγχυση AI.

Τόσο έγκυρο όσο Οι ανησυχίες του Elon Musk για την ανάπτυξη AI Ίσως, ορισμένα μέρη της τεχνολογίας έχουν ακόμα πολλά να μάθουν. Και τα εμπόδια τους ξεπερνούν τα ανεπαρκή παραδείγματα χεριών.

Άλλοι λόγοι για τους οποίους οι Γεννήτριες Εικόνας AI αργούν να βελτιωθούν

Κοιταζώ Τα μοντέλα του Midjourney, το v5 προσφέρει προηγμένη συνοχή μεταξύ των μηνυμάτων κειμένου και των παραγόμενων εικόνων, καθώς και υψηλότερη ανάλυση και πρόσθετα εργαλεία. Αλλά τέτοια επιτεύγματα δεν είναι φτηνά.

Για να εκπαιδεύσετε ένα AI να τα κάνει καλύτερα με τα χέρια απαιτεί να του δίνετε καλύτερες εικόνες, ειδικά σε 3D. Αυτό σημαίνει ότι δαπανάται πολύς χρόνος και ανθρώπινο δυναμικό σε διαδικασίες, από την απόκτηση υλικών πηγής έως τη βελτίωση της κωδικοποίησης και την επανάληψη της εκπαίδευσης έως ότου το AI να το κάνει σωστά.

Ακόμη και τότε, το λογισμικό μπορεί να κάνει λάθη σε κατά τα άλλα εκπληκτικά έργα τέχνης. Εκτός από τεράστια και πολύπλοκη δουλειά, είναι και ακριβή. Μην περιμένετε λοιπόν δωρεάν γεννήτριες κειμένου σε εικόνα AI να ανέβει στο διαμέτρημα του Midjourney μόλις.

Με απλά λόγια, το πρόβλημα με τους κινητήρες AI δεν έγκειται μόνο στην αδυναμία αυτών των προγραμμάτων υπολογιστών να κατανοήσουν πλήρως πώς φαίνονται ή λειτουργούν τα ανθρώπινα χαρακτηριστικά όπως τα χέρια και τα πόδια. Επίσης, εξαρτάται από το κόστος και την πρόσβαση της τεχνολογίας σε τρισδιάστατες εικόνες και τεχνικές μηχανικής εκμάθησης που μπορούν να βοηθήσουν τις γεννήτριες να αποκτήσουν μια πιο ρεαλιστική αντίληψη του κόσμου γύρω τους.

Οι γεννήτριες εικόνων AI δεν θα αγωνίζονται για πάντα

Τα χέρια είναι μια δύσκολη ιδέα για την τεχνητή νοημοσύνη να τυλίξει τη δυαδική της κεφαλή, αλλά οι λύσεις στο πρόβλημα βρίσκονται ήδη σε εφαρμογή. Το Midjourney, το DALL-E 2 και άλλες πλατφόρμες θα μπορέσουν τελικά να διατηρήσουν τα ιδιόμορφα δάχτυλα στο ελάχιστο, αν όχι να τα εξαλείψουν εντελώς.

Η πρόοδος σε άλλους τομείς της τεχνητής νοημοσύνης διασφαλίζει ότι η τεχνολογία εξελίσσεται συνεχώς και οι προγραμματιστές της μαθαίνουν πάντα νέους τρόπους να την εφαρμόζουν και να τη βελτιώνουν.