Τα εργαλεία AI στη μουσική παραγωγή δεν είναι κάτι καινούργιο. Τι γίνεται όμως με τη μουσική που δημιουργείται από την αρχή με AI; Είναι και αυτό πλέον πραγματικότητα.
Το Generative AI εξαπλώνεται σιγά σιγά σε όλο και περισσότερους κλάδους της δημιουργικής βιομηχανίας. Ξεκίνησε με γεννήτριες τέχνης AI και στη συνέχεια εξαπλώθηκε στη γραφή με κείμενο που δημιουργήθηκε από AI. Τώρα, μπορούμε να προσθέσουμε μουσική σε αυτή τη λίστα.
Στο εγγύς μέλλον, η μουσική που δημιουργείται από την τεχνητή νοημοσύνη, που γεννήθηκε από την αρχή, θα γίνει πραγματικότητα. Στην πραγματικότητα, είναι ήδη μια δυνατότητα με το Jukebox, το μοντέλο τεχνητής νοημοσύνης του OpenAI που δημιουργεί μουσική. Δεν είναι ακόμη διαθέσιμο σε μια εύχρηστη εφαρμογή και δεν ακούγεται αρκετά καλό ακόμα, αλλά τα αλγοριθμικά οστά είναι εκεί.
Εδώ είναι τι πρέπει να γνωρίζετε για το Jukebox του OpenAI και τι μπορείτε να κάνετε με αυτό.
Jukebox: AI που δημιουργεί μουσική ως ακατέργαστο ήχο
Το Jukebox είναι ένα νευρωνικό δίκτυο που μπορεί να δημιουργήσει μουσική σε ακατέργαστη μορφή ήχου όταν του δίνετε στοιχεία όπως είδος, καλλιτέχνη ή στίχους. Κυκλοφόρησε τον Απρίλιο του 2020 από την OpenAI, την ίδια εταιρεία που μας έφερε τη γεννήτρια τέχνης AI με το όνομα Dall-E και το chatbot AI που ονομάζεται ChatGPT.
Σε αντίθεση με το Dall-E, το οποίο εξαπλώθηκε γρήγορα σε όλο τον κόσμο και έκανε την τεχνητή νοημοσύνη ένα πυρετό θέμα ειδήσεων και μέσων ενημέρωσης, το Jukebox δεν σημείωσε μεγάλη ποικιλία ενδιαφέροντος μετά την κυκλοφορία του. Ένας λόγος για αυτό είναι ότι δεν διαθέτει μια φιλική προς το χρήστη εφαρμογή web — τουλάχιστον όχι ακόμα.
Μπορείτε να βρείτε τον κωδικό στο Ιστότοπος OpenAI, μαζί με μια εις βάθος εξήγηση του τρόπου λειτουργίας της διαδικασίας κωδικοποίησης και αποκωδικοποίησης.
Ένας άλλος πιθανός λόγος είναι ότι χρειάζεται τεράστιος χρόνος και υπολογιστική ισχύς. Για να σας δώσουμε μια ιδέα, η απόδοση ήχου ενός μόνο λεπτού μπορεί να διαρκέσει 9 ώρες. Θα χρειαστείτε προθυμία να εξερευνήσετε το μοντέλο στην κωδική μορφή του, καθώς και πολλή υπομονή αν θέλετε να δείτε τι μπορεί να κάνει ένα μοντέλο AI για να δημιουργήσει μουσική.
Ή, μπορείτε να μεταβείτε στο Jukebox Sample Explorer. Αυτό είναι όπου το OpenAI έχει δημοσιεύσει τα πειράματά του από τη δημιουργία τραγουδιών που μοιάζουν με την Ella Fitzgerald ή το 2Pac.
Για να είμαι ξεκάθαρος, άλλα μουσικά εργαλεία AI υπάρχουν για να σας βοηθήσουν να δημιουργήσετε ένα τραγούδι, αλλά δεν παράγουν ήχο από την αρχή. Αντίθετα, είτε συνδυάζουν προηχογραφημένα δείγματα είτε δημιουργούν πληροφορίες MIDI που τοποθετούνται μέσω ενός ψηφιακού συνθεσάιζερ.
Πώς ακούγεται το Jukebox;
Τα αποτελέσματα του Jukebox είναι αναγνωρίσιμα αλλά περίεργα. Δεν είναι δύσκολο να καταλάβεις το σχήμα του τραγουδιού και το είδος στο οποίο ανήκει, αλλά την ποιότητα των αποτελεσμάτων το κάνει να ακούγεται σαν να ακούτε κάποια από τις παλαιότερες ηχογραφημένες μουσικές: δηλαδή, πνιχτό με άφθονα θόρυβος.
Είναι ασφαλές να πούμε ότι το Jukebox δεν παράγει τον ήχο υψηλής πιστότητας που θα ακούσατε από ένα ζευγάρι καλά ακουστικά. Είναι περισσότερο σαν να ακούς μουσική από έναν ραδιοφωνικό σταθμό που δεν είναι πλήρως συντονισμένος στη σωστή συχνότητα. Μερικά τραγούδια είναι επανεκδόσεις ενώ άλλα είναι συνέχεια υπαρχόντων τραγουδιών. Υπάρχει επίσης μια κατηγορία για μυθιστορηματικούς καλλιτέχνες και στυλ, καθώς και αφανείς στίχους.
Παρά την ποιότητα του ήχου, οι πρώτοι πειραματιστές περιγράφουν ότι τους προκαλεί δέος η απόκοσμη ομορφιά και η παράξενη φύση της μουσικής που δημιουργεί το Jukebox. «Σαν σάουντρακ σε τεκμηρίωση για μια άγνωστη χώρα με άγνωστη κουλτούρα», γράφει Merzmench στο Medium.
Επί του παρόντος, τα αποτελέσματα απέχουν πολύ από το να είναι αρκετά καλά για να αντιγράψουν, ή ακόμα και να αντικαταστήσουν, τη μουσική που δημιουργήθηκε από ανθρώπους, αλλά το Η τεχνολογία κινείται γρήγορα και, αρκετά σύντομα, μοντέλα όπως το Jukebox θα είναι σε θέση να επιτύχουν αυτά τα κατορθώματα πολύ.
Πώς εκπαιδεύτηκε το Jukebox του OpenAI
Μέρος του τρόπου με τον οποίο το Jukebox μπορεί να δημιουργήσει μουσική που δεν υπήρξε ποτέ πριν είναι ότι έχει εκπαιδευτεί στη μουσική πραγματικών μουσικών. Το OpenAI εξηγεί ότι:
"Για να εκπαιδεύσουμε αυτό το μοντέλο, ανιχνεύσαμε τον ιστό για να επιμεληθούμε ένα νέο σύνολο δεδομένων 1,2 εκατομμυρίων τραγουδιών (600.000 από τα οποία είναι στα αγγλικά), σε συνδυασμό με τους αντίστοιχους στίχους και μεταδεδομένα από το LyricWiki."
Η ανίχνευση δεδομένων είναι μια πρακτική που χρησιμοποιείται από ορισμένες εταιρείες τεχνητής νοημοσύνης για τη δημιουργία ενός συνόλου δεδομένων από τα οποία ένα μοντέλο τεχνητής νοημοσύνης μπορεί να χρησιμοποιήσει για να μάθει και να λάβει αποφάσεις κατά τη δημιουργία μιας εικόνας, κειμένου —ή σε αυτήν την περίπτωση— μουσικής. Τα σύνολα δεδομένων που δημιουργούνται με ανίχνευση είναι αμφιλεγόμενα επειδή δεν λαμβάνεται εξαρχής η συγκατάθεση από τους κατόχους των δεδομένων. Ωστόσο, ορισμένες πλατφόρμες σας το επιτρέπουν εξαιρεθείτε από το περιεχόμενό σας από σύνολα δεδομένων.
Μπορεί να πιστεύετε ότι 1,2 εκατομμύρια τραγούδια είναι πολλά, αλλά συγκριτικά, το Dall-E 2 εκπαιδεύτηκε σε εκατοντάδες εκατομμύρια ζεύγη εικόνας-κειμένου από το διαδίκτυο. Έχοντας αυτό κατά νου, το Jukebox έχει τους περιορισμούς του.
Η σχετικά μικρή προπονητική του πισίνα δεν μπορεί να αποτυπώσει τον πλούτο και την ποικιλομορφία της ανθρώπινης μουσικής. Το OpenAI έχει δηλώσει ότι έχει εκπαιδευτεί σε μεγάλο βαθμό στη δυτική μουσική, αντιπροσωπεύοντας μια σαφή προκατάληψη ως προς τη μουσική που μπορεί να παράγει.
Τι μπορείτε να κάνετε με το Jukebox;
Λοιπόν, έχοντας υπόψη τους περιορισμούς του, τι μπορείτε να κάνετε με το Jukebox; Ένας γρήγορος τρόπος για να απαντήσετε σε αυτήν την ερώτηση είναι να πείτε τι δεν μπορείτε να κάνετε με το Jukebox.
Επειδή χρειάζεται σχεδόν μισή μέρα για να αποδοθεί ένα λεπτό μουσικής, δεν είναι πολύ χρήσιμο για την παραγωγή μουσικής. Τουλάχιστον, όχι με την παραδοσιακή έννοια. Κανονικά, οι μουσικοί κινούνται πέρα δώθε μεταξύ του να παίζουν σε ένα όργανο (αυτοσχεδιάζοντας) και στο σχεδιασμό της δομής ενός τραγουδιού. Το ίδιο είδος πειραματισμού δεν είναι δυνατό με το Jukebox.
Δεδομένου ότι δεν είναι εύκολο να δημιουργήσετε ένα τραγούδι με το Jukebox σε αυτό το στάδιο, μπορείτε να το σκεφτείτε περισσότερο ως έναν νέο τρόπο δημιουργίας δειγμάτων μουσικής. Αφού δημιουργήσετε ήχο που σας αρέσει, μπορείτε να τον χρησιμοποιήσετε στα δημιουργικά σας έργα όπως θα μπορούσατε να κάνετε συνήθως.
Το παρακάτω βίντεο είναι το αποτέλεσμα κάποιου που χρησιμοποιεί μουσική που δημιουργήθηκε με το Jukebox για να υπογραμμίσει ένα σύντομο βίντεο μοντάζ.
Η τεχνητή νοημοσύνη έχει ένα ευρύ φάσμα εφαρμογών και εκτός δημιουργικών εφαρμογών, γι' αυτό και αξίζει κατανοώντας τι είναι η τεχνητή νοημοσύνη και τους κινδύνους που εγκυμονεί.
Σας συγκινεί η AI Music;
Η μουσική που δημιουργείται από το Jukebox δεν είναι εύκολο να απορριφθεί, και παρ' όλη την παράξενη και απόκοσμη ποιότητα της ανθρώπινης μηχανής, τελικά ακούγεται σαν μουσική. Ενώ η μουσική βιομηχανία χρησιμοποιεί εργαλεία τεχνητής νοημοσύνης εδώ και αρκετό καιρό, η δυνατότητα δημιουργίας μουσικής ως ακατέργαστου ήχου είναι μόνο τώρα πραγματικότητα.
Όμως, ενώ υπάρχουν μοντέλα όπως το Jukebox, δεν έχουν ακόμη συσκευαστεί σε ένα εμπορικό εργαλείο και εξακολουθούν να υπολείπονται των δυνατοτήτων των ανθρώπινων μουσικών.