Έχετε δει πιθανώς εφαρμογές που ισχυρίζονται ότι μεταφράζουν αυτό που λέει η γάτα σας. Αλλά μπορούν πραγματικά να μεταφράσουν το νιαούρισμα της γάτας σας στα Αγγλικά; Η σύντομη απάντηση είναι ναι, κάπως. Είναι δύσκολο λόγω του πόσο μοναδική είναι η "γλώσσα" κάθε γάτας, αλλά μπορούν να φτάσουν πολύ κοντά στη σύγχρονη τεχνολογία.

Οι εφαρμογές μετάφρασης γάτας όπως το MeowTalk χρησιμοποιούν μια μορφή αναγνώρισης ομιλίας που δίνει έμφαση στη μηχανική εκμάθηση. Ας κοιτάξουμε πιο κοντά.

Αναγνώριση ομιλίας και μηχανική μάθηση

Μαίρη Τερέζα Μακλίν /Pixabay

Η αναγνώριση ομιλίας λειτουργεί καταγράφοντας ομιλία και μετατρέποντας τον ήχο σε ψηφιακό αρχείο δεδομένων. Κωδικοποιεί δεδομένα όπως το βήμα και τον όγκο ως σημεία δεδομένων που η εφαρμογή μπορεί να αναλύσει και να ταιριάξει με τις έννοιες. Μικρόφωνα DPA εξηγεί ότι αυτά τα σημεία δεδομένων μπορεί να φαίνονται πολύ διαφορετικά ανάλογα με τους ήχους στο παρασκήνιο και τον τρόπο που λέγεται μια λέξη.

Μερικές φορές θεωρούμε δεδομένη τη φωνητική αναγνώριση, αλλά είναι ένα απίστευτο επίτευγμα τεχνολογίας. Ιδιαίτερα λαμβάνοντας υπόψη πόσο περίπλοκη είναι η ανθρώπινη ομιλία. Οπως και

instagram viewer
Ο επιστήμονας εξηγεί, κάθε λέξη περιλαμβάνει ένα ευρύ φάσμα ήχων ή "φωνήματα" αναμεμιγμένα μεταξύ τους. Η απόκτηση υπολογιστή για την κατανόηση της ομιλίας είναι πολύ δύσκολη. Τα νέα σύνορα των ήχων της γάτας θα είναι ακόμη πιο δύσκολα.

Οι εφαρμογές που χρησιμοποιούν αναγνώριση ομιλίας προγραμματίζονται με ένα "λεξιλόγιο" λέξεων που ονομάζονται σύνολο δεδομένων. Στη συνέχεια, η εφαρμογή ταιριάζει με την ομιλία σας στην πλησιέστερη επιλογή στο λεξιλόγιο δεδομένων.

Όταν κάνει λάθος, το διορθώνετε και αποθηκεύει αυτά τα δεδομένα για την επόμενη φορά. Αυτό είναι μέρος της μηχανικής μάθησης. Είναι πώς ένα πρόγραμμα μαθαίνει να αναγνωρίζει την ομιλία ακόμα και όταν δεν είναι πανομοιότυπο με το σύνολο δεδομένων με το οποίο ξεκίνησε.

Σχετιζομαι με: Τι είναι οι αλγόριθμοι μηχανικής εκμάθησης; Δείτε πώς λειτουργούν

Η αναγνώριση φωνής εξακολουθεί να έχει προβλήματα, ειδικά με εμπόδια ομιλίας και τόνους. Ορισμένες εταιρείες είναι βελτίωση της μηχανικής μάθησης για την αντιμετώπιση αυτών των ζητημάτων, αν και. Με την πάροδο του χρόνου, η μηχανική εκμάθηση μπορεί να μετατρέψει την αναγνώριση ομιλίας σε ένα ισχυρό εργαλείο.

Έτσι λειτουργεί η αναγνώριση ομιλίας για τους ανθρώπους. Λειτουργεί όμως για γάτες;

Αναγνώριση ομιλίας εναντίον Αναγνώριση Meow

Αριάνα Σουάρεζ /Απεμπλοκή

Πρώτον, πρέπει να καταλάβουμε γιατί η μετάφραση ενός συγκεκριμένου είδους meow ως "πεινάω" είναι διαφορετική από την ανάλυση της ανθρώπινης ομιλίας. Το πρόβλημα είναι κυρίως ότι η επικοινωνία της γάτας βασίζεται περισσότερο σε μη λεκτικά στοιχεία όπως η στάση του σώματος. Ένα άλλο πρόβλημα είναι η απουσία καθολικής «γλώσσας γάτας».

Σύμφωνα με την ASPCA, οι άγριες άγριες γάτες δεν χτυπούν ποτέ ο ένας τον άλλον, μόνο σε ανθρώπους. Άλλες έρευνες από η Ανθρωπιστική Εταιρεία προσθέτει ότι αυτοί οι ήχοι "δεν εμφανίζονται σε κενό". Πρέπει να τα ερμηνεύσουμε παράλληλα με τη γλώσσα του σώματος και άλλα πλαίσια. Σε πολλές περιπτώσεις, αυτά τα σιωπηλά σήματα είναι η μόνη διαφορά μεταξύ ενός meow που σημαίνει "πεινάω" και ενός που σημαίνει "θέλω να παίξω".

Προσθέτοντας αυτό το πρόβλημα, καμία γάτα δεν έχει την ίδια γλώσσα. Οι γάτες αναπτύσσουν εξατομικευμένες "γλώσσες" για τους ιδιοκτήτες τους. Αυτά βασίζονται εν μέρει στη μίμηση της φωνής του ιδιοκτήτη και εν μέρει στην προσωπικότητα της γάτας. Δεν ακούγονται δύο γάτες το ίδιο, ακόμη και όταν μεταφέρουν την ίδια επιθυμία ή ανάγκη. Πώς μπορεί λοιπόν να μεταφράσει το λεξιλόγιο ομιλίας μιας εφαρμογής για όλα αυτά;

Ευέλικτη μηχανική εκμάθηση για γάτες

Δωρεάν χρήση ήχων /Απεμπλοκή

Αν και μερικοί εικονικοί βοηθοί αρέσουν Ότο προσπάθεια κατανόησης του τόνου και του συναισθήματος, η αναγνώριση ομιλίας εξακολουθεί να είναι τρομερή σε μη λεκτικά σήματα. Αλλά αυτό δεν σημαίνει ότι είναι αδύνατο να τα ερμηνεύσουμε.

Το MeowTalk χρησιμοποιεί ένα πιο ευέλικτο είδος μηχανικής μάθησης για να βοηθήσει στην επίλυση αυτών των ζητημάτων.

Κατεβάστε: MeowTalk για Android | iOS (Ελεύθερος)

Το Meowtalk δημιουργήθηκε από τον Javier Sanchez, ο οποίος εργάστηκε επίσης στην ομάδα της Alexa. Φαντάστηκε την εφαρμογή ως ένα βήμα προς τα έξυπνα κολάρα. Αυτά τα περιλαίμια θα μεταφράσουν τους ήχους της γάτας σε ανθρώπινο λόγο, αντλώντας από σύνθετες στρατηγικές μηχανικής μάθησης για να βοηθήσουν τους ανθρώπους να κατανοήσουν καλύτερα και να φροντίσουν τις γάτες τους.

Η ομάδα του MeowTalk αντιστάθμισε ζητήματα μοναδικότητας δημιουργώντας πιο συγκεκριμένα προφίλ για κάθε γάτα. Στην εφαρμογή, καταχωρίζετε κάθε γάτα ξεχωριστά. Επιστήμη Νορβηγία αναφέρει ότι τα γατάκια γλιστρούν διαφορετικά από τις ενήλικες γάτες, οπότε η εφαρμογή ζητά επίσης τα γενέθλια της γάτας. Κάθε προφίλ δημιουργεί ένα μοναδικό δίκτυο δεδομένων για τη γάτα, ενσωματώνοντας λίγο βαθιά μάθηση στη μηχανική εκμάθηση.

Σχετιζομαι με: Βαθιά μάθηση εναντίον Μηχανική εκμάθηση εναντίον AI: Πώς πηγαίνουν μαζί;

Για λεξιλόγιο, το MeowTalk ξεκινά με 10 προφίλ ήχου στο σύνολο δεδομένων του. Κάθε ένα έχει διαφορετικό νόημα, όπως "χαρούμενος" ή "κυνήγι". Όταν η εφαρμογή ακούει έναν ήχο και κάνει λάθος, μπορείτε είτε να τον διορθώσετε είτε να δημιουργήσετε μια νέα ερμηνεία.

CATSOUNDS δεδομένα συλλέχθηκαν από Akvelon

Η διόρθωση λέει στην εφαρμογή να αντικαταστήσει το βασικό λεξιλόγιο με τον νέο ήχο.

Για παράδειγμα, μπορείτε να πείτε στην εφαρμογή να ταιριάζει με το "Κυνήγι" με τα μικρά χτενίσματα αντί για μια μακρά κουκουβάγια. Αυτό το είδος διόρθωσης είναι πιο χρήσιμο από την προσθήκη πολλαπλών ήχων για να ταιριάζει με έναν που σημαίνει τον τρόπο αναγνώρισης ομιλίας, κάτι που θα ήταν σαν να πείτε στην εφαρμογή ότι ένα μακρύ κούρεμα και μια μικρή κουβέντα και τα δυο σημαίνει "Μητέρα κλήση."

Η μηχανική εκμάθηση σε εφαρμογές αναγνώρισης ομιλίας αντιστέκεται συνήθως σε αυτόν τον τύπο αντικατάστασης. Θα ήταν σαν να προσπαθείτε να διδάξετε στον Σίρι ότι όταν λέτε "blog blog", εννοείτε πραγματικά "αχλάδι". Αλλά η πιο ευέλικτη μορφή μηχανικής μάθησης που χρησιμοποιεί το MeowTalk μπορεί να χειριστεί αυτήν τη διόρθωση περισσότερο εύκολα.

Η δημιουργία μιας νέας ερμηνείας προσθέτει μια έννοια που δεν είχε προηγουμένως κωδικοποιηθεί. Για παράδειγμα, εάν η γάτα σας έχει μια συγκεκριμένη κλήση όταν θέλει το αγαπημένο της παιχνίδι, μπορείτε να προσθέσετε την επιλογή "Θέλω το ποντίκι μου". Είναι παρόμοιο με την προσθήκη μιας λέξης στο λεξικό αυτόματης διόρθωσης.

Σχετιζομαι με: Πώς να ορίσετε τις δικές σας λέξεις αυτόματης διόρθωσης σε Android

Με την πάροδο του χρόνου, μπορείτε να αναπτύξετε ένα εξαιρετικά εξατομικευμένο προφίλ ομιλίας για τη γάτα σας. Τελικά, μπορεί ακόμη και να είναι αρκετά εξελιγμένο για να είναι χρήσιμο για τα κατοικίδια ζώα ή για την επίλυση προβλημάτων συμπεριφοράς. Αν δεν υπάρχει τίποτα άλλο, βοηθά τους ιδιοκτήτες γάτας να είναι πιο προσεκτικοί στα κατοικίδια ζώα τους.

Η ετυμηγορία: Λειτουργούν οι εφαρμογές μετάφρασης γάτας;

Στο τέλος, η "μετάφραση γάτας" εξακολουθεί να βασίζεται πολύ στον χρήστη που διδάσκει στην εφαρμογή πώς μιλάει η γάτα τους. Αυτό πιθανότατα θα ισχύει πάντα λόγω του πόσο μοναδική είναι η επικοινωνία κάθε γάτας.

Αλλά το γεγονός ότι η μηχανική μάθηση έχει φτάσει μέχρι στιγμής που οι προγραμματιστές μπορούν ακόμη και να επιτύχουν εν μέρει σε αυτό είναι απίστευτο. Η μηχανική εκμάθηση και η τεχνητή νοημοσύνη εξελίσσονται με πρωτοποριακές ταχύτητες και δεν μπορούμε να περιμένουμε να δούμε πού πηγαίνουν στη συνέχεια.

ΗΛΕΚΤΡΟΝΙΚΗ ΔΙΕΥΘΥΝΣΗ
Σχετικά θέματα
  • Η τεχνολογία εξηγείται
  • Εκμάθηση γλώσσας
  • Μηχανική εκμάθηση
Σχετικά με τον Συγγραφέα
Νάταλι Στιούαρτ (Δημοσιεύθηκαν 16 άρθρα)

Η Natalie Stewart είναι συγγραφέας του MakeUseOf. Αρχικά ενδιαφερόταν για την τεχνολογία στο κολέγιο και ανέπτυξε ένα πάθος για τη γραφή των μέσων ενημέρωσης στο πανεπιστήμιο. Η Natalie επικεντρώνεται στην τεχνολογία που είναι προσβάσιμη και εύχρηστη και αγαπά τις εφαρμογές και τις συσκευές που κάνουν τη ζωή απλούστερη για τους καθημερινούς ανθρώπους.

Περισσότερα από την Natalie Stewart

Εγγραφείτε στο Newsletter μας

Εγγραφείτε στο ενημερωτικό δελτίο μας για τεχνικές συμβουλές, κριτικές, δωρεάν ebook και αποκλειστικές προσφορές!

Ένα ακόμη βήμα…!

Επιβεβαιώστε τη διεύθυνση email σας στο email που μόλις σας στείλαμε.

.