Η μηχανική όραση είναι το θεμέλιο των αυτοοδηγούμενων αυτοκινήτων και είναι ζωτικής σημασίας για ένα πλήρως αυτόνομο μέλλον.
Βασικά Takeaways
- Τα αυτοοδηγούμενα αυτοκίνητα βασίζονται στην τεχνολογία μηχανικής όρασης για να δουν και να κατανοήσουν το περιβάλλον τους, επιτρέποντάς τους να ανιχνεύουν αντικείμενα, να αναγνωρίζουν σήματα και να πλοηγούνται στο δρόμο.
- Η μηχανική όραση στα αυτοοδηγούμενα αυτοκίνητα αποτελείται από ένα σύστημα κάμερας, υπολογιστές άκρων και αλγόριθμους τεχνητής νοημοσύνης, που συνεργάζονται για τη συλλογή οπτικών πληροφοριών, την επεξεργασία τους σε πραγματικό χρόνο και τον εντοπισμό προτύπων και αντικείμενα.
- Η μηχανική όραση είναι ζωτικής σημασίας για την επίτευξη πλήρους αυτονομίας στα αυτόνομα αυτοκίνητα, καθώς επιτρέπει την ταξινόμηση αντικειμένων, την ανίχνευση λωρίδας και σήματος, την αναγνώριση σημάτων και την αναγνώριση κυκλοφορίας. Το μέλλον των αυτόνομων οχημάτων έγκειται στις εξελίξεις στην τεχνητή νοημοσύνη, στους υπολογιστές αιχμής και στην τεχνολογία κάμερας.
Τα αυτοοδηγούμενα αυτοκίνητα πάντα τραβούσαν την προσοχή. Αν και μπορεί να μην έχουμε ακόμη πλήρως αυτόνομα αυτοκίνητα, έχουμε αυτοκίνητα με προηγμένα συστήματα υποβοήθησης οδηγού (ADAS) ικανά για αυτόματο τιμόνι, αλλαγή λωρίδας, στάθμευση και cruise control με επίγνωση της κυκλοφορίας.
Ένα αυτοοδηγούμενο αυτοκίνητο χρησιμοποιεί πολλούς αισθητήρες για το ADAS του, με την μηχανική όραση να είναι ο κύριος τρόπος ανίχνευσης, αναγνώρισης και υπολογισμού της απόστασης των αντικειμένων και του γενικού περιβάλλοντος. Χωρίς μηχανική όραση, τα αυτόνομα αυτοκίνητα με cruise control και αυτόματο πιλότο είναι πολύ απίθανα.
Τι είναι το Machine Vision;
Η μηχανική όραση είναι μια τεχνολογία που επιτρέπει στις μηχανές να βλέπουν και να αναγνωρίζουν αντικείμενα στο περιβάλλον τους. Είναι ένα υποσύνολο της όρασης υπολογιστών που εστιάζει στις βιομηχανικές εφαρμογές ανίχνευσης αντικειμένων προσανατολισμένη στην όραση σε αυτόνομες μηχανές όπως τα ρομπότ και τα οχήματα.
Η μηχανική όραση σήμερα χρησιμοποιεί αλγόριθμους βαθιάς μάθησης AI, όπως συνελικτικά νευρωνικά δίκτυα (CNN) για τη δημιουργία ισχυρών και καλά γενικευμένων μοντέλων που μπορούν να αναγνωρίσουν με ακρίβεια αντικείμενα σε διάφορα συνθήκες. Καθιστά δυνατή την εφαρμογή της μηχανικής όρασης σε διάφορες εργασίες που απαιτούν υψηλότερη αξιοπιστία στην κατασκευή, τη γεωργία, τη ρομποτική και την αυτοκινητοβιομηχανία.
Πώς λειτουργεί το Machine Vision σε αυτοοδηγούμενα αυτοκίνητα;
Η μηχανική όραση στα αυτοοδηγούμενα αυτοκίνητα μπορεί συνήθως να χωριστεί σε τρία μέρη: το σύστημα κάμερας, την επεξεργασία (υπολογισμός άκρων) και την τεχνητή νοημοσύνη. Αυτή η στοίβα τεχνολογίας επιτρέπει σε ένα αυτόνομο όχημα να βλέπει, να σκέφτεται και να αναγνωρίζει σημάδια και εμπόδια κατά την οδήγηση. Ας συζητήσουμε κάθε μέρος σε βάθος για να κατανοήσουμε πώς αυτές οι τεχνολογίες συνδέονται μεταξύ τους για να σχηματίσουν το μηχανικό όραμα ενός αυτοοδηγούμενου αυτοκινήτου.
Σύστημα κάμερας
Η μηχανική όραση βασίζεται σε συστήματα κάμερας για τη συλλογή οπτικών πληροφοριών για το περιβάλλον. Τα αυτοοδηγούμενα αυτοκίνητα χρησιμοποιούν πολλές κάμερες που είναι εγκατεστημένες γύρω από το αυτοκίνητο για να συλλέξουν όσο το δυνατόν περισσότερες οπτικές πληροφορίες.
Δύο κύριοι αισθητήρες χρησιμοποιούνται στις κάμερες μηχανικής όρασης: συμπληρωματικοί ημιαγωγοί μεταλλικού οξειδίου (CMOS) και Συσκευές συζευγμένες με φόρτιση (CCD). Για αυτοοδηγούμενα αυτοκίνητα, το CMOS προτιμάται συχνά για τη γρήγορη ταχύτητα ανάγνωσης, το ισχυρό στο πλοίο ηλεκτρονικά και δυνατότητες παράλληλης επεξεργασίας, καθιστώντας τον ταχύτερο αισθητήρα, αν και επιρρεπής σε θόρυβο ή τεχνουργήματα. Λύσεις, όπως διαφορετικές λειτουργίες φωτισμού, ψηφιακή νυχτερινή όραση και φίλτρα, μπορεί να βοηθήσουν τον αισθητήρα CMOS σε συνθήκες φωτισμού λιγότερο από ιδανικές.
Για αυτοοδηγούμενα αυτοκίνητα, οι κάμερες εγκαθίστανται σε συγκεκριμένες αποστάσεις μεταξύ τους για να παράγουν στερεοσκοπική όραση. Η στερεοσκοπική όραση είναι η ικανότητα συνδυασμού δύο ή περισσότερων οπτικών εισόδων, δημιουργώντας μια αίσθηση βάθους ή τρισδιάστατης εικόνας στα αντικείμενα και στο περιβάλλον. Αυτό, με τη σειρά του, επιτρέπει στα αυτοκίνητα να τριγωνίζουν και να υπολογίζουν την κατά προσέγγιση απόσταση μεταξύ του αντικειμένου και του αυτοκινήτου.
Δεδομένου ότι οι άνθρωποι έχουν δύο μάτια, επωφελούμαστε και από τη στερεοσκοπική όραση. Μπορείτε να το δοκιμάσετε μόνοι σας. κλείστε το ένα μάτι και επιλέξτε ένα μικρό αντικείμενο από το γραφείο σας. Τοποθετήστε το χέρι σας στο πλάι του αντικειμένου και βεβαιωθείτε ότι η άκρη του αντικειμένου είναι τουλάχιστον δύο ίντσες μακριά. Δοκιμάστε να κάνετε παύση για μερικά δευτερόλεπτα και δείτε πόσο σίγουροι είστε με την προσέγγισή σας. Τώρα, δοκιμάστε να ανοίξετε και τα δύο μάτια και δείτε πώς η αίσθηση του βάθους σας είναι πολύ καλύτερη.
Υπολογιστής Edge
Ενώ το σύστημα κάμερας στο αυτοοδηγούμενο αυτοκίνητο συλλέγει δεδομένα, ένας ενσωματωμένος υπολογιστής (επεξεργαστής άκρων) θα επεξεργαστεί όλες τις εισόδους σε πραγματικό χρόνο για να ενημερώσει το σύστημα σχετικά με την κατάσταση του περιβάλλοντος αμέσως. Αν και οι τυπικές εργασίες μηχανικής όρασης μπορούν να εξοικονομήσουν χρήματα χρησιμοποιώντας το cloud computing, υπάρχουν απλώς πάρα πολλά κίνδυνος για αυτοοδηγούμενα αυτοκίνητα να συνδεθούν στο cloud, ακόμα κι αν πρόκειται για την εξωτερική ανάθεση της διαδικασίας στις απαιτήσεις της για μηχανική όραση.
Η χρήση ενός υπολογιστή αιχμής για την επεξεργασία δεδομένων εισόδου εξαλείφει τα προβλήματα καθυστέρησης και διασφαλίζει ότι τα δεδομένα λαμβάνονται, υποβάλλονται σε επεξεργασία και μεταδίδονται σε πραγματικό χρόνο. Οι υπολογιστές Edge για αυτοοδηγούμενα αυτοκίνητα χρησιμοποιούν εξειδικευμένους υπολογιστές που ενσωματώνουν επεξεργαστές γραφικών τεχνητής νοημοσύνης όπως ο Tensor Core της NVIDIA και οι πυρήνες CUDA.
Αλγόριθμοι AI
Οι αλγόριθμοι ήταν πάντα ένα κρίσιμο μέρος της μηχανικής όρασης. Ο αλγόριθμος είναι αυτός που επιτρέπει σε έναν υπολογιστή να αναγνωρίζει όλα τα μοτίβα, τα σχήματα και τα χρώματα που παρέχονται από το σύστημα κάμερας. Η χρήση της τεχνητής νοημοσύνης σε σχέση με πιο παραδοσιακούς αλγόριθμους μηχανικής όρασης ενισχύει σημαντικά την ικανότητα ενός αυτοοδηγούμενου αυτοκινήτου να αναγνωρίζει αξιόπιστα αντικείμενα, οδικές πινακίδες, οδικές σημάνσεις και φανάρια. Πολλοί αλγόριθμοι τεχνητής νοημοσύνης χρησιμοποιούνται για την εκπαίδευση αυτοοδηγούμενων αυτοκινήτων. Τα πιο δημοφιλή περιλαμβάνουν:
- YOLO (Μόνο μια φορά κοιτάς): Ένας αλγόριθμος ανίχνευσης αντικειμένων σε πραγματικό χρόνο που εντοπίζει και παρακολουθεί αντικείμενα στο οπτικό πεδίο του αυτοκινήτου.
- SIFT (Scale-Icar'sant Feature Transform): Χρησιμοποιείται για εξαγωγή χαρακτηριστικών, βοηθά το αυτοκίνητο να αναγνωρίζει διακριτικά ορόσημα και αντικείμενα στο περιβάλλον του.
- Ιστόγραμμα προσανατολισμένων κλίσεων (HOG): Χρησιμοποιείται για την αναγνώριση αντικειμένων, εστιάζει στην εξαγωγή τοπικών μοτίβων και διαβαθμίσεων από εικόνες.
- TextonBoost: Ένας αλγόριθμος που βοηθά στην αναγνώριση αντικειμένων αναλύοντας υφές στο περιβάλλον.
- AdaBoost: Χρησιμοποιείται για την ταξινόμηση δεδομένων, το AdaBoost συνδυάζει πολλούς αδύναμους ταξινομητές για να λάβει ισχυρές αποφάσεις σχετικά με τα αντικείμενα και τα εμπόδια στην πορεία του οχήματος.
Η σημασία της μηχανικής όρασης στα αυτοοδηγούμενα αυτοκίνητα
Η μηχανική όραση είναι ο πρωταρχικός τρόπος για ένα αυτοοδηγούμενο αυτοκίνητο να αισθάνεται και να κατανοεί το περιβάλλον του. Χωρίς μηχανική όραση, είναι πολύ πιθανό τα αυτοοδηγούμενα αυτοκίνητα να ωθηθούν πίσω στο Επίπεδο 1 του κλίμακα αυτονομίας οχήματος και μπορεί να μην φτάσει ποτέ σε πλήρη αυτονομία.
Με τη μηχανική όραση, τα αυτοοδηγούμενα αυτοκίνητα είναι πλέον ικανά για ταξινόμηση αντικειμένων, ανίχνευση λωρίδας και σήματος, αναγνώριση σημάτων και αναγνώριση κυκλοφορίας.
Αν και πολλά αυτοοδηγούμενα οχήματα χρησιμοποιούν πλέον διάφορους αισθητήρες, όπως LIDAR, RADAR και SONAR, όλα βασίζονται σε μεγάλο βαθμό σε μηχανική όραση για να δείτε το περιβάλλον, να αναγνωρίσετε αντικείμενα και να κατανοήσετε τη σημασία των πινακίδων και των φωτεινών σηματοδοτών στο δρόμος. Όλοι αυτοί οι επιπλέον αισθητήρες υπάρχουν μόνο για να αυξήσουν την όραση των μηχανών και να βελτιώσουν την ασφάλεια ανθρώπων, ζώων και ιδιοτήτων.
Τούτου λεχθέντος, η μηχανική όραση μπορεί να λειτουργεί ανεξάρτητα χωρίς τη βοήθεια άλλων αισθητήρων για την παροχή δυνατοτήτων αυτόματου πιλότου. Στην πραγματικότητα, τα νεότερα αυτοοδηγούμενα αυτοκίνητα της Tesla έριξαν το RADAR και τώρα βασίζονται αποκλειστικά στη μηχανική όραση για το σύστημα αυτόματου πιλότου.
Αν και αυτό δεν σημαίνει τίποτα από την άποψη της απαξίωσης της χρησιμότητας άλλων τεχνολογιών αισθητήρων, δείχνει τη σημασία και τη δύναμη της μηχανικής όρασης στα αυτόνομα αυτοκίνητα.
Το μέλλον της μηχανικής όρασης στα αυτόνομα οχήματα
Η μηχανική όραση είναι το θεμέλιο των αυτοοδηγούμενων αυτοκινήτων. Μέσω της μηχανικής όρασης, τα αυτοκίνητα μπορούν να δουν και να αντιληφθούν το περιβάλλον ακριβώς όπως οι άνθρωποι. Ενώ οι προκλήσεις εξακολουθούν να υφίστανται, τα οφέλη της μηχανικής όρασης όσον αφορά την ασφάλεια και την πλοήγηση δεν μπορούν να υποτιμηθούν. Όσον αφορά το μέλλον των αυτόνομων οχημάτων, οποιεσδήποτε περαιτέρω εξελίξεις στην τεχνητή νοημοσύνη, τους υπολογιστές αιχμής και/ή την κάμερα Η τεχνολογία σίγουρα θα κάνει τα αυτοοδηγούμενα αυτοκίνητα πιο ικανά, κάτι που πιθανότατα θα τα οδηγήσει σε υψηλότερο επίπεδο αυτοματοποίηση.