Το YOLO-NAS είναι η κορυφή των μοντέλων ανίχνευσης αντικειμένων στη σειρά YOLO. Γιατί όμως θεωρείται το καλύτερο;

Μετά το YOLOv8, υπάρχει ακόμα ένα νέο και καλύτερο μοντέλο ανίχνευσης αντικειμένων τελευταίας τεχνολογίας, το YOLO-NAS. Είναι ένας αλγόριθμος ανίχνευσης αντικειμένων που αναπτύχθηκε από την Deci AI για να αντιμετωπίσει τους περιορισμούς των προηγούμενων μοντέλων YOLO (You Only Look Once).

Το μοντέλο κατασκευάστηκε από το AutoNAC, μια μηχανή αναζήτησης νευρωνικής αρχιτεκτονικής. Ξεπερνά την ταχύτητα και την απόδοση των μοντέλων SOTA, γεγονός που παρουσιάζει ένα μεγάλο άλμα στην ανίχνευση αντικειμένων βελτιώνοντας τις αντισταθμίσεις υποστήριξης ακρίβειας-λανθάνοντος χρόνου και κβαντισμού.

Αυτό το άρθρο θα συζητήσει τα δυνατά και τα χαρακτηριστικά του YOLO-NAS, διερευνώντας γιατί είναι το καλύτερο μοντέλο ανίχνευσης αντικειμένων στη σειρά YOLO.

Κατανόηση του τρόπου λειτουργίας του YOLO-NAS

Το AutoNAC του Deci (Αυτοματοποιημένη Νευρωνική Αρχιτεκτονική Κατασκευή) δημιουργεί την αρχιτεκτονική του YOLO-NAS. Το AutoNAC είναι μια απρόσκοπτη διαδικασία που παρέχει ώθηση απόδοσης στα υπάρχοντα βαθιά νευρωνικά δίκτυα.

instagram viewer

Ο αγωγός AutoNAC παίρνει ένα βαθύ νευρωνικό δίκτυο εκπαιδευμένο από τον χρήστη ως είσοδο, ένα σύνολο δεδομένων και πρόσβαση σε ένα σύστημα συμπερασμάτων. Στη συνέχεια, το βαθύ νευρωνικό δίκτυο που έχει εκπαιδευτεί από χρήστες υποβάλλεται σε επανασχεδιασμό χρησιμοποιώντας τη σωλήνωση. Στη συνέχεια επιτυγχάνεται μια βελτιστοποιημένη αρχιτεκτονική με χαμηλότερο λανθάνοντα χρόνο χωρίς να διακυβεύεται η ακρίβεια.

Το YOLO-NAS χρησιμοποιεί RepVGG. Το RepVGG το καθιστά διαθέσιμο για βελτιστοποίηση μετά την προπόνηση με επαναπαραμετροποίηση ή κβαντοποίηση μετά την εκπαίδευση. Είναι ένας τύπος αρχιτεκτονικής νευρωνικών δικτύων που βασίζεται στο VGG. Χρησιμοποιεί τεχνικές τακτοποίησης που έχουν σχεδιαστεί για να ενισχύσουν την ικανότητα γενίκευσης των μοντέλων βαθιάς μάθησης.

Ο σχεδιασμός της αρχιτεκτονικής είναι πιο αποτελεσματικός σε ταχύτητα και μνήμη. Το RepVGG υποβάλλεται σε εκπαίδευση χρησιμοποιώντας μια αρχιτεκτονική πολλαπλών κλάδων για να επιτύχει ένα ταχύτερο συμπέρασμα. Στη συνέχεια, μετατρέπεται σε έναν κλάδο χρησιμοποιώντας εκ νέου παραμετροποίηση.

Αυτή η δυνατότητα καθιστά το YOLO-NAS πολύ χρήσιμο για την ανάπτυξη παραγωγής. Αυτό οφείλεται στο γεγονός ότι είναι δυνατό να εκπαιδεύσετε και να βελτιστοποιήσετε το μοντέλο με πλήρη ακρίβεια για ταχύτητα συμπερασμάτων και χρήση μνήμης.

Βασικά χαρακτηριστικά του YOLO-NAS

Τα βασικά χαρακτηριστικά του YOLO-NAS περιλαμβάνουν τα ακόλουθα:

  • Εκπαίδευση με επίγνωση κβαντικοποίησης: Το μοντέλο χρησιμοποιεί QSP και QCI (ενότητες με επίγνωση κβαντισμού) για να μειώσει την απώλεια ακρίβειας κατά την κβαντοποίηση μετά την εκπαίδευση συνδυάζοντας την εκ νέου παραμετροποίηση της κβαντοποίησης 8-bit.
  • Αυτόματος αρχιτεκτονικός σχεδιασμός: Το AutoNAC, η αποκλειστική τεχνολογία NAS της Deci αναζητά μια βέλτιστη αρχιτεκτονική μοντέλων που ενσωματώνει τις θεμελιώδεις αρχιτεκτονικές μοντέλων YOLO για να καταλήξει σε ένα βελτιστοποιημένο μοντέλο.
  • Υβριδική τεχνική κβαντισμού: Η τυπική μέθοδος κβαντισμού επηρεάζει ολόκληρο το μοντέλο. Αντίθετα, η τεχνική υβριδικής κβαντοποίησης κβαντοποιεί ένα τμήμα ενός μοντέλου για να εξισορροπήσει την καθυστέρηση και την ακρίβεια του μοντέλου.
  • Χρησιμοποιήστε μοναδικές προσεγγίσεις για να προετοιμάσετε το μοντέλο για εκπαίδευση χρησιμοποιώντας δεδομένα με αυτόματη σήμανση. Στη συνέχεια, το μοντέλο μαθαίνει από τις προβλέψεις του και έχει πρόσβαση σε μεγάλες ποσότητες δεδομένων.

Συγκριτική Ανάλυση: YOLO-NAS vs Άλλα μοντέλα YOLO

Ακολουθεί μια σύγκριση μεταξύ διαφόρων μοντέλων της σειράς YOLO.

Το YOLO-NAS είναι καλύτερο από τα προϋπάρχοντα μοντέλα ανίχνευσης αντικειμένων, αλλά έρχεται με τα μειονεκτήματά του. Ακολουθεί μια λίστα με τα οφέλη και τα μειονεκτήματα του YOLO-NAS:

Πλεονεκτήματα

  • Είναι ανοιχτού κώδικα.
  • Είναι 10-20% πιο γρήγορο από τα προϋπάρχοντα μοντέλα YOLO.
  • Είναι πιο ακριβές σε σύγκριση με τα προϋπάρχοντα μοντέλα YOLO.
  • Χρησιμοποιεί μια καλύτερη αρχιτεκτονική, το AutoNAC. Αυτό θέτει ένα νέο ρεκόρ στην ανίχνευση αντικειμένων, παρέχοντας την καλύτερη απόδοση αντιστάθμισης ακρίβειας και καθυστέρησης.
  • Απρόσκοπτη υποστήριξη για μηχανές συμπερασμάτων όπως η NVIDIA. Αυτό το χαρακτηριστικό το καθιστά ένα μοντέλο έτοιμο για παραγωγή.
  • Έχει καλύτερη απόδοση μνήμης και αυξημένες ταχύτητες συμπερασμάτων.

Μειονεκτήματα

  • Δεν είναι ακόμη σταθερό, καθώς η τεχνολογία είναι ακόμα νέα και δεν έχει χρησιμοποιηθεί άγρια ​​στην παραγωγή.

Υλοποίηση YOLO-NAS

θα χρησιμοποιήσετε Google Colab για να γράψετε και να εκτελέσετε τους κωδικούς σε αυτήν την υλοποίηση. Μια εναλλακτική λύση για το Google Colab θα ήταν δημιουργήστε ένα εικονικό περιβάλλον και χρησιμοποιήστε ένα IDE στον τοπικό σας υπολογιστή.

Το μοντέλο απαιτεί πολύ πόρους. Βεβαιωθείτε ότι διαθέτετε τουλάχιστον 8 GB RAM πριν τη χρησιμοποιήσετε στο μηχάνημά σας. Όσο μεγαλύτερο είναι το μέγεθος του βίντεο, τόσο περισσότερη μνήμη χρησιμοποιεί.

Εγκατάσταση εξαρτήσεων

Εγκαταστήστε την εξάρτηση YOLO-NAS, υπερ-κλίσεις χρησιμοποιώντας την παρακάτω εντολή:

Pip install super-gradients==3.1.2

Μετά από μια επιτυχημένη εγκατάσταση, θα μπορείτε πλέον να εκπαιδεύσετε το μοντέλο YOLO-NAS.

Εκπαίδευση μοντέλου

Για να εκπαιδεύσετε το μοντέλο, εκτελέστε το μπλοκ κώδικα παρακάτω:

από super_gradients.εκπαίδευση εισαγωγή μοντέλα
yolo_nas_l = models.get("yolo_nas_l", pretrained_weights="κακάο")

Εισάγετε το μοντέλο εκπαίδευσης από την εγκατεστημένη βιβλιοθήκη SuperGradients σε αυτόν τον κώδικα. Στη συνέχεια, χρησιμοποιείτε τα προεκπαιδευμένα βάρη μοντέλων από το σύνολο δεδομένων COCO.

Συμπέρασμα μοντέλου

Το συμπέρασμα μοντέλου έχει πιθανές εφαρμογές για εργασίες ανίχνευσης, ταξινόμησης και τμηματοποίησης εικόνων.

Σε αυτή την περίπτωση, θα εστιάσετε στο εργασία ανίχνευσης αντικειμένων για βίντεο και εικόνες. Για να εντοπίσετε ένα αντικείμενο σε μια εικόνα, εκτελέστε το μπλοκ κώδικα παρακάτω:

url = "img_path"
yolo_nas_l.predict (url, conf=0.25).προβολή()

Βεβαιωθείτε ότι χρησιμοποιείτε την ακριβή διαδρομή προς την εικόνα σας. Σε αυτήν την περίπτωση, ανεβάστε την εικόνα στο περιβάλλον Google Colab και, στη συνέχεια, αντιγράψτε τη διαδρομή της εικόνας.

Αναμενόμενη έξοδος:

Για να εντοπίσετε αντικείμενα σε ένα βίντεο, εκτελέστε το μπλοκ κώδικα παρακάτω:

εισαγωγή δάδα

input_video_path = "path_to_video"
output_video_path = "detected.mp4"
συσκευή = 'cuda'αν torch.cuda.is_available() αλλού"ΕΠΕΞΕΡΓΑΣΤΗΣ"
yolo_nas_l.to (συσκευή).πρόβλεψη (input_video_path).save (output_video_path)

Όπως και τα δεδομένα της εικόνας, ανεβάστε το βίντεο που θέλετε να εντοπιστούν τα αντικείμενά του στο περιβάλλον Google Colab και αντιγράψτε τη διαδρομή στη μεταβλητή βίντεο. Το προβλεπόμενο βίντεο θα είναι προσβάσιμο από το περιβάλλον Google Colab χρησιμοποιώντας το όνομα εντοπίστηκε.mp4. Κατεβάστε το βίντεο στο τοπικό σας μηχάνημα πριν ολοκληρώσετε τη συνεδρία σας.

Αναμενόμενη έξοδος:

Το YOLO-NAS υποστηρίζει επίσης τη βελτίωση του μοντέλου και την εκπαίδευση σε προσαρμοσμένα δεδομένα. Η τεκμηρίωση είναι διαθέσιμη στις Deci’s σημειωματάριο εκκίνησης τελειοποίησης.

Εφαρμογές του YOLO-NAS σε πραγματικό κόσμο

Ο πηγαίος κώδικας του YOLO-NAS είναι προσβάσιμος με την άδεια Apache 2.0, η οποία είναι προσβάσιμη για μη εμπορική χρήση. Για εμπορική χρήση, το μοντέλο θα πρέπει να υποβληθεί σε επανεκπαίδευση από την αρχή για να αποκτήσει προσαρμοσμένα βάρη.

Είναι ένα ευέλικτο μοντέλο του οποίου η εφαρμογή είναι δυνατή σε πολλούς τομείς, όπως:

Αυτόνομα Οχήματα και Ρομποτική

Το YOLO-NAS μπορεί να βελτιώσει τις δυνατότητες αντίληψης των αυτόνομων οχημάτων, επιτρέποντάς τους να εντοπίζουν και να παρακολουθούν αντικείμενα ταχύτερα και με μεγαλύτερη ακρίβεια σε πραγματικό χρόνο. Αυτή η ικανότητα βοηθά στη διασφάλιση της οδικής ασφάλειας και της ομαλής οδηγικής εμπειρίας.

Συστήματα επιτήρησης και ασφάλειας

Το μοντέλο μπορεί να παρέχει γρήγορη, ακριβή και σε πραγματικό χρόνο ανίχνευση αντικειμένων για επιτήρηση και ασφάλεια συστήματα, τα οποία βοηθούν στον εντοπισμό πιθανών απειλών ή ύποπτων δραστηριοτήτων, με αποτέλεσμα καλύτερη ασφάλεια συστήματα

Διαχείριση λιανικής και αποθεμάτων

Το μοντέλο μπορεί να παρέχει γρήγορες και ακριβείς δυνατότητες ανίχνευσης αντικειμένων που επιτρέπουν αποτελεσματική και σε πραγματικό χρόνο αυτοματοποιημένη διαχείριση αποθέματος, παρακολούθηση αποθεμάτων και βελτιστοποίηση ραφιών. Αυτό το μοντέλο βοηθά στη μείωση του λειτουργικού κόστους και στην αύξηση των κερδών.

Υγειονομική περίθαλψη και Ιατρική Απεικόνιση

Στην υγειονομική περίθαλψη, το YOLO-NAS είναι ικανό να βοηθήσει στην αποτελεσματική ανίχνευση και ανάλυση ανωμαλιών ασθενειών ή συγκεκριμένων περιοχών ενδιαφέροντος. Το μοντέλο μπορεί να βοηθήσει τους γιατρούς να διαγνώσουν με ακρίβεια ασθένειες και να παρακολουθούν τους ασθενείς, βελτιώνοντας έτσι τον τομέα της υγειονομικής περίθαλψης.

YOLO-NAS Takeaway

Το YOLO-NAS είναι ένα νέο μοντέλο ανίχνευσης αντικειμένων που πρωτοπορεί σε έναν νέο τρόπο εκτέλεσης ανίχνευσης αντικειμένων. Είναι καλύτερο από τα μοντέλα SOTA. Η απόδοσή του στην ανίχνευση αντικειμένων είναι ένα μεγάλο άλμα για έργα όρασης υπολογιστή.