Τα δεδομένα είναι ένα ευαίσθητο θέμα και φυσικά θα ασχολείστε πολύ με αυτό ως επιστήμονας δεδομένων. Εδώ είναι μερικοί κανόνες που πρέπει πάντα να ακολουθείτε.
Τα δεδομένα είναι εξαιρετικά πολύτιμα και η αξιοποίησή τους είναι εύκολα μια από τις καλύτερες πρακτικές για τους περισσότερους οργανισμούς σήμερα. Αλλά η γνώση των προτύπων του κλάδου σχετικά με αυτό είναι απαραίτητο για τους επιστήμονες δεδομένων να μην κάνουν λάθος με τα δεδομένα, καθώς οι άνθρωποι μαθαίνουν περισσότερα για την αξία τους.
Ως εκ τούτου, οι επιστήμονες δεδομένων πρέπει να υιοθετήσουν ασφαλείς και ηθικές πρακτικές και να υιοθετήσουν τυποποιημένες. Αντί να εξετάζουμε πόσο πολύτιμα είναι μόνο τα δεδομένα, είναι συνετό να αμφισβητούμε τις μεθόδους απόκτησης και επεξεργασίας δεδομένων για οποιονδήποτε σκοπό. Επομένως, εδώ είναι εννέα κώδικες συμπεριφοράς που κάθε επιστήμονας δεδομένων πρέπει να ακολουθεί.
1. Τηρήστε τους Κανονισμούς
Οι επιστήμονες δεδομένων πρέπει να γνωρίζουν τους κανονισμούς προστασίας δεδομένων που ισχύουν για ορισμένες θέσεις εργασίας. Διαφορετικά, μπορεί εν αγνοία σας να παραβιάσετε το νόμο και να θέσετε τον εαυτό σας και τους άλλους σε κίνδυνο. Επομένως, αυτή η γνώση είναι ζωτικής σημασίας για τη διασφάλιση της ηθικής εργασίας και την πρόληψη ακούσιας βλάβης.
Ως εκ τούτου, ελέγξτε τους σχετικούς νόμους προτού εμπλακείτε σε οποιαδήποτε δραστηριότητα. Επιπλέον, μην τηρείτε απλώς τους κανονισμούς για να ακολουθείτε τους κανόνες. αναζητήστε επίσης μια βαθύτερη κατανόησή τους. Για να τηρείτε σωστά τους κανονισμούς, πρέπει να γνωρίζετε γιατί τοποθετήθηκαν και από τι προστατεύουν.
Μερικοί αξιοσημείωτοι νόμοι περί απορρήτου είναι ο Γενικός Κανονισμός για την Προστασία Δεδομένων της ΕΕ (GDPR) και ο νόμος περί απορρήτου των καταναλωτών της Καλιφόρνια (CCPA). Άλλα περιλαμβάνουν τους HIIPA, DPA, PIPEDA, LGPD και πολλούς κανονισμούς που αφορούν τον κλάδο.
2. Σεβαστείτε το απόρρητο
Οι διευθύνσεις, τα μηνύματα ηλεκτρονικού ταχυδρομείου και οι ταυτότητες είναι αναγνωριστικά που δεν πρέπει να είναι δημόσια καθώς ενέχουν πραγματικούς κινδύνους για τους ανθρώπους. Επομένως, φροντίστε να κάνετε αυτές τις λεπτομέρειες όσο το δυνατόν πιο ιδιωτικές.
Εάν εκτεθούν, τα θύματα θα μπορούσαν να υποφέρουν από κλοπή ταυτότητας ή απάτη. Θα μπορούσαν επίσης να εκβιαστούν από άτομα που απειλούν να δημοσιοποιήσουν τις εμπιστευτικές τους πληροφορίες. Επιπλέον, οι επαγγελματίες ενδέχεται να υποστούν ζημιά στη φήμη τους και διαδικτυακή παρενόχληση μόλις δημοσιοποιηθούν οι προσωπικές τους προτιμήσεις. Αυτά μπορεί να επηρεάσουν τις σχέσεις, τις ευκαιρίες σταδιοδρομίας και την κοινωνική τους θέση.
Έτσι, έχοντας αυτό κατά νου, ερευνήστε και επιλέξτε αποτελεσματικούς τρόπους για να βελτιώσετε ασφαλείς διαδικτυακές ταυτότητες και να αποπροσδιορίσει τα δεδομένα. Για παράδειγμα, μπορείτε να αντικαταστήσετε χαρακτήρες, να αφαιρέσετε άμεσα αναγνωριστικά ή να γενικεύσετε. Αυτό προστατεύει ευαίσθητα δεδομένα από εγκληματίες στον κυβερνοχώρο, ενώ βοηθά τους οργανισμούς με τα ευρήματά σας.
3. Εξάλειψη της προκατάληψης
Οι επιστήμονες δεδομένων βασίζονται στις στατιστικές για να είναι όσο το δυνατόν πιο αντικειμενικοί. Ωστόσο, παρά αυτές τις προσπάθειες, η μεροληψία παραμένει, επειδή η ιδέα ότι τα μεγαλύτερα δεδομένα είναι πιο ακριβή είναι μια από τις πιο κοινοί μύθοι της επιστήμης δεδομένων.
Υπάρχει κάποια αλήθεια σε αυτό, αλλά δυστυχώς, τα μεγάλα δεδομένα μερικές φορές περιέχουν περιττά ή ψεύτικα στοιχεία και στατιστικά στοιχεία. Επομένως, αντί να εστιάσετε μόνο στους αριθμούς, βεβαιωθείτε ότι τα δεδομένα σας είναι καθαρά και αντιπροσωπευτικά.
Ο καθαρισμός ή το φιλτράρισμα των δεδομένων πριν από τη χρήση είναι εξαιρετικές μέθοδοι καταπολέμησης της προκατάληψης. Για παράδειγμα, μπορείτε να ελέγξετε για σφάλματα ή να χρησιμοποιήσετε στρωματοποιημένη δειγματοληψία για να διασφαλίσετε αντιπροσωπευτικά δεδομένα.
4. Μην κατασκευάζετε ή επινοείτε αποτελέσματα
Η κατασκευή είναι μια μορφή κακής συμπεριφοράς δεδομένων και ερευνητικής απάτης που περιλαμβάνει τη δημιουργία ευρημάτων και την αναφορά τους ως αληθή.
Για παράδειγμα, ένας επιστήμονας δεδομένων μπορεί να αναφέρει ότι ένα φάρμακο έχει βρεθεί ότι δεν έχει παρενέργειες για τα περισσότερα μέλη μιας συγκεκριμένης ηλικιακής ομάδας. Αυτά τα ευρήματα θα κατασκευάζονταν αν δεν υπήρχαν αρχικά ιατρικά πειράματα και δεν συλλέγονταν δεδομένα για την υποστήριξη τους.
Η κατασκευή έχει σοβαρές και αρνητικές συνέπειες για τους επιστήμονες δεδομένων και όσους βασίζονται στην εργασία τους. Θα μπορούσε να καταστρέψει την αξιοπιστία σας, να βλάψει τη φήμη του οργανισμού σας, να βλάψει το κοινό ή να σας εκθέσει σε νομικούς κινδύνους.
5. Μην παραποιείτε ή χειραγωγείτε αποδεικτικά στοιχεία
Η παραποίηση είναι η χειραγώγηση της πραγματικότητας, τα δεδομένα που συλλέγονται για να ταιριάζουν σε μια ατζέντα. Ενώ οι κατασκευαστές δημιουργούν αποτελέσματα από ανύπαρκτα δεδομένα για να υποστηρίξουν τους ισχυρισμούς τους, οι παραποιητές εργάζονται για να διαψεύσουν πραγματικά και υπάρχοντα δεδομένα για προσωπικούς λόγους. Για να το επιτύχουν αυτό, ενδέχεται να παραβιάσουν τον ερευνητικό εξοπλισμό, να αλλάξουν ή να παραλείψουν εντελώς δεδομένα.
Η παραποίηση μπορεί να βλάψει το κοινό παρέχοντας ψευδείς πληροφορίες που επηρεάζουν τη λήψη αποφάσεων σε διάφορους τομείς. Για παράδειγμα, μια παραποιημένη μελέτη φαρμάκων θα μπορούσε να εκθέσει τους ανθρώπους σε περιττούς κινδύνους, αναποτελεσματικές θεραπείες ή επιβλαβείς παρενέργειες. Μπορεί επίσης να προκαλέσει απώλεια χρημάτων, χρόνου ή υλικών που θα μπορούσαν να είχαν χρησιμοποιηθεί για άλλους σκοπούς.
Η κατασκευή και η παραποίηση είναι αδίστακτες πρακτικές με δυσμενείς επιπτώσεις και πολυάριθμες κυρώσεις. Αυτά μπορεί να περιλαμβάνουν πρόστιμα, ανάκληση διαπιστευτηρίων, απώλεια χρηματοδότησης της έρευνας ή φυλάκιση.
6. Εμφάνιση διαφάνειας
Διαφάνεια για τους επιστήμονες δεδομένων σημαίνει να είναι ειλικρινείς σχετικά με τις μεθόδους που εφαρμόζονται για τη συλλογή, την ανάλυση και την παρουσίαση δεδομένων. Οι επιστήμονες δεδομένων θα πρέπει να είναι ανοιχτοί και έτοιμοι να μοιραστούν τις πρακτικές τους με άλλους επιστήμονες δεδομένων και συμμετέχοντες στη μελέτη.
Επιπλέον, πρέπει να λάβετε τη συγκατάθεση των συμμετεχόντων στη μελέτη, επειδή η δημοσίευση αποτελεσμάτων χωρίς ενημερωμένη συγκατάθεση μπορεί να ασέβει ή να βλάψει τους συμμετέχοντες με διάφορους τρόπους. Μπορεί να παραβιάσουν την αξιοπρέπεια, το απόρρητο και την αυτονομία τους ή να τους εκθέσουν σε επιβλαβείς, περιττούς κινδύνους που προκύπτουν από τη μελέτη.
Η διαφάνεια δημιουργεί εμπιστοσύνη με όσους βασίζονται στα δεδομένα σας για πληροφορίες. Εξασφαλίζει επίσης την ποιότητα των δεδομένων επιτρέποντας σε άλλους να ελέγχουν τα αποτελέσματά σας.
Επιπλέον, το άνοιγμα μεταξύ των επιστημόνων δεδομένων προωθεί τη συνεργασία και τη μάθηση. Μπορείτε να συμβάλετε στην προώθηση της καινοτομίας κοινοποιώντας τη διαδικασία σας και επικοινωνώντας την καλύτερες μεθόδους οπτικοποίησης δεδομένων και τεχνικές επιστήμης δεδομένων σε συνομηλίκους ενώ μαθαίνουν από αυτούς.
7. Συλλέξτε δεδομένα με ασφάλεια
Οι επιστήμονες δεδομένων πρέπει να επιβεβαιώσουν την ασφάλεια των μεθόδων που χρησιμοποιούνται για τη συλλογή, ανάλυση και αποθήκευση δεδομένων. Με αυτόν τον τρόπο αποτρέπονται πιθανές παραβιάσεις δεδομένων που μπορεί να επηρεάσουν τους επιστήμονες δεδομένων και τους συμμετέχοντες στη μελέτη.
Οι παραβιάσεις δεδομένων θέτουν σε κίνδυνο την προσωπική ασφάλεια, υπονομεύουν την εμπιστοσύνη του κοινού και εκθέτουν την οργανωτική ανεπάρκεια με αποτέλεσμα τρομερές οικονομικές απώλειες για την εταιρεία. Αυτές οι απώλειες θα μπορούσαν να είναι αγωγές από τα θύματα παραβίασης δεδομένων, λιγότερους πελάτες και πολλά άλλα.
Υπό το πρίσμα αυτό, πρέπει να διεξάγετε έρευνα για να βρείτε το αποτελεσματικότερες λύσεις ασφάλειας δεδομένων και εφαρμόστε τα. Για παράδειγμα, μπορείτε να ασφαλίσετε τις συνδέσεις με κρυπτογράφηση TLS/SSL ή να χρησιμοποιήσετε περιστρεφόμενους διακομιστή μεσολάβησης. Επίσης, θα μπορούσατε να επιβάλλετε μέτρα ελέγχου πρόσβασης και να δημιουργήσετε αντίγραφα ασφαλείας σε περίπτωση επίθεσης. Όταν βρίσκετε λύσεις, μην ξεχάσετε να τις μοιραστείτε με άλλους για να εξασφαλίσετε τη μέγιστη ασφάλεια.
8. Χρησιμοποιήστε τους αλγόριθμους με υπευθυνότητα
Οι αλγόριθμοι δεν είναι απλώς εργαλεία για την ανάλυση δεδομένων. Είναι ισχυρές επιρροές στις ζωές, τις συμπεριφορές και τις ευκαιρίες των ανθρώπων. Ωστόσο, αν και βοηθούν στην επίλυση προβλημάτων και κάνουν καινοτόμες προβλέψεις, είναι επίσης ατελείς.
Εάν δεν έχουν σχεδιαστεί, δοκιμαστεί ή αναπτυχθεί προσεκτικά, οι αλγόριθμοι έχουν κοινωνικές και ηθικές επιπτώσεις που μπορεί να βλάψουν ορισμένες ομάδες ανθρώπων. Εισάγουν επίσης μεροληψία εάν εκπαιδευτούν σε δεδομένα που αντικατοπτρίζουν τις υπάρχουσες προκαταλήψεις και μπορεί να είναι απρόβλεπτα. Έτσι, οι επιστήμονες δεδομένων πρέπει να τα σχεδιάζουν και να τα χρησιμοποιούν με υπευθυνότητα.
Να επιλέγετε πάντα κατάλληλους αλγόριθμους, να δοκιμάζετε την απόδοσή τους και να εξηγείτε πώς λειτουργούν. Επίσης, βεβαιωθείτε ότι εντοπίζετε πιθανές πηγές μεροληψίας και εφαρμόζετε μηχανισμούς που ενημερώνουν ή διορθώνουν όπου χρειάζεται.
9. Εξετάστε τις μακροπρόθεσμες επιπτώσεις της εργασίας σας
Η εργασία σας ως επιστήμονας δεδομένων θα επηρεάσει σημαντικά πολλές πτυχές της κοινωνίας. Λοιπόν, σκεφτείτε πάντα πώς επηρεάζουν τα μοντέλα σας τους ανθρώπους.
Για παράδειγμα, προσπαθήστε να αναρωτηθείτε εάν η εργασία σας μπορεί να διαιωνίσει τις προκαταλήψεις και την ανισότητα ή να θέσει σε κίνδυνο την ιδιωτική ζωή στο μέλλον. Στη συνέχεια, αντιμετωπίστε επαρκώς αυτές τις ανησυχίες.
Σημειώστε ότι μια προοπτική προσανατολισμένη στο μέλλον είναι πιο σημαντική από οποιαδήποτε διορθωτική μέθοδο και η σκέψη για τις επόμενες μέρες είναι ένας από τους πιο αποτελεσματικούς τρόπους για να λάβετε ηθικά ορθές αποφάσεις.
Πρέπει να είστε ηθικοί ως επιστήμονας δεδομένων
Ως επιστήμονας δεδομένων, λαμβάνετε μια δύναμη που συνοδεύεται από ανάλογη ευθύνη. Οι δεξιότητές σας είναι σπάνιες, επομένως βρίσκεστε στην πρώτη γραμμή της οργανωτικής λήψης αποφάσεων.
Οι αποφάσεις σας επηρεάζουν τα πάντα, από τα επιχειρηματικά σχέδια της εταιρείας μέχρι τα συστήματα ποινικής δικαιοσύνης. Επομένως, δεν πρέπει να τα κάνετε επιπόλαια. Να είστε πάντα ειλικρινείς, ηθικοί και σχολαστικοί στην εργασία σας για να προστατεύσετε τους ανθρώπους από τα υπάρχοντα ηθικά διλήμματα στον κλάδο σας και σε άλλους τομείς της τεχνολογίας.