Ενώ χρησιμοποιείτε τα Φύλλα Google για εργασία με δύο σύνολα δεδομένων, ίσως θέλετε να συγκρίνετε τα δύο προσδιορίζοντας τον βαθμό στον οποίο το ένα επηρεάζει το άλλο.
Οι συσχετίσεις μπορούν να προσφέρουν μια εικόνα για το εάν υπάρχει μια προγνωστική σχέση μεταξύ των επιπέδων x και y, αλλά δεν υποδεικνύουν απαραίτητα αιτιότητα. Δείτε πώς μπορείτε να χρησιμοποιήσετε τα Φύλλα Google για να εντοπίσετε συσχετίσεις στα δεδομένα σας.
Τι είναι η συσχέτιση και σε τι μπορείτε να τη χρησιμοποιήσετε;
Όταν δύο μεταβλητές συσχετίζονται, μπορεί κανείς να καθορίσει πώς μια μεταβλητή επηρεάζει την άλλη. Όμως, είναι σημαντικό να θυμόμαστε ότι η συσχέτιση δεν συνεπάγεται εξάρτηση σε αυτή την περίπτωση. Απλώς δείχνει πόσο στενά και γρήγορα συγκρίνονται ή συσχετίζονται δύο μεταβλητές.
Οι στατιστικές μετρήσεις βοηθούν στην κατανόηση των υποκείμενων τάσεων στην ανάλυση δεδομένων. Η συσχέτιση είναι μια από τις πιο συχνά χρησιμοποιούμενες στατιστικές μετρήσεις και καθορίζει πόσο στενά συνδεδεμένες ή εξαρτημένες είναι δύο μεταβλητές.
Κατανόηση του Συντελεστή Συσχέτισης στα Φύλλα Google
Στα Φύλλα Google, ένας συντελεστής συσχέτισης υπολογίζεται χρησιμοποιώντας τη συνάρτηση CORREL. Ο συντελεστής συσχέτισης χρησιμεύει ως μετρητής του πόσο στενά συνδέονται τα σύνολα δεδομένων. Μπορεί να χρησιμοποιηθεί για τη λήψη του συντελεστή συσχέτισης προϊόντος-στιγμής Pearson (r) εάν έχετε δύο μεταβλητά σύνολα δεδομένων. Εάν θέλετε να μάθετε περισσότερα σχετικά με αυτόν τον συντελεστή, μπορείτε να διαβάσετε περισσότερα σε αυτόν τον οδηγό από Στατιστικά στοιχεία στο Leard.
Θα μπορούσε κανείς να συναντήσει μία από τις τρεις μετρήσεις συσχέτισης. Κάθε μέτρηση ορίζει τις σχέσεις μεταξύ των μεταβλητών διαφορετικά. Η τιμή του είναι μεταξύ -1 και +1:
- -1 υποδηλώνει μια τέλεια αρνητική συσχέτιση: Όταν μια συσχέτιση έχει συντελεστή συσχέτισης που είναι ίσος ή κάτω από -0,9, δηλώνεται ότι είναι έντονα αρνητικός. Είναι μια ένδειξη ότι τα δεδομένα συσχετίζονται. Ωστόσο, η μεταβλητή x συνεχίζει να αυξάνεται, ενώ η μεταβλητή y συνεχίζει να μειώνεται.
- Το 0 υποδηλώνει καμία σύνδεση: Οι μεταβλητές θεωρείται ότι δεν συσχετίζονται εάν ο συντελεστής συσχέτισης είναι μεγαλύτερος από 0,01 αλλά μικρότερος από 0,1, καθώς δεν υπάρχει ευδιάκριτη σχέση μεταξύ κάθε μεταβλητής. Είναι ανεξάρτητοι το ένα από το άλλο.
- Το +1 υποδηλώνει μια τέλεια θετική συσχέτιση: Όταν ο συντελεστής συσχέτισης πέφτει μεταξύ 0,9 και 1, θεωρείται εξαιρετικά θετικός. Δείχνει ότι υπήρξε αύξηση στα δύο σύνολα μεταβλητών.
Η υψηλότερη τιμή ενός συντελεστή μπορεί να ήταν ένας συντελεστής συσχέτισης 1. Όταν η τιμή συσχέτισης είναι 1, σημαίνει ότι αν σχεδιάζατε γραφικά τα δεδομένα, θα ήταν πλήρως ευθυγραμμισμένα για να δημιουργήσετε μια ευθεία γραμμή.
Εάν είστε ακόμα λίγο χαμένοι, μην ανησυχείτε. Θα εξηγήσουμε τη σύνταξη της συνάρτησης CORREL και στη συνέχεια θα βουτήξουμε σε μερικά παραδείγματα του πραγματικού κόσμου για να σας βοηθήσουμε να την κατανοήσετε καλύτερα. Κατανόηση των γραμμών της καλύτερης εφαρμογής και πώς να δημιουργήσετε γραμμές τάσεων στα Φύλλα Google θα σας βοηθήσει με αυτό.
Σύνταξη συνάρτησης CORREL στα Φύλλα Google
=CORREL(δεδομένα_y, δεδομένα_x)
Ας το αναλύσουμε στα μέρη του και ας καταλάβουμε καλύτερα τι σημαίνει κάθε φράση:
- =ΚΟΡΕΛΑΣ: Αυτή είναι η συνάρτηση του Φύλλου Google που καθορίζει το r, (συντελεστής συσχέτισης προϊόντος-στιγμής Pearson του συνόλου δεδομένων).
- data_y: Αυτό αναφέρεται στην ομάδα κελιών που περιέχει τα εξαρτημένα δεδομένα ή το εύρος τιμών για αυτά τα κελιά.
- δεδομένα x: Πρόκειται είτε για αναφορά στη διάταξη των κελιών με τα ανεξάρτητα δεδομένα είτε στο εύρος τιμών για αυτά τα κελιά.
Εάν σχεδιάζατε τη γραφική παράσταση των σημείων δεδομένων, το data_y θα ήταν ο άξονας Y και το data_x ο άξονας X. Θα παρατηρήσετε ότι υπάρχουν δύο διαφορετικοί τρόποι εισαγωγής του εύρους δεδομένων. Είτε μια περιοχή κελιών αναφοράς είτε η απευθείας εισαγωγή δεδομένων στη συνάρτηση είναι επιλογές.
Στις περισσότερες περιπτώσεις, προτιμάται η χρήση του εύρους κελιών αναφοράς. Αυτό συμβαίνει επειδή το υπολογιστικό φύλλο πιθανότατα περιέχει ήδη τα δεδομένα σας. Η χρήση μιας περιοχής κελιών αναφοράς μπορεί να αποφύγει την υπερβολική πληκτρολόγηση που μπορεί να οδηγήσει σε σφάλμα χρήστη.
Παραδείγματα συναρτήσεων CORREL στα Φύλλα Google
Ας δούμε μερικά παραδείγματα για να κατανοήσουμε πώς να χρησιμοποιήσετε τη συνάρτηση CORREL στα Φύλλα Google.
Παράδειγμα 1: Μια ισχυρή θετική συσχέτιση
Για αυτό το πρώτο παράδειγμα, ας προσποιηθούμε ότι εργαζόμαστε στον κλάδο των ακινήτων. Στο παρακάτω υπολογιστικό φύλλο, έχουμε χωρίσματα εκταρίων γης που πουλάτε και τον αριθμό των μονάδων που πωλήθηκαν από τα δεδομένα αυτών των διαφορετικών εκτάσεων στο Φύλλο Google σας.
- Εάν ακολουθείτε σε ένα φύλλο, θα ξεκινήσετε πληκτρολογώντας τα δεδομένα των μεταβλητών στο υπολογιστικό φύλλο σας, όπως φαίνεται παρακάτω:
- Κάντε κλικ στο κελί Γ2
- Τύπος =CORREL(
- Στη συνέχεια θα προχωρήσετε στον τύπο data_y, που στην περίπτωσή μας είναι η περιοχή αναφοράς κελιών A2:A6, μετά εισάγετε κόμμα.
- Προχωρήστε στον τύπο data_x, το οποίο στην περίπτωσή μας αναφέρεται ως Β2:Β6.
- Τελειώστε με ένα στήριγμα κλεισίματος, όπως φαίνεται παρακάτω:
- Τέλος, πατήστε Εισαγω για να επιστρέψετε τον συντελεστή συσχέτισης των δύο τμημάτων δεδομένων στο κελί Γ2.
Χρησιμοποιώντας το παράδειγμα που μόλις φαίνεται παραπάνω, έχετε αποκτήσει έναν συντελεστή συσχέτισης 0,90, ο οποίος είναι μια ισχυρή θετική συσχέτιση, καθώς η τιμή του πέφτει μεταξύ 0,9 και 1. Επομένως, αυτό δείχνει ότι καθώς το y αλλάζει, το x αλλάζει επίσης με ουσιαστικά συγκρίσιμο τρόπο.
Παρακάτω είναι μια αναπαράσταση του παραδείγματος δεδομένων μας σε ένα γράφημα διασποράς XY. Όπως μπορείτε να δείτε, η γραμμή της καλύτερης προσαρμογής είναι κοντά στα σημεία δεδομένων στο γράφημα, γεγονός που υποστηρίζει την ιδέα ότι τα στοιχεία συσχετίζονται σε μεγάλο βαθμό.
Μπορείτε να μάθετε περισσότερα για δημιουργία γραφημάτων διασποράς XY στα Φύλλα Google σε άλλο άρθρο μας.
Παράδειγμα 2: Ασθενής αρνητική συσχέτιση
Αυτή τη φορά, θα χρησιμοποιήσουμε ένα πιο γενικό παράδειγμα της "μεταβλητής x και y" στο υπολογιστικό μας φύλλο. Έχουμε συμπεριλάβει σκόπιμα στοιχεία για να δείξουμε μια αρνητική συσχέτιση, την οποία η συνάρτηση CORREL δείχνει παρακάτω:
Δεν υπάρχει ισχυρή σχέση μεταξύ των μεταβλητών y και x, επομένως το αποτέλεσμα που παίρνουμε είναι ένας λιγότερο σημαντικός συντελεστής συσχέτισης από ό, τι στο προηγούμενο παράδειγμα. Το αποτέλεσμα που πετύχαμε είναι -0,47. Αυτό, ωστόσο, δεν σημαίνει ότι δεν υπάρχει καμία απολύτως συσχέτιση. Ας δούμε ξανά μια σειρά που ταιριάζει καλύτερα για να το καταλάβουμε.
Όπως μπορείτε να δείτε από το διάγραμμα διασποράς, τα σημεία δεδομένων είναι πιο μακριά από τη γραμμή της καλύτερης προσαρμογής. Υπάρχει, επομένως, μικρότερη συσχέτιση από ό, τι στο πρώτο παράδειγμα, αλλά όχι καμία. Θα παρατηρήσετε επίσης ότι η γραμμή της καλύτερης εφαρμογής μειώνεται. Αυτό δείχνει μια αρνητική συσχέτιση, η μία τιμή μειώνεται όσο αυξάνεται η άλλη.
Παράδειγμα 3: Χωρίς σύνδεση
Εδώ έχουμε ένα σύνολο εντελώς τυχαίων αριθμών. Ας αγγίξουμε γρήγορα πώς να χρησιμοποιήσετε ξανά τη λειτουργία CORREL:
- Πληκτρολογήστε στο κελί Γ2 τον τύπο CORREL
- Τα επιχειρήματά μας είναι Α2: Α10 και Β2:Β10
- Πατήστε Enter
Η τιμή που επιστρέφεται στο C2 είναι 0,02. Εάν ένας συντελεστής συσχέτισης πέσει μεταξύ 0,01 και 0,1, προσδιορίζεται ότι οι εν λόγω μεταβλητές δεν συσχετίζονται αφού δεν υπάρχει διακριτή σύνδεση μεταξύ τους. Οι σχέσεις μεταξύ των μεταβλητών είναι εντελώς ανεξάρτητες.
Παρακάτω είναι η αναπαράσταση του ίδιου σε ένα γράφημα διασποράς. Η γραμμή καλύτερης προσαρμογής είναι σχεδόν επίπεδη, υποδηλώνοντας μικρή συσχέτιση μεταξύ των δύο συνόλων δεδομένων.
Συσχετίστε εύκολα τα δεδομένα σας στα Φύλλα Google
Ο συσχετισμός θα μπορούσε να είναι ένα προκλητικό θέμα, αν δεν δουλέψατε πολύ μαζί του στο γυμνάσιο. Αυτός ο οδηγός κάλυψε όλα τα βασικά, αλλά θα πρέπει να συνεχίσετε να χρησιμοποιείτε τη λειτουργία CORREL στα Φύλλα Google για να τη διατηρείτε φρέσκια στο μυαλό σας.
Αυτή είναι μια ισχυρή λειτουργία, καθώς βοηθά στην αποφυγή δημιουργίας γραφημάτων διασποράς και μπορεί να βρει γρήγορα τάσεις στα δεδομένα σας. Ωστόσο, μην φοβάστε να προσθέσετε γραφήματα για να βοηθήσετε άλλους χρήστες να κατανοήσουν καλύτερα τα δεδομένα στα υπολογιστικά φύλλα σας.