- सहसंबंध गुणांक की गणना कैसे करें?
- सहसंयोजक और विचरण
- सचित्र मामला
- Covariance Sxy
- मानक विचलन Sx
- मानक विचलन सी.ए.
- सहसंबंध गुणांक r
- व्याख्या
- रेखीय प्रतिगमन
- उदाहरण
- संदर्भ
सहसंबंध गुणांक आँकड़ों में एक संकेतक उपायों दो मात्रात्मक चर एक्स और वाई की प्रवृत्ति एक रेखीय या उन दोनों के बीच आनुपातिक संबंध है कि है।
आमतौर पर, चर X और Y के जोड़े एक ही जनसंख्या की दो विशेषताएं हैं। उदाहरण के लिए, X व्यक्ति की ऊंचाई और Y उसका वजन हो सकता है।
चित्रा 1. चार डेटा जोड़े (एक्स, वाई) के लिए सहसंबंध गुणांक। स्रोत: एफ। ज़पाटा
इस मामले में, सहसंबंध गुणांक इंगित करेगा कि किसी दी गई आबादी में ऊंचाई और वजन के बीच आनुपातिक संबंध की ओर रुझान है या नहीं।
पियर्सन के रैखिक सहसंबंध गुणांक को लोअरकेस अक्षर r द्वारा दर्शाया गया है और इसके न्यूनतम और अधिकतम मान क्रमशः -1 और +1 हैं।
एक मान r = +1 इंगित करेगा कि जोड़े (X, Y) का सेट पूरी तरह से संरेखित है और जब X बढ़ता है, तो Y उसी अनुपात में बढ़ेगा। दूसरी ओर, अगर ऐसा होता है कि r = -1, जोड़े का सेट भी पूरी तरह से संरेखित किया जाएगा, लेकिन इस मामले में जब एक्स बढ़ता है, तो उसी अनुपात में वाई घट जाती है।
चित्रा 2. रैखिक सहसंबंध गुणांक के विभिन्न मूल्य। स्रोत: विकिमीडिया कॉमन्स
दूसरी ओर, एक मान r = 0 इंगित करेगा कि चर X और Y के बीच कोई रैखिक सहसंबंध नहीं है। जबकि r = +0.8 का मान इंगित करेगा कि जोड़े (X, Y) एक तरफ क्लस्टर होते हैं और एक निश्चित रेखा का दूसरा।
सहसंबंध गुणांक r की गणना करने का सूत्र इस प्रकार है:
सहसंबंध गुणांक की गणना कैसे करें?
रैखिक सहसंबंध गुणांक एक सांख्यिकीय मात्रा है जिसे वैज्ञानिक कैलकुलेटर, अधिकांश स्प्रेडशीट और सांख्यिकीय कार्यक्रमों में बनाया गया है।
हालांकि, यह जानना सुविधाजनक है कि यह निर्धारित करने वाला सूत्र कैसे लागू किया जाता है, और इसके लिए एक विस्तृत गणना दिखाई जाएगी, जो एक छोटे डेटा सेट पर की जाती है।
और जैसा कि पिछले अनुभाग में कहा गया है, सहसंबंध गुणांक कोविरियस Sxy है जो चर Y के लिए मानक X और Sy के लिए मानक विचलन Sx के उत्पाद द्वारा विभाजित है।
सहसंयोजक और विचरण
सहसंयोजक Sxy है:
Sxy = / (N-1)
जहां योग 1 से N जोड़े गए डेटा (शी, यी) तक जाता है।
इसके भाग के लिए, चर X के लिए मानक विचलन, डेटा सेट शी के विचरण का वर्गमूल है, जिसके साथ मैं 1 से 1:
Sx = √
इसी तरह, वेरिएबल Y के लिए मानक विचलन, डेटा सेट यी के संस्करण का वर्गमूल है, जिसके साथ मैं 1 से N:
सय = √
सचित्र मामला
सहसंबंध गुणांक की गणना करने के तरीके के बारे में विस्तार से दिखाने के लिए, हम डेटा के चार जोड़े के निम्नलिखित सेट लेंगे
(एक्स, वाई): {(1, 1); (2. 3); (3, 6) और (4, 7)}।
पहले हम एक्स और वाई के लिए अंकगणितीय माध्य की गणना करते हैं, इस प्रकार है:
फिर शेष मापदंडों की गणना की जाती है:
Covariance Sxy
Sxy = / (4-1)
Sxy = / (3) = 10.5 / 3 = 3.5
मानक विचलन Sx
Sx = √ = √ = 1.29
मानक विचलन सी.ए.
Sx = √ =
√ = 2.75
सहसंबंध गुणांक r
आर = 3.5 / (1.29 * 2.75) = 0.98
व्याख्या
पिछले मामले के डेटा सेट में, चर X और Y के बीच एक मजबूत रेखीय सहसंबंध मनाया जाता है, जो स्कैटर प्लॉट (चित्र 1 में दिखाया गया है) और सहसंबंध गुणांक दोनों में प्रकट होता है, जिसमें एक उपज मिली मूल्य एकता के काफी करीब है।
इस हद तक कि सहसंबंध गुणांक 1 या -1 के करीब है, यह एक लाइन में डेटा को फिट करने के लिए जितना अधिक समझ में आता है, रैखिक प्रतिगमन का परिणाम है।
रेखीय प्रतिगमन
रैखिक प्रतिगमन रेखा सबसे कम वर्ग विधि से प्राप्त की जाती है। जिसमें प्रतिगमन रेखा के मापदंडों को अनुमानित Y मान और N डेटा के यी के बीच अंतर के वर्ग के योग के न्यूनतमकरण से प्राप्त किया जाता है।
दूसरी ओर, प्रतिगमन रेखा y = a + bx के पैरामीटर a और b, कम से कम स्क्विट की विधि द्वारा प्राप्त किए गए हैं, ये हैं:
* b = ढलान के लिए Sxy / (Sx 2)
* ए =
याद रखें कि Sxy ऊपर परिभाषित कोविरेंस है और Sx 2 मानक परिभाषित विचलन का वर्ग या वर्ग है।
उदाहरण
सहसंबंध गुणांक का उपयोग यह निर्धारित करने के लिए किया जाता है कि क्या दो चर के बीच एक रैखिक सहसंबंध है। यह तब लागू होता है जब अध्ययन किए जाने वाले चर मात्रात्मक होते हैं और इसके अलावा, यह माना जाता है कि वे सामान्य प्रकार के वितरण का पालन करते हैं।
हमारे पास नीचे दिए गए उदाहरण हैं: मोटापे की डिग्री का एक माप बॉडी मास इंडेक्स है, जो वर्ग मीटर की इकाइयों में व्यक्ति के वजन को किलोग्राम में विभाजित करके व्यक्ति के वजन को किलोग्राम में विभाजित करके प्राप्त किया जाता है।
आप जानना चाहते हैं कि बॉडी मास इंडेक्स और रक्त में एचडीएल कोलेस्ट्रॉल की एकाग्रता के बीच एक मजबूत सहसंबंध है, जिसे प्रति लीटर मिलिमोल में मापा जाता है। इस उद्देश्य के लिए, 533 लोगों के साथ एक अध्ययन किया गया है, जिसका सारांश निम्नलिखित ग्राफ में दिया गया है, जिसमें प्रत्येक बिंदु एक व्यक्ति के डेटा का प्रतिनिधित्व करता है।
चित्रा 3. 533 रोगियों में बीएमआई और एचडीएल कोलेस्ट्रॉल का अध्ययन। स्रोत: स्वास्थ्य विज्ञान संस्थान (IACS)
ग्राफ के सावधानीपूर्वक अवलोकन से पता चलता है कि एचडीएल कोलेस्ट्रॉल एकाग्रता और बॉडी मास इंडेक्स के बीच एक निश्चित रैखिक प्रवृत्ति (बहुत चिह्नित नहीं) है। इस प्रवृत्ति का मात्रात्मक माप सहसंबंध गुणांक है, जो इस मामले में आर = -0.276 निकला।
संदर्भ
- गोंजालेज सी। जनरल सांख्यिकी। से बरामद: tarwi.lamolina.edu.pe
- आईएसीएस। स्वास्थ्य विज्ञान के वेलेंटाइन संस्थान। से पुनर्प्राप्त: ics-aragon.com
- सालाजार सी। और कैस्टिलो एस। सांख्यिकी के मूल सिद्धांत। (2018)। से पुनर्प्राप्त: dspace.uce.edu.ec
- Superprof। सहसंबंध गुणांक। से पुनर्प्राप्त: superprof.es
- यूएसएसी। वर्णनात्मक आँकड़े मैनुअल। (2011)। से पुनर्प्राप्त किया गया: आँकड़ा.इंजीनियरिया.सैक.एडयू.जीटी
- विकिपीडिया। पियर्सन का सहसंबंध गुणांक। से पुनर्प्राप्त: es.wikipedia.com