- निर्धारण के गुणांक की गणना कैसे करें?
- सचित्र मामला
- व्याख्या
- उदाहरण
- - उदाहरण 1
- उपाय
- - उदाहरण २
- उपाय
- - उदाहरण 3
- उपाय
- फिट तुलना
- निष्कर्ष
- संदर्भ
दृढ़ संकल्प के गुणांक कि अंक (एक्स, वाई) कि दो चर के साथ एक डेटा सेट के फिट की प्रतिगमन लाइन का पालन के अंश का प्रतिनिधित्व करता है 0 और 1 के बीच एक संख्या है।
इसे फिट की अच्छाई के रूप में भी जाना जाता है और इसे आर 2 द्वारा निरूपित किया जाता है । इसकी गणना करने के लिए, प्रतिगमन मॉडल द्वारा अनुमानित डेटा byi के विचरण और डेटा के प्रत्येक शी के अनुरूप डेटा यी के विचरण को लिया जाता है।
R 2 = Sŷ / Sy
चित्रा 1. डेटा के चार जोड़े के लिए सहसंबंध गुणांक। स्रोत: एफ। ज़पाटा
यदि 100% डेटा प्रतिगमन फ़ंक्शन की रेखा पर है, तो निर्धारण का गुणांक 1 होगा।
इसके विपरीत, यदि डेटा के एक सेट और एक निश्चित फिट फ़ंक्शन के लिए गुणांक आर 2 0.5 के बराबर निकलता है, तो यह कहा जा सकता है कि फिट 50% संतोषजनक या अच्छा है।
इसी तरह, जब प्रतिगमन मॉडल R 2 मान को 0.5 से कम करता है, तो यह इंगित करता है कि चुना गया समायोजन फ़ंक्शन डेटा के संतोषजनक रूप से अनुकूलन नहीं करता है, इसलिए दूसरे समायोजन फ़ंक्शन की खोज करना आवश्यक है।
और जब सहसंयोजक या सहसंबंध गुणांक शून्य हो जाता है, तो डेटा में चर X और Y असंबंधित होते हैं, और इसलिए R 2 भी शून्य हो जाएगा।
निर्धारण के गुणांक की गणना कैसे करें?
पिछले खंड में यह कहा गया था कि निर्धारण के गुणांक की गणना विभेदकों के बीच भागफल ज्ञात करके की जाती है:
चर Y के प्रतिगमन समारोह से प्रेरित
एन डेटा जोड़े के चर शीरों के प्रत्येक के लिए इसी चर यी की क्या।
गणितीय रूप से, यह इस तरह दिखता है:
R 2 = Sŷ / Sy
इस सूत्र से यह निम्नानुसार है कि आर 2 प्रतिगमन मॉडल द्वारा समझाया गया विचरण के अनुपात का प्रतिनिधित्व करता है। वैकल्पिक रूप से, आर 2 की गणना निम्न सूत्र का उपयोग करके की जा सकती है, जो पिछले एक के बराबर है:
R 2 = 1 - (Sε / Sy)
जहां S Where अवशिष्टों के विचरण का प्रतिनिधित्व करता है =i = --i - Yi, जबकि Sy डेटा के Yi मानों के समुच्चय का विचरण है। Meansi निर्धारित करने के लिए प्रतिगमन समारोह लागू किया जाता है, जिसका अर्थ है कि =i = f (क्सी) की पुष्टि करना।
1 से N तक डेटा सेट यी के संस्करण की गणना इस तरह से की जाती है:
साय =
और फिर Sŷ या S similar के लिए इसी तरह आगे बढ़ें।
सचित्र मामला
निर्धारण के गुणांक की गणना कैसे की जाती है, इसका विवरण दिखाने के लिए, हम निम्नलिखित चार जोड़े में से कुछ जोड़े लेंगे:
(एक्स, वाई): {(1, 1); (2. 3); (3, 6) और (4, 7)}।
इस डेटा सेट के लिए एक रेखीय प्रतिगमन फिट प्रस्तावित है, जिसे कम से कम वर्ग विधि का उपयोग करके प्राप्त किया जाता है:
f (x) = 2.1 x - 1
इस समायोजन फ़ंक्शन को लागू करने से, टॉर्क्स प्राप्त होते हैं:
(एक्स,;): {(1, 1.1); (2, 3.2); (3, 5.3) और (4, 7.4)}।
फिर हम एक्स और वाई के लिए अंकगणितीय माध्य की गणना करते हैं:
वेरियनस सी
साय = / (4-1) =
= = 7,583
भिन्नता Sŷ
S = / (4-1) =
= = 7.35
निश्चय का गुणांक R 2
R 2 = S = / Sy = 7.35 / 7.58 = 0.97
व्याख्या
पिछले खंड में विचार किए गए उदाहरण के मामले के लिए निर्धारित गुणांक 0.98 निकला। दूसरे शब्दों में, फ़ंक्शन के माध्यम से रैखिक समायोजन:
f (x) = 2.1x - 1
यह उस डेटा की व्याख्या करने में 98% विश्वसनीय है जिसके साथ इसे कम से कम वर्ग विधि का उपयोग करके प्राप्त किया गया था।
निर्धारण के गुणांक के अलावा, रैखिक सहसंबंध गुणांक है या जिसे पियर्सन के गुणांक के रूप में भी जाना जाता है। यह गुणांक, जिसे r के रूप में निरूपित किया गया है, की गणना निम्नलिखित संबंधों द्वारा की जाती है:
r = Sxy / (Sx Sy)
यहाँ अंश चर X और Y के बीच सहसंयोजक का प्रतिनिधित्व करता है, जबकि हर एक चर X के लिए मानक विचलन और चर Y के लिए मानक विचलन का गुणनफल है।
पियर्सन के गुणांक -1 और +1 के बीच मान ले सकते हैं। जब यह गुणांक +1 पर जाता है तो X और Y के बीच एक सीधा रैखिक सहसंबंध होता है। यदि यह 1 के बजाय झुकता है, तो रैखिक संबंध है, लेकिन जब X बढ़ता है तो Y कम हो जाता है। अंत में, यह 0 के करीब है दोनों चर के बीच कोई संबंध नहीं है।
यह ध्यान दिया जाना चाहिए कि निर्धारण का गुणांक पियर्सन गुणांक के वर्ग के साथ मेल खाता है, केवल जब पहले एक रेखीय फिट के आधार पर गणना की गई है, लेकिन यह समानता अन्य गैर-रेखीय फिट के लिए मान्य नहीं है।
उदाहरण
- उदाहरण 1
हाई स्कूल के छात्रों का एक समूह अपनी लंबाई के एक समारोह के रूप में एक पेंडुलम की अवधि के लिए एक अनुभवजन्य कानून का निर्धारण करने के लिए निर्धारित करता है। इस उद्देश्य को प्राप्त करने के लिए, वे मापों की एक श्रृंखला लेते हैं, जिसमें वे निम्नलिखित मान प्राप्त करने वाली विभिन्न लंबाई के लिए एक पेंडुलम दोलन का समय मापते हैं:
लंबाई (एम) | अवधि |
---|---|
0.1 | 0.6 |
0.4 | 1.31 |
0.7 | 1.78 |
एक | 1.93 |
1.3 | 2.19 |
1.6 | 2.66 |
1.9 | 2.77 |
3 | 3.62 |
यह डेटा के बिखराव की साजिश बनाने और प्रतिगमन के माध्यम से एक रैखिक फिट प्रदर्शन करने के लिए अनुरोध किया जाता है। इसके अलावा, प्रतिगमन समीकरण और इसके निर्धारण के गुणांक को दिखाएं।
उपाय
चित्रा 2. व्यायाम के लिए समाधान का ग्राफ 1. स्रोत: एफ। ज़पाटा।
निर्धारण का काफी उच्च गुणांक (95%) देखा जा सकता है, इसलिए यह सोचा जा सकता है कि रैखिक फिट इष्टतम है। हालाँकि, यदि बिंदुओं को एक साथ देखा जाता है, तो वे नीचे की ओर वक्र होते हैं। रैखिक मॉडल में इस विस्तार पर विचार नहीं किया गया है।
- उदाहरण २
उदाहरण 1 में समान डेटा के लिए, डेटा का स्कैटर प्लॉट करें। इस अवसर पर, उदाहरण 1 के विपरीत, एक संभावित फ़ंक्शन का उपयोग करके एक प्रतिगमन समायोजन का अनुरोध किया जाता है।
चित्रा 3. व्यायाम के लिए समाधान ग्राफ 2. स्रोत: एफ। ज़पाटा।
फिट फ़ंक्शन और निर्धारण आर 2 के इसके गुणांक को भी दिखाएं ।
उपाय
संभावित फ़ंक्शन फॉर्म एफ (एक्स) = एक्स बी है, जहां ए और बी स्थिरांक हैं जो न्यूनतम वर्गों विधि द्वारा निर्धारित किए जाते हैं।
पिछला आंकड़ा संभावित फ़ंक्शन और उसके मापदंडों को दिखाता है, साथ ही साथ 99% के बहुत उच्च मूल्य के साथ निर्धारण का गुणांक भी है। ध्यान दें कि डेटा ट्रेंड लाइन की वक्रता का अनुसरण करता है।
- उदाहरण 3
उदाहरण 1 और उदाहरण 2 से समान डेटा का उपयोग करना, एक दूसरे की डिग्री बहुपद फिट करें। ग्राफ, फिट बहुपद, और निर्धारण R 2 के संगत गुणांक दिखाएं ।
उपाय
चित्रा 4. व्यायाम के लिए समाधान ग्राफ 3. स्रोत: एफ। ज़पाटा।
दूसरी डिग्री के बहुपद फिट के साथ आप एक ट्रेंड लाइन देख सकते हैं जो डेटा की वक्रता को अच्छी तरह से फिट करता है। इसके अलावा, निर्धारण का गुणांक रैखिक फिट के ऊपर और संभावित फिट के नीचे है।
फिट तुलना
दिखाए गए तीन फिट में से, दृढ़ संकल्प के उच्चतम गुणांक वाला एक संभावित फिट (उदाहरण 2) है।
संभावित फिट पेंडुलम के भौतिक सिद्धांत के साथ मेल खाता है, जो कि जैसा कि ज्ञात है, स्थापित करता है कि एक पेंडुलम की अवधि इसकी लंबाई के वर्गमूल के समानुपाती होती है, आनुपातिकता का निरंतरता 2π / √g है जहां जी गुरुत्वाकर्षण का त्वरण है।
इस प्रकार के संभावित फिट में न केवल निर्धारण का उच्चतम गुणांक है, बल्कि आनुपातिकता के प्रतिपादक और निरंतरता भौतिक मॉडल से मेल खाते हैं।
निष्कर्ष
-प्रतिरोध समायोजन फ़ंक्शन के मापदंडों को निर्धारित करता है जिसका उद्देश्य कम से कम वर्ग विधि का उपयोग करके डेटा की व्याख्या करना है। इस पद्धति में समायोजन वाई मूल्य और डेटा के एक्सआई मान के लिए डेटा के यी मूल्य के बीच द्विघात अंतर के योग को कम करना शामिल है। यह ट्यूनिंग फ़ंक्शन के मापदंडों को निर्धारित करता है।
-जैसे हमने देखा है, सबसे सामान्य समायोजन फ़ंक्शन लाइन है, लेकिन यह केवल एक ही नहीं है, क्योंकि समायोजन भी बहुपद, संभावित, घातीय, लघुगणक और अन्य हो सकते हैं।
किसी भी मामले में, निर्धारण का गुणांक डेटा और समायोजन के प्रकार पर निर्भर करता है और लागू समायोजन की अच्छाई का एक संकेत है।
-विशेष रूप से, निर्धारण का गुणांक दिए गए एक्स के लिए समायोजन के to मूल्य के संबंध में डेटा के वाई मूल्य के बीच कुल परिवर्तनशीलता का प्रतिशत दर्शाता है।
संदर्भ
- गोंजालेज सी। जनरल सांख्यिकी। से बरामद: tarwi.lamolina.edu.pe
- आईएसीएस। स्वास्थ्य विज्ञान के वेलेंटाइन संस्थान। से पुनर्प्राप्त: ics-aragon.com
- सालाजार सी। और कैस्टिलो एस। सांख्यिकी के मूल सिद्धांत। (2018)। से पुनर्प्राप्त: dspace.uce.edu.ec
- Superprof। निर्धारण गुणांक। से पुनर्प्राप्त: superprof.es
- यूएसएसी। वर्णनात्मक आँकड़े मैनुअल। (2011)। से पुनर्प्राप्त: आंकड़े।
- विकिपीडिया। निर्धारण गुणांक। से पुनर्प्राप्त: es.wikipedia.com