- समरूपता का महत्व
- समरूपता बनाम समरूपता
- Homoscedasticity परीक्षण
- मानकीकृत चर
- समरूपता के गैर-ग्राफिकल परीक्षण
- संदर्भ
Homoscedasticity एक भविष्य कहनेवाला सांख्यिकीय मॉडल में होता है, तो सब एक या अधिक टिप्पणियों, विचरण (या स्वतंत्र) पैटर्न के डेटा समूहों के साथ व्याख्यात्मक चर के संबंध में लगातार रहते हैं।
एक प्रतिगमन मॉडल समरूपतावादी हो सकता है या नहीं, जिस स्थिति में हम विषमलैंगिकता की बात करते हैं।
चित्रा 1. पांच डेटा सेट और सेट के प्रतिगमन फिट। प्रत्येक समूह में अनुमानित मूल्य के संबंध में भिन्नता समान है। (Upav-biblioteca.org)
कई स्वतंत्र चर के एक सांख्यिकीय प्रतिगमन मॉडल को होमोसैडेस्टिक कहा जाता है, केवल तभी जब अनुमानित चर (या आश्रित चर के मानक विचलन) की त्रुटि का विचरण व्याख्यात्मक या स्वतंत्र चर के मूल्यों के विभिन्न समूहों के लिए एक समान रहता है।
चित्रा 1 में पांच डेटा समूहों में, प्रत्येक समूह में विचरण की गणना की गई है, प्रतिगमन द्वारा अनुमानित मूल्य के संबंध में, प्रत्येक समूह में समान होना। यह आगे माना जाता है कि डेटा सामान्य वितरण का पालन करता है।
चित्रमय स्तर पर इसका मतलब है कि प्रतिगमन फिट द्वारा अनुमानित मूल्य के आसपास अंक समान रूप से बिखरे हुए या बिखरे हुए हैं, और प्रतिगमन चर की सीमा के लिए प्रतिगमन मॉडल में एक ही त्रुटि और वैधता है।
समरूपता का महत्व
पूर्वानुमेय आँकड़ों में समरूपता के महत्व को समझाने के लिए, विपरीत घटना, विषमलैंगिकता के साथ विपरीत होना आवश्यक है।
समरूपता बनाम समरूपता
आकृति 1 के मामले में, जिसमें समरूपता है, यह सच है कि:
वार (y1-Y1); X1) (वार ((y2-Y2); X2)-…… वार ((y4-Y4); X4)
जहाँ Var ((yi-Yi); Xi) विचरण का प्रतिनिधित्व करता है, जोड़ी (xi, yi) समूह i के डेटा का प्रतिनिधित्व करता है, जबकि Yi समूह के माध्य मान ग्यारह के लिए प्रतिगमन द्वारा अनुमानित मूल्य है। समूह I से n डेटा के विचरण की गणना निम्नानुसार की जाती है:
वर ((यि-यि); षी) = yज (यि - यि) ^ २ / एन
इसके विपरीत, जब विषमलैंगिकता होती है, तो प्रतिगमन मॉडल पूरे क्षेत्र के लिए मान्य नहीं हो सकता है जिसमें इसकी गणना की गई थी। चित्र 2 इस स्थिति का एक उदाहरण दिखाता है।
चित्र 2. विषमलैंगिकता दिखाने वाले डेटा का समूह। (खुद का विस्तार)
चित्र 2 एक रेखीय प्रतिगमन का उपयोग करके डेटा के तीन समूहों और सेट के फिट का प्रतिनिधित्व करता है। यह ध्यान दिया जाना चाहिए कि पहले समूह की तुलना में दूसरे और तीसरे समूह में डेटा अधिक फैला हुआ है। आंकड़ा 2 में ग्राफ प्रत्येक समूह और उसके त्रुटि बार σ mean का माध्य मान दिखाता है, जिसमें डेटा के प्रत्येक समूह का मानक विचलन है। यह याद रखना चाहिए कि मानक विचलन iance विचरण का वर्गमूल है।
यह स्पष्ट है कि विषमलैंगिकता के मामले में, प्रतिगमन आकलन त्रुटि व्याख्यात्मक या स्वतंत्र चर के मूल्यों की सीमा में बदल जाती है, और अंतराल में जहां यह त्रुटि बहुत बड़ी है, प्रतिगमन भविष्यवाणी अविश्वसनीय है या लागू नहीं।
एक प्रतिगमन मॉडल में त्रुटियों या अवशिष्ट (और -Y) को स्वतंत्र चर के मूल्यों के अंतराल के दौरान समान विचरण (2 ^ 2) के साथ वितरित किया जाना चाहिए। यह इस कारण से है कि एक अच्छा प्रतिगमन मॉडल (रैखिक या अरेखीय) को होमोसिडैसिटी परीक्षण पास करना होगा।
Homoscedasticity परीक्षण
आकृति 3 में दिखाए गए बिंदु एक अध्ययन के डेटा से मेल खाते हैं, जो वर्ग मीटर में आकार या क्षेत्र के एक समारोह के रूप में घरों की कीमतों (डॉलर में) के बीच संबंध के लिए दिखता है।
परीक्षण किया जाने वाला पहला मॉडल एक रेखीय प्रतिगमन है। सबसे पहले, यह ध्यान दिया जाता है कि फिट के निर्धारण आर ^ 2 का गुणांक काफी अधिक है (91%), इसलिए यह सोचा जा सकता है कि फिट संतोषजनक है।
हालांकि, दो क्षेत्रों को समायोजन ग्राफ से स्पष्ट रूप से अलग किया जा सकता है। उनमें से एक, एक अंडाकार में संलग्न दाईं ओर, एक समरूपता को पूरा करता है, जबकि बाईं ओर के क्षेत्र में समरूपता नहीं होती है।
इसका अर्थ है कि प्रतिगमन मॉडल की भविष्यवाणी 1800 मीटर ^ 2 से 4800 मीटर ^ 2 तक की सीमा में पर्याप्त और विश्वसनीय है लेकिन इस क्षेत्र के बाहर बहुत अपर्याप्त है। विषमलैंगिक क्षेत्र में, न केवल त्रुटि बहुत बड़ी है, बल्कि डेटा भी रेखीय प्रतिगमन मॉडल द्वारा प्रस्तावित की तुलना में एक अलग प्रवृत्ति का पालन करता है।
चित्रा 3. आवास की कीमतें बनाम क्षेत्र और रैखिक प्रतिगमन द्वारा भविष्य कहनेवाला मॉडल, समरूपता और विषमलैंगिक क्षेत्र दिखा रहा है। (खुद का विस्तार)
डेटा का तितर बितर ग्राफ उनकी समरूपता का सबसे सरल और सबसे दृश्य परीक्षण है, हालांकि, उन अवसरों पर जहां यह उतना स्पष्ट नहीं है जितना कि उदाहरण 3 में दिखाया गया है, सहायक चर के साथ ग्राफ़ का सहारा लेना आवश्यक है।
मानकीकृत चर
उन क्षेत्रों को अलग करने के लिए जहां समलैंगिकता पूरी हुई है और जहां यह नहीं है, मानकीकृत चर ZRes और ZPred पेश किए गए हैं:
ZRes = Abs (y - Y) / y
ZPred = Y / /
यह ध्यान दिया जाना चाहिए कि ये चर लागू प्रतिगमन मॉडल पर निर्भर करते हैं, क्योंकि Y प्रतिगमन भविष्यवाणी का मूल्य है। नीचे एक ही उदाहरण के लिए स्कैप प्लॉट ZRes बनाम ZPred है:
चित्रा 4. यह ध्यान दिया जाना चाहिए कि समरूपता क्षेत्र में ZRes भविष्यवाणी क्षेत्र (स्वयं के विस्तार) में एक समान और छोटा रहता है।
मानकीकृत चर के साथ चित्रा 4 में ग्राफ में, जिस क्षेत्र में अवशिष्ट त्रुटि छोटा है और वर्दी उस क्षेत्र से स्पष्ट रूप से अलग है जहां यह नहीं है। पहले क्षेत्र में, होमोसिस्टैसिटी पूरी हो जाती है, जबकि इस क्षेत्र में जहां अवशिष्ट त्रुटि अत्यधिक परिवर्तनशील होती है और बड़ी, विषमलैंगिकता पूरी होती है।
प्रतिगमन समायोजन आंकड़ा 3 में डेटा के एक ही समूह पर लागू होता है, इस मामले में समायोजन गैर-रैखिक है, क्योंकि उपयोग किए गए मॉडल में एक संभावित फ़ंक्शन शामिल है। परिणाम निम्न आकृति में दिखाया गया है:
चित्रा 5. गैर-रेखीय प्रतिगमन मॉडल के साथ डेटा में समरूपता और विषमलैंगिकता के नए क्षेत्र। (खुद का विस्तार)।
चित्रा 5 के ग्राफ में, होमोसिस्टैस्टिक और विषम क्षेत्रों को स्पष्ट रूप से नोट किया जाना चाहिए। यह भी ध्यान दिया जाना चाहिए कि इन क्षेत्रों को उन लोगों के संबंध में बदल दिया गया था जो रैखिक फिट मॉडल में बनाए गए थे।
चित्र 5 के ग्राफ में यह स्पष्ट है कि फिट (93.5%) के निर्धारण का काफी उच्च गुणांक होने पर भी, मॉडल व्याख्यात्मक चर के पूरे अंतराल के लिए पर्याप्त नहीं है, क्योंकि मूल्यों के लिए डेटा 2000 मीटर ^ 2 से अधिक वर्तमान विषमलैंगिकता।
समरूपता के गैर-ग्राफिकल परीक्षण
गैर-ग्राफिकल परीक्षणों में से एक का उपयोग सबसे अधिक यह सत्यापित करने के लिए किया जाता है कि होमोसेक्शुअलिटी को पूरा किया गया है या नहीं, ब्रेक्स-पैगन परीक्षण है।
इस परीक्षण के सभी विवरण इस लेख में नहीं दिए जाएंगे, लेकिन इसकी मौलिक विशेषताओं और उसी के कदम मोटे तौर पर उल्लिखित हैं:
- प्रतिगमन मॉडल को n डेटा पर लागू किया जाता है और उसी के विचरण की गणना मॉडल by ^ 2 = (j (yj - Y) ^ 2 / n द्वारा अनुमानित मूल्य के संबंध में की जाती है।
- एक नया चर परिभाषित किया गया है (= ((yj - Y) ^ 2) / (- ^ 2)
- उसी प्रतिगमन मॉडल को नए चर पर लागू किया जाता है और इसके नए प्रतिगमन मापदंडों की गणना की जाती है।
- महत्वपूर्ण मान ची वर्ग (2 ^ 2) निर्धारित किया जाता है, यह चर resid में नए अवशिष्ट वर्गों के योग का आधा होता है।
- ची वर्ग वितरण तालिका का उपयोग महत्व के स्तर (आमतौर पर 5%) और तालिका के x- अक्ष पर स्वतंत्रता (प्रतिगमन चर की # इकाई) की डिग्री की संख्या का उपयोग करने के लिए किया जाता है। बोर्ड।
- चरण 3 में प्राप्त महत्वपूर्ण मान की तुलना तालिका में पाए गए मूल्य () ^ 2) से की जाती है।
- यदि महत्वपूर्ण मान तालिका से नीचे है, तो हमारे पास अशक्त परिकल्पना है: समरूपता है
- यदि महत्वपूर्ण मान तालिका के ऊपर है, तो हमारे पास वैकल्पिक परिकल्पना है: कोई समरूपता नहीं है।
अधिकांश सांख्यिकीय सॉफ्टवेयर पैकेज जैसे: एसपीएसएस, मिनीटेब, आर, पायथन पंडस, एसएएस, स्टेटग्राफिक और कई अन्य ब्रेक्स-पैगन होमोसैसिडिसिटी टेस्ट को शामिल करते हैं। विचरण की एकरूपता को सत्यापित करने के लिए एक और परीक्षण लेवेन परीक्षण है।
संदर्भ
- बॉक्स, हंटर और हंटर। (1988) शोधकर्ताओं के लिए सांख्यिकी। मैंने संपादकों पर पलटवार किया।
- जॉनसन, जे (1989)। अर्थमिति विधियाँ, विसें -विवे संपादन।
- मुरिलो और गोंजालेज (2000)। अर्थमिति मैनुअल। लास पालमास डी ग्रैन कैनरिया विश्वविद्यालय। से पुनर्प्राप्त: ulpgc.es।
- विकिपीडिया। Homoscedasticity। से पुनर्प्राप्त: es.wikipedia.com
- विकिपीडिया। Homoscedasticity। से पुनर्प्राप्त: en.wikipedia.com