नियम Sturges वर्गों या श्रेणियों जो सांख्यिकीय आंकड़ों का एक सेट की साजिश रचने के लिए आवश्यक हैं की संख्या निर्धारित करने के लिए इस्तेमाल एक कसौटी है। इस नियम को 1926 में जर्मन गणितज्ञ हर्बर्ट स्टर्ज ने लिखा था।
स्टर्गेस ने एक सरल विधि का प्रस्ताव किया, जो नमूनों की संख्या के आधार पर x है जो हमें कक्षाओं की संख्या और उनकी सीमा चौड़ाई का पता लगाने की अनुमति देगा। स्टर्जन के नियम का व्यापक रूप से उपयोग किया जाता है, विशेष रूप से सांख्यिकी के क्षेत्र में, विशेष रूप से आवृत्ति हिस्टोग्राम का निर्माण करने के लिए।
व्याख्या
स्टर्ज का नियम एक आनुभविक विधि है जिसका उपयोग वर्णनात्मक आंकड़ों में व्यापक रूप से उन वर्गों की संख्या को निर्धारित करने के लिए किया जाता है, जो एक आवृत्ति हिस्टोग्राम में मौजूद होना चाहिए, ताकि एक नमूना या जनसंख्या का प्रतिनिधित्व करने वाले डेटा के एक सेट को वर्गीकृत किया जा सके।
मूल रूप से, यह नियम ग्राफिक कंटेनरों की चौड़ाई, आवृत्ति हिस्टोग्राम की निर्धारित करता है।
अपने नियम को स्थापित करने के लिए हर्बर्ट स्टर्ज ने एक आदर्श आवृत्ति आरेख पर विचार किया, जिसमें K अंतराल शामिल है, जहां i-th अंतराल में एक निश्चित संख्या में नमूने (i = 0,… k - 1) शामिल हैं:
नमूनों की संख्या को उन तरीकों की संख्या के द्वारा दिया जाता है जिनमें सेट का सबसेट निकाला जा सकता है; द्विपद गुणांक द्वारा, इस प्रकार व्यक्त किया गया है:
अभिव्यक्ति को सरल बनाने के लिए, उन्होंने समीकरण के दोनों भागों में लघुगणक के गुणों को लागू किया:
इस प्रकार, स्टर्ज ने स्थापित किया कि अंतराल की अधिकतम संख्या k अभिव्यक्ति द्वारा दी गई है:
इसे इस प्रकार भी व्यक्त किया जा सकता है:
इस अभिव्यक्ति में:
- k कक्षाओं की संख्या है।
- नमूने में एन कुल टिप्पणियों की संख्या है।
- लॉग आधार 10 का सामान्य लघुगणक है।
उदाहरण के लिए, एक आवृत्ति हिस्टोग्राम के निर्माण के लिए जो 142 बच्चों की ऊंचाई का एक यादृच्छिक नमूना व्यक्त करता है, वितरण या अंतराल की संख्या जो वितरण होगा:
k = 1 + 3.322 * लॉग 10 (एन)
k = 1 + 3,322 * लॉग (142)
k = 1 + 3.322 * 2.1523
k = 8.14 ≈ 8
इस प्रकार, वितरण 8 अंतराल में होगा।
अंतराल की संख्या को हमेशा संपूर्ण संख्याओं द्वारा दर्शाया जाना चाहिए। ऐसे मामलों में जहां मूल्य दशमलव है, निकटतम पूर्ण संख्या में एक सन्निकटन बनाया जाना चाहिए।
अनुप्रयोग
स्टर्ज का नियम मुख्य रूप से आंकड़ों में लागू होता है, क्योंकि यह कक्षाओं की संख्या (के) की गणना के माध्यम से एक आवृत्ति वितरण की अनुमति देता है, साथ ही इनमें से प्रत्येक की लंबाई, जिसे आयाम भी कहा जाता है।
आयाम वर्ग की ऊपरी और निचली सीमा का अंतर है, जिसे कक्षाओं की संख्या से विभाजित किया जाता है, और व्यक्त किया जाता है:
अंगूठे के कई नियम हैं जो आवृत्ति वितरण की अनुमति देते हैं। हालांकि, स्टर्ज का नियम आमतौर पर उपयोग किया जाता है क्योंकि यह कक्षाओं की संख्या का अनुमान लगाता है, जो आमतौर पर 5 से 15 तक होता है।
इस प्रकार, यह एक मूल्य मानता है जो पर्याप्त रूप से एक नमूना या आबादी का प्रतिनिधित्व करता है; यही है, सन्निकटन चरम समूहों का प्रतिनिधित्व नहीं करता है, और न ही यह अत्यधिक वर्गों के साथ काम करता है जो नमूना को संक्षेप में प्रस्तुत करने की अनुमति नहीं देते हैं।
उदाहरण
दिए गए आंकड़ों के अनुसार एक आवृत्ति हिस्टोग्राम की आवश्यकता होती है, जो उन पुरुषों के सर्वेक्षण में प्राप्त उम्र के अनुरूप है जो एक स्थानीय जिम में व्यायाम करते हैं।
अंतराल निर्धारित करने के लिए, किसी को नमूने के आकार या टिप्पणियों की संख्या का पता होना चाहिए; इस मामले में, 30 हैं।
तब स्टर्गेस नियम लागू होता है:
k = 1 + 3.322 * लॉग 10 (एन)
k = 1 + 3,322 * लॉग (30)
k = 1 + 3.322 * 1.4771
k = 5.90 inter 6 अंतराल।
अंतराल की संख्या से, इन आयामों की गणना की जा सकती है; यही है, आवृत्ति हिस्टोग्राम में प्रतिनिधित्व प्रत्येक पट्टी की चौड़ाई:
निचली सीमा को डेटा का सबसे छोटा मान माना जाता है, और ऊपरी सीमा सबसे बड़ा मूल्य है। ऊपरी और निचली सीमाओं के बीच के अंतर को चर (R) की सीमा या सीमा कहा जाता है।
तालिका से हमारे पास यह है कि ऊपरी सीमा 46 है और निचली सीमा 13 है; इस प्रकार, प्रत्येक वर्ग का आयाम होगा:
अंतराल एक ऊपरी और निचली सीमा से बना होगा। इन अंतरालों को निर्धारित करने के लिए, हम निम्न सीमा से, नियम (6) द्वारा निर्धारित आयाम को जोड़कर, निम्न प्रकार से शुरू करते हैं:
फिर प्रत्येक अंतराल के अनुरूप पुरुषों की संख्या निर्धारित करने के लिए पूर्ण आवृत्ति की गणना की जाती है; इस मामले में यह है:
- अंतराल 1: 13 - 18 = 9
- अंतराल २: १ ९ - २४ = ९
- अंतराल 3: 25 - 30 = 5
- अंतराल 4: 31 - 36 = 2
- अंतराल 5: 37 - 42 = 2
- अंतराल 6: 43 - 48 = 3
प्रत्येक वर्ग की निरपेक्ष आवृत्ति जोड़ते समय, यह नमूने की कुल संख्या के बराबर होना चाहिए; इस मामले में, 30।
इसके बाद, प्रत्येक अंतराल की सापेक्ष आवृत्ति की गणना की जाती है, इसकी निरपेक्ष आवृत्ति को टिप्पणियों की कुल संख्या से विभाजित करते हुए:
- अंतराल 1: फाई = 9 = 30 = 0.30
- अंतराल 2: फाई = 9 = 30 = 0.30
- अंतराल 3: फाई = 5 = 30 = 0.1666
- अंतराल 4: फाई = 2 = 30 = 0.0666
- अंतराल 5: फाई = 2 = 30 = 0.0666
- अंतराल 4: फाई = 3 = 30 = 0.10
फिर आप एक तालिका बना सकते हैं जो डेटा को दर्शाती है, और प्राप्त अंतराल के संबंध में सापेक्ष आवृत्ति से आरेख भी, जैसा कि निम्नलिखित छवियों में देखा जा सकता है:
इस तरह, स्टर्ज नियम उन वर्गों या अंतरालों की संख्या निर्धारित करने की अनुमति देता है जिनमें एक नमूना विभाजित किया जा सकता है, ताकि तालिकाओं और रेखांकन के विस्तार के माध्यम से एक डेटा नमूना को संक्षेप में प्रस्तुत किया जा सके।
संदर्भ
- अल्फांसो उर्किया, एमवी (2013)। मॉडलिंग और असतत घटनाओं का अनुकरण। UNED,
- अल्तमन नाओमी, एमके (2015)। "सरल रैखिक प्रतिगमन।" प्रकृति के तरीके।
- एंटुनेज़, आरजे (2014)। शिक्षा में सांख्यिकी। डिजिटल यूएनआईटी।
- फॉक्स, जे। (1997.)। अनुप्रयुक्त प्रतिगमन विश्लेषण, रैखिक मॉडल और संबंधित तरीके। SAGE प्रकाशन।
- हम्बर्टो लेलिनस सोलानो, सीआर (2005)। वर्णनात्मक आँकड़े और संभाव्यता वितरण। उत्तरी विश्वविद्यालय।
- पेंटेलेवा, ओवी (2005)। संभाव्यता और सांख्यिकी के मूल आधार।
- ओ। कुहल, एमओ (2001)। प्रयोगों का डिजाइन: अनुसंधान डिजाइन और विश्लेषण के सांख्यिकीय सिद्धांत। थॉमसन एडिटर्स।