- आवृत्ति वितरण
- कितने वर्गों पर विचार करना है?
- यह कैसे प्राप्त किया जाता है?
- उदाहरण
- ये किसके लिये है?
- उदाहरण
- संदर्भ
वर्गांक, यह भी मध्य के रूप में जाना, एक वर्ग के केंद्र है, जो सभी मूल्यों को उस श्रेणी में हैं का प्रतिनिधित्व करता है में मूल्य है। मूल रूप से, वर्ग चिह्न का उपयोग कुछ मापदंडों की गणना करने के लिए किया जाता है, जैसे कि अंकगणितीय माध्य या मानक विचलन।
तो वर्ग चिह्न किसी भी अंतराल का मध्य बिंदु है। यह मान कक्षाओं में पहले से रखे गए डेटा के एक सेट के विचरण को खोजने के लिए भी बहुत उपयोगी है, जो बदले में हमें यह समझने की अनुमति देता है कि केंद्र से ये विशिष्ट डेटा कितनी दूर स्थित हैं।
आवृत्ति वितरण
यह समझने के लिए कि कक्षा चिह्न क्या है, आवृत्ति वितरण की अवधारणा आवश्यक है। डेटा के एक सेट को देखते हुए, एक आवृत्ति वितरण एक तालिका है जो डेटा को कई श्रेणियों में विभाजित करती है जिसे कक्षाएं कहा जाता है।
यह तालिका उन तत्वों की संख्या को दर्शाती है जो प्रत्येक वर्ग के हैं; उत्तरार्द्ध को आवृत्ति के रूप में जाना जाता है।
यह तालिका उस जानकारी का हिस्सा है जो हम डेटा से प्राप्त करते हैं, क्योंकि प्रत्येक तत्व का व्यक्तिगत मूल्य होने के बजाय, हम केवल यह जानते हैं कि यह उस वर्ग का है।
दूसरी ओर, हम डेटा सेट की बेहतर समझ प्राप्त करते हैं, क्योंकि इस तरह से स्थापित पैटर्नों की सराहना करना आसान है, जो उक्त डेटा के हेरफेर की सुविधा देता है।
कितने वर्गों पर विचार करना है?
आवृत्ति वितरण करने के लिए, हमें सबसे पहले उन कक्षाओं की संख्या निर्धारित करनी चाहिए जिन्हें हम लेना चाहते हैं और उनकी कक्षा की सीमाएँ चुनते हैं।
कितने वर्गों को लेने का विकल्प सुविधाजनक होना चाहिए, इस बात को ध्यान में रखते हुए कि बहुत कम संख्या में कक्षाएं हमारे द्वारा अध्ययन किए जाने वाले डेटा के बारे में जानकारी छिपा सकती हैं और एक बहुत बड़ा एक बहुत अधिक विवरण उत्पन्न कर सकता है जो आवश्यक रूप से उपयोगी नहीं हैं।
जिन कारकों को हमें ध्यान में रखना चाहिए, उन्हें चुनने के लिए कि कितनी कक्षाएं लेने के लिए कई वर्ग हैं, लेकिन इन दो में से एक है: पहला ध्यान में रखना है कि हमें कितना डेटा पर विचार करना है; दूसरा यह जानना है कि वितरण की सीमा कितनी बड़ी है (यानी सबसे बड़े और सबसे छोटे अवलोकन के बीच का अंतर)।
पहले से परिभाषित कक्षाएं होने के बाद, हम यह गिनने के लिए आगे बढ़ते हैं कि प्रत्येक कक्षा में कितना डेटा मौजूद है। इस संख्या को कक्षाओं की आवृत्ति कहा जाता है और इसे फाई द्वारा दर्शाया जाता है।
जैसा कि हमने पहले कहा था, हमारे पास यह है कि एक आवृत्ति वितरण प्रत्येक डेटा या अवलोकन से व्यक्तिगत रूप से आने वाली जानकारी को खो देता है। इस कारण से, एक मूल्य मांगा जाता है जो उस पूरे वर्ग का प्रतिनिधित्व करता है जिसके पास वह है; यह मान वर्ग चिह्न है।
यह कैसे प्राप्त किया जाता है?
वर्ग चिह्न कोर मूल्य है जो एक वर्ग का प्रतिनिधित्व करता है। यह अंतराल की सीमाओं को जोड़कर और इस मूल्य को दो से विभाजित करके प्राप्त किया जाता है। हम इसे निम्नानुसार गणितीय रूप से व्यक्त कर सकते हैं:
x i = (निचली सीमा + ऊपरी सीमा) / 2।
इस एक्सप्रेशन में मैं iith वर्ग के निशान को दर्शाता है।
उदाहरण
निम्नलिखित डेटा सेट को देखते हुए, एक प्रतिनिधि आवृत्ति वितरण दें और संबंधित वर्ग चिह्न प्राप्त करें।
चूंकि उच्चतम संख्यात्मक मान वाला डेटा 391 और निम्नतम 221 है, इसलिए हमारे पास यह सीमा 391 -22 = 170 है।
हम 5 वर्गों का चयन करेंगे, सभी समान आकार के साथ। वर्गों को चुनने का एक तरीका इस प्रकार है:
ध्यान दें कि प्रत्येक डेटा एक वर्ग में है, ये असमान हैं और समान मूल्य रखते हैं। कक्षाओं को चुनने का एक अन्य तरीका डेटा को एक सतत चर के हिस्से के रूप में विचार करके है, जो किसी भी वास्तविक मूल्य तक पहुंच सकता है। इस मामले में हम प्रपत्र की कक्षाओं पर विचार कर सकते हैं:
205-245, 245-285, 285-325, 325-365, 365-405
हालांकि, डेटा को समूहीकृत करने का यह तरीका सीमाओं के साथ कुछ अस्पष्टताएं पेश कर सकता है। उदाहरण के लिए, 245 के मामले में, सवाल उठता है: यह किस वर्ग का है, पहला या दूसरा?
इस भ्रम से बचने के लिए, एक समापन बिंदु सम्मेलन बनाया जाता है। इस तरह, पहला वर्ग अंतराल (205,245), दूसरा (245,285), और इसी तरह होगा।
एक बार कक्षाओं को परिभाषित करने के बाद, हम आवृत्ति की गणना करने के लिए आगे बढ़ते हैं और हमारे पास निम्न तालिका होती है:
डेटा के आवृत्ति वितरण को प्राप्त करने के बाद, हम प्रत्येक अंतराल के वर्ग के निशान को खोजने के लिए आगे बढ़ते हैं। वास्तव में, हमें निम्न करना होगा:
x 1 = (205+ 245) / 2 = 225
x 2 = (245+ 285) / 2 = 265
x 3 = (285+ 325) / 2 = 305
x 4 = (325+ 365) / 2 = 345
x 5 = (365+ 405) / 2 = 385
हम निम्नलिखित ग्राफ द्वारा इसका प्रतिनिधित्व कर सकते हैं:
ये किसके लिये है?
जैसा कि पहले उल्लेख किया गया है, अंकगणित माध्य और डेटा के एक समूह के विचरण को खोजने के लिए वर्ग चिह्न बहुत कार्यात्मक है जो पहले से ही विभिन्न वर्गों में वर्गीकृत किया गया है।
हम अंकगणितीय माध्य को नमूना आकार के बीच प्राप्त टिप्पणियों के योग के रूप में परिभाषित कर सकते हैं। भौतिक दृष्टिकोण से, इसकी व्याख्या डेटा सेट के संतुलन बिंदु की तरह है।
एक एकल संख्या द्वारा निर्धारित संपूर्ण डेटा की पहचान करना जोखिम भरा हो सकता है, इसलिए इस संक्षिप्त बिंदु और वास्तविक डेटा के बीच अंतर को भी ध्यान में रखा जाना चाहिए। इन मूल्यों को अंकगणितीय माध्य से विचलन के रूप में जाना जाता है, और इनके साथ हम यह निर्धारित करना चाहते हैं कि डेटा का अंकगणितीय माध्य कितना भिन्न होता है।
इस मूल्य को खोजने का सबसे आम तरीका विचरण द्वारा है, जो अंकगणित माध्य से विचलन के वर्गों का औसत है।
अंकगणित माध्य और एक वर्ग में समूहीकृत डेटा के सेट के विचरण की गणना करने के लिए, हम क्रमशः निम्न सूत्रों का उपयोग करते हैं:
इन एक्सप्रेशन्स में x i, i-th क्लास मार्क है, f i, संबंधित फ्रिक्वेंसी को दर्शाता है और k उस क्लास की संख्या को दर्शाता है जिसमें डेटा को ग्रुप किया गया था।
उदाहरण
पिछले उदाहरण में दिए गए डेटा का उपयोग करते हुए, हमारे पास यह है कि हम आवृत्ति वितरण तालिका के थोड़ा अधिक डेटा का विस्तार कर सकते हैं। आप निम्न प्राप्त करें:
फिर, सूत्र में डेटा को प्रतिस्थापित करके, हमें अंकगणित माध्य के साथ छोड़ दिया जाता है:
इसके विचलन और मानक विचलन हैं:
इससे हम यह निष्कर्ष निकाल सकते हैं कि मूल डेटा का अंकगणितीय माध्य 306.6 और मानक विचलन 39.56 है।
संदर्भ
- फर्नांडीज एफ। सैंटियागो, कॉर्डोबा एल। अलेजांद्रो, कोरडरो एस। जोस एम। वर्णनात्मक सांख्यिकी। एशिक संपादकीय।
- झोंसन रिचर्ड ए। मिलर और फ्रायंड प्रोबेबिलिटी एंड स्टेट्समेन फॉर इंजीनियर्स। पियर्सन एजुकेशन।
- इंजीनियर के लिए मिलर I और फ्रायंड जे। संभावना और स्टेट्समैन। वापस।
- सरबिया ए। जोस मारिया, पास्कल मार्टा। कंपनियों के लिए बुनियादी सांख्यिकी पाठ्यक्रम
- लेलिनस एस। हम्बर्टो, रोजास ए। कार्लोस वर्णनात्मक आँकड़े और संभाव्यता वितरण, यूनिवर्सिडेल डेल नॉर्ट एडिटोरियल