- इंटरनेट सर्च इंजन के प्रकारों का वर्गीकरण
- 1- श्रेणीबद्ध साधक (स्पाइडर)
- फिसलना
- इंडेक्स किए गए
- प्रासंगिकता की गणना करें
- परिणाम को पुनः प्राप्त करें
- 2- निर्देशिकाएँ
- 3- हाइब्रिड सर्च इंजन
- 4- मेटासर्च इंजन
- संदर्भ
के वर्गीकरण इंटरनेट खोज इंजन श्रेणीबद्ध खोज इंजन, निर्देशिका, संकर खोज इंजन और मेटा खोज इंजन में विभाजित किया जा सकता है।
सर्च इंजन एक सॉफ्टवेयर सिस्टम है जिसे वर्ल्ड वाइड वेब पर जानकारी खोजने के लिए डिज़ाइन किया गया है। वे उन दस्तावेज़ों को खोजने के लिए कीवर्ड का उपयोग करते हैं जो उन शब्दों से संबंधित हैं और फिर खोजे जा रहे विषय के लिए प्रासंगिकता के क्रम में परिणामों को रैंक करते हैं।
इंटरनेट सर्च इंजन उन जानकारियों को निकालना चाहते हैं जो उनके उपयोगकर्ता को चाहिए; यह इंटरनेट पर उपलब्ध एक बड़े डेटाबेस के कारण संभव है।
वे जानकारी खोजने के लिए दैनिक उपयोग के लिए एक उपकरण बन गए हैं। इसके लिए धन्यवाद, वर्तमान में Google, AOL, Yahoo और Bing जैसे खोज इंजन के साथ जानकारी प्राप्त करना बहुत आसान है।
इंटरनेट पर हजारों विभिन्न खोज इंजन उपलब्ध हैं; हर एक की अपनी अलग-अलग क्षमताएं और विशेषताएं हैं।
विकसित किए गए पहले खोज इंजन को आर्ची कहा जाता था और इसका उपयोग एफ़टीपी फ़ाइलों की खोज के लिए किया जाता था; पहले पाठ-आधारित खोज इंजन को वेरोनिका कहा जाता था।
उपयोगकर्ता कंप्यूटर, स्मार्टफोन, टैबलेट, या किसी अन्य इलेक्ट्रॉनिक उपकरण पर ब्राउज़र के माध्यम से एक खोज इंजन का उपयोग कर सकते हैं।
इंटरनेट सर्च इंजन के प्रकारों का वर्गीकरण
1- श्रेणीबद्ध साधक (स्पाइडर)
इस प्रकार का सर्च इंजन इंटरनेट पर वेबसाइटों की खोज के लिए एक 'मकड़ी' का उपयोग करता है। यह मकड़ी अलग-अलग वेब पेजों में प्रवेश करती है, कीवर्ड्स को बाहर निकालती है, और फिर पेजों को इंटरनेट सर्च इंजन के डेटाबेस में जोड़ती है।
इस प्रकार के खोज इंजन के लाभ यह है कि इनमें बड़ी संख्या में पृष्ठ होते हैं, और वे उपयोग करने में आसान होते हैं। इस कारण से उपयोगकर्ता के लिए एक परिचित बनाना और इसे बार-बार उपयोग करना बहुत आम है।
दूसरी ओर, डाउनसाइड में यह शामिल है कि क्योंकि वे बहुत अधिक डेटा निकालते हैं, इसलिए बहुत अधिक जानकारी होना संभव है।
इंटरनेट पर अधिकांश लोकप्रिय सर्च इंजन गूगल, बिंग, याहू, Baidu और यैंडेक्स जैसे पदानुक्रमित हैं।
सभी पदानुक्रमित इंटरनेट खोज इंजन खोज सामग्री को नई सामग्री खोजने और अनुक्रमित करने के लिए एक बॉट (मकड़ी) का उपयोग करते हैं।
खोज परिणामों में किसी भी वेब पेज को प्रदर्शित करने से पहले हर बुनियादी खोज इंजन का अनुसरण करने वाले चार बुनियादी चरण हैं:
फिसलना
उपलब्ध वेब पेजों को खोजने के लिए खोज इंजन पूरे इंटरनेट पर क्रॉल करते हैं। यह मकड़ी नामक एक सॉफ्टवेयर द्वारा किया जाता है; भूस्खलन के बीच की आवृत्ति में दिन लग सकते हैं।
इंडेक्स किए गए
यह उन शब्दों और अभिव्यक्तियों की पहचान करने की प्रक्रिया है जो वेब पेज का सबसे अच्छा वर्णन करते हैं। पहचाने गए शब्दों को कीवर्ड के रूप में संदर्भित किया जाता है और पृष्ठ को पहचाने गए शब्दों को सौंपा जाता है।
प्रासंगिकता की गणना करें
खोज इंजन डेटाबेस के अनुक्रमित पृष्ठों के साथ आवश्यकता स्ट्रिंग में खोज स्ट्रिंग की तुलना करता है।
चूँकि एक से अधिक पृष्ठ में खोज स्ट्रिंग सम्मिलित होने की संभावना अधिक होती है, खोज इंजन अपने तर्ज के प्रत्येक पृष्ठ की प्रासंगिकता की गणना खोज स्ट्रिंग के साथ करने लगता है।
प्रासंगिकता की गणना के लिए कई एल्गोरिदम हैं। इनमें से प्रत्येक एल्गोरिदम में कीवर्ड या लिंक घनत्व जैसे सामान्य कारकों के लिए अलग-अलग वजन हैं।
यही कारण है कि प्रत्येक खोज इंजन एक ही खोज स्ट्रिंग के लिए परिणामों के विभिन्न पृष्ठ देता है।
समय-समय पर खोज इंजन अपने एल्गोरिदम को बदलते हैं।
परिणाम को पुनः प्राप्त करें
मूल रूप से यह केवल ब्राउज़र में परिणाम प्रदर्शित कर रहा है; खोज परिणामों के अंतहीन पृष्ठ जो सबसे अधिक प्रासंगिक से कम से कम महत्वपूर्ण के लिए आदेश दिए गए हैं।
2- निर्देशिकाएँ
निर्देशिका खोज इंजन हैं जो उनकी लिस्टिंग के लिए मानवीय गतिविधियों पर निर्भर करते हैं: एक वेब पेज निर्देशिका को प्रस्तुत किया जाता है और इसके समावेश को संपादकीय टीम द्वारा अनुमोदित किया जाना चाहिए।
यह प्रक्रिया निम्नानुसार होती है:
1-वेबसाइट का मालिक उस श्रेणी के साथ निर्देशिका में अपनी साइट का एक छोटा विवरण प्रस्तुत करता है जिसमें इसे सूचीबद्ध किया जाना चाहिए।
2-प्रस्तुत साइट की मैन्युअल रूप से समीक्षा की जाती है। फिर इसे उपयुक्त श्रेणी में जोड़ा जा सकता है या इसे सूची से खारिज किया जा सकता है। खराब सामग्री वाली वेब साइट की तुलना में अच्छी सामग्री वाली साइट को जोड़े जाने की अधिक संभावना है।
3-खोज बॉक्स में दर्ज किए गए कीवर्ड वेब पेज के विवरण से मेल खाएंगे। इसका मतलब यह है कि साइट की सामग्री में किए गए बदलावों पर ध्यान नहीं दिया जाता है क्योंकि केवल साइट के मामलों का विवरण होता है।
लाभ यह है कि शामिल किए जाने से पहले प्रासंगिकता और सामग्री के लिए प्रत्येक पृष्ठ की समीक्षा की जाती है। अक्सर परिणाम कम होने का मतलब है कि आपको जो चाहिए वह तेजी से मिल सकता है।
यह कहा जा रहा है, प्रारूप और लेआउट अधिकांश लोगों के अनुकूल नहीं है और वे कम सामान्य खोजों के साथ संघर्ष कर सकते हैं। एक और नुकसान यह है कि वेब पेज के निर्माण और निर्देशिका में इसके शामिल होने में देरी होती है
कुछ प्रसिद्ध निर्देशिकाओं में ओपन डिक्शनरी प्रोजेक्ट, इंटरनेट पब्लिक लाइब्रेरी और हाल ही में बंद DMOZ शामिल हैं।
3- हाइब्रिड सर्च इंजन
ये खोज इंजन खोज परिणामों में वेब पृष्ठों को सूचीबद्ध करने के लिए पदानुक्रमित खोज इंजन और निर्देशिका दोनों का उपयोग करते हैं।
अधिकांश मकड़ी खोज इंजन, जैसे Google, मूल रूप से प्राथमिक तंत्र के रूप में पदानुक्रमित खोज इंजन का उपयोग करते हैं और द्वितीयक तंत्र के रूप में मैन्युअल निगरानी करते हैं।
कभी-कभी उपयोगकर्ता को वेब या निर्देशिका खोजने का विकल्प दिया जाता है। अन्य समय में, उपयोगकर्ता को एक ही खोज में मानव-घुमावदार परिणाम और श्रेणीबद्ध परिणाम दोनों प्राप्त हो सकते हैं; जब ऐसा होता है, तो मानव परिणाम आमतौर पर पहले सूचीबद्ध होते हैं।
Google और याहू दो मुख्य खोज इंजन हैं जो इस श्रेणी में आते हैं, हालांकि अधिक से अधिक खोज इंजन इस प्रणाली की ओर पलायन कर रहे हैं।
4- मेटासर्च इंजन
ये इंटरनेट सर्च इंजन वे हैं जो एक ही समय में अन्य खोज इंजनों को खोजते हैं और फिर परिणामों को एक सूची में जोड़ते हैं।
लाभ यह है कि अधिक परिणाम प्राप्त होते हैं, लेकिन उनकी प्रासंगिकता और गुणवत्ता काफी हद तक पीड़ित हो सकती है।
मेटा सर्च इंजन के उदाहरणों में डॉगपाइल, मेटाक्रॉलर, और क्लस्टी शामिल हैं।
संदर्भ
- विभिन्न प्रकार के खोज इंजन (2016) क्या हैं। वेबनोट्स डॉट कॉम से पुनर्प्राप्त
- इंटरनेट की खोज: खोज इंजन के प्रकार। Libguides.astate.edu से पुनर्प्राप्त किया गया
- खोज इंजन के प्रकार (2008)। Zeald.com से पुनर्प्राप्त किया गया
- खोज इंजन और इसके प्रकार (2015)। स्लाइडशेयर डॉट कॉम से पुनर्प्राप्त
- खोज इंजन (2017)। Computerhope.com से पुनर्प्राप्त