सर्च इंजन कैसे काम करते हैं?
सर्च इंजन तीन प्राथमिक कार्यों के माध्यम से काम करते हैं:
क्रॉलिंग: सामग्री के लिए इंटरनेट पर छानबीन करें, प्रत्येक URL के लिए कोड/सामग्री को देखें।
अनुक्रमण: क्रॉलिंग प्रक्रिया के दौरान मिली सामग्री को संग्रहीत और व्यवस्थित करें। एक बार जब कोई पृष्ठ अनुक्रमणिका में होता है, तो वह प्रासंगिक प्रश्नों के परिणामस्वरूप प्रदर्शित होने की दौड़ में होता है।
रैंकिंग: सामग्री के टुकड़े प्रदान करें जो एक खोजकर्ता की क्वेरी का सबसे अच्छा उत्तर देगा, जिसका अर्थ है कि परिणाम सबसे प्रासंगिक से कम से कम प्रासंगिक द्वारा आदेशित किए जाते हैं।
सर्च इंजन क्रॉलिंग क्या है?
क्रॉलिंग एक खोज प्रक्रिया है जिसमें खोज इंजन नई और अद्यतन सामग्री खोजने के लिए रोबोट (क्रॉलर या स्पाइडर के रूप में जाना जाता है) की एक टीम भेजते हैं। सामग्री भिन्न हो सकती है - यह एक वेबपेज, एक छवि, एक वीडियो, एक पीडीएफ आदि हो सकती है - लेकिन प्रारूप की परवाह किए बिना, सामग्री लिंक द्वारा खोजी जाती है। उस शब्द का क्या अर्थ है?
इस खंड की किसी भी परिभाषा से परेशानी हो रही है? हमारी एसईओ शब्दावली में आपको अप-टू-स्पीड रहने में मदद करने के लिए अध्याय-विशिष्ट परिभाषाएँ हैं।
अध्याय 2 परिभाषाएँ देखें
खोज इंजन रोबोट, जिन्हें स्पाइडर भी कहा जाता है, नई और अद्यतन सामग्री खोजने के लिए एक पृष्ठ से दूसरे पृष्ठ पर क्रॉल करते हैं।
Googlebot कुछ वेब पेजों को लाकर शुरू करता है, और फिर नए URL खोजने के लिए उन वेबपेजों के लिंक का अनुसरण करता है। लिंक के इस पथ के साथ कूदकर, क्रॉलर नई सामग्री ढूंढने में सक्षम है और इसे कैफीन नामक अपने इंडेक्स में जोड़ सकता है - खोजे गए यूआरएल का एक विशाल डेटाबेस - बाद में पुनर्प्राप्त किया जा सकता है जब कोई खोजकर्ता जानकारी मांग रहा है कि उस यूआरएल पर सामग्री एक है के लिए अच्छा मैच।
सर्च इंजन इंडेक्स क्या है?
खोज इंजन उन सूचनाओं को संसाधित और संग्रहीत करते हैं जो उन्हें एक अनुक्रमणिका में मिलती हैं, जो उनके द्वारा खोजी गई सभी सामग्री का एक विशाल डेटाबेस है और खोजकर्ताओं की सेवा करने के लिए पर्याप्त है।
सर्च इंजन रैंकिंग
जब कोई खोज करता है, तो खोज इंजन अत्यधिक प्रासंगिक सामग्री के लिए उनकी अनुक्रमणिका को परिमार्जन करते हैं और फिर खोजकर्ता की क्वेरी को हल करने की उम्मीद में उस सामग्री को ऑर्डर करते हैं। प्रासंगिकता के आधार पर खोज परिणामों के इस क्रम को रैंकिंग के रूप में जाना जाता है। सामान्य तौर पर, आप यह मान सकते हैं कि किसी वेबसाइट की रैंक जितनी अधिक होगी, खोज इंजन उतना ही प्रासंगिक होगा कि साइट क्वेरी के लिए है।
आपकी साइट के किसी हिस्से या पूरी साइट से खोज इंजन क्रॉलर को अवरोधित करना संभव है, या खोज इंजनों को उनकी अनुक्रमणिका में कुछ पृष्ठों को संग्रहीत करने से बचने का निर्देश देना संभव है। हालांकि ऐसा करने के कई कारण हो सकते हैं, यदि आप चाहते हैं कि आपकी सामग्री खोजकर्ताओं को मिले, तो आपको पहले यह सुनिश्चित करना होगा कि यह क्रॉलर के लिए सुलभ है और अनुक्रमित है। अन्यथा, यह उतना ही अच्छा है जितना कि अदृश्य।
SEO में सभी सर्च इंजन समान नहीं होते हैं
कई शुरुआती लोग विशेष खोज इंजन के सापेक्ष महत्व के बारे में आश्चर्य करते हैं। अधिकांश लोग जानते हैं कि Google का बाजार में सबसे बड़ा हिस्सा है, लेकिन बिंग, याहू और अन्य के लिए अनुकूलन करना कितना महत्वपूर्ण है? सच्चाई यह है कि 30 से अधिक प्रमुख वेब सर्च इंजनों के अस्तित्व के बावजूद, SEO समुदाय वास्तव में केवल Google पर ही ध्यान देता है। क्यों? संक्षिप्त उत्तर यह है कि Google वह जगह है जहाँ अधिकांश लोग वेब पर खोज करते हैं। यदि हम Google छवियाँ, Google मानचित्र और YouTube (एक Google संपत्ति) शामिल करते हैं, तो 90% से अधिक वेब खोजें Google पर होती हैं - यह बिंग और Yahoo को मिलाकर लगभग 20 गुना है।
क्रॉलिंग: क्या सर्च इंजन आपके पेज ढूंढ सकते हैं?
जैसा कि आपने अभी सीखा है, यह सुनिश्चित करना कि आपकी साइट क्रॉल और अनुक्रमित हो, SERPs में प्रदर्शित होने के लिए एक पूर्वापेक्षा है। यदि आपके पास पहले से ही एक वेबसाइट है, तो यह देखकर शुरू करना एक अच्छा विचार हो सकता है कि आपके कितने पृष्ठ अनुक्रमणिका में हैं। इससे कुछ अच्छी जानकारी मिलेगी कि क्या Google क्रॉल कर रहा है और उन सभी पेजों को ढूंढ रहा है जिन पर आप इसे चाहते हैं, और कोई भी जो आप नहीं चाहते हैं।
अपने अनुक्रमित पृष्ठों की जांच करने का एक तरीका "site:yourdomain.com" है, जो एक उन्नत खोज ऑपरेटर है। Google पर जाएं और सर्च बार में "site:yourdomain.com" टाइप करें। यह निर्दिष्ट साइट के लिए Google की अनुक्रमणिका में परिणाम लौटाएगा
एक साइट का स्क्रीनशॉट: Google में moz.com खोज, खोज बॉक्स के नीचे परिणामों की संख्या दिखा रहा है।
Google द्वारा प्रदर्शित किए जाने वाले परिणामों की संख्या (ऊपर "एक्सएक्स परिणामों के बारे में" देखें) सटीक नहीं है, लेकिन यह आपको एक ठोस विचार देता है कि आपकी साइट पर कौन से पृष्ठ अनुक्रमित हैं और वे वर्तमान में खोज परिणामों में कैसे दिखाई दे रहे हैं।
अधिक सटीक परिणामों के लिए, Google खोज कंसोल में अनुक्रमणिका कवरेज रिपोर्ट की निगरानी करें और उसका उपयोग करें। यदि आपके पास वर्तमान में एक नहीं है तो आप एक निःशुल्क Google खोज कंसोल खाते के लिए साइन अप कर सकते हैं।
Tell search engines how to crawl your site
If you used Google Search Console or the “site:domain.com” advanced search operator and found that some of your important pages are missing from the index and/or some of your unimportant pages have been mistakenly indexed, there are some optimizations you can implement to better direct Googlebot how you want your web content crawled. Telling search engines how to crawl your site can give you better control of what ends up in the index.
सर्च इंजन को बताएं कि अपनी साइट को कैसे क्रॉल करें
यदि आपने Google खोज कंसोल या "site:domain.com" उन्नत खोज ऑपरेटर का उपयोग किया है और पाया है कि आपके कुछ महत्वपूर्ण पृष्ठ अनुक्रमणिका से गायब हैं और/या आपके कुछ महत्वहीन पृष्ठों को गलती से अनुक्रमित कर दिया गया है, तो कुछ अनुकूलन हैं जिन्हें आप कर सकते हैं Googlebot को बेहतर ढंग से निर्देशित करने के लिए लागू करें कि आप अपनी वेब सामग्री को कैसे क्रॉल करना चाहते हैं। खोज इंजनों को यह बताना कि आपकी साइट को कैसे क्रॉल किया जाए, इससे आपको इस बात का बेहतर नियंत्रण मिल सकता है कि अनुक्रमणिका में क्या समाप्त होता है।
Tell search engines how to crawl your site
If you used Google Search Console or the “site:domain.com” advanced search operator and found that some of your important pages are missing from the index and/or some of your unimportant pages have been mistakenly indexed, there are some optimizations you can implement to better direct Googlebot how you want your web content crawled. Telling search engines how to crawl your site can give you better control of what ends up in the index.
सर्च इंजन को बताएं कि अपनी साइट को कैसे क्रॉल करें
यदि आपने Google खोज कंसोल या "site:domain.com" उन्नत खोज ऑपरेटर का उपयोग किया है और पाया है कि आपके कुछ महत्वपूर्ण पृष्ठ अनुक्रमणिका से गायब हैं और/या आपके कुछ महत्वहीन पृष्ठों को गलती से अनुक्रमित कर दिया गया है, तो कुछ अनुकूलन हैं जिन्हें आप कर सकते हैं Googlebot को बेहतर ढंग से निर्देशित करने के लिए लागू करें कि आप अपनी वेब सामग्री को कैसे क्रॉल करना चाहते हैं। खोज इंजनों को यह बताना कि आपकी साइट को कैसे क्रॉल किया जाए, इससे आपको इस बात का बेहतर नियंत्रण मिल सकता है कि अनुक्रमणिका में क्या समाप्त होता है।