پیغام خطای discovered – currently not indexed نشون میده که Google از وجود URL صفحه شما اطلاع داره، اما هنوز اون رو کراول نکرده (و بنابراین ایندکس هم نشده).
برای اکثر وب سایت های کوچیک، این حالت URL طبیعی است و پس از خزیدن URL ها توسط Google، این مسئله به طور خودکار برطرف میشه. روند ایندکس شدن URL یه سایت در تصویر زیر نشون داده شده:
در تصویر زیر هم خطای discovered – currently not indexed که ممکنه برای شما در کنسول جستجوی گوگل ظاهر بشه رو نشون دادیم:
ولی اگه شما در وبسایت های بزرگتر (یعنی حدوداً بیشتر از 10.000 صفحه) با این مسئله روبرو هستین، ممکنه دلایل زیر در به وجود اومدن این خطا موثر باشن:
- Overloaded server سرور بیش از حد شلوغ: گوگل در خزیدن سایت شما با مشکل روبرو شده. چون که به نظر میرسه این سایت بیش از حد شلوغ شده. اگه این مورد باعث ایجاد مشکل شما شده بود با ارائه دهنده میزبانی خودتون مشورت کنین.
- Content overload اضافه بار محتوا: وب سایت شما محتوای خیلی بیشتری نسبت به چیزی که Google در حال حاضر برای خزیدن میخواد، داره. پس خزندهها فکر میکنن که کراول کردن این سایت ارزش نداره. نمونههایی از مطالب متناسب با این مورد: صفحات دسته محصولات فیلتر شده، محتوای تولید شده خودکار و محتوای تولید شده توسط کاربر. در صورتی که میخواین Google اون صفحه رو کراول و فهرست بندی کنه میتونین با هرس کردن content pruning و منحصر به فرد کردن محتوا این کار رو انجام بدین. همینطور با حذف لینک های داده شده به اون ضفحه و به روزرسانی فایل robots.txt خودتون، برای جلوگیری از دسترسی Google به URl هایی که نباید محتوای اونها رو discover کنه میتونین این مشکل رو حل کنین.
- ساختار پیوند داخلی ضعیف: Google راههای کافی برای ورود به محتوایی که قراره کراول بشه پیدا نمیکنه. پس با بهبود ساختار پیوند داخلی میتونین این مشکل رو برطرف کنین.
شماره 1 و 2 نمونههای کلاسیک مسائل مربوط به خزیدن است که برای وب سایت های بزرگتر، این موضوع نگران کننده است.
تو این راهنما قراره به یکی از خطای Coverage کنسول جستجوی گوگل بپردازیم و ببینیم چطوری میشه از شر discovered currently not indexed خلاص شد، پس تا آخر مقاله با ما همراه باشین:
پیغام discovered currently not indexed
پیغام خطای discovered – currently not indexed به این معنیه که Google با استفاده از فایل sitemap.xml یا از طریق URL Bot با موفقیت URL های وب سایت رو کشف کرده اما در فهرست جستجوی Google ایندکس نشده. بنابراین در کنسول جستجوی گوگل پیغامی با این شکل: discovered – currently not indexed ظاهر میشه که میگه: URL ها خزیده و کشف شدهاند اما هنوز در جستجوی Google ایندکس نشدن!
اگه تعداد زیادی صفحه در کنسول جستجوی Google خودتون دارین که Exclude شدن، ممکنه متوجه بشین که خیلی از اونها با این پیغام discovered – currently not indexed نشون داده میشن.
اگه در بررسی این پیغام خطا مهارت کافی رو پیدا کنین، با کلیک کردن روی صفحه متوجه میشین که Google حتی این صفحات رو کراول هم نکرده، چون که آخرین تاریخ خزیده شدن اونها N/A هست:
توضیحی که توسط گوگل داده شده اینه که ممکنه ربات google در تلاش برای جستجوی صفحه با مشکلی روبرو شده باشه. البته به نظر ما این اتفاق خیلی بعید و دور از ذهنه، زیرا بعضی سایت ها به سختی ترافیک دارن و در Blogger-Google میزبانی میشن!!
البته اینجا یه توضیح محتملتر هم داریم و اون اینه که، به هر دلیلی، Google این صفحات رو مهم ندونسته و اونها رو در صف خزیدن بسیار کم قرار داده و از اونجایی که ربات گوگل خیلی سرش شلوغه، هرگز مجبور به دوباره برگشتن و کراول کردن اونها نمیشه.
درسته که شما یه URL با نقشه سایت ارسال میکنین یا Google Bot صفحه وب شما رو از طریق مکانیسم پیوند کشف کرده، اما خب این کشف کردن از طریق خزنده های ارگانیک Google انجام شده. ولی خب سایت شما هنوز ایندکس نشده و همچنین Google Bot صفحات زیادی رو در وب سایت شما مشاهده میکنه و علاقهای نداره که در حال حاضر اونها رو ایندکس کنه. پس اینطوریه که خطای discovered – currently not indexed ظاهر میشه!
نحوه رفع وضعیت discovered – currently not indexed
اگه چشمتون به مواردی خورد که با این پیغام روبرو بودن و ایندکس نشده بودن، باید تو سه تا مورد زیر دنبال دلیل خطا بگردین:
1- ابتدا اطمینان حاصل کنین که به طور تصادفی URL های زیادی تولید نمیکنین.
2 – مطمئن بشین که پیوند داخلی به خوبی کار میکنه و تلاش کنین که تعداد صفحات رو کاهش بدین.
3 – به نوعی محتوا رو برای تقویت بیشتر ترکیب کنین!
discovered – currently not indexed
هنگامی که دیدین URL وب سایت شما با مشکل ایندکس نشدن و این پیغام روبرو شده، بدونین که URL در حال تکمیل موفقیت آمیز فرآیند کشف و خزیدن توسط Google Bot است اما خب هنوز ایندکس نشده و ممکنه بعد از مدتی Google Bot فکر کنه که آیا URL باید براساس اطلاعاتی که در اونها ارائه میدین، فهرست بندی بشه یا نه.
کنترل فنی discovered currently not indexed در کنسول جستجو
همیشه سعی کنین URL های وب سایت خودتون رو برای Google Bot بدون هیچ گونه ارور 404 ، قابل کشف و کراول کنین، بعد از همه این موارد اگه چک کردین و دیدین که حدود 99 درصد پیجها ایندکس نشدن وقتشه که سراغ یه سری از مسائل فنی برین! به این فکر کردین که آیا تا حالابه طور تصادفی با استفاده از انواع مختلفی از الگوهای URL، یو آر الی تولید میکنین یا نه؟ بله اینجا همون جاییه که مسئله دیگه فقط ایندکس نشدن صفحات نیست، بلکه ممکنه تو انبوهی از URLهای به ظاهر مشابهی که در حقیقت کاملاً متفاوت هستن، گم بشین.
بنابراین مواردی مانند پارامترهایی که در URL خودتون دارین مثل سایز حروف، میتونن منجر به تولید محتوای تکراری بشن و اگه ربات گوگل بسیاری از این URL های تکراری رو کشف کرده باشه، به نظرتون لازم میدونه همه رو ایندکس کنه؟! معلومه که نه!
درخواست ایندکس کردن دستی
پس از آزمایش، متوجه شدیم که میتونین از Google درخواست کنین فلان صفحه رو فهرست بندی کنه. در واقع با این کار به گوگل میگین که اولویت بیشتری برای این صفحه قرار بده و به طور کلی طی چند روز هم کراول و هم ایندکس بشه، پس در واقع میتونیم از این روش برای دور زدن discovered – currently not indexed استفاده کنیم!
اما نکته منفی این کار اینه که شما میتونین صفحات رو یکی یکی درخواست کنین. بنابراین باید به هر صفحه برین و روی REQUEST INDEXING کلیک کنین. در شکل زیر نحوه انجام دادن این کار بهتون نشون داده شده:
روی پیوندی که میخواین برای اون درخواست ایندکس کردن بفرسین و روی دکمه INSPECT URL که نشون داده میشه کلیک کنین. با این کار به صفحهای میرین که جزئیات بیشتری برای URL انتخاب شده نشون میده:
در این صفحه باید نوشته بشه «URL در Google نیست» و آخرین تاریخ خزیدن N/A است.
روی دکمه REQUEST INDEXING کلیک کنین تا یه پنجره براتون باز بشه که Google رو در حال پردازش و ارسال درخواست نشون میده. این کار حدود یک یا دو دقیقه طول میکشه.
همین کار رو برای هر صفحهای که میخواین درخواست ایندکس بدین، انجام بدین تا دیگه از شر خطای discovered – currently not indexed هم راحت بشین.
نتیجه فهرست بندی رو بررسی کنین
بعد از 6 یا 7 روز دوباره درخواست خودتون رو بررسی کنین، سپس خواهید دید دیگه با discovered – currently not indexed مواجه نمیشین.
کلام آخر
اگه URL هایی رو در این بخش مشاهده کردین که در حال حاضر فهرست نشده، اون URL ها رو لیست کنین و با ابزار بازرسی URL بررسیشون کنین و ببینین که آیا خطایی با ابزار بازرسی URL مشاهده میکنین یا نه. اگه از صفحات خاص خطایی دریافت کردین، فقط این خطاها رو برطرف کنین و اجازه بدین تا ربات گوگل از طریق آزمایش زنده با کنسول جستجوی گوگل اون رو کراول کنه و برای صفحات اون URL ها تغییری ایجاد کنه و درخواست ایندکس کردن بده و URL های وب سایت شما رو که در حال حاضر فهرست نشده یا به عبارتی حاوی پیام discovered currently not indexed است رو حذف exclude کنه.
امیدواریم که آموزش برای شما مفید واقع شده باشه. هر سوال یا نظری درباره این موضوع دارین، میتونین از طریق کامنتها با ما در ارتباط باشین.