ارور یا خطای Submitted url blocked by robots.txt در سرچ کنسول به چه معناست؟
چگونه می توان این مشکل را برطرف کرد؟
پاسخ :
خطای Submitted url blocked by robots.txt در سرچ کنسول، بخش Coverage و تب Error نمایش داده می شود.
معنی این خطا این است که صفحه مدنظر در فایل سایت مپ لیست شده است، اما در فایل روبوتس جلوی کراول کردن آن گرفته شده است.
این مشکل هم دقیقا همانند دیگر خطاهای سرچ کنسول است که در بخش «مطالعه بیشتر» پایین این پست ذکر کرده ام. در واقع همگی از این موضوع ناشی می شوند که گوگل می گوید شما تکلیفتان با خودتان مشخص نیست!
اگر می خواهید صفحه ای ایندکس شود، نباید دسترسی آن را از جای دیگری ببندید.
ارور Submitted url blocked by robots.txt نیز از همین موضوع ناشی می شود. شما صفحه را در سایت مپ لیست کرده اید (به منظور تمایل به ایندکس شدن) اما از سوی دیگر، جلوی کراولر کردن آن صفحه توسط ربات های گوگل را بسته اید (به منظور عدم تمایل به ایندکس شدن).
بنابراین راه حل قطعی این مشکل این است که اگر :
- می خواهید صفحه ایندکس شود، بسته بودن دسترسی آن را در فایل Robots.txt اصلاح کنید.
- نمی خواهید صفحه ایندکس شود، صفحه را از لیست سایت مپ حذف کنید.
به همین راحتی می توانید ارور Submitted url blocked by robots.txt را در سرچ کنسول برطرف کنید.
* توجه کنید که ممکن است صفحاتی که این ارور را دارند، ایندکس نشوند. پس اگر صفحه مهمی این مشکل را دارد، سریعا آن را برطرف کنید.
مطالعه بیشتر :
- پست «رفع خطای Indexed, though blocked by robots.txt»
- پست «رفع خطای Indexed, not submitted in sitemap»
- پست «رفع خطای Submitted url marked noindex»
- مقالات مرتبط با «سرچ کنسول»
در نهایت، اگر هر سوال، نظر، تجربه و یا ابهامی دارید، همین الان کامنت کنید!
در اسرع وقت، شخصا به دیدگاه شما پاسخ خواهم داد. جدای از اینکه کامنت شما بهشدت به من انرژی مثبت تزریق می کند 🙂
سلام نیما جان مثلاً من یک صفحه دارم ایندکس شده مثل لینک زیر
https://afrashopping.com/product-category/%D8%A2%D8%B1%D8%A7%DB%8C%D8%B4%DB%8C/%DA%A9%D8%B1%D9%85-%D9%BE%D9%88%D8%AF%D8%B1-%D9%88-%D9%BE%D9%86%DA%A9%DB%8C%DA%A9/
اما یه url دیگه دارم که به همون دسته مربوط میشه ولی ایندکس نشده و همین ارور رو داره مثل این:
https://afrashopping.com/product-category/%D8%A2%D8%B1%D8%A7%DB%8C%D8%B4%DB%8C/%DA%A9%D8%B1%D9%85-%D9%BE%D9%88%D8%AF%D8%B1-%D9%88-%D9%BE%D9%86%DA%A9%DB%8C%DA%A9/?per_page=24
سلام دوست عزیز
اگر دقت کنین لینک دوم، مربوط به Pagination یا صفحه بندی این دسته میشه. طبیعی هم هستش که نباید ایندکس بشه چون ارزشی برای گوگل نداره. شما باید اول این مشکل رو حل کنین.
بعدش بررسی کنین که چرا تو robots بسته شده، البته که بنظرم درسته.
سلام وقتتون بخیر
چند وقت پیش رباتی داخل یکی از سایت های ما وارد شد و تعداد زیادی لینک ساخت که همگی 404 بودن
در robots.txt بستیم و در سرچ کنسول درخواست حذفشون رو دادیم حدود 2 میلیون صفحه بود
میخواستم بدونم چیکار کنیم که این صفحات حتی در سرچ کنسول هم نمایش نده و حذف بشن و به robots.txt هم نرسند