تبلیغات
Ads
تبلیغات
Ads
گفتگو با مدیر
Chat
آخرين مطالب سایت
last posts
پر بازدید ترین مطالب
Top Posts
محبوبترین ها
Popular Posts
آخرين نظرات
Last comments

robot.txt چیست؟

بطور خلاصه فایل robots.txt محدودیت هایی رو برای موتورهای جستجو در زمینه جستجو و گردآوری سایت شما انجام می ده.
شاید شما هم به این فکر رسیده باشید که اگر بخواهید جلوی قسمتی از سایت، محتوا و یا جایی از سایتتون رو برای خوانده شدن توسط موتورهای جستجویی نظیر گوگل یا یاهو بگیرید چه کاری باید انجام بدید.

خب، راه حل استفاده از فایل robots.txt هست. موتورهای جستجو قبل از هر کاری ابتدا به این فایل مراجعه می کنند و اگر اجازه داشتند به ادامه کار می پردازند. پیروی از فایل robots.txt نوعی قانون در موتورهای جستجو محسوب می شه.

خب، اگه شما می خواهید موتورهایی جستجو همه سایت شما رو بخوانند بنابراین نیازی نیست این مطلب رو بخوانید. نبود این فایل نشانگر رضایت شما از خوانده شدن تمام محتوای قابل دسترس برای موتورهای جستجو هست …

+ فایل robots.txt کجا باید قرار گیرد؟
– فایل robots.txt باید در root هاست شما ( پوشه اصلی که دامنه شما در آن قرار دارد ) قرار گیرد. بطور مثال آدرس فایل http://www.example.com/robots.txt قابل قبول هست ولی آدرسی مانند http://www.example.com/mysite/robots.txt غیرقابل قبول محسوب می شود و محتویات اون خوانده نمی شود. اگر شما به پوشه اصلی ( root ) دسترسی ندارید می توانید از META tag ها استفاده کنید ( + ).

+ چگونه فایل robots.txt رو بسازم ؟
– شما کافیست برای این کار فایلی با نام robots و با پسوند txt بسازید. توجه داشته باشید تمامی حروف باید کوچک باشد و برای هنگام ذخیره باید حالت ASCII-encoded text رو انتخاب کنید. با برنامه ای مثل notepad می توانید خیلی راحت این کار را انجام دهید.
ساده ترین فایل robots.txt شامل ۲ نقش است:

* User-agent : روبات های مجاز
* Disallow : صفحه های غیرمجاز

بطور مثال برای اجازه دادن به تمامی روبات های خزنده وب می تونید از دستور زیر استفاده کنید :

[css]
User-agent: *
[/css]

چند تا مثال کاربردی:

– جلوگیری از خوانده شدن محتوا برای تمامی موتورهای جستجو:

[css]
User-agent: *
Disallow: /
[/css]

– جلوگیری از خوانده شدن محتوای ۴ پوشه مشخص شده :

[css]
User-agent: *
Disallow: /cgi-bin/
Disallow: /images/
Disallow: /tmp/
Disallow: /private/
[/css]

– جلوگیری از خواندن محتویات پوشه private توسط گوگل :

[css]
User-agent: Googlebot
Disallow: /private/
[/css]

– جلوگیری از خوانده شدن یک فایل خاص :

[css]
User-agent: *
Disallow: /directory/file.html
[/css]

– برای کامنت گذاری از # استفاده می شه. تمامی نوشته ها بعد از # در یک خط کامنت محسوب می شوند ( در نظر گرفته نمی شوند ).
– توجه داشته باشید که بزرگ و کوچک بودن آدرس ها مهم است

موضوع : آموزش, بهینه سازی موتور های جستجو, طراحی وب
تاریخ ارسال : ۱۷ خرداد ۱۳۹۰  ,  بازدید : 24,853 بازدید ,  نظرات : ۱   ,  نویسنده : 

یک پاسخ به “robot.txt چیست ؟”

  1. آزاد می‌گه:

    عالي بود مــــــــــــــــــــــــــــــرس :*

پاسخ دهید