SEO Basics

Apa itu file robots.txt?

File robots.txt adalah dokumen teks yang terletak di direktori root situs web yang memberitahu crawler mesin pencari halaman atau bagian mana yang boleh atau tidak boleh dijelajahi. Ini adalah alat vital untuk mengelola crawl budget dan mencegah pengindeksan bagian situs yang sensitif atau redundan.

File robots.txt pada dasarnya adalah kumpulan instruksi untuk robot web (crawler). Saat mesin pencari seperti Google mengunjungi sebuah situs, hal pertama yang dicari adalah file ini. File ini menggunakan 'Robots Exclusion Protocol' untuk memberikan perintah seperti 'User-agent' (kepada siapa aturan berlaku) dan 'Disallow' (jalur mana yang harus diabaikan). Meskipun sangat baik untuk mencegah crawler membuang waktu pada halaman bernilai rendah—seperti halaman login, hasil pencarian internal, atau folder admin—penting untuk dicatat bahwa robots.txt bukanlah cara yang dijamin untuk menjauhkan halaman dari indeks Google. Jika sebuah halaman diblokir di robots.txt tetapi memiliki tautan eksternal yang mengarah ke sana, Google mungkin masih mengindeks URL tersebut. Untuk benar-benar mencegah halaman muncul di hasil pencarian, diperlukan tag 'noindex'. Salah mengonfigurasi file robots.txt adalah kesalahan teknis SEO yang umum; secara tidak sengaja memblokir seluruh situs dapat menyebabkan hilangnya visibilitas pencarian secara total, sehingga harus ditangani dengan hati-hati.

Panduan Langkah demi Langkah

1

Cari atau Buat File

Pastikan file bernama robots.txt ada di direktori root situs Anda (misalnya, contoh.com/robots.txt).

2

Tentukan User-Agent

Tentukan bot mana yang berlaku untuk aturan tersebut, gunakan tanda bintang (*) untuk semua bot atau 'Googlebot' untuk bot spesifik.

3

Atur Aturan Disallow

Daftarkan direktori atau jalur file spesifik yang ingin Anda rahasiakan dari crawler mesin pencari.

4

Tambahkan Link Sitemap

Sertakan tautan langsung ke XML sitemap Anda di bagian bawah file untuk membantu bot menemukan konten Anda.

5

Uji Kesalahan

Gunakan robots.txt Tester di Google Search Console untuk memastikan Anda tidak memblokir halaman penting.

Pro Tips

🚀

Bagaimana pSeoMatic Membantu

pSeoMatic secara otomatis memantau file robots.txt Anda dari perubahan yang tidak terduga. Jika pengembang secara tidak sengaja memblokir bagian situs yang ber-traffic tinggi, sistem kami akan mengirimkan peringatan instan, mencegah penurunan drastis pada visibilitas organik sebelum berdampak pada pendapatan Anda.

Coba pSeoMatic gratis

Pertanyaan Terkait

Bisakah robots.txt menghentikan halaman agar tidak terindeks?

Ini menghentikan perayapan (crawling), tetapi pengindeksan masih bisa terjadi jika situs lain menautkan ke halaman tersebut. Gunakan tag noindex untuk penghapusan total.

Di mana saya harus meletakkan file robots.txt?

File ini harus diletakkan di direktori root utama (main root directory) dari host situs web Anda.

Apakah robots.txt bersifat case sensitive?

Ya, baik nama file maupun jalur direktori yang tercantum di dalamnya bersifat peka terhadap huruf besar/kecil (case sensitive).

Panduan Terkait

Siap untuk mempraktikkan ini?

pSeoMatic menghasilkan ribuan halaman yang dioptimalkan untuk SEO dari data Anda.