SEO Basics

Co to jest plik robots.txt?

Plik robots.txt to dokument tekstowy umieszczony w katalogu głównym witryny, który instruuje roboty wyszukiwarek, które strony lub sekcje powinny być skanowane, a które pomijane. To kluczowe narzędzie do zarządzania crawl budget i zapobiegania indeksowaniu wrażliwych lub zbędnych części serwisu.

Zacznij za darmo Przewodnik krok po kroku ↓

Plik robots.txt to w zasadzie zestaw instrukcji dla robotów internetowych. Gdy wyszukiwarka taka jak Google odwiedza stronę, najpierw szuka właśnie tego pliku. Wykorzystuje on protokół wykluczania robotów do wydawania poleceń, takich jak „User-agent” (do kogo odnosi się reguła) i „Disallow” (które ścieżki należy ignorować). Choć doskonale nadaje się do zapobiegania marnowaniu czasu robotów na mało wartościowe strony – takie jak ekrany logowania, wyniki wyszukiwania wewnętrznego czy foldery administratora – należy pamiętać, że robots.txt nie gwarantuje usunięcia strony z indeksu Google. Jeśli strona jest zablokowana w robots.txt, ale prowadzą do niej linki zewnętrzne, Google może nadal zaindeksować dany URL. Aby całkowicie wykluczyć stronę z wyników wyszukiwania, wymagany jest tag „noindex”. Błędna konfiguracja robots.txt to częsty błąd technicznego SEO; przypadkowe zablokowanie całej witryny może prowadzić do całkowitej utraty widoczności, dlatego należy z nim postępować ostrożnie.

Przewodnik krok po kroku

Zlokalizuj lub utwórz plik

Upewnij się, że plik o nazwie robots.txt istnieje w katalogu głównym Twojej strony (np. example.com/robots.txt).

Zdefiniuj User-Agentów

Określ, których botów dotyczą reguły, używając gwiazdki (*) dla wszystkich lub „Googlebot” dla konkretnego robota.

Ustaw reguły Disallow

Wymień katalogi lub konkretne ścieżki plików, które chcesz ukryć przed robotami wyszukiwarek.

Dodaj link do sitemapy

Umieść bezpośredni link do swojej mapy witryny XML na dole pliku, aby pomóc botom w indeksowaniu treści.

Przetestuj pod kątem błędów

Użyj testera robots.txt w Google Search Console, aby upewnić się, że nie blokujesz ważnych stron.

Profesjonalne wskazówki

Używaj „Disallow” dla prywatnych lub powtarzalnych stron, takich jak /wp-admin/ lub /search/.
Nigdy nie używaj robots.txt do ukrywania wrażliwych danych użytkowników; do tego służy ochrona hasłem.
Dbaj o prostą składnię; złożone reguły mogą prowadzić do błędów w crawlingu.

🚀

Jak pomaga pSeoMatic

pSeoMatic automatycznie monitoruje Twój plik robots.txt pod kątem nieoczekiwanych zmian. Jeśli programista przypadkowo zablokuje sekcję generującą duży ruch, nasz system natychmiast wyśle alert, zapobiegając katastrofalnym spadkom widoczności organicznej.

Wypróbuj pSeoMatic za darmo

Powiązane pytania

Czy robots.txt powstrzyma indeksowanie strony?

Zatrzymuje skanowanie (crawling), ale indeksowanie może nadal nastąpić, jeśli inne strony linkują do tego adresu. Użyj tagu noindex dla pełnej blokady.

Gdzie należy umieścić plik robots.txt?

Musi on znajdować się w głównym katalogu (root) hostingu Twojej strony.

Czy w robots.txt wielkość liter ma znaczenie?

Tak, zarówno nazwa pliku, jak i ścieżki katalogów wewnątrz niego są wrażliwe na wielkość liter.

Powiązane przewodniki

Gotowy, aby wprowadzić to w życie?

pSeoMatic generuje tysiące stron zoptymalizowanych pod SEO na podstawie Twoich danych.

Zacznij za darmo