Google 웹마스터 공식블로그 [KO]: robots.txt에서 지원되지 않는 규칙에 대하여

웹마스터 블로그

구글 검색과 웹에 대한 최신 소식을 전합니다.

robots.txt에서 지원되지 않는 규칙에 대하여

2020년 3월 16일 월요일

원문robots.txt 파서를 오픈소스화한다개발자웹마스터인터넷 드래프트오픈소스 robots.txt 파서

로봇 메타 태그의 Noindex: HTTP 응답 헤더와 HTML 모두에서 지원되는 noindex 지시문은 크롤링이 허용될 때 색인에서 URL을 제거하는 가장 효과적인 방법입니다.

404 및 410 HTTP 상태 코드: 두 상태 코드는 모두 해당 페이지가 존재하지 않음을 의미하며, 크롤링 및 처리가 되면 해당 URL을 구글 색인에서 삭제합니다.

비밀번호 보호: 구독 또는 유료 콘텐츠를 표시하기 위해 마크업이 사용된 경우를 제외하고, 로그인 후 페이지를 숨기면 일반적으로 구글 색인에서 해당 페이지가 제거됩니다.

robots.txt에서 차단: 검색 엔진은 해당 엔진이 알고 있는 페이지만 색인할 수 있으므로 페이지가 크롤링되는 것을 차단하면 일반적으로 콘텐츠의 색인이 생성되지 않습니다. 검색 엔진은 콘텐츠 자체를 보지 않고 다른 페이지 링크를 기반으로 URL을 색인할 수도 있지만, 구글의 목표는 앞으로 이러한 페이지가 색인되지 않도록 하는 것입니다.

서치 콘솔 URL 제거 도구: 구글 검색결과에서 URL을 일시적으로 제거하는 빠르고 간편한 도구입니다.

고객센터트위터웹마스터 커뮤니티오프라게리

Google

검색 결과
렌더링
로봇 배제 표준
로봇 배제 프로토콜
모바일 친화성
색인
서치 콘솔
소통
속도
웹마스터 도구
웹마스터 커뮤니티
이미지
인덱싱
자바스크립트
체리 머핀
치솔이
코로나19
크롤링
피드백
AMP
crawling and indexing
feedback and communication
k-pop
robots.txt
search results
SEO
webmaster community

이전글 보기

2020
- 11월
- 10월
- 9월
- 8월
- 7월
- 6월
- 5월
- 4월
- 3월
- 2월

Google
Privacy
Terms