2020.11.08 12:31

라이믹스 사이트에 구글봇이 트래픽을 과도하게 소진한다면 robots.tx 에서 조치

꿀팁관리소장

주소복사 ▷▶ https://rxtip.kr/free/2240 조회 수 483 추천지수 6점 댓글 0

Extra Form
추천지수	6

불필요한 주소까지 모두 크롤링해서 수집하려고 접속하는지 확인해 볼 필요가 있습니다. 문서나 페이지의 정식 주소 외 나머지 주소는 검색엔진에 노출될 필요도 없고 사실 불필요한 수집입니다.

제가 운영하는 사이트에 구글,빙 에서 방문하면서 과도하게 트래픽이 발생을 해서 서버의 로그를 확인해보고 크롤링해가는 주소를 보고 불필요한 부분은 robots.txt 로 접근하지 못하도록 조치했습니다.

해외트래픽으로 10기가 이상이 발생을 하는 바람에... (구글과 빙)

User-agent: *
Disallow: /*act=IS&
Disallow: /*act=IS$
Disallow: /*search_keyword
Disallow: /*search_target
Disallow: /*listStyle=viewer
Disallow: /*act=dispBoardCategory
Disallow: /*sort_index

IS 는 통합검색의 검색에 봇들이 검색하지 못하도록 합니다. 여기서는 굉장히 많은 키워드 등으로 크롤링하게 되는데 너무 많은 과도한 크롤링이 발생합니다.

그리고 나머지는 읽어보시면 대충 어떤 상황에서 쓰이는 변수들인지 확인이 되실겁니다.

하나의 문서가 저런 형태로 수십 수백가지 패턴의 주소로 크롤링을 하게 되면 1개의 문서를 불필요하게 중복해서 수집을 시도하게 됩니다. 여기서 엄청난 트래픽이 발생하게 됩니다.

저 정도만 막아줘도 낭비되는 트래픽의 대부분을 줄일 수 있을 것으로 보입니다.

물론 사용하는 스킨이나 자료에 따라서 긁어가는 주소의 형태가 사이트마다 다 다를 수 있으니 저것 외 자신의 사이트의 access.log 를 볼 수 있다면 거이서 접근되는 주소를 시간내서 살펴보면 불필요한 패턴을 확인할 수 있습니다.

TAG •

Who's 꿀팁관리소장

라이믹스로 커뮤니티 사이트를 운영하는 비개발자 운영자 입니다.
파트너쉽 맺으실 사이트 운영자분 환영합니다.

Prev 사이트에 과도한 트래픽 발생이 있어 불필요한 봇 제한하고 검색... 사이트에 과도한 트래픽 발생이 있어 불필요한 봇 제한하고 검색... 2020.11.09by 꿀팁관리소장 운영하는 사이트에 방문했던 도움 안되는 봇 에이전트 Next 운영하는 사이트에 방문했던 도움 안되는 봇 에이전트 2020.11.07by 꿀팁관리소장

3 추천 스크랩

Facebook Twitter Kakao KakaoStory Band LinkCopy

댓글로 가기 인쇄

✔댓글 쓰기

에디터 선택하기

✔ 텍스트 모드 ✔ 에디터 모드

자유게시판(68)

주제를 정하지 않은 가벼운 이야기 들입니다.

라이믹스로 사이트를 운영하는 개인이 라이믹스 팁을 공유하는 블로그 입니다.

Date2020.07.16 Views1432 Votes6

read more
휴대폰 판매 홍보를 무료로 하고 싶다면 웰바잉을 이용해 보세요.

Date2020.12.06 Views229 Votes3

Read More
오라클 클라우드의 저렴한 블록스토리지 비용

Date2020.11.26 Views803 Votes3

Read More
와우~ 애드센스 CPC 5달러 3

Date2020.11.21 Views376 Votes3

Read More
VPS를 사용하면 좋은 점은 쉽게 자원을 증설하거나 감소 시킬 수 있는 점.

Date2020.11.19 Views408 Votes3

Read More
사이트 2개의 멀티미디파일 캐시서버를 오라클 클라우드 무료티어로 이전했습니다. 4

Date2020.11.17 Views601 Votes3

Read More
오라클 클라우트 프리티어(평생무료) 계정 유료계정으로 업그레이드 2

Date2020.11.16 Views4811 Votes4

Read More
오라클 클라우드 네트워크 속도를 측정해 봤더니 4

Date2020.11.16 Views1076 Votes3

Read More
Adsbot 요놈 뭐하는 놈인지

Date2020.11.09 Views788 Votes3

Read More
사이트에 과도한 트래픽 발생이 있어 불필요한 봇 제한하고 검색엔진도 특정 url은 접근을 막았습니다.

Date2020.11.09 Views415 Votes3

Read More
라이믹스 사이트에 구글봇이 트래픽을 과도하게 소진한다면 robots.tx 에서 조치

Date2020.11.08 Views483 Votes3

Read More
운영하는 사이트에 방문했던 도움 안되는 봇 에이전트 4

Date2020.11.07 Views883 Votes3

Read More
네이버 검색 29일부터 PC에서도 모바일과 동일한 검색결과 제공

Date2020.10.28 Views176 Votes3

Read More
웹페이지나 앱에 유튜브를 단순 재생하는 정도의 컨텐츠라면 원칙적으로 광고를 달면 안됩니다. 2

Date2020.10.13 Views365 Votes3

Read More
카페24 웹호스팅 해지 환불 신청 방법

Date2020.10.11 Views2661 Votes4

Read More
라이믹스 꿀팁 사이트 오라클 클라우드 프리티어(무료) 로 이전했습니다. 4

Date2020.10.10 Views464 Votes3

Read More
사이트 운영을 웹호스팅에서 가상서버로 바꾸게 되는 이유 3

Date2020.09.16 Views713 Votes3

Read More
애드센스 사이트 자동광고 해제 했는데 크롬 브라우저에서 자동광고가 계속 나온다면

Date2020.08.17 Views206 Votes3

Read More
애드센스 사이트 승인이 났네요. 3

Date2020.08.17 Views391 Votes3

Read More
아이폰 input 태그에 기본 둥근 테두리 그림자 효과 제거

Date2020.08.12 Views484 Votes3

Read More
각 게시판의 새글 소식을 메일로 받을 수 있도록 했습니다.

Date2020.08.11 Views315 Votes3

Read More

Prev 1 2 3 4 Next

/ 4

로그인

검색

Who's 꿀팁관리소장

자유게시판(68)

주제를 정하지 않은 가벼운 이야기 들입니다.