본문 바로가기
SEO(검색엔진최적화)

검색엔진최적화정보::검색엔진로봇을 다시 부르는 요소들

by HiSeoSem 2009. 6. 20.

검색엔진최적화정보::검색엔진로봇을 다시 부르는 요소들  ||  SEO(검색엔진최적화)

사이트를 검색엔진이나 포털에 노출시키는 검색엔진최적화(SEO)작업을 두개의 큰 범주로 나누면 사이트내부의 검색엔진최적화작업과

사이트내부의 검색엔진최적화작업으로 나눌 수 있습니다.

이 중에서 검색엔진로봇을 내사이트로 부르는 작업, 특히 자주 또는 재방문을 유도하는 작업은 신규색인과 순위유지 및 향상에 큰 역할을 합니다.

 

이와 관련한 작업개요를 알고리즘소스를 통해 엿보겠습니다.

 

검색엔진최적화관련 자료들을 보고 있노라면 이해할 수 없는 수학공식 같은 것들이 심심치않게
나옵니다.
저로서는 이를 알고도 싶지도 않고 설명글을 통해 그저 "아! xx관련식이구나."정도로만 이해합니다.
여러분도 검색엔진개발자가 아닌 이상 굳이 알필요는 없습니다.
 
그런데 여기서 검색엔진로봇의 크롤링관련 소스를 하나 올려볼까 합니다. 
아래 식은 수학공식이아니라 프로그래밍소스로 보시면되는데 검색엔진로봇의 사이트 재방문
관련 프로그래밍소스의 일부입니다.
위에 것은 Age, 아래것은 Freshness입니다. 

위에서 A는 Age,p는 page, t는 time으로 검색엔진로봇이 방문한 페이지의 Age관련 소스입니다.
해석을 하자면 "만일 (방문한)페이지가 (검색엔진에서 정한)특정시간에 변경이 안되었다면 0으로 지정하고
그렇지 않다면 페이지의 변경된 시간은 해당시간을 지정한다."라고 해석할 수 있습니다.
  

 여기서 F는 Freshness로 검색엔진로봇이 방문한 페이지의 Freshness관련 소스입니다.
해석을 하자면 "페이지가 일정시간에 (검색엔진DB에 캐쉬한 사본과 동일하다면 1로 지정하고
그렇지 않다면 0으로 지정한다."
 
자 이제 해석을 했으니 이를 이해하여야합니다.
앞에서 검색엔진로봇의 재방문관련 소스라고 말슴드렸습니다.
먼저 검색엔진로봇은 페이지의 나이(Age)와 신선도(Freshness)를 본다는 뜻입니다.
이는 검색엔진서버의 유지비용과도 관련이 있습니다.
첫번째 소스에서 페이지의 나이는 오래되면 좋지만 일정기간내에 변경(업데이트)이 안되면
불리하다(극단적으로 인덱싱에서 제외)는 것을 이해할 수 있습니다.
두번째 소스에서는 페이지의 업데이트간격/주기가 짧으면 유리하다는 것을 알 수 있습니다.
이를 근거로 검색엔진로봇은 해당페이지를 얼마주기로 크롤링할 것인가를 판단하겠지요.
어떤 사이트는 로봇이 매일 또는 매시간 방문하는데 어떤 사이트는 며칠에 한 번씩 또는 잊을만하면
방문하는 사이트가 있습니다.
결국 위 소스와 관련있는데 이를 이해하였으면 이에 대응하는 작업(검색엔진최적화)을 하여야
합니다.
구글웹마스터도구에 크롤링관련 옵션을 보면 크롤링주기를 설정할 수 있지만 구글은 설정대로 크롤링을 해주지도 않고
추천하지도 않고 있습니다.
지들이 잘 알아서 크롤링하겠다고 말하고 있습니다.
 
자 이제 어떻게 재 방문율을 늘릴까요?
위 소스의 이념(?)에 부응해주면 됩니다.(인바운드링크관련은 여기서 제외)
-.게시글을 업데이트한다.
-.공지사항을 업데이트한다.
-.새품목을 메인에 띄운다.
-.콘텐츠를 업데이트한다.
-.댓글/답글을 달아준다.
-.메인페이지 crawlling 개선작업
등등이 있습니다.
위 방법은 주로 일반사이트나 쇼핑몰에 해당되는데 블로그콘텐츠에 밀리는 이유가 위방법에
관심을 안두기 때문입니다. 아니 일반사이트에게는 고단한 작업을 강요하는 소스인지도 모릅니다.
그래도 구글은 어느정도 양반인데 네이버는 위 소스에 너무 충실하고 있지 않나는 생각도 듭니다.
(그렇다고 구글보다 크롤링이 활발하다는 것은 절대 아닙니다. 다음의 daumoa는 더 심합니다.)
블로그는 새포스트,댓글,트랙백등만으로도 위 소스에 정확히 부응하게 되어 룰루랄라 인덱싱됩니다.
 
그렇다면 검색엔진로봇의 재방문율이 왜 중요할까요?
일반사이트든 블로그든 새 콘텐츠는 잘 검색엔진의 SERP가 일반적으로 높습니다.
구글처럼 "site:www.내사이트주소"로 검색해보아도 최신 글이 비교적 상위에 인덱싱되고
있습니다.
그런데 해당페이지를 아무리 SEO friendly하게 만들어 놓았더라도 얼마안가서 SERP가
뒤로 밀리게 됩니다. 
하지만 위 작업들을 잘 수행함으로써 검색엔진로봇이 자주방문하고 그 결과 인덱싱DB가
업데이트됨으로써 이러한 SERP하락을 극복할 수 있을 것입니다.
 
註)일반적인 검색엔진은 위 소스를 잘 반영하겠지만 보다 똑똑한 검색엔진은 이 소스만으로도
    부족할 것입니다. 바로 spam을 염두하지 않을 수 없습니다. 특히 freshness부분인데
    과도한 refreshing 작업을  필터링하는 또 다른 소스를 탑재할 것입니다.
    이런 소스는 어떤 것이 될까요?

반응형

댓글