허니몬의 IT 이야기
MS, 고성능 검색기술개발에 관한 연구성과를 발표
Candace Lombardi [2006/08/09]
원문보기

검색 순위나 검색 정밀도 등 신기술개발에 착수한 MS의 연구자가 성과를 발표했다.

MS의 연구자 그룹이 발표한 2건의 연구 논문에 의하면, 특정 콘텐츠의 열람 및 클릭-스루(Click-Though)의 검색 결과에 대한 타당성을 분석하는 MS의 신기술이 검색 순위에 이용하는 알고리즘을 향상시키는 것이라고 했다.

MS 리서치의 Mining, Search and Navigation Group의 유진 아지치타인(Agichtein)은 "현재 이용되고 있는 검색 엔진의 대부분은 콘텐츠에 관한 사용자의 문의와 웹 페이지의 링크 구조를 대조, 그 결과를 리스트로 표시하는, 2개의 접근방법을 이용하고 있다. 우리가 착수하고 있는 개발은 여기에 사용자 자신을 포함시키는 세가지의 접근 방법이다. 이러한 새로운 기법에 의해서 검색 익스피리언스(experience)가 향상한다" 라고 말했다.

8월 6일부터 11일에 걸쳐, 시애틀에서 국제 연차 이벤트 「Association for Computing Machinery's Special Interest Group on Information Retrieval(ACM SIGIR 2006)」가 개최되고 있다. 올해로 29번째가 되는 이번 이벤트에서는, MS의 연구자와 각 대학의 연구자로 구성된 13개의 그룹이 연구 성과를 발표하고 있다.

이 이벤트에서 발표된 논문 가운데, 「웹 검색 결과의 우선도를 예측하기 위한 사용자 상호작용 모델 연구(Learning User Interaction Models for Predicting Web Search Results Preferences)는, 처음 검색 결과의 페이지에서 클릭-스루이후의 사용자 행동을 추적하는 신기술에 관해 설명하고 있다.

연구자들은, 소정의 페이지에 다수의 사용자가 머물렀던 합계 시간이나, 사용자가 각 페이지의 열람에서 소비하는 평균 시간으로 계산한, 가장 긴 '체재시간' 을 보낸 웹페이지, 도메인내에서 검색된 단어를 보유하는 비율이 높은 페이지에 대한 열람 시간 등의 요소를 응용, 새로운 기술을 개발했다. 검색 이용자에 의해 클릭된 검색어, 도메인명, 페이지 타이틀, 요점 등에 공통되는 단어의 비율에 연구자들은 주목했다고 한다.

"웹 검색 환경은 원래 잡음이 많지만, '군중의 지혜'를 활용하면, 사용자의 커뮤니케이션 동향을 정확히 파악할 수 있다. 우리의 이 방법은 지금까지 사용한 어떤 방법보다도 정밀도가 높고,웹 검색 결과에 있어서도 선택의 타당성을 자동적으로 예측할 수 있는 것이다"라고, MS의 연구 그룹은 논문에 기록하고 있다.

같은 연구자 그룹이 발표한 또 하나의 논문에서는, 검색 알고리즘의 개량에서 이러한 사용자의 정보를 이용하는 방법에 관해 논했다. 이 연구자 그룹은 3,000건에 달하는 검색 데이터와 1,200만건의 사용자 상호작용 정보를 분석한 결과를 이용, 이 그룹이 개발한 방법이 웹 검색순위 알고리즘을 31%향상시키는 것을 나타냈다.@
Copyright ⓒ 2004 CNET Networks, Inc. All rights reserved. ZDNet is a registered service mark of CNET Networks, Inc. ZDNet Logo is service mark of CNET Networks,