[현장에서] 노범석 서치퍼트 “내년 200개 이상 사이트·700만 개 문서 데이터 구축 목표”
스크롤 이동 상태바
[현장에서] 노범석 서치퍼트 “내년 200개 이상 사이트·700만 개 문서 데이터 구축 목표”
  • 손정은 기자
  • 승인 2019.11.06 16:31
  • 댓글 0
이 기사를 공유합니다

2억 페이지 구축·매일 20만 페이지 문서 수집…향후 미국 공시 정보 구축 포부까지 밝혀

[시사오늘·시사ON·시사온 = 손정은 기자]

창업자들의 평균 연령이 150살인 스타트업 '서처퍼트'. 그간 사회생활을 통해 얻은 연륜을 증명하듯, '일이 쉬워진다'라는 슬로건 아래 국내 최초 문서검색 포털을 개발했다.

6일 문서검색 포털기업 서치퍼트는 서울 종로구에서 기자간담회를 열고 서비스 소개 및 비전 발표 자리를 가졌다.

6일 문서검색 포털기업 서치퍼트는 서울 종로구에서 기자간담회를 열고 서비스 소개 및 비전 발표 자리를 가졌다. ⓒ시사오늘
6일 문서검색 포털기업 서치퍼트는 서울 종로구에서 기자간담회를 열고 서비스 소개 및 비전 발표 자리를 가졌다. ⓒ시사오늘

노범석 서치퍼트 대표는 "스타트업 중에서 최고령 스타트업이라 생각한다. 3년 반 전에 서치퍼트를 시작했다"면서 "전문가를 위한 검색이 필요하다고 생각했고 한국에서 구글·네이버가 좋은 검색이지만, 엄청난 아쉬움이 있었다"고 입을 열었다.

이어 "원하는 것을 다 찾지 못했고 찾았어도 열고 찾고 보관하는 데 많은 시간이 들었다"며 "많은 기술이 바탕이 되는데 이 문제의 원인은 문서를 못 찾아 주는 것이다. 문서를 잘 찾으면 우리가 편하다고 생각해 시작했다"고 덧붙였다.

서치퍼트는 약 7개월간의 베타 서비스 기간을 거쳐 지난달 16일 정식 출시했다. 대법원, 감사원, 국세청 등 214곳의 공공기관 및 정부 부처 등을 대상으로 500만 건(약 1억 5000만 페이지)의 문서를 제공하고 있다.

이는 약 6테라바이트(Tera Byte)에 해당하는 규모로, 문서 데이터로는 국내 최대 규모를 자랑한다. 

노 대표는 "서치퍼트 검색 결과 입법 동향, 법무 동향, 중앙정부, 정책 동향 등에서 문서를 찾을 수 있다"며 "가령, 불화수소 검색어를 넣었을 때, 전자 공시는 11개만 나오는데 서치퍼트에서는 227개가 나온다. 또 환경부 처음 자료부터 오늘까지의 정보를 최신성을 가지면서 과거 정보도 다 가져온다. 사이트가 개편돼도 과거 데이터를 가져올 수 있는 장점이 있다"고 설명했다.

특히 서치퍼트 사이트는 기존 검색과 차이를 두기 위해 심혈을 기울였다는 후문이다. 기존 웹페이지는 검색 후, 해당 링크를 찾는 방식으로 발달됐지만, 서치퍼트는 문서에 해당 페이지를 찾아 하이라이트까지 해주기 때문이다.

20개 고객사 중 하나인 효성캐피탈은 서치퍼트를 쓰기 전에 오전 내내 원하는 정보를 찾았지만, 서치퍼트 사용 후, 10분 만에 일을 끝냈다고 긍정적인 반응을 보였다고 노 대표는 밝혔다.

현재(11월 기준)는 200개 이상의 사이트, 500만 개의 문서, 1.6억 페이지가 보유 중이며, 매일 10만 페이지의 문서가 수집되고 있으나, 오는 2020년 2월 400개 이상 사이트, 700만 개 문서,  2억 페이지를 구축하며, 매일 20만 페이지의 문서를 수집한다는 포부다.

6일 문서검색 포털기업 서치퍼트는 서울 종로구에서 기자간담회를 열고 서비스 소개 및 비전 발표 자리를 가졌다. ⓒ시사오늘
6일 문서검색 포털기업 서치퍼트는 서울 종로구에서 기자간담회를 열고 서비스 소개 및 비전 발표 자리를 가졌다. ⓒ시사오늘

이날 설명을 맡은 박준 서치퍼트 연구소장은 "주요 데이터 세트 목록은 16대 이후 국회 발행된 모든 문서인 입법 정보, 중앙정부, 2009년 이후 기업공시 등의 데이터를 가지고 있다"며 "미국 증권거래위원회의 공시를 내년도에 제공할 예정"이라고 말했다.

마지막으로 노범석 대표는 "우리 시스템 구축은 오픈으로 돼 있다. 어떤 기업에 돈을 주고 사 오지 않았고 오픈 소스로 구축을 했다"며 "오픈 데이터를 오픈하려고 한다. 사회에 기여하고 싶다"고 강조했다.

그러면서 "서치퍼트는 신뢰 되고 잘 정리된 데이터만 가지고 있다"면서 "와이드워치, 서치 다큐 등을 통해 최종적으로 절판 도서와 잡지 등을 스트리밍 방식으로 검색하는 딥페이퍼 서비스를 제공할 예정"이라고 마무리 지었다.

담당업무 : 백화점, 편의점, 홈쇼핑, 제약 등을 담당합니다.
좌우명 : 매순간 최선을.


댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글 0
댓글쓰기
계정을 선택하시면 로그인·계정인증을 통해
댓글을 남기실 수 있습니다.