netTop

빅데이터 분석 솔루션 


비정형 빅데이터 추출 플랫폼

넷톺 솔루션은 비정형 빅데이터를 효율적으로 저장하고, 빅데이터에서 필요한 데이터를 검색 및 추출하는 솔루션으로서 디지털 포렌식분야, 컴플라이언스분야 분야에서 다양하게 사용될 수 있습니다.

증거 분석 및 문서 추출의 활용 분야

  • 개인과 기업에서 생성하는 모든 데이터의 80% 이상이표준 관계형 데이터베이스에 기록되지 않으며 
  • 대신 구조화되지 않은 문서, 소셜미디어 게시물, 시스템로그, 이미지 및 기타 소스에 기록되기 때문에 
  • 많은 기업들이 이러한 비정형 데이터의 막대한 볼륨을 관리하는데 어려움을 겪고 있습니다. 

10TB가 담고 있는 정보의 양을 종이에 뽑아 쌓아놓으면, 30km 높이에 달한다고 합니다.

디지털 포렌식

문서들의 형태 및 양이 다양하고 방대해 
데이터처리 과정이 매우 중요하기 때문에
제한된 시간 내에 문서를 수집, 분류, 처리
해 증거의 가능성이 높은 문서들을 추출 

컴플라이언스 (내부통제)

내부위협, 직원의 위법 행위 및 규정 준수
위반을 신속하게 식별하고 조사 할 수 있도
록 디지털 포렌식으로 증거를 수집, 분석
및 생성 업무를 지원

이디스커버리 (LegalTech)

법정소송에서 사실 확인 및 증거수집 절차
로 증거개시제도 적용 시 전자문서의 경우
변형 시도를 차단하고 디지털 증거의 원본
성, 무결성을 확보하여 증거 입증을 지원


색인 및 검색 주요 기능

수집된 자료에 대하여 고속 색인과정을 거쳐 색인어 및 색인정보가 포함된  색인볼륨(파일형태)을 생성하고, 검색이 가능 한 형태로 사용자 조건에 맞추어 다양한 검색기능을 제공합니다. 

고속색인(Indexing) 과정 

색인이란 검색을 빠르게 하기 위해 
  • 원문으로부터 색인어를 추출 
  • 색인어가 어떤 문서의 어느 부분에 있는지를 구조적으로 저장하는 과정  
넷톱 솔루션
원본 자료(파일)로부터 텍스트를 추출하고 형태소 분석을 통한 색인어 추출 및 색인 정보를 저장하는 과정을 수행 
  • 원본 파일에서 추출 정보 → “파일의 이름”, “파일의 메타 데이터 정보”, “파일 본문 내용” 
  • 파일에서 텍스트를 추출할 수 없는 정보는 파일 이름만 검색이 가능 
→ 그림파일(*.png, *.jpg 등), 시스템 파일(*.dll, *.sys 등), 실행 파일(*.exe, *.com 등) 

•− Connector−• − 문서필터−• −형태소 분석기− −• 

조사자료

텍스트 추출

조사자료

     

텍스트 추출    

색인어 추출

색인 저장

색인어 추출

색인 저장

고속검색 이용

고속검색 이용



통합검색

통합 검색 화면은 색인어를 입력하여 검색하거나 조사 대상 자료의 파일 유형(HWP, EXCEL 등), 대상 폴더를 선택하는 등 의 다양한 형태로 자료를 검색할 수 있습니다. 화면은 검색 조건과 정렬 조건등을 지정하는 영역, 검색 결과의 폴더 트 리가 표시되는 영역, 검색 결과가 표시되는 영역 및 ④검색키워드 및 관심파일 등 부가기능 영역으로 표시됩니다. 


이메일 검색

이메일 파일 유형은 이메일 검색 화면을 통해 이메일의 내용, 첨부파일등을 확인할 수 있습니다. 이메일 검색 화면은 조사 대상 자료중 이메일에 특화된 검색을 제공하고, 전체 화면 구성은 통합검색과 유사하며 검색 결 과 폴더 트리 대신 검색 결과의 수신자, 발신자 목록이 표시되는 것이 조금 다른 부분입니다. 



원본 자료 수집/저장 기능 (1)

컴퓨터 사용내역 미리보기

해당컴퓨터에 현재 존재 하는 파일의 종류와 USB 사용내역 인터넷 사용내역 등을 한눈에 볼 수 있도록 화면을 제공합니다.



원본 자료 수집/저장 기능 (2)

파일단위 자료 확보

드라이브 정보에서 선택한 드라이브를 기준으로 오른쪽 파일 확장 필터에 등록된 파일들을 사용자가 지정한 곳으로 복사 합니다. 



원본 자료 수집/저장 기능 (3)

물리적 드라이브 이미징 자료 확보

드라이브 정보에서 선택한 드라이브를 기준으로 오른쪽 이미징 정보를 토대로 사용자가 선택한 위치에 이미징 파일을 생 성합니다. 



기술의 차별성

비정형 빅데이터 추출 솔루션의 차별성은 데이터 처리의 속도 및 용량에서 국내 최고의 성능을 갖추고 있고 한글검색 정확도가 97%이며, 휴대형 서버장비를 활용한 방문서비스 및 당사의 전자파일 금고를 활용한 보안성을 갖추고 있습니다. 

데이터 처리속도

  • 1TB 당40분(텍스트파일)90 분(텍스트및압출파일,  메일함 등 포함시) 속도로 처리.
  • 국내 최고의 속도로 문서 필터링 및 색인(Indexing) 시간을 단축 하여 시간과 비용을 절감. 

보안성

  • 휴대형 서버 장비를 활용하여 파일 보안이 필요시 방문을 통한분석 서비스가 가능. 
  • 분석 완료시 모든 디스크는 파기

데이터 처리 용량

  • 장비당 최대 분석 용량40TB 
  • 이는 최대 200명 급의 PC 용량으로 국내 최대 용량. 

한글 지원

  • 국산 최초 솔루션으로 모든 한글 지원이 가능하고 한글 검색 정확도97% 이상.
  • 훈민정음, 한글, 국내메신저 및 SNS의 분석이 가능. 

기술의 차별성


비정형 빅데이터 추출 솔루션의 차별성은 데이터 처리의 속도 및 용량에서 국내 최고의 성능을 갖추고 있고 한글검색 정확도가 97%이며, 휴대형 서버장비를 활용한 방문서비스 및 당사의 전자파일 금고를 활용한 보안성을 갖추고 있습니다.

데이터 처리속도

데이터 처리용량

1TB 당40분(텍스트파일), 90 분(텍스트및압출파일,  메일함 등 포함시) 속도로 처리.

▪ 국내 최고의 속도로 문서 필터링 및 색인(Indexing) 시간을 단축 하여 시간과 비용을 절감. 

▪장비당 최대 분석 용량이 40TB 



▪ 이는 최대 200명 급의 PC 용량으로 국내 최대 용량. 



보안성

휴대형 서버 장비를 활요하여 파일 보안이 필요시 방문을 통한 분석 서비스가 가능


▪분석 완료시 모든 디스크는 파기

한글 지원

▪국산 최초 솔루션으로 모든 한글 지원이 가능하고 한글 검색 정확도가 97% 이상.

▪훈민정음, 한글, 국내 메신저 및 SNS의 분석이 가능.