본문 바로가기

미래학

[미래예측방법]텍스트 마이닝(TEXT MINING)



텍스트 마이닝(TEXT MINING)

 

l  텍스트 마이닝(Text Mining)은 주로 내부 대용량의 데이터나 텍스트 등의 문헌정보로부터 사용자가 관심을 가지는 정보를 찾아내는 프로세스를 의미한다. 텍스트 마이닝기법을 통해서 컴퓨터를 논리적 언어를 통해 이해 시킴으로써 대용량의 데이터를 분류하고 처리할 수 있다. , 텍스트 마이닝은 대용량의 데이터속에서 값어치있는 숨겨진 패턴을 발견하고 특정 주제와 연관된 데이터를 검색하는데도 사용되는 것이다.

 

l  텍스트마이닝은 주로 내부의 데이터베이스나 전문적인 문헌등에 대하여 자연어처리 (Natural Language Processing) 기술과 문서처리 기술을 적용하여 유용한 정보를 추출, 가공 하는것을 목적으로 하는 기법이다

 

l  기능적 특성

 

내부에서 구축된 DB와 신뢰성이 높은 전문가의 문헌정보로부터 핵심 키워드에 해당하는 정보추출이 가능함

 

l  제약요건

 

Mining하는 사람의 의도에 따라 해석이 달라질 수 있으며, 데이터 베이스 구축의 비용 및 노력부담이 큼

 

l  텍스트 마이닝 프로세스는 다음 3단계를 반복하는 것으로 미래연구를 포함한 다양한 문제해결에 필요한 유용한 정보들을 추출하여 적용한다. 목표설정, 정보추출, 피드백 및 개선