시시각각 달라지는 주식시세나 집값, 환율 등의 흐름을 분석해 자동으로 보고서를 작성하는 인공지능(AI)이 개발됐다.
최재식 전기전자컴퓨터공학부 교수팀은 시간에 따라 변하는 다양한 변수들에서 공통적인 변화를 자동으로 뽑아내 보고하는 ‘관계형 자동 통계학자 시스템’을 개발했다. 시간이 지남에 따라 변하는 다양한 변수의 기록을 ‘다중 시계열 데이터’라고 하는데, 관계형 자동통계학자 시스템은 이들끼리의 관계를 분석해 공통적으로 변하는 요인을 추출해낼 수 있다.
최재식 교수는 “주식이나 환율 등 시계열 데이터의 분석은 복합적인 요소가 관여하기 때문에 어떤 요소가 영향을 주는지 정확히 찾아내기는 어렵다”며 “새로 개발한 시스템은 기존 인공지능 데이터 분석법에 다중 시계열 데이터의 변화까지 고려한 방식으로 설계해 정확도를 높였다”고 설명했다.
일반적으로 시간에 따라 달라지는 여러 데이터를 기반으로 변화를 예측하는 ‘확률 관계형 모델’은 전체적인 흐름이나 추이를 빠르고 견실하게 예측하는 데 적합하다. 하지만 예측 정확도는 하나의 요소만 놓고 분석하는 것에 비해 낮았다.
이에 최 교수팀은 시시각각 변하는 데이터 하나를 효율적으로 파악할 수 있는 함수를 통해 먼저 학습시켰다. 그런 다음 시간에 따라 변하는 데이터 무리에서 학습된 관계형 모델과 혼합했다. 이를 통해 정확도를 높이면서 전체적인 추이를 예측할 최적의 조합을 찾을 수 있는 ‘준-관계형 커널 학습 알고리즘’을 개발한 것이다.
이 알고리즘이 적용된 관계형 자동통계 학자 시스템은 다중 시계열 데이터의 공통적인 변화는 물론 개별적인 변화를 찾아냈다. 이를 기반으로 시간에 따라 변하는 각각의 데이터의 미래 변화까지 정확하게 예측할 수 있었다. 실제로 미국의 9·11 공격 이후 미국 상위 주식이 공통적인 하락 후 상승을 보인 특징을 찾고 이를 기반으로 변화를 예측한 결과를 보였다.
특히 원자력 발전소에서 특정 부품에 이상 징후가 발견되는 경우, 고장인지 아닌지 판별하는 게 매우 중요하다. 이번 연구에서 개발한 관계형 자동 통계학자 시스템은 원자력 발전소를 포함한 발전소 센서의 이상 유무를 판단할 수 있다. 또 앞으로 일어날 일을 예측함으로써 발전소 시설의 진단 정확도를 높일 수 있다.
최 교수는 “이 연구는 데이터 무리에서 추출한 특징 정보와 개별 데이터에서 얻은 정보를 혼합해 시계열 데이터의 자동 분석 정확도를 향상시킨 것”이라며 “시간에 따라 변화는 데이터를 분석하는 것이 중요한 주식, 환율 등 금융산업은 물론 원자력 발전소나 중공업, 군사 산업 등 다양한 산업에 적용할 수 있을 것”이라고 기대했다.
이 연구성과는 6월 22일 개최된 국제 기계학습 학술대회(International Conference on Machine Learning)에서 발표됐다. 연구지원은 미래창조과학부와 한국연구재단의 기초연구사업(개인연구)와 원자력연구개발사업을 통해 이뤄졌다.