“처음에는 화학공학에서 데이터 사이언스가 어떻게 쓰이는지 궁금해 공부를 시작했어요. 그런데 점점 재미가 생기더라고요. 나만의 무기가 될 수 있을 거라 생각해서 공부해왔는데, 대회에도 한 번 도전해보자 생각하게 됐죠”
고영진 에너지화학공학과 학생은 지난 8월 열린 ‘2021년 해양수산 빅데이터 경진대회’에서 대상(해양수산부 장관상)을 받았다. 해양 빅데이터를 활용해 창의적인 비즈니스 모델을 발굴하거나, 새로운 부가가치 창출 모델을 개발하는 대회에서 가장 우수한 아이디어를 제시했다는 평가를 받은 것이다.
해양 분야나 빅데이터 분야 전공자가 아닌 고영진 학생은 어떻게 이 대회 최고상을 받게 된 것일까? 이유는 군 복학 이후 관심을 갖게 된 데이터 사이언스 공부에 있었다.
고영진 학생은 “처음에는 스스로의 경쟁력을 높이기 위한 시도였지만, 점차 흥미가 커져서 진로를 틀어야겠다는 생각도 하게 됐다”며 “인공지능대학원 김지수 교수님 연구실에서 인턴을 하면서 진지하게 공부를 계속해나갈 계획도 하고 있다”고 설명했다.
지난 8월 열린 대회에서는 참가자들이 임의로 섞여 팀을 이뤘다. 처음 만나는 학생들과 비대면으로 팀을 구성하고 프로젝트를 수행하는 것은 쉽지만은 않았다. 고영진 학생은 국민대학교 권유진, 인하대학교 동아름, 공주대학교 정재은 학생과 함께 NEXT팀을 구성했다. 고영진 학생은 4명의 학생 중 팀장을 맡았다.
그는 “밤을 꼬박 새우며 회의를 하는 등 팀원들의 적극적인 참여가 있어서 좋은 아이디어를 도출할 수 있었다”며 “전공자와 비전공자가 섞여서 자유롭게 아이디어를 내고, 이를 실현해보는 과정을 겪으면서 여러 가지를 배울 수 있었던 시간이었다”고 말했다.
NEXT팀은 해양사고의 판결문이라고 불리는 ‘재결서’를 활용해 해양사고의 원인을 분석하고, 이를 기반으로 해양사고 위험성을 예측할 수 있는 모델을 개발했다. 첫 단계는 재결서 텍스트 마이닝이었다. 복합적인 해양사고의 원인을 추출한 후에는, 요인분석을 통해 사고 원인을 유기적인 변수로서 재구성했다. 최종적으로 구성된 데이터셋을 인공지능 모델에 학습시켰고, 이를 활용해 현재 선박의 위치와 기상에 따른 사고 원인을 분석해낼 수 있었다.
고영진 학생은 “기존 사고의 데이터를 통해 현재 선박이 처한 상황에서 위협이 될 수 있는 요소들을 미리 알려주는 시스템을 구축한 것”이라며 “양질의 데이터를 활용한다면 해양사고의 발생률을 감소시킬 수 있을 것으로 기대한다”고 말했다.
그는 “진로 변경을 결정한 후 9개월 정도 지났는데, 그동안의 노력을 보상받은 것 같아 기쁘다”며 “이번 대회를 통해 도메인 지식의 중요성, 문제해결을 위한 협력의 필요성 등 여러 가지를 배운 만큼 앞으로 더 큰 성장을 통해 데이터로 세상의 다양한 문제를 해결하는 데이터 사이언티스트가 될 수 있도록 노력하겠다”고 소감을 밝혔다.