보도자료

2022. 08. 09. (화)부터 보도해 주시기 바랍니다.

딥러닝(Deep Learning), 고분자 시뮬레이션 속도 높인다

UNIST 김재업 교수팀, 4배 빨라진 고분자 시뮬레이션 기술 개발
통계물리에 AI 더해 속도, 정확도↑… Macromolecules 9일자 출판

옷감이나 플라스틱 등 우리 일상에는 ‘고분자(polymer)’로 만든 재료가 많다. 특히 현대의 나노기술은 고분자의 자기조립 성질을 이용하는 경우가 흔하다. 어떤 고분자를 재료로 쓸지 결정하는 목적으로 시뮬레이션을 활용하는데, 연결된 사슬구조를 가진 고분자의 특성상 복잡한 함수를 써서 오랜 시간 계산해야 했다. 그런데 최근 AI 기술을 써서 고분자 시뮬레이션을 빠르게 수행하는 방법이 나왔다.

UNIST(총장 이용훈) 물리학과 김재업 교수팀은 일주일 정도 소요되던 계산을 하루 안에 끝낼 수 있는 ‘AI 고분자 시뮬레이션 기술’을 개발했다. 이 기술은 오픈소스 프로그램으로 공개돼 고분자 시뮬레이션 발전에 이바지할 전망이다.

고분자계의 통계물리학적 특성을 정밀하게 계산할 수 있는 차세대 이론 도구로 ‘랑주뱅 장이론 시뮬레이션(Langevin Field Theoretic Simulation, L-FTS)이 개발돼 주목받고 있다. 그러나 계산량이 너무 많아 고성능 GPU(그래픽 처리장치)를 사용해도 시뮬레이션 한 번에 며칠씩 걸렸다. 김재업 교수팀은 이런 단점을 극복하기 위해 기계학습을 제안했다.

L-FTS를 수행하려면 고분자의 비압축성(힘을 받아도 부피가 줄어들지 않는 성질)이 성립하는 지점*을 찾는 작업을 수십만 번 이상 수행해야 한다. 기존에 쓰이던 반복법은 대략 예측한 값에서 실제 결과까지 거리를 계산해 예측치를 수정하는 과정을 반복해 이 지점을 찾아냈는데, 한 번 찾을 때마다 예측 작업을 50회 정도 반복해야 했다.

^*안장점(鞍裝點; saddle point): 다변수 실함수의 변역에서, 어느 방향에서 보면 극대값이지만 다른 방향에서 보면 극소값이 되는 점이다. 수학에서 안장점이란 정류점이지만 극값을 가지지 않는 점을 말한다. 이차원의 시각에서 어느 방향에서 보면 아래로 굽어있지만 다른 방향에서 보면 위로 굽어있는 전형적인 모양이 고개 모양 혹은 말 안장과 닮았다고 해서 붙여진 이름이다.

김재업 교수팀은 AI 기술로 잘 알려진 딥러닝(Deep Learning)을 이용해 반복법의 단점을 해결했다. 인공신경망에 많은 데이터를 주고 훈련을 진행해 예측치를 더 정확하게 도출하게 만든 것이다. 이 기술을 쓰면 50회씩 반복하던 예측을 2~4회로 줄일 수 있어 기존보다 6배 이상 빠르게 시뮬레이션을 수행할 수 있다. 인공신경망 훈련을 위한 데이터 준비와 훈련에 드는 시간을 포함해도 기존 대비 최소 4배 이상 속도가 향상됐다.

제1저자인 용대성 KIAS 연구원(UNIST 물리학과 박사 졸업)은 “지금까지는 작은 고분자계에서 매우 제한적으로 수행됐던 ‘장이론 시뮬레이션’을 대면적 박막이나 복잡한 형상이 예상되는 고분자에도 사용할 길이 열렸다”고 연구의 의미를 짚었다.

이번 연구는 특히 ‘기계학습 기반의 시뮬레이션 방법의 한계로 지적됐던 낮은 정확도를 극복한 기술’이라는 점에서 주목받는다. 최근 수치적 계산과 시뮬레이션을 빠르게 수행하기 위해 AI 분야의 기계학습을 이용한 해법이 많이 제안됐지만 대부분 정확도가 낮고 AI 훈련에 많은 시간이 요구됐다. 그런데 이번 연구는 이런 단점까지 극복한 것이다.

김재업 교수는 “이번 기술은 심층인공신경망이 예측한 답을 그대로 사용하는 게 아니라, 예측치와 정답의 차이를 다시 계산해 새로운 입력값을 부여해 더 정밀한 예측이 가능하다”며 “이 덕분에 몇 번의 예측으로 원하는 수치적 정밀도를 얻을 수 있다”고 설명했다. 김 교수는 이어 “기존의 편미분 방정식이나 밀도 범함수 이론(DFT)의 해를 얻는 문제 등의 다양한 문제에 이 기술을 적용해볼 수 있어 여러 분야로 응용될 것”이라고 전망했다.

이번 연구는 과학기술정보통신부와 한국연구재단의 중견연구자지원사업과 기초연구실사업(BRL), 세종과학펠로우십의 지원으로 수행됐다. 연구 성과는 고분자 연구 권위지인 ‘매크로몰레큘스(Macromolecules)’에 8월 9일자로 출판됐다.

(논문명: Accelerating Langevin Field-Theoretic Simulation of Polymers with Deep Learning)

자료문의

대외협력팀: 김학찬 실장, 박태진 담당 (052)217-1231

물리학과: 김재업 교수 (052)217-2318

[붙임] 연구결과 개요

1. 연구배경

고분자 장이론의 계산기법인 ‘자기일관 장이론(Self-Consistent Field Theory, SCFT)’1)은 블록 공중합체2)의 통계물리학적 특성을 연구하기 위한 표준적인 도구로써 지난 30년간 사용됐다. SCFT는 지금까지 많은 실험 결과를 예측하거나 설명하는 데 성공적이었지만 고분자 세계에서 실제로 나타나는 요동효과를 반영하지 못했다. 최근 요동효과를 반영할 수 있는 ‘랑주뱅 장이론 시뮬레이션(Langevin Field Theoretic Simulation, L-FTS)’3)이 제시돼 발전하고 있다. 하지만 하나의 시뮬레이션을 수행하는 데 수일 이상의 시간이 소요되는 단점이 있다. 그래서 L-FTS 시뮬레이션을 더 빠르게 수행하는 방법을 찾는 게 고분자 이론 분야의 중요한 과제로 여겨지고 있다.

2. 연구내용

L-FTS를 수행하기 위해서는 고분자의 장(field)이 랑주뱅 방정식에 따라 변화할 때마다 비압축성을 만족하는 안장점(鞍裝點; saddle point)을 찾아야 한다. 그런데 이 안장점은 닫힌 형태의 방정식으로 표현되지 않아서 반복법(iteration)4)을 사용하는 게 불가피하다. 안장점을 곧바로 계산할 수 없으니 적당한 초기 예측에서 출발해 안장점까지 거리를 계산하고, 그 결과를 바탕으로 예측을 수정하며 점진적으로 정답에 가까워지는 것이다. 지금까지 연구자들은 여러 알고리즘을 도입해 안장점까지 예측을 반복하는 횟수를 줄이려 시도했다. 그러나 현재 수준으로는 수십 번의 반복을 거쳐야만 답을 찾을 수 있었다.

이번 연구에서는 기계학습의 일종인 ‘딥러닝(Deep Learning)’을 이용해 반복 횟수를 크게 줄였다. 딥러닝에 사용되는 인공신경망의 함수 근사능력을 이용해 닫힌 형태의 함수를 직접적으로 근사하는 방법으로 안장점에 아주 가깝게 접근하는 게 가능하다는 것을 밝혔다. 이를 이용하면 2~4회 예측만으로 안장점을 찾아낼 수 있고, 안장점에 도착했다는 것도 쉽게 확인된다. 이번에 제시한 방법은 기존의 기계학습 해법들과 다르게 임의의 정확도로 답을 찾는 게 가능하다. 또 인공신경망 훈련을 위한 데이터 준비 시간과 훈련 시간을 모두 포함해도 기존에 사용되던 앤더슨 혼합법보다 최소 4배 이상 빠르게 안장점을 찾을 수 있다.

3. 기대효과

이번에 제시한 방법은 계산 시간이 오래 걸리는 FTS의 단점을 해결했다. 따라서 L-FTS가 전자구조 계산의 표준적인 도구인 ‘밀도 범함수 이론(Density Functional Theory, DFT)’처럼 고분자 계산의 표준적 위치까지 올라서는 것도 기대할 수 있다.

지금까지 기계학습을 이용한 물리학 시뮬레이션 연구들은 데이터 준비와 인공신경망 훈련까지 고려하면 기존 방법보다 시간이 오래 걸리는 경우가 많았다. 경우에 따라서는 더 빠르게 시뮬레이션을 할 수 있더라도 그 결과의 정확도에 대한 신뢰가 부족해 실험적인 단계에 머무르고 있기도 했다. 이번 연구에서는 기존 방법을 완전히 대체하는 물리학 시뮬레이션이 가능한 실용적인 기계학습 사례를 제시했다. 이 방법은 다른 물리학 분야의 기계학습 해법에도 응용될 수 있다.

[붙임] 용어설명

1. 자기일관 장이론(self-consistent field theory, SCFT)

고분자 장이론에서 안장점 근사를 이용해 가장 확률이 높은 해를 구하는 계산법. 빠르게 답을 구할 수 있지만 요동효과를 포함하지 않는 평균장 이론인 만큼 부정확한 답을 준다.

2. 블록 공중합체(Block Copolymer)

두 종류 이상의 단위체(monomer)를 중합시켜 만든 고분자를 공중합체라고 하는데, 이 중에서 한 종류의 단위체로 이루어진 여러 블록이 연결된 형태를 블록 공중합체라고 한다. 예를 들어 AB 블록 공중합체는 아래와 같은 형태로 단위체가 연결된 고분자를 말한다.

A-A-A-A-A-B-B-B-B-B

3. 랑주뱅 장이론 시뮬레이션(Langevin field-theoretic simulation, L-FTS)

고분자 장이론에서 계산하는 범함수 적분을 랑주뱅 방정식을 통해서 샘플링하는 시뮬레이션 방법이다. 충분히 많은(수십만 이상) 점들에서의 데이터를 모아 물리량을 계산하는 방법으로 요동효과를 포함하는 정밀한 시뮬레이션을 수행할 수 있다.

4. 반복법(iteration)

정답을 곧바로 알 수 없는 문제의 정답을 찾기 위해 적당한 초기 예측에서 출발하여 정답과의 거리를 계산해 본다. 그 결과를 바탕으로 예측을 수정해 가면서 정답에 점점 접근해 가는 방법이다.

[붙임] 그림 설명

그림1. L-FTS에 딥러닝을 도입해 예측한 결과와 기존 예측 결과 비교

(위) 실제로 예측하고자 하는 고분자 장(왼쪽)을 본 연구에서 제안한 딥러닝 방법으로 예측한 결과(가운데)는 기존의 앤더슨 혼합법을 1회 사용해 예측한 결과(오른쪽)보다 훨씬 더 정밀하다. (아래) 기존 방법과 시뮬레이션 수행 시간 비교. 시뮬레이션 시간만을 비교하면 기존보다 6배 이상 빠르게 시뮬레이션을 할 수 있고, 훈련 데이터 준비와 훈련 시간, 시뮬레이션 시간을 모두 포함해도 기존보다 4배 이상 빠르다.

UNIST 홍보팀 news@unist.ac.kr

TEL : 052)217-1230FAX : 052)217-1229