AI 발전과 함께 사용자 개인정보 침해 문제가 심각해지고 있는 가운데, 이를 해결할 연합학습 핵심기술이 등장했다. IT 기업들이 주목하는 기기 내(On-Device) AI 학습에 도움이 될 전망이다.
인공지능대학원 윤성환 교수팀은 개인정보를 보호하면서도 AI 성능을 높일 수 있는 FedGF(Federated Learning for Global Flatness) 기술을 개발했다. 사용자 데이터 유출 문제를 해결할 것으로 기대된다.
연구팀은 다양한 사용자 데이터 분포 상황에서도 일관되게 높은 성능을 내는 방법을 개발했다. 기존 기술은 사용자 데이터 분포와 유사한 환경에서만 우수한 성능을 보였지만, 다른 환경에서는 성능이 낮았다.
연합학습은 사용자 기기에서 딥러닝 모델을 학습해 개인정보를 보호하지만, 데이터 차이로 성능에 한계가 있다. FedGF는 데이터를 중앙 서버로 보내지 않고, 각 기기에서 학습된 모델을 통해 최적화된 모델을 만들어 높은 정확도를 보였다.
FedGF는 효율성도 뛰어났다. 기존 방법보다 적은 통신자원으로 완전한 학습이 가능하다. Wi-Fi와 같은 무선통신을 사용하는 모바일 장치들에 특히 유리하다.
윤성환 교수는 “연합학습 기술은 AI 개인정보 침해 문제 해결의 핵심적인 발판이 될 것이다”며, “IT 빅테크 기업들의 개인정보 문제와 분산 데이터 이질성 극복에 큰 도움이 될 것”이라고 밝혔다.
제1저자 이태환 연구원은 “FedGF 기술로 기업은 개인정보 침해 없이 높은 성능의 AI 모델을 얻을 수 있어, IT, 의료, 자율주행 등 다양한 분야에 주요 역할을 할 것”이라고 덧붙였다.
연구 결과는 세계적 국제학술대회 ICML(International Conference on Machine Learning)에 7월 20일 온라인 게재됐다. 연구는 과학기술정보통신부 지원 정보보호 국제공동연구 및 정보통신방송혁신인재양성사업을 통해 수행됐다.