인공지능 기술이 비약적으로 발전하면서 우리는 매일 새로운 모델을 마주하고 있습니다. 하지만 한 번 학습된 모델은 시간이 지나면 필연적으로 '유통기한'의 문제에 직면하게 됩니다. 스마트폰이나 전기차처럼 10~15년 전에는 존재하지 않았던 새로운 객체가 계속 등장하고, 과거에 학습한 정보가 더 이상 유효하지 않거나 심지어 개인정보 보호 등의 이유로 위험해질 수 있기 때문입니다.
일반적으로 모델을 최신 상태로 유지하거나 잘못된 정보를 수정하려면 막대한 컴퓨팅 자원과 시간을 들여 처음부터 다시 학습시켜야 합니다. 그러나 LLM의 시대에 이러한 반복적인 재학습은 경제적으로나 환경적으로 더 이상 지속 가능하지 않습니다. 때문에 모델이 새로운 지식을 습득하는 지속 학습과, 필요한 정보만 선택적으로 지우는 기계 망각이 어떻게 AI의 실용성과 안정성을 높이는가가 오늘 세미나의 핵심 내용입니다.
Towards Sustainable Machine Learning: Continual Learning and Machine Unlearning
1. OVS Meets Continual Learning : Towards Sustainable Open-Vocabualary Segmentation
자율주행 차량이 도로를 달리다 생전 처음 보는 형태의 고라니나 너구리를 마주쳤다고 가정해 보겠습니다. 이때 모델이 학습 데이터에 없던 객체라는 이유로 인식을 포기한다면 큰 사고로 이어질 수 있습니다. 이러한 문제를 해결하기 위해 등장한 것이 바로 개방형 어휘 분할(Open Vocabulary Segmentation, OVS) 기술입니다.

기존의 일반적인 세그멘테이션 모델은 정해진 클래스(사람, 자동차 등)만 인식할 수 있지만, OVS 모델은 자연어 입력을 통해 학습 데이터에 없던 새로운 객체도 찾아낼 수 있도록 설계되었습니다. 하지만 실제 성능은 기대에 미치지 못했습니다. 새로운 데이터를 반영하기 위해 모델을 처음부터 다시 학습시키는 재학습은 막대한 자원이 소모되며, 새 데이터만 학습시키는 미세 조정은 기존 지식을 잊어버리는 Catastrophic Forgetting 문제를 일으킵니다.
이를 해결하기 위해 새로운 데이터셋이 추가될 때마다 전체 모델을 건드리는 대신, 공유된 인코더 위에 해당 데이터셋에 특화된 디코더 부분만 해당 데이터셋 전문가를 하나씩 추가합니다. 또한 CLIP을 사용해서 이미지, 텍스트 임베딩을 생성한 후, MVN 파라미터를 계산합니다.
실험을 통해 성능을 확인할 수 있었으며 로보틱스 분야와의 결합 혹은 Detection 분야로의 확장이 기대되고 있습니다.
2. Improving Fisher Information Estimation and Efficiency for LoRA-based LLM Unlearning
LLM은 방대한 데이터를 학습하며 똑똑해졌지만, 그 과정에서 원치 않는 정보까지 기억해버리는 부작용을 낳았습니다. 누군가의 개인 전화번호나 저작권이 있는 텍스트 등 나와서는 안될 정보가 답변에 섞여 나오는 것이 대표적인 예입니다.

학습 데이터에서 민감한 정보를 삭제하고 모델을 처음부터 다시 만드는 재학습은 가장 확실한 방법이지만, LLM 시대에는 비현실적입니다. 수십억 개의 파라미터를 다시 학습시키는 데 드는 막대한 비용과 시간 때문입니다. 따라서 전체 모델을 건드리지 않고, 특정 지식만 골라내어 "나는 그 정보를 모릅니다"라고 적절히 답하게 만드는 기계 망각 기술이 필수적입니다.
기존의 방법론인 FILA 는 통계적 개념인 피셔 정보를 활용해 삭제할 지식과 연관된 파라미터를 식별합니다. 하지만 여기서 두 가지 치명적인 문제점을 발견했습니다.
- Fisher 수식의 오류 : Forget set은 전체 데이터 셋과 매우 달라 대변할 수 없는 편향된 정보이므로 가정에 오류가 발생합니다.
- LoRA와 FFT의 충돌 : Fisher 방법론은 LoRA를 통해 효율성을 높히고자 하지만, 계산 과정에서 전체 파라미터를 필요로 하게되어 적은 연산량이라는 LoRA의 장점이 퇴색됩니다.
이를 해결하기 위해 연구팀은 VILA 라는 새로운 방법론을 제안합니다. Fisher 수식에서 정의가 제대로 이루어지지 못했던 항을 개선하고 전체 파라미터가 아닌 LoRA adapter 내에서만 계산을 수행하여 LoRA의 장점을 살렸습니다.
3차 10Talks를 청강하며 느낀 점은 연구실의 논문 작성 과정에서 겪었던 어려움과 고민들을 직접 들을 수 있었기 때문에 논문 리뷰를 통해서는 알 수 없었던 점을 전달받을 수 있다는 것이었습니다. 이번 세미나는 연구실에서 작성된 논문을 중심으로 이루어졌지만, 꼭 이런 형태의 세미나만 있지는 않았습니다. 4차 10Talks는 최근 발표된 Olma 3에 대해서 알아보는 시간이었습니다.
매주 금요일에 유튜브를 통해 라이브를 진행하며 다시보기가 남지 않는 소중한 기회이니 연구와 파운데이션에 관심있으신 분들은 한 번 시청해보면 좋을 것 같습니다!
많은 요청에 따라 업스테이지 측에서 자료 아카이브를 공개하였습니다!
'대외 활동' 카테고리의 다른 글
| 서울과기대 연구실 | 연구에 대한 면담 간단 정리 (0) | 2026.02.13 |
|---|---|
| 빅데이터 연합동아리 BITAmin | 2026 홈커밍 파티 후기 (0) | 2026.02.06 |
| Upstage AI Ambassador | 병원에서 활용하는 AI 오픈 세미나 (0) | 2025.09.06 |
| 빅데이터 연합동아리 BITAmin | 14기 수료 후기 (0) | 2025.09.02 |
| 카카오테크 부트캠프 in 판교 2기 | 수료 후기 (0) | 2025.08.10 |
