MIT와 MIT-IBM Watson AI Lab의 연구진이 “Thermometer”라는 AI 모델 교정 방법을 발표했습니다. 이 기술은 대형 언어 모델(LLM)의 신뢰도를 개선하기 위해 고안된 것으로, 특히 모델이 틀린 예측에 대해 과도하게 자신감을 가지거나, 반대로 정확한 예측에 대해 자신감이 부족할 때 이를 교정하는 데 도움을 줍니다.
기존의 모델 교정 방법은 주로 단일 작업에 맞춰져 있어, 여러 작업을 수행할 수 있는 LLM에 적용하기에는 비효율적입니다. Thermometer는 이러한 문제를 해결하기 위해 고안되었으며, 보조 모델을 활용하여 LLM이 다양한 작업에서 적절한 신뢰도 수준을 유지할 수 있도록 합니다. 이 보조 모델은 온도 스케일링이라는 고전적인 교정 방법을 활용해, LLM의 예측 신뢰도를 조정합니다.
온도 스케일링(Temperature Scaling)이란?
온도 스케일링(Temperature Scaling)은 머신러닝 모델의 출력 확률을 교정하는 방법 중 하나로, 특히 모델의 예측 확률이 실제 확률과 일치하도록 조정하는 데 사용됩니다. 이 방법은 모델이 예측하는 확률 값에 일정한 온도 매개변수(T)를 적용하여, 모델이 과도하게 자신감을 가지거나 과소평가하는 문제를 완화시킵니다.
온도 스케일링의 기본 원리는, 모델이 예측한 로짓(logit) 값을 온도 매개변수로 나눈 다음 소프트맥스(softmax) 함수를 적용해 확률을 다시 계산하는 것입니다. 온도 매개변수 T는 모델의 신뢰도를 조정하는 역할을 하며, T 값이 1보다 클 경우 모델의 확률 출력이 더 분산되고(T 값이 작아질수록 모델의 확률 출력이 더 확신에 찬 것처럼 보이게 됩니다). 이 방법을 통해 모델의 확률 예측이 실제 데이터와 더 잘 맞아떨어지게 할 수 있습니다.
온도 스케일링은 간단하지만 효과적인 방법으로, 모델의 예측 확률이 정확하지 않을 때 이를 교정하여 더 신뢰할 수 있는 결과를 얻을 수 있도록 도와줍니다. 이 방법은 특히 신경망과 같은 복잡한 모델에서 자주 사용됩니다.
정리하자면
LLM은 종종 새로운 작업에 적용되므로 레이블이 지정된 데이터 세트를 얻는 것이 거의 불가능할 수 있습니다. 예를 들어, 새로운 제품에 대한 고객 질문에 답하기 위해 LLM을 배포하려는 사용자는 그러한 질문과 답변이 포함된 데이터 세트가 없을 가능성이 큽니다.
그래서 레이블이 지정된 데이터 세트를 사용하는 대신 연구자들은 LLM 위에서 실행되는 보조 모델을 학습시켜 이 새로운 작업에 대해 교정하는 데 필요한 온도를 자동으로 예측할 수 있는 것입니다.
그리고 일단 학습이 완료되면 추가 레이블이 지정된 데이터가 필요 없이 유사한 범주의 새로운 작업으로 일반화 할 수 있다는 것이 Thermometer의 장점입니다.
<이하 광고>