'낙관적 편향(Optimistic Bias)' 태그의 글 목록

[강화학습 정복하기] 7강: DQN 성능 높이기-Dueling DQN 구조와 학습 안정화 팁

2025.12.22·

Reinforcement learning

이 글은 서강대 가상융합 전문대학원(구 메타버스 전문대학원) 강화학습 자료를 기반으로 작성되었습니다. DQN 성능 높이기-Dueling DQN 구조와 학습 안정화 팁강화학습(Reinforcement Learning)이라는 용어를 처음 접할 때, 대다수의 사람들은 기계가 스스로 판단하고 학습한다는 표현에서 막연한 기대를 품는다. 마치 어린아이가 걸음마를 배우듯, 기계가 경험을 쌓아가며 점점 더 인간처럼 똑똑한 존재로 성장하는 모습을 상상하게 되는 것이다. 그러나 실제 연구 현장에서 강화학습을 다루다 보면, 연구자가 가장 먼저 마주하는 감정은 경이로움이 아니라 깊은 의심이다. 지금 눈앞의 모델이 정말로 환경을 이해하고 학습하고 있는 것인지, 아니면 단지 운 좋게 맞아떨어진 결과를 반복하고 있는 것인지 구별하..

티스토리툴바