Efficient Exploration in Combinatorial Contextual Bandits
Speaker
오민환 교수 (서울대학교 데이터사이언스대학원)
Date
2021. 9. 13
본 발표에서는 조합적 문맥 밴딧(Combinatorial Contextual Bandit) 문제를 중심으로, 연속적인 학습과 의사결정에서 효율성과 실용성을 높이기 위한 알고리즘을 제안합니다. 컨텐츠 추천 및 헬스케어 등 다양한 사례를 통해 실생활에서의 활용 가능성을 설명하며, 이론적으로 효율성을 보장하고 실험적으로 우수한 성능을 입증한 결과를 공유합니다. 이를 통해 사용자 경험과 실시간 데이터 기반의 최적 행동 선택 모델을 제시합니다.