NLPExplorer

Rethinking Reward Model Evaluation Through the Lens of Reward Overoptimization

Sunghwan Kim | Dongjin Kang | Taeyoon Kwon | Hyungjoo Chae | Dongha Lee | Jinyoung Yeo |

Paper Details:

Month: July
Year: 2025
Location: Vienna, Austria
Venue: ACL |

Citations

URL

No Citations Yet

Field Of Study