Search Results for author: Yongcheng Zeng

Token-level Direct Preference Optimization

Fine-tuning pre-trained Large Language Models (LLMs) is essential to align them with human values and intentions.

Paper
Code

Cannot find the paper you are looking for? You can Submit a new open access paper.