2026 4 月 18__珍惜时间ing🚀🚀🚀

You are more than what you have become now！

You are more than what you have become now！

Rudy

项目部署模型微调：SFT + LoRA 实战记录

前言 SFT: 监督学习，解决的是对不对的问题。 RLHF: 强化学习，解决的是能不能安全做对的问题。 DPO…

2026/4/18

4

🔥今日总访问量 0 次 | ❤️今日总访客数 0 人 | ✨本站总访问量 0 次 | ❤️‍🔥本站总访客数 0 人

皖ICP备2024064971号-2

Copyright © 珍惜时间ing🚀🚀🚀 Powered WordPress Theme Qzdy