instructGPT
-
ChatGPT技术原理解析:从RL之PPO算法、RLHF到GPT4、instructGPT
写在最前面,为了彻底写清楚ChatGPT背后的所有关键细节,从1月初写到5月底仍未完工,除了本文之外,过程中涉及到多篇文章(RL入门、论文解读、微调实战、代码实现、CV多模态),再…
-
Instruction Tuning(FLAN、instructGPT、chatGPT)
首页最近被chatGPT刷屏,但翔二博主左看右看发现很多想法似乎都是一脉相通的,于是连夜从存档中找了一些文章尝试理一理它的理论路线。 具身智能综述和应用(Embodied AI) …