大模型导论
上QQ阅读APP看书,第一时间看更新

1.2.3 按微调方式划分

按微调方式不同,可以将大模型划分为未经过微调的Transformer大模型(如LLaMA)、经过指令微调的大模型(如WizardLM[53]、Dolly2.0、Chinese-LLaMA-Alpaca)和基于人类反馈的强化学习训练的大模型(如StableVicuna、ChatYuan-large-v2、OpenAssistant[54])等。