AI文摘

blog-thum
「用AI训AI」这事靠谱吗?

专题解读事件:来自Meta、纽约大学的研究者近期发表论文,提出用「自我奖励方法」,让大模型自己生成自己的微调数据。研究者对Llama270B进行了三个迭代的微调,生成的模型在AlpacaE

read more