AI文摘

blog-thum
百川2模型解读、服务部署、微调(上篇)

引言简介预训练数据模型结构对齐监督微调奖励模型PPO安全预训练阶段对齐阶段总结引言今天开始以2篇小作文(整成一篇的话,略长)详细介绍百川2模型,上篇主要介绍百川2的技术细节,包括如何做预训练、如何做对

read more
blog-thum
百川2模型解读、服务部署、微调(下篇)

引言本地部署单轮对话多轮对话网页部署13B-base13B-chat量化部署模型微调引言紧接前文百川2模型解读、服务部署、微调(上篇),今天这篇小作文作为下篇侧重于实战,介绍如何本地部署百川2模型、模

read more
blog-thum
一文探秘LLM应用开发(23)-Prompt(相关工具)

本文旨在让无大模型开发背景的工程师或者技术爱好者无痛理解大语言模型应用开发的理论和主流工具,因此会先从与LLM应用开发相关的基础概念谈起,并不刻意追求极致的严谨和完备,而是从直觉和本质入手,结合笔者调

read more
blog-thum
如何优雅地自动评测LLM模型质量

LLM距离去年GPT发布,火了也快有一年时间了,也有相当多的企业和高校参与到了LLM的研发当中,所以,对这些模型质量的评测也就成了一个重要的工作。大家也知道,我在今年5月制作过一个JioN

read more