文章目录 前言一、在线环境操作1. 获取dify项目(使用魔法)2.进入项目中docker目录3.镜像拉取4.查看镜像5.镜像打包6.镜像
文章目录 前言一、在线环境操作1. 获取dify项目(使用魔法)2.进入项目中docker目录3.镜像拉取4.查看镜像5.镜像打包6.镜像
DeepSeek v1版本 模型结构 DeepSeek LLM基本上遵循LLaMA的设计: 采⽤Pre-Norm结构,并使⽤RMSNorm函数. 利⽤SwiGLU作为Feed-F
什么是lora微调 LoRA 提出在预训练模型的参数矩阵上添加低秩分解矩阵来近似每层的参数更新,从而减少适配下游任务所需要训练