最新资讯

  • 最新资讯了解最新公司动态及行业资讯

2025-04-28111 阅读量

文章目录 前言一、在线环境操作1. 获取dify项目(使用魔法)2.进入项目中docker目录3.镜像拉取4.查看镜像5.镜像打包6.镜像

2025-04-2861 阅读量

DeepSeek v1版本 模型结构 DeepSeek LLM基本上遵循LLaMA的设计: 采⽤Pre-Norm结构,并使⽤RMSNorm函数. 利⽤SwiGLU作为Feed-F

2025-04-2676 阅读量

什么是lora微调 LoRA 提出在预训练模型的参数矩阵上添加低秩分解矩阵来近似每层的参数更新,从而减少适配下游任务所需要训练