最新资讯-VPS345-香港VPS_香港云_美国VPS_美国云_服务器提供商

2025-04-28111 阅读量

文章目录前言一、在线环境操作1. 获取dify项目（使用魔法）2.进入项目中docker目录3.镜像拉取4.查看镜像5.镜像打包6.镜像

查看详情

2025-04-2861 阅读量

DeepSeek v1版本模型结构 DeepSeek LLM基本上遵循LLaMA的设计：采⽤Pre-Norm结构，并使⽤RMSNorm函数. 利⽤SwiGLU作为Feed-F

查看详情

2025-04-2676 阅读量

什么是lora微调 LoRA 提出在预训练模型的参数矩阵上添加低秩分解矩阵来近似每层的参数更新，从而减少适配下游任务所需要训练

查看详情

最新资讯