最新资讯-VPS345-香港VPS_香港云_美国VPS_美国云_服务器提供商

2026-01-287 阅读量

8卡H20服务器 + vLLM企业级部署满血版DeepSeek实录

前言最近给一家集团公司部署本地大模型，便写下本文记录一下企业级生产环境部署大模型的全过程。整体服务器配置如下：部署框

查看详情

2026-01-234 阅读量

使用SCNet服务器编译vLLM cpu端：编译完成，vLLM启动，使用SCNet公网转发8000端口，远程测试通过

安装python3.12版本本身系统里有python3.10版本，也有vLLM，而且是DCU vLLM版本，但是需要用到python3.12版本，所以才重新弄整

查看详情

2026-01-213 阅读量

如何在服务器上运行LobeChat镜像并对接GPU加速推理？

如何在服务器上运行 LobeChat 镜像并对接 GPU 加速推理？在企业级 AI 应用快速落地的今天，一个常见但棘手的问题浮现出来：

查看详情

2026-01-196 阅读量

统信UOS V2500服务器操作系统+海光K100 AI卡环境下VLLM服务部署

部署环境说明服务器：曙光 X7850H0（256 核+ 8张A100+1.5T内存）服务器操作系统： UOS V2500 DTK版本： 25.04.1 Rocm版本

查看详情

2026-01-185 阅读量

大模型面试题60：vLLM中PageAttention的实现原理

一、小白入门：先搞懂核心概念（无技术门槛）1. 为什么需要PageAttention？LLM（大语言模型）推理时，KV Cache 是核心（存储

查看详情

2026-01-184 阅读量

LLaMA-Factory使用

文章目录一、LLAMA-Factory简介二、安装LLaMA-Factory三、准备训练数据四、模型训练1. 模型下载2. 全量微调3.lora微调4.Q

查看详情

2026-01-157 阅读量

封神！昇腾平台推理性能翻倍秘籍：SGLang+vllm-ascend 调优全拆解（5 年运维血泪踩坑实录）

封神！昇腾平台推理性能翻倍秘籍：SGLang+vllm-ascend 调优全拆解（5 年运维血泪踩坑实录）引言正文一、先亮底牌：真

查看详情

2026-01-145 阅读量

封神！昇腾平台推理性能翻倍秘籍：SGLang+vllm-ascend 调优全拆解（5 年运维血泪踩坑实录）

封神！昇腾平台推理性能翻倍秘籍：SGLang+vllm-ascend 调优全拆解（5 年运维血泪踩坑实录）引言正文一、先亮底牌：真

查看详情

2025-06-20103 阅读量

ubuntu+RTX5090+CUDA12.8编译vllm启动本地模型

一、安装Python 安装依赖项 sudo apt update sudo apt install -y build-essential libssl-dev zlib1g-dev libncurses5-dev

查看详情

最新资讯

8卡H20服务器 + vLLM企业级部署满血版DeepSeek实录

使用SCNet服务器编译vLLM cpu端：编译完成，vLLM启动，使用SCNet公网转发8000端口，远程测试通过

如何在服务器上运行LobeChat镜像并对接GPU加速推理？

统信UOS V2500服务器操作系统+海光K100 AI卡环境下VLLM服务部署

大模型面试题60：vLLM中PageAttention的实现原理

LLaMA-Factory使用

封神！昇腾平台推理性能翻倍秘籍：SGLang+vllm-ascend 调优全拆解（5 年运维血泪踩坑实录）

封神！昇腾平台推理性能翻倍秘籍：SGLang+vllm-ascend 调优全拆解（5 年运维血泪踩坑实录）

ubuntu+RTX5090+CUDA12.8编译vllm启动本地模型

服务器租用

站群服务器

高防服务器

关于我们