最新资讯

  • 一文深入了解DeepSeek-R1:模型架构

一文深入了解DeepSeek-R1:模型架构

2025-04-28 00:00:56 1 阅读

本文深入探讨了 DeepSeek-R1 模型架构。让我们从输入到输出追踪 DeepSeek-R1 模型,以找到架构中的新发展和关键部分。DeepSeek-R1 基于 DeepSeek-V3-Base 模型架构。本文旨在涵盖其设计的所有重要方面。

📝 1. 输入上下文长度

DeepSeek-R1的输入上下文长度为128K。

DeepSeek-R1 从其基础模型 DeepSeek-V3-Base 继承了 128K 上下文长度。最初,DeepSeek-V3 使用 4K 上下文长度进行预训练。然后,利用 YaRN 技术,两阶段上下文长度扩展首先将其增加到 32K,然后增加到 128K。

YaRN(另一种 RoPE 扩展方法)是一种旨在有效扩展使用旋转位置嵌入 (RoPE)的大型语言模型 (LLM) 的上下文窗口的技术。RoPE 使用旋转矩阵对位置信息进行编码,而 YaRN 则修改这些旋转频率的缩放方式。它不是简单地推断频率(这通常会导致性能下降),而是平滑地插入和调整这些频率,从而能够更好地推广到更长的上下文。它在计算上是高效的,并且无需大量重新训练即可扩展模型上下文长度。

🏛 2. 总层数

DeepSeek-R1 由一个嵌入层、其后的 61 个变换器层以及输出阶段的多个预测头组成。

DeepSeek-R1 在所有 Transformer 层上采用多头潜在注意力 (MLA) 层,而不是标准多头注意力。前三个 Transformer 层与其他层不同,使用标准前馈网络 (FFN) 层。从第 4 层到第 61 层,混合专家 (MoE) 层取代了 FFN 层。MLA 和 MoE 的细节将在以下部分中探讨。

带有维度的完整模型架构描述:

DeepSeek-V3使用多标记预测 (MTP) 技术,利用最后两个预测头预测接下来的2 个标记。第二个预测标记的接受率介于85% 和 90%之间,表明在各个生成主题中均具有很高的可靠性。 DeepSeek-R1 (DeepSeek-V3) 总共包含 671B 个参数,其中每个标记激活 37B 个。在这里插入图片描述

🔬 3. 前 3 个 DeepSeek-R1 层

前 3 层由多头潜在注意力 (MLA) 和标准 FFN 层组成。这些通常被称为“密集 LLM 层”,因为 FFN 层不会被 MoE 层取代,相比之下 MoE 层被认为更稀疏。

DeepSeek-R1 中的前 3 个 Transformer 层

🧩 4. DeepSeek-R1 的第 4 层至第 61 层

这些层由 MLA 层和 MoE 层组成。我们将在接下来的部分中了解什么是 MLA 层和 MoE 层以及它们如何工作。

MoE Transformer 层

🧠 5.多头潜在注意力(MLA)

现在让我们了解什么是 MLA。

MLA 首次在 DeepSeek-V2 中引入,并已延续到 DeepSeek-V3 和 DeepSeek-R1。

为什么要开发MLA?

以下是 DeepSeek-V2 论文/技术报告中的一份声明,它清楚地阐述了开发 MLA 背后的原因。

“传统的Transformer模型通常采用多头注意力机制(MHA),但在生成过程中,其繁重的键值(KV)缓存会成为限制推理效率的瓶颈。为了减少KV缓存,提出了多查询注意力机制(MQA)和分组查询注意力机制(GQA)。它们需要的KV缓存量级较小,但性能不如MHA。

对于 DeepSeek-V2,我们设计了一种创新的注意力机制,称为多头潜在注意力 (MLA)。MLA 配备了低秩键值联合压缩,性能优于 MHA,但所需的 KV 缓存量却少得多。”

MLA 与 MHA、GQA 和 MQA 的比较:来自 DeepSeek-V2 的图表

MLA 如何实现减少 KV 缓存以加快推理速度?

“MLA 的核心是对注意力键和值进行低秩联合压缩,以减少推理过程中的键值 (KV) 缓存。” — DeepSeek-V2

让我们一步一步地理解这个图:

步骤 1:Q、K 和 V 的下投影

MLA 层的输入是 h t ​ h_t​ ht。为清楚起见,我们假设 h t h_t ht 的形状为 (input_sequence_length×2000)。

在传统的 Transformer 层中,权重矩阵用于将 h_t​ 投影到查询 (Q)、键 (K) 和值 (V) 表示中。这些表示中的每一个通常都保留与输入相同的隐藏维度,从而导致 Q、K、V 具有 (input_sequence_length×2000) 的形状。

MLA 层的输入是 h t h_t ht​。为清楚起见,我们假设 h t h_t ht 的形状为 (input_sequence_length×2000)。

在传统的 Transformer 层中,权重矩阵用于将 h_t​ 投影到查询 (Q)、键 (K) 和值 (V) 表示中。这些表示中的每一个通常都保留与输入相同的隐藏维度,从而导致 Q、K、V 具有 (input_sequence_length×2000) 的形状。

然而,在具有多头潜在注意力 (MLA) 的 Transformer 层中,权重矩阵生成的 Q、K 和 V 的尺寸明显小于输入。MLA 不会保留完整的隐藏维度,而是会减小它们的尺寸。例如,如果输入 h t h_t ht​ 的形状为 (序列长度 × 2000),则生成的 Q、K 和 V 的形状可能为 (序列长度 × 100)。

在实施过程中,通常会融合 Q、K 和 V 的权重矩阵,以提高GPU 上的计算和内存效率。不是应用单独的投影,而是使用组合权重矩阵来优化操作。在 MLA 中, K和V的生成遵循这一原则。具体而言,在方程中使用单个权重矩阵,表示为 W D K V W^{DKV} WDKV ​。这里, W D K V W^{DKV} WDKV​ 中的“D”代表下投影权重矩阵,反映了其在降低维度以实现高效注意力计算方面的作用。

潜在 K 和 V 嵌入

此投影的输出是包含 K 和 V 的连接表示。可以使用简单的切片机制轻松提取它们。结果输出的形状为 (序列长度 × 200),其中第一个 (序列长度 × 100) 对应于 K,其余 (序列长度 × 100) 对应于 V。

压缩的 K 和 V 输出在推理期间被缓存,从而显著减少了 KV 缓存的内存占用。

类似地,Q 也在MLA中被压缩。Q 的结果形状为(序列长度 × 100)。

第 2 步:Q、K 和 V 的向上投影

压缩后,Q、K 和 V被向上投影回更大的尺寸以进行注意力计算。这个更大的尺寸可以匹配原始输入 h t h_t ht ​,也可以遵循基于注意力头配置的结构。

例如,向上投影的形状可以是:

  • (序列长度×2000),与输入大小匹配。
  • 序列长度×3200),其中3200来自于64×50(有64 个注意力头,每个头有 50 个维度)。

K 和 V 向上投影

Q 向上投影

Q、K 和 V的上投影是使用专用权重矩阵执行的:

  • W_UK​ 表示K 向上投影
  • W_UV​ 用于垂直向上投影
  • W_UQ​ 用于Q 向上投影

这里,“U”代表向上投影,表示将压缩表示扩展回更大维度的空间以进行注意力计算。

注意:每个注意力头的输入维度将进行调整以适应旋转位置嵌入 (RoPE)。此调整将在接下来的部分中变得更加清晰。

步骤 3:Q 和 K 中的 RoPE 嵌入用于编码位置信息

此步骤用于计算 RoPE 嵌入来编码位置信息。

旋转位置嵌入(RoPE)的结合:

  • 解耦 RoPE 策略:为了整合位置信息,DeepSeek-V2(随后是 DeepSeek-V3 和 DeepSeek-R1)采用了解耦 RoPE 方法。这涉及创建专门用于携带位置信息的额外查询 (Q) 和密钥 (K) 向量。
  • 连接:这些 RoPE 增强的 Q 和 K 向量与上投影的 Q 和 K 向量连接。
    这是 MLA 中比较棘手的部分。

我将尝试按照我从 DeepSeek 的技术报告中理解的方式来解释它。

在传统的 Transformer 层中,RoPE 操作直接作用于 Q 和 K。它不改变 Q 和 K 的维度,而是改变 Q 和 K 中的语义表示(Q 和 K 中的数值)来编码位置信息。因此,得到的 Q 和 K 同时具有语义和位置信息。

但是,在具有 MLA 的transformer层中,RoPE 被应用于分离新生成的查询(Q)和键(K)嵌入,并将其连接到上投影的 Q 和 K。

步骤 3.1:为 Q 生成 RoPE 嵌入

传统上,RoPE(旋转位置嵌入)会根据查询 (Q) 和键 (K) 向量在序列中的位置,对它们应用旋转矩阵。此转换会直接在 Q 和 K 中编码相对位置信息,从而无需使用正弦或绝对编码等显式位置嵌入。

但是在 MLA 中,不是将 RoPE 应用于上投影的 Q( q t C q_t^C qtC),而是从 c t Q c_t^Q ctQ 生成新的 Q 嵌入( q t R q_t^R qtR)并对其应用 RoPE。

通过将 c t Q c_t^Q ctQ 与权重矩阵 W Q R W^{QR} WQR 相乘,可以生成完全独立的查询嵌入。这些新的独立查询嵌入经过 RoPE 转换,为我们提供位置编码查询嵌入 ( q t R q_t^R qtR)。

q t R q_t^R qtR 的生成方式是,它们可以连接到每个注意力头的输入查询嵌入,以便每个注意力头都具有位置信息。 [从等式来看,这个说法似乎是正确的,但需要进一步验证。]

步骤 3.2:为 K 生成 RoPE 嵌入
类似地,不是将 RoPE 应用于上投影的 K,而是生成新的 K 嵌入并对其应用 RoPE。

但是与 RoPE 嵌入的 q t R q_t^R qtR有两个关键区别:

新的 K 嵌入是由 h t h_t ht(输入嵌入)而不是向下投影的 K( c t K c_t^K ctK)生成的。
相同的 RoPE 嵌入 K(键)连接到每个注意力头的输入。但是,单独的 RoPE 嵌入 Q(查询)被计算并连接到每个注意力头,如步骤 3.1 所示。[从等式来看,这个说法似乎是正确的,但需要进一步验证。]

为什么不从向上投影的 K 即 k t C k_t^C ktC 生成?

DeepSeek-V2报告中的推理:

“如果我们将 RoPE 应用于键k _𝐶,𝑊𝑈𝐾 将与位置敏感的 RoPE 矩阵耦合。这样,𝑊𝑈𝐾 在推理过程中就不能再被吸收到𝑊_𝑄 中,因为与当前生成的 token 相关的 RoPE 矩阵将位于 𝑊_𝑄 和 𝑊𝑈𝐾 之间,而矩阵乘法不遵循交换律。”

从下面的解释截图可以更好地理解这一点:

K 的 RoPE 嵌入:第 1 部分

K 的 RoPE 嵌入:第 2 部分

K 的 RoPE 嵌入:第 3 部分

因此,为了提高推理效率,位置嵌入的 K(关键)嵌入是从输入嵌入 h t h_t ht 生成的。

在 MLA 中引入额外的权重矩阵不会导致内存和计算效率低下吗?

为了解决这些开销,DeepSeek-V2 报告:

“此外,在推理过程中,由于 𝑊𝑈𝐾 可以被吸收到 𝑊𝑄 中,而 𝑊𝑈𝑉 可以被吸收到 𝑊𝑂 中,我们甚至不需要计算键和值来引起注意。”

为了进一步减少内存消耗:

“此外,为了减少训练期间的激活内存,我们还对查询执行低秩压缩,即使它不能减少 KV 缓存”

步骤4:计算注意力输出

连接过程会增加 Q 和 K 向量的维数。为了管理这种增加的维数,模型可以采取以下任一方式:

  • 增加注意力头的数量:这将保持原始的每个头的维度,但需要更多的计算资源。
  • 调整每个头的维数:保持头的数量不变,但增加每个头的维数以适应连接的向量。

注意力输出是使用这些标准注意力方程来计算的:


O_t_i 是注意力得分,u_t 是注意力输出。W_o 表示输出投影权重矩阵。输出被投影回与输入相同的维度(就像在我们的例子中:这个形状将是 input_sequence_length x 2000)

🎭 6.混合专家(MoE)

什么是混合专家 (MoE)?

为了清楚地理解什么是 MoE,首先让我们看看它在 Transformer 中的具体用途以及它的架构简介。标准 Transformer 层中的 FFN 被 MoE 取代。

从本质上讲,MoE 遵循标准 Transformer 设计,但通过引入多个并行专家网络(FFN) 而不是单个密集 FFN来修改前馈层。其工作原理如下:

1. 多个 FFN(而非一个)

MoE 不使用单个共享的 FFN,而是使用多个并行训练的FFN 层(专家) 。

2. 输入处理和令牌路由

  • 每个 token 都像往常一样经过 transformer自注意力层。
  • 它不是由单个 FFN 处理,而是被发送到路由器,由路由器决定哪些专家应该处理它。

3. 通过路由器选择专家

  • 一个小型的、可训练的路由器决定哪个专家子集(FFN)应该处理每个标记。
  • 通常,每个 token仅选择 1 或 2 个专家以保持效率(例如, top-1 或 top-2 门控)。DeepSeek -V3(DeepSeek-R1)使用 9 个专家,其中 1 个是共享专家,其他 8 个是路由专家。
  • 选择通常基于softmax 评分机制,其中路由器为每个专家分配概率。具体来说,在 DeepSeek-V3 (DeepSeek-R1) 中,使用 Sigmoid 而不是 softmax。

4. 专家稀疏计算

  • 只有选定的专家才能处理令牌,而其他人则保持不活动状态。
  • 专家输出使用加权求和进行组合,并传递到下一个 Transformer 层。在 DeepSeek-V3/R1 中,权重是归一化的 S 型输出。
  • 这种稀疏激活可确保任何时候仅使用模型的一小部分,从而保持计算可管理。

为什么要用 MoE 取代单一 FFN?

  • 可扩展性— MoE 允许模型使用更多参数进行扩展,而无需线性增加计算量。
  • 高效学习— 专家专注于数据的不同方面,从而提高泛化能力。
  • 计算节省— 由于每个 token 仅使用专家子集,因此与相同大小的密集模型相比,MoE 模型的运行成本更低。DeepSeek-V3/R1 共有 6710 亿个参数,其中每个 token 激活 370 亿个参数。

MoE 在 DeepSeek-R1 中如何发挥作用?

以下来自 DeepSeek-V3 技术报告的公式显示了每个 MoE 层中的计算。在 DeepSeek 系列模型中,MoE 架构首次在 DeepSeekMoE 模型中引入,并且正在 DeepSeek-V2、DeepSeek-V3 和 DeepSeek-R1 中使用。

路由器计算:

在 DeepSeek-V3 、 DeepSeek-R1 和其他一些现代混合专家 (MoE) 模型中,e_i​ 表示学习到的质心,有助于将输入路由到正确的专家。与传统的 MoE 架构中基于 FFN 的路由器计算门控分数不同,此方法预定义了一组可学习向量e_i​,每个向量对应一位专家。

关键思想:

  • 每个专家 i 都有一个相关的质心向量 e i e_i ei
  • 我们不是将输入 u t ​ u_t​ ut 传递给 FFN 来获取专家概率,而是通过点积来计 u t u_t ut 和每个 e i ​ e_i​ ei 之间的相似度:
  • 该分数决定了专家与给定输入的相关程度。
  • 仅激活具有最高 s i , t s_{i,t} si,t​ 值的Top-K专家进行处理。

  • 在 S 型输出中添加了一个偏差项,以创建无辅助损失的 MoE 负载平衡。

DeepSeek-V3 论文中的这段描述进一步阐明了它的用途以及它在训练过程中的计算方式:

  • 使用选定的 top-k 值对输出值进行标准化。


专家计算:


u t u_t ut是 MoE 层的输入。等式中的第二项表示输入与共享专家相乘。每个专家由 FFN(前馈网络)组成,因此用“FFN”表示。在 DeepSeek-R1 中,只有 1 个共享专家。因此,Ns=1。同样,等式中的第三项表示输入与活跃的个人专家相乘。在 DeepSeek-R1 中,总共有 256 个个人专家。但每个 token 只有 8 个活跃,因此 Nr=8。每个活跃的个人专家都将具有与等式 13 中关联的 g i , t g_{i,t} gi,t。它用于计算第三项。

输出


h t h_t ht表示 MoE 层的输出。 u t u_t ut 是 MoE 层的输入。专家计算结果添加到输入 u t u_t ut 中,得到 MoE 层的输出。

🔢 7. 多标记预测(MTP)

什么是多标记预测?

多标记预测是语言建模中的一种高级方法,其中模型不是一次预测一个序列中的下一个单词,而是同时预测多个未来标记。此方法使模型能够并行预测多个即将到来的单词,从而提高学习效率并加速文本生成。


Meta 引入了一种多标记预测架构,可训练语言模型同时预测多个未来标记,从而提高采样效率并加快推理速度。在此概念的基础上,DeepSeek-V3 整合了多标记预测 (MTP) 目标,使模型能够同时预测多个标记。这种方法使训练信号密集化,并能够更好地预先规划标记表示,从而提高复杂基准测试的性能。

DeepSeek-V3/R1 和 Meta 的多令牌预测有两个关键区别:

“与 Gloeckle 等人(2024 年)[Meta Research] 使用独立输出头并行预测 𝐷 个额外标记不同,我们按顺序预测其他标记,并在每个预测深度保留完整的因果链。” — DeepSeek-V3

  1. Meta 的模型预测了4 个 token,而 DeepSeek-V3 预测了2 个 token。
  2. Meta 模型中的预测头是独立的,而 DeepSeek-V3 的预测头是顺序连接的。

MTP 在 DeepSeek-R1 中如何工作?


让我们一步一步地看一下该图表。

在训练期间,输入标记(位于左下角)穿过嵌入层,然后传播到所有变压器块/层。

第一个预测头(包括输出头)直接连接到主模型的最终 Transformer 层。输出头通常是前馈网络 (FFN),其输出维度与模型的词汇量相匹配。该头负责按顺序预测下一个标记。给定输入标记t₁、t₂、t₃、t₄,它会预测t₂、t₃、t₄、t₅ 。但是,在推理过程中,只计算最终标记t₅ 。

第二个预测头通过添加额外的可学习层扩展了这种方法。它从主模型的最终 Transformer 层获取输出,应用 RMSNorm 进行归一化,然后将其与输入嵌入连接起来。这些输入嵌入是从主模型中使用的相同嵌入层获得的。与第一个预测头不同,这个头从t₂而不是t₁开始处理输入标记。然后使用线性投影层将连接的输出投影到合适的嵌入大小,然后使用可学习的 Transformer 块/层进行进一步处理。在训练期间,这个头将t₃预测为t₆,但在推理中,只计算t₆ 。

类似地,第三个预测头从第二个预测头的transformer器块/层获取输入以及相应的输入嵌入,现在从t₃开始到t₆。它遵循与前几个头相同的结构,在训练期间预测t₄到t₇,但在推理期间仅计算t₇。

每个预测头使用交叉熵计算损失。然后,这些损失用因子λ加权,取其平均值作为最终损失值。

单独预测头损失

最终损失

在 DeepSeek-V3 和 R1 中,MTP 仅在训练期间使用,而不在推理期间使用:

“推理中的 MTP:我们的 MTP 策略主要是为了提高主模型的性能,因此在推理过程中,我们可以直接丢弃 MTP 模块,主模型可以独立正常运行。”——DeepSeek-V3

参考资料

  • https://arxiv.org/pdf/2412.19437
  • https://arxiv.org/pdf/2405.04434
  • https://arxiv.org/pdf/2402.03300
  • https://arxiv.org/pdf/2401.02954
  • https://arxiv.org/pdf/2401.06066
  • https://arxiv.org/pdf/2404.19737

本文地址:https://www.vps345.com/4048.html

搜索文章

Tags

PV计算 带宽计算 流量带宽 服务器带宽 上行带宽 上行速率 什么是上行带宽? CC攻击 攻击怎么办 流量攻击 DDOS攻击 服务器被攻击怎么办 源IP 服务器 linux 运维 游戏 云计算 javascript 前端 chrome edge 进程 操作系统 进程控制 Ubuntu python MCP 阿里云 网络 网络安全 网络协议 llama 算法 opencv 自然语言处理 神经网络 语言模型 ssh ubuntu deepseek Ollama 模型联网 API CherryStudio 科技 ai java 人工智能 个人开发 harmonyos 华为 开发语言 typescript 计算机网络 数据库 centos oracle 关系型 安全 分布式 Flask FastAPI Waitress Gunicorn uWSGI Uvicorn RTSP xop RTP RTSPServer 推流 视频 php android 宝塔面板访问不了 宝塔面板网站访问不了 宝塔面板怎么配置网站能访问 宝塔面板配置ip访问 宝塔面板配置域名访问教程 宝塔面板配置教程 Dell R750XS 华为云 物联网 嵌入式硬件 单片机 c++ 温湿度数据上传到服务器 Arduino HTTP 面试 性能优化 jdk intellij-idea 架构 udp unity vue.js audio vue音乐播放器 vue播放音频文件 Audio音频播放器自定义样式 播放暂停进度条音量调节快进快退 自定义audio覆盖默认样式 学习 rust http uni-app 深度学习 YOLO 目标检测 计算机视觉 fastapi mcp mcp-proxy mcp-inspector fastapi-mcp agent sse pycharm ide pytorch filezilla 无法连接服务器 连接被服务器拒绝 vsftpd 331/530 GaN HEMT 氮化镓 单粒子烧毁 辐射损伤 辐照效应 ssl 前端框架 golang 后端 HCIE 数通 numpy tcp/ip macos adb vue3 HTML audio 控件组件 vue3 audio音乐播放器 Audio标签自定义样式默认 vue3播放音频文件音效音乐 自定义audio播放器样式 播放暂停调整声音大小下载文件 asm c# efficientVIT YOLOv8替换主干网络 TOLOv8 flutter Hyper-V WinRM TrustedHosts flask spring boot AI编程 AIGC 鸿蒙 windows websocket react.js 前端面试题 node.js 持续部署 github Qwen2.5-coder 离线部署 ollama 大模型 mac oceanbase rc.local 开机自启 systemd 麒麟 redis mybatis 机器学习 Dify chatgpt llama3 Chatglm 开源大模型 编辑器 transformer ping++ 运维开发 conda 深度优先 图论 并集查找 换根法 树上倍增 ddos llm pip docker 容器 学习方法 zotero WebDAV 同步失败 代理模式 ffmpeg 音视频 系统架构 大数据 爬虫 数据挖掘 网络用户购物行为分析可视化平台 大数据毕业设计 1024程序员节 笔记 测试工具 web安全 银河麒麟服务器操作系统 系统激活 jenkins sql KingBase 博客 windwos防火墙 defender防火墙 win防火墙白名单 防火墙白名单效果 防火墙只允许指定应用上网 防火墙允许指定上网其它禁止 漏洞 负载均衡 ESP32 智能手机 NAS Termux Samba Linux tomcat postman mock mock server 模拟服务器 mock服务器 Postman内置变量 Postman随机数据 LDAP aws googlecloud kubernetes k8s ecmascript KVM vscode 腾讯云 fpga开发 maven intellij idea 鸿蒙系统 Cookie 实时音视频 AI Agent 计算机外设 电脑 软件需求 nginx dubbo r语言 数据可视化 数据分析 gitee .netcore word图片自动上传 word一键转存 复制word图片 复制word图文 复制word公式 粘贴word图文 粘贴word公式 git ansible cuda cudnn anaconda mysql 微服务 springcloud kamailio sip VoIP 大数据平台 gpu算力 vim sqlserver rust腐蚀 嵌入式 linux驱动开发 arm开发 .net 进程信号 list 数据结构 微信 微信分享 Image wxopensdk 豆瓣 追剧助手 迅雷 nas gitlab firewalld 低代码 kafka jmeter 软件测试 多线程服务器 Linux网络编程 YOLOv12 监控 自动化运维 gateway Clion Nova ResharperC++引擎 Centos7 远程开发 c语言 经验分享 智能路由器 外网访问 内网穿透 端口映射 HarmonyOS Next pillow live555 rtsp rtp json html5 firefox WSL win11 无法解析服务器的名称或地址 https 命名管道 客户端与服务端通信 django web3.py Windsurf 小程序 微信小程序域名配置 微信小程序服务器域名 微信小程序合法域名 小程序配置业务域名 微信小程序需要域名吗 微信小程序添加域名 产品经理 agi microsoft Kali Linux 黑客 渗透测试 信息收集 信息与通信 mongodb 程序人生 代码调试 ipdb C 环境变量 进程地址空间 springsecurity6 oauth2 授权服务器 token sas 创意 社区 DeepSeek-R1 API接口 源码剖析 rtsp实现步骤 流媒体开发 远程控制 远程看看 远程协助 rsyslog cpu 内存 实时 使用 ollama下载加速 mcu iot C语言 VMware安装Ubuntu Ubuntu安装k8s WSL2 DigitalOcean GPU服务器购买 GPU服务器哪里有 GPU服务器 僵尸进程 apache YOLOv8 NPU Atlas800 A300I pro asi_bench mount挂载磁盘 wrong fs type LVM挂载磁盘 Centos7.9 camera Arduino 电子信息 开源 统信UOS bonding 链路聚合 自动化 蓝耘科技 元生代平台工作流 ComfyUI qt stm32项目 stm32 debian PVE prometheus 飞牛NAS 飞牛OS MacBook Pro rabbitmq 安装教程 GPU环境配置 Ubuntu22 CUDA PyTorch Anaconda安装 Ubuntu Server Ubuntu 22.04.5 go file server http server web server AI大模型 LLM 企业微信 Linux24.04 deepin visual studio code 集成学习 集成测试 Reactor 设计模式 C++ 状态管理的 UDP 服务器 Arduino RTOS ESXi yum 服务器配置 生物信息学 openEuler bash 驱动开发 ip命令 新增网卡 新增IP 启动网卡 gitea selenium html 计算机 elasticsearch 监控k8s集群 集群内prometheus Invalid Host allowedHosts vue 程序员 远程连接 rdp 实验 DevEco Studio 王者荣耀 NFS 远程工作 DNS minio webrtc java-ee iftop 网络流量监控 kylin dify 服务器管理 宝塔面板 配置教程 服务器安装 网站管理 express 技能大赛 UOS 统信操作系统 SysBench 基准测试 ecm bpm make命令 makefile文件 spring threejs 3D 云电竞 云电脑 todesk 数据集 职场和发展 交换机 硬件 设备 GPU PCI-Express 缓存 英语 ip ui selete 高级IO postgresql 音乐服务器 Navidrome 音流 安卓 政务 分布式系统 监控运维 Prometheus Grafana 游戏服务器 Minecraft 客户端 Erlang OTP gen_server 热代码交换 事务语义 实时互动 MNN DeepSeek Qwen Dell HPE 联想 浪潮 gpt-3 文心一言 软件工程 freebsd eureka 其他 中间件 可信计算技术 安全架构 网络攻击模型 系统安全 媒体 显卡驱动 部署 远程桌面 matlab 文件系统 路径解析 DeepSeek行业应用 Heroku 网站部署 excel 在线预览 xlsx xls文件 在浏览器直接打开解析xls表格 前端实现vue3打开excel 文件地址url或接口文档流二进 tcpdump jupyter kind mamba Vmamba AI写作 AI作画 react next.js 部署next.js QQ 聊天室 spring cloud 云原生 etcd 数据安全 RBAC ocr 命令 金融 硬件架构 思科模拟器 思科 Cisco MacOS录屏软件 压力测试 测试用例 功能测试 ruoyi asp.net大文件上传 asp.net大文件上传源码 ASP.NET断点续传 asp.net上传文件夹 asp.net上传大文件 .net core断点续传 .net mvc断点续传 playbook 剧本 Java RAGFLOW RAG 检索增强生成 文档解析 大模型垂直应用 muduo docker run 数据卷挂载 交互模式 X11 Xming CPU 主板 电源 网卡 高效远程协作 TrustViewer体验 跨设备操作便利 智能远程控制 线程 docker搭建nacos详解 docker部署nacos docker安装nacos 腾讯云搭建nacos centos7搭建nacos 弹性计算 虚拟化 计算虚拟化 弹性裸金属 医疗APP开发 app开发 springboot远程调试 java项目远程debug docker远程debug java项目远程调试 springboot远程 Deepseek 游戏程序 工业4.0 安全威胁分析 微信小程序 eNSP 网络规划 VLAN 企业网络 vscode 1.86 网站搭建 serv00 jetty undertow Linux无人智慧超市 LInux多线程服务器 QT项目 LInux项目 单片机项目 grafana 直流充电桩 充电桩 微信开放平台 微信公众平台 微信公众号配置 IPMI linux环境变量 远程登录 telnet unix RAID RAID技术 磁盘 存储 远程 执行 sshpass 操作 Linux awk awk函数 awk结构 awk内置变量 awk参数 awk脚本 awk详解 EMUI 回退 降级 升级 银河麒麟 kylin v10 麒麟 v10 SSH Xterminal kali 共享文件夹 虚拟机 k8s资源监控 annotations自动化 自动化监控 监控service 监控jvm 机器人 云服务器 裸金属服务器 弹性裸金属服务器 p2p 多进程 游戏机 hugo Netty 即时通信 NIO Docker Compose docker compose docker-compose SWAT 配置文件 服务管理 网络共享 zabbix 单元测试 IIS服务器 IIS性能 日志监控 TRAE 半虚拟化 硬件虚拟化 Hypervisor Ubuntu DeepSeek DeepSeek Ubuntu DeepSeek 本地部署 DeepSeek 知识库 DeepSeek 私有化知识库 本地部署 DeepSeek DeepSeek 私有化部署 wireshark svn 能力提升 面试宝典 技术 IT信息化 micropython esp32 mqtt 灵办AI kvm rpc nuxt3 边缘计算 智能硬件 华为od sqlite pgpool 开机自启动 openssl 密码学 业界资讯 模拟退火算法 田俊楠 code-server MQTT mosquitto 消息队列 Portainer搭建 Portainer使用 Portainer使用详解 Portainer详解 Portainer portainer ue4 着色器 ue5 虚幻 图形化界面 pyautogui 目标跟踪 OpenVINO 推理应用 tensorflow ci/cd trae hibernate 课程设计 bot Docker GCC crosstool-ng ceph echarts 信息可视化 网页设计 wsl2 wsl 数据库系统 jar 同步 备份 建站 rocketmq 大模型入门 大模型教程 remote-ssh 多层架构 解耦 MQTT协议 消息服务器 代码 深度求索 私域 知识库 国产操作系统 ukui 麒麟kylinos openeuler dba W5500 OLED u8g2 TCP服务器 chfs ubuntu 16.04 统信 虚拟机安装 框架搭建 unity3d CLion IDE 分析解读 网络穿透 火绒安全 腾讯云大模型知识引擎 VPS Nuxt.js 图像处理 protobuf 序列化和反序列化 安装 bug virtualenv webstorm 致远OA OA服务器 服务器磁盘扩容 强制清理 强制删除 mac废纸篓 OD机试真题 华为OD机试真题 服务器能耗统计 okhttp CORS 跨域 雨云 NPS 孤岛惊魂4 uniapp 报错 ios 恒源云 curl wget vSphere vCenter 软件定义数据中心 sddc RTMP 应用层 MacMini Mac 迷你主机 mini Apple devops springboot 宠物 毕业设计 免费学习 宠物领养 宠物平台 服务器数据恢复 数据恢复 存储数据恢复 北亚数据恢复 oracle数据恢复 Ark-TS语言 IPMITOOL BMC 硬件管理 arm 设置代理 实用教程 opcua opcda KEPServer安装 oneapi 小艺 Pura X 大模型微调 open webui JAVA linux 命令 sed 命令 RoboVLM 通用机器人策略 VLA设计哲学 vlm fot robot 视觉语言动作模型 具身智能 xml 传统数据库升级 银行 开发环境 大语言模型 LLMs 华为认证 网络工程师 繁忙 服务器繁忙 解决办法 替代网站 汇总推荐 AI推理 移动云 MS Materials android studio 鲲鹏 FTP 服务器 cmos ragflow XCC Lenovo VR手套 数据手套 动捕手套 动捕数据手套 shell embedding VMware安装mocOS VMware macOS系统安装 visualstudio minicom 串口调试工具 SSL 域名 skynet 输入法 av1 电视盒子 机顶盒ROM 魔百盒刷机 3d 数学建模 LORA NLP Trae AI 原生集成开发环境 Trae AI n8n 工作流 workflow 硬件工程 嵌入式实习 gcc RustDesk自建服务器 rustdesk服务器 docker rustdesk 黑客技术 流式接口 URL 本地部署 api web pyqt docker命令大全 系统开发 binder 车载系统 framework 源码环境 5G 3GPP 卫星通信 Kylin-Server 指令 EasyConnect mq Cline nextjs reactjs hadoop ArcTS 登录 ArcUI GridItem arkUI Google pay Apple pay opensearch helm 服务器主板 AI芯片 搜索引擎 ssrf 失效的访问控制 交互 WebRTC gpt Linux PID openwrt ux 多线程 chrome devtools chromedriver open Euler dde LInux Cursor Python 网络编程 聊天服务器 套接字 TCP Socket xrdp gradle string模拟实现 深拷贝 浅拷贝 经典的string类问题 三个swap Docker Hub docker pull 镜像源 daemon.json TrinityCore 魔兽世界 C# MQTTS 双向认证 emqx adobe 监控k8s 监控kubernetes elk 群晖 文件分享 iis VSCode 大模型面经 大模型学习 雨云服务器 环境迁移 崖山数据库 YashanDB WebUI DeepSeek V3 Ubuntu 24.04.1 轻量级服务器 redhat tidb GLIBC pdf 毕设 系统 黑苹果 pygame 小游戏 五子棋 raid5数据恢复 磁盘阵列数据恢复 并查集 leetcode sdkman iBMC UltraISO 银河麒麟操作系统 国产化 远程过程调用 Windows环境 蓝桥杯 直播推流 服务器部署ai模型 sqlite3 Anolis nginx安装 环境安装 linux插件下载 三级等保 服务器审计日志备份 nvidia 无桌面 命令行 串口服务器 risc-v ipython 软考 mysql离线安装 ubuntu22.04 mysql8.0 源码 Playwright 自动化测试 css 混合开发 JDK 联想开天P90Z装win10 linux上传下载 bootstrap Redis Desktop k8s集群资源管理 云原生开发 hive Hive环境搭建 hive3环境 Hive远程模式 网工 压测 ECS vmware 卡死 SSH 服务 SSH Server OpenSSH Server centos-root /dev/mapper yum clean all df -h / du -sh 自动化编程 向日葵 宕机切换 服务器宕机 京东云 基础入门 编程 ai小智 语音助手 ai小智配网 ai小智教程 esp32语音助手 diy语音助手 idm matplotlib ros2 moveit 机器人运动 Ubuntu 24 常用命令 Ubuntu 24 Ubuntu vi 异常处理 AI代码编辑器 数据库架构 数据管理 数据治理 数据编织 数据虚拟化 flash-attention mariadb safari 显示过滤器 ICMP Wireshark安装 thingsboard iDRAC R720xd 磁盘监控 rime 相差8小时 UTC 时间 netty dell服务器 cnn IIS .net core Hosting Bundle .NET Framework vs2022 XFS xfs文件系统损坏 I_O error es jvm 软件构建 firewall openstack Xen cfssl 迁移指南 composer FunASR ASR 佛山戴尔服务器维修 佛山三水服务器维修 c/c++ 串口 产测工具框架 IMX6ULL 管理框架 Spring Security 技术共享 我的世界 我的世界联机 数码 用户缓冲区 模拟实现 Logstash 日志采集 无人机 支付 微信支付 开放平台 影刀 #影刀RPA# 我的世界服务器搭建 链表 Wi-Fi Typore 干货分享 黑客工具 密码爆破 fd 文件描述符 deepseek r1 执法记录仪 智能安全帽 smarteye 矩阵 线性代数 电商平台 ROS 自动驾驶 服务器时间 聚类 ISO镜像作为本地源 cocoapods xcode 程序 性能分析 eclipse SenseVoice iphone c 虚拟局域网 代码托管服务 备份SQL Server数据库 数据库备份 傲梅企业备份网络版 yolov8 强化学习 Kali 渗透 prompt UOS1070e 版本 figma H3C powerpoint 小智AI服务端 xiaozhi TTS pppoe radius gaussdb 大模型应用 GoogLeNet dns是什么 如何设置电脑dns dns应该如何设置 xss OpenSSH 交叉编译 trea idea 序列化反序列化 IPv4 子网掩码 公网IP 私有IP SSH 密钥生成 SSH 公钥 私钥 生成 主从复制 人工智能生成内容 AI agent 信号处理 云服务 Ubuntu22.04 开发人员主页 互信 个人博客 DIFY 上传视频至服务器代码 vue3批量上传多个视频并预览 如何实现将本地视频上传到网页 element plu视频上传 ant design vue vue3本地上传视频及预览移除 ruby 游戏引擎 uni-file-picker 拍摄从相册选择 uni.uploadFile H5上传图片 微信小程序上传图片 seleium CH340 串口驱动 CH341 uart 485 算力 EMQX 通信协议 双系统 GRUB引导 Linux技巧 键盘 epoll edge浏览器 RAGFlow 本地知识库部署 DeepSeek R1 模型 VS Code P2P HDLC bcompare Beyond Compare 模拟器 教程 社交电子 uv glibc 阻塞队列 生产者消费者模型 服务器崩坏原因 AD 域管理 langchain junit 游戏开发 安防软件 端口测试 匿名管道 显示管理器 lightdm gdm lio-sam SLAM wps linux安装配置 磁盘镜像 服务器镜像 服务器实时复制 实时文件备份 嵌入式Linux IPC 软负载 AI-native Docker Desktop apt minecraft 读写锁 中兴光猫 换光猫 网络桥接 自己换光猫 办公自动化 自动化生成 pdf教程 rnn Jellyfin HTTP 服务器控制 ESP32 DeepSeek 备选 网站 调用 示例 银河麒麟桌面操作系统 Kylin OS 远程服务 TrueLicense AD域 毕昇JDK 分布式训练 语音识别 arcgis AutoDL x64 SIGSEGV SSE xmm0 稳定性 看门狗 seatunnel 超融合 g++ g++13 nac 802.1 portal vasp安装 查询数据库服务IP地址 SQL Server npm 昇腾 npu qt项目 qt项目实战 qt教程 rag ragflow 源码启动 Ubuntu共享文件夹 共享目录 Linux共享文件夹 运维监控 EtherNet/IP串口网关 EIP转RS485 EIP转Modbus EtherNet/IP网关协议 EIP转RS485网关 EIP串口服务器 国标28181 视频监控 监控接入 语音广播 流程 SIP SDP k8s二次开发 集群管理 换源 国内源 Debian Radius 网络结构图 yaml Ultralytics 可视化 推荐算法 银河麒麟高级服务器 外接硬盘 Kylin 根服务器 代理 clickhouse 华为机试 Linux环境 outlook DeepSeek r1 Open WebUI cd 目录切换 做raid 装系统 Java Applet URL操作 服务器建立 Socket编程 网络文件读取 laravel OpenManus WSL2 上安装 Ubuntu 宝塔 vpn deekseek miniapp 真机调试 调试 debug 断点 网络API请求调试方法 frp Node-Red 编程工具 流编程 ArkTs ArkUI IM即时通讯 剪切板对通 HTML FORMAT CVE-2024-7347 内网服务器 内网代理 内网通信 VM搭建win2012 win2012应急响应靶机搭建 攻击者获取服务器权限 上传wakaung病毒 应急响应并溯源 挖矿病毒处置 应急响应综合性靶场 saltstack NLP模型 需求分析 规格说明书 自学笔记 小米 澎湃OS Android rustdesk Linux的基础指令 飞书 dns web3 阿里云ECS tcp 信号 bat Mac内存不够用怎么办 反向代理 单例模式 deep learning 单一职责原则 less CDN 自动化任务管理 easyui 小番茄C盘清理 便捷易用C盘清理工具 小番茄C盘清理的优势尽显何处? 教你深度体验小番茄C盘清理 C盘变红?!不知所措? C盘瘦身后电脑会发生什么变化? 虚拟显示器 spark HistoryServer Spark YARN jobhistory 实习 Headless Linux 相机 权限 asp.net大文件上传下载 程序员创富 重启 排查 系统重启 日志 原因 yum源切换 更换国内yum源 AISphereButler ubuntu24.04.1 自定义客户端 SAS IO模型 zookeeper flink nfs 飞牛nas fnos ros 大大通 第三代半导体 碳化硅 回显服务器 UDP的API使用 Windows ai工具 ldap armbian u-boot GIS 遥感 WebGIS 7z vr keepalived 免费域名 域名解析 sonoma 自动更新 项目部署到linux服务器 项目部署过程 ftp xshell termius iterm2 neo4j 数据仓库 数据库开发 database DocFlow h.264 LLM Web APP Streamlit 李心怡 big data cpp-httplib 服务网格 istio MI300x wordpress 无法访问wordpess后台 打开网站页面错乱 linux宝塔面板 wordpress更换服务器 IMX317 MIPI H265 VCU Linux的权限 怎么卸载MySQL MySQL怎么卸载干净 MySQL卸载重新安装教程 MySQL5.7卸载 Linux卸载MySQL8.0 如何卸载MySQL教程 MySQL卸载与安装 vscode1.86 1.86版本 ssh远程连接 本地部署AI大模型 SRS 流媒体 直播 SSL证书 sysctl.conf vm.nr_hugepages Claude odoo 服务器动作 Server action AnythingLLM AnythingLLM安装 视觉检测 VMware创建虚拟机 视频编解码 dash 正则表达式 语法 图形渲染 CrewAI log4j qemu libvirt EtherCAT转Modbus ECT转Modbus协议 EtherCAT转485网关 ECT转Modbus串口网关 EtherCAT转485协议 ECT转Modbus网关 WebVM 僵尸世界大战 游戏服务器搭建 基础环境 策略模式 流水线 脚本式流水线 捆绑 链接 谷歌浏览器 youtube google gmail DenseNet 高效日志打印 串口通信日志 服务器日志 系统状态监控日志 异常记录日志 alias unalias 别名 swoole FTP服务器 v10 软件 HarmonyOS 音乐库 飞牛 can 线程池 增强现实 沉浸式体验 应用场景 技术实现 案例分析 AR USB网络共享 架构与原理 regedit 开机启动 多个客户端访问 IO多路复用 TCP相关API 网络药理学 生信 gromacs 分子动力学模拟 MD 动力学模拟 rclone AList webdav fnOS tailscale derp derper 中转 triton 模型分析 大文件分片上传断点续传及进度条 如何批量上传超大文件并显示进度 axios大文件切片上传详细教 node服务器合并切片 vue3大文件上传报错提示错误 大文件秒传跨域报错cors webgl C++软件实战问题排查经验分享 0xfeeefeee 0xcdcdcdcd 动态库加载失败 程序启动失败 程序运行权限 标准用户权限与管理员权限 考研 IDEA ssh漏洞 ssh9.9p2 CVE-2025-23419 lsb_release /etc/issue /proc/version uname -r 查看ubuntu版本 cursor 私有化 lua MCP server C/S windows日志 vue-i18n 国际化多语言 vue2中英文切换详细教程 如何动态加载i18n语言包 把语言json放到服务器调用 前端调用api获取语言配置文件 AP配网 AK配网 小程序AP配网和AK配网教程 WIFI设备配网小程序UDP开 DOIT 四博智联 Unity Dedicated Server Host Client 无头主机 aarch64 编译安装 HPC Deepseek-R1 私有化部署 推理模型 etl 域名服务 DHCP 符号链接 配置 性能测试 dity make 历史版本 下载 常用命令 文本命令 目录命令 python3.11 searxng midjourney banner Docker引擎已经停止 Docker无法使用 WSL进度一直是0 镜像加速地址 perf 前后端分离 移动魔百盒 USB转串口 DBeaver kerberos sentinel 邮件APP 免费软件 服务器无法访问 ip地址无法访问 无法访问宝塔面板 宝塔面板打不开 实战案例 知识图谱 win服务器架设 windows server TCP协议 抗锯齿 拓扑图 沙盒 UDP PX4 加解密 Yakit yaklang nlp milvus 流量运营 粘包问题 计算生物学 生物信息 基因组 带外管理 MVS 海康威视相机 镜像 区块链 proxy模式 top Linux top top命令详解 top命令重点 top常用参数 fast ubuntu20.04 ros1 Noetic 20.04 apt 安装 navicat llama.cpp onlyoffice 在线office 磁盘清理 kernel visual studio Attention 容器技术 docker搭建pg docker搭建pgsql pg授权 postgresql使用 postgresql搭建 iperf3 带宽测试 ranger MySQL8.0 状态模式 ShenTong QT 5.12.12 QT开发环境 Ubuntu18.04 rtsp服务器 rtsp server android rtsp服务 安卓rtsp服务器 移动端rtsp服务 大牛直播SDK 虚拟现实 对比 工具 meld DiffMerge 代理服务器 项目部署 grub 版本升级 扩容 SEO hexo 嵌入式系统开发 环境配置 大模型推理 gnu deployment daemonset statefulset cronjob 浏览器自动化 AI Agent 字节智能运维 多端开发 智慧分发 应用生态 鸿蒙OS 云桌面 微软 AD域控 证书服务器 大模型部署 健康医疗 互联网医院 MDK 嵌入式开发工具 论文笔记 sublime text 查看显卡进程 fuser ArtTS 元服务 应用上架 SVN Server tortoise svn Linux权限 权限命令 特殊权限 端口聚合 windows11 vu大文件秒传跨域报错cors HAProxy ABAP Linux find grep 钉钉 物联网开发 CentOS 存储维护 NetApp存储 EMC存储 System V共享内存 进程通信 HiCar CarLife+ CarPlay QT RK3588 docker desktop image MacOS 网络建设与运维 jina 软链接 硬链接 进程优先级 调度队列 进程切换 xpath定位元素 autodl 端口 查看 ss 智能音箱 智能家居 docker部署翻译组件 docker部署deepl docker搭建deepl java对接deepl 翻译组件使用 hosts IMM word 开发 云耀服务器 上传视频文件到服务器 uniApp本地上传视频并预览 uniapp移动端h5网页 uniapp微信小程序上传视频 uniapp app端视频上传 uniapp uview组件库 rpa wpf su sudo wsgiref Web 服务器网关接口 java-rocketmq HarmonyOS NEXT 原生鸿蒙 金仓数据库 2025 征文 数据库平替用金仓 ardunio BLE 抓包工具 Xinference fstab 内网环境 信创 信创终端 中科方德 网卡的名称修改 eth0 ens33 perl react native Python基础 Python教程 Python技巧 合成模型 扩散模型 图像生成 openvpn server openvpn配置教程 centos安装openvpn 极限编程 docker部署Python CentOS Stream OpenHarmony KylinV10 麒麟操作系统 Vmware zip unzip 鸿蒙开发 移动开发 db 网络爬虫 sequoiaDB prometheus数据采集 prometheus数据模型 prometheus特点 多路转接 AI员工 kotlin ssh远程登录 虚幻引擎 virtualbox nvm whistle 问题解决 ubuntu24 vivado24 Sealos 本地化部署 论文阅读 企业网络规划 华为eNSP 浏览器开发 AI浏览器 chrome 浏览器下载 chrome 下载安装 谷歌浏览器下载 WLAN 软件卸载 系统清理 rancher 玩机技巧 软件分享 软件图标 防火墙 NAT转发 NAT Server 烟花代码 烟花 元旦 性能调优 安全代理 Qwen2.5-VL vllm 欧标 OCPP MySql 网络搭建 神州数码 神州数码云平台 云平台 树莓派 VNC nosql PPI String Cytoscape CytoHubba Unity插件 iventoy VmWare OpenEuler harmonyOS面试题 css3 ip协议 MobaXterm ubuntu 18.04 dock 加速 搜狗输入法 中文输入法 像素流送api 像素流送UE4 像素流送卡顿 像素流送并发支持 yolov5 mcp服务器 client close conda配置 conda镜像源 MAC SecureCRT 达梦 DM8 西门子PLC 通讯 mm-wiki搭建 linux搭建mm-wiki mm-wiki搭建与使用 mm-wiki使用 mm-wiki详解 风扇控制软件 接口优化 React Next.js 开源框架 MAVROS 四旋翼无人机 热榜 解决方案 数字证书 签署证书 js 智能电视 安装MySQL vnc 通信工程 毕业 yum换源 Reactor反应堆 开机黑屏 搭建个人相关服务器 电视剧收视率分析与可视化平台 服务器正确解析请求体 离线部署dify IO centos 7 视频平台 录像 视频转发 视频流 macOS