• CVPR2025 | Prompt-CAM: 让视觉 Transformer 可解释以进行细粒度分析

CVPR2025 | Prompt-CAM: 让视觉 Transformer 可解释以进行细粒度分析

2025-05-20 13:01:01 0 阅读

Prompt-CAM: Making Vision Transformers Interpretable for Fine-Grained Analysis

  • 摘要-Abstract
  • 引言-Introduction
  • 方法-Approach
    • 预备知识-Preliminaries
    • Prompt-CAM: Prompt Class Attention Map
    • 特征识别与定位-Trait Identification and Localization
    • 变体与扩展-Variants and Extensions
    • Prompt-CAM 适用于什么?-What is Prompt-CAM suited for?
  • 实验-Experiments
  • 结论-Conclusion



论文链接

GitHub链接

本文 “Prompt-CAM: Making Vision Transformers Interpretable for Fine-Grained Analysis” 提出 Prompt-CAM 方法,旨在使预训练的视觉 Transformer(ViT)可解释以用于细粒度分析。该方法通过学习类特定提示,利用预训练 ViT 的特征,实现细粒度图像分类、特征定位等功能。与其他方法相比,Prompt-CAM 具有简单易实现和训练的优势。在 13 个不同领域的数据集上的实验验证了其卓越的解释能力、广泛的适用性和可扩展性,能有效识别和定位特征,在生物和生态研究等领域具有应用潜力。


摘要-Abstract

We present a simple approach to make pre-trained Vision Transformers (ViTs) interpretable for fine-grained analysis, aiming to identify and localize the traits that distinguish visually similar categories, such as bird species. Pretrained ViTs, such as DINO, have demonstrated remarkable capabilities in extracting localized, discriminative features. However, saliency maps like Grad-CAM often fail to identify these traits, producing blurred, coarse heatmaps that highlight entire objects instead. We propose a novel approach, Prompt Class Attention Map (Prompt-CAM), to address this limitation. Prompt-CAM learns classspecific prompts for a pre-trained ViT and uses the corresponding outputs for classification. To correctly classify an image, the true-class prompt must attend to unique image patches not present in other classes’ images (i.e., traits). As a result, the true class’s multi-head attention maps reveal traits and their locations. Implementation-wise, Prompt-CAM is almost a “free lunch,” requiring only a modification to the prediction head of Visual Prompt Tuning (VPT). This makes Prompt-CAM easy to train and apply, in stark contrast to other interpretable methods that require designing specific models and training processes. Extensive empirical studies on a dozen datasets from various domains (e.g., birds, fishes, insects, fungi, flowers, food, and cars) validate the superior interpretation capability of Prompt-CAM.

我们提出了一种简单的方法,使预训练的视觉 Transformer(ViT)可用于细粒度分析,旨在识别和定位那些能够区分视觉上相似类别的特征,比如鸟类物种。像 DINO 这样的预训练 ViT 在提取局部化的、具有判别力的特征方面展现出了卓越的能力。然而,诸如 Grad-CAM 这样的显著性图往往无法识别这些特征,生成的是模糊、粗糙的热图,只能突出整个物体。我们提出了一种新颖的方法——提示类注意力图(Prompt-CAM),以解决这一局限性。Prompt-CAM 为预训练的 ViT 学习特定类别的提示,并利用相应的输出进行分类。为了正确地对图像进行分类,真实类别的提示必须关注其他类别图像中不存在的独特图像块(即特征)。因此,真实类别的多头注意力图能够揭示特征及其位置。在实现方面,Prompt-CAM 几乎是一种“免费的午餐”,只需要对视觉提示调整(VPT)的预测头进行修改。这使得 Prompt-CAM 易于训练和应用,与其他需要设计特定模型和训练过程的可解释方法形成鲜明对比。在来自不同领域(如鸟类、鱼类、昆虫、真菌、花卉、食物和汽车)的十几个数据集上进行的大量实证研究,验证了 Prompt-CAM 卓越的解释能力。


引言-Introduction

该部分主要阐述了研究背景、现有方法的不足、Prompt-CAM 的提出及优势,具体内容如下:

  1. 研究背景:预训练的视觉 Transformer(ViT)在视觉识别任务中取得显著进展,尤其是在细粒度对象识别方面。像 DINO 和 DINOv2 等模型能够提取局部化且具有丰富信息的特征,为利用预训练 ViT 发现区分相似类别的“特征”提供了可能。
  2. 现有方法的不足
    • 显著性图方法的问题:常用的显著性图方法,如 CAM,在 ViT 上表现不佳。它通常会生成模糊、粗糙的热图,定位整个对象,而不是聚焦于区分相似对象(如鸟类)的细微特征。即便有针对 ViT 的改进变体,问题也仅得到轻微缓解。
    • 注意力图的局限性:ViT 依赖自注意力机制,[CLS] 标记的注意力图虽能突出对象内部区域,但这些区域并非类特定的,常聚焦于不同类别对象的相同身体部位,无法准确区分不同类别。
  3. Prompt-CAM 的提出及优势
    • 方法提出:受相关研究启发,通过为 ViT 提供可学习的“类特定” token 作为提示,这些 token 可通过自注意力机制关注图像 patch,有望突出特定类别的区域,即特征。
    • 方法实现:该方法名为 Prompt Class Attention Map(Prompt-CAM),为预训练 ViT 添加可学习的类特定 token,通过最小化交叉熵损失使其具有类特异性,训练时仅优化这些 token 和共享评分向量,保持预训练 ViT 骨干网络冻结。
    • 优势体现:Prompt-CAM 易于实现和训练,相比其他可解释方法,如 ProtoPNet、ProtoTree 和 INTR 等,具有明显优势。它只需对 Visual Prompt Tuning(VPT)的预测头进行少量修改,无需设计特定模型和复杂训练策略。

      图1. Prompt-CAM 示意图。通过为预训练的视觉 Transformer(ViT)学习类特定提示,Prompt-CAM 实现了多种功能。(a) Prompt-CAM 利用类特定提示的输出对 logits 实现细粒度图像分类。(b) Prompt-CAM 通过可视化真实类提示查询的多头注意力图来实现特征定位。(c) Prompt-CAM 通过可视化其他类提示查询的注意力图来识别物种间共有的特征。(d) Prompt-CAM 可以通过系统地屏蔽最不重要的注意力头,识别每个物种最具判别力的特征(例如,“斯科特拟鹂”独特的黄色胸部和黑色颈部)。详情见2.3小节。

      图2. Prompt-CAM 与视觉提示调整(VPT)的对比。(a) VPT在 [CLS] 标记的输出之上添加预测头,这是使用视觉 Transformer(ViT)进行分类的默认设计。(b) Prompt-CAM 在注入提示的输出之上添加预测头,使这些提示具有类别特异性,从而识别和定位特征。
  4. 实验验证与贡献
    • 实验验证:在多个领域的十几个数据集上对 Prompt-CAM 进行验证,结果表明它能通过多头注意力机制识别类别特征并在图像中定位。
    • 研究贡献:提出了 Prompt-CAM 这一可解释方法,利用预训练 ViT 进行细粒度分析;通过大量实验验证了该方法的解释质量、广泛适用性和可扩展性。

方法-Approach

预备知识-Preliminaries

该部分主要介绍了视觉 Transformer(ViT)的基本结构和输入处理方式,为后续理解 Prompt-CAM 方法奠定基础,具体内容如下:

  1. ViT 的基本结构:一个典型的 ViT 包含 N N N 个 Transformer 层,每个 Transformer 层由多头自注意力(MSA)块、多层感知机(MLP)块,以及层归一化和残差连接等操作组成。
  2. 输入处理:输入图像 I I I 会先被划分为 M M M 个固定大小的 patch。每个 patch 会被投影到 D D D 维特征空间,并添加位置编码,用 e 0 j e_{0}^{j} e0j 表示,其中 1 ≤ j ≤ M 1 leq j leq M 1jM ,所有 patch 的特征按列拼接表示为 E 0 = [ e 0 1 , ⋯   , e 0 M ] ∈ R D × M E_{0}=[e_{0}^{1}, cdots, e_{0}^{M}] in mathbb{R}^{D ×M} E0=[e01,,e0M]RD×M
  3. ViT 的前向传播公式[CLS] 是一个可学习的向量 x 0 ∈ R D x_{0} in mathbb{R}^{D} x0RD ,ViT 的前向传播可以表示为: [ E i , x i ] = L i ( [ E i − 1 , x i − 1 ] ) , i = 1 , ⋯   , N left[E_{i}, x_{i} ight]=L_{i}left(left[E_{i - 1}, x_{i - 1} ight] ight), i = 1, cdots, N [Ei,xi]=Li([Ei1,xi1]),i=1,,N,其中 L i L_{i} Li 表示第 i i i 个 Transformer 层。最终的 x N x_{N} xN 通常用于表示整个图像,并被输入到预测头进行分类。

Prompt-CAM: Prompt Class Attention Map

该部分主要介绍了 Prompt Class Attention Map(Prompt-CAM)的具体实现方式,包括两种变体:Prompt-CAM-Shallow 和 Prompt-CAM-Deep,具体内容如下:

  1. Prompt-CAM-Shallow:给定预训练的 ViT 和有 c c c 个类别的下游分类数据集,引入一组 c c c 个可学习的 D D D 维向量作为提示。这些类特定提示被注入到第一个 Transformer 层 L 1 L_{1} L1,用 p c ∈ R D p^{c} in mathbb{R}^{D} pcRD 表示每个提示( 1 ≤ c ≤ C 1 ≤ c ≤ C 1cC),其按列拼接为 P = [ p 1 , ⋯   , p C ] ∈ R D × C P=[p^{1}, cdots, p^{C}] in mathbb{R}^{D ×C} P=[p1,,pC]RD×C
    则添加提示后的 ViT 前向传播公式为 [ Z 1 , E 1 , x 1 ] = L 1 ( [ P , E 0 , x 0 ] ) left[Z_{1}, E_{1}, x_{1} ight]=L_{1}left(left[P, E_{0}, x_{0} ight] ight) [Z1,E1,x1]=L1([P,E0,x0]),后续层为 [ Z i , E i , x i ] = L i ( [ Z i − 1 , E i − 1 , x i − 1 ] ) , i = 2 , ⋯   , N left[Z_{i}, E_{i}, x_{i} ight]=L_{i}left(left[Z_{i - 1}, E_{i - 1}, x_{i - 1} ight] ight), i = 2, cdots, N [Zi,Ei,xi]=Li([Zi1,Ei1,xi1]),i=2,,N ,其中 Z i Z_{i} Zi 代表 P P P 对应的特征。为使 P P P 具有类特异性,在 ViT 输出 Z N = [ z N 1 , ⋯   , z N C ] Z_{N}=[z_{N}^{1}, cdots, z_{N}^{C}] ZN=[zN1,,zNC] 的基础上使用交叉熵损失。对于 token 的训练样本 ( I , y ∈ { 1 , ⋯   , C } ) (I, y in{1, cdots, C}) (I,y{1,,C}) ,通过 s [ c ] = w ⊤ z N c s[c]=w^{ op} z_{N}^{c} s[c]=wzNc 1 ≤ c ≤ C 1 leq c leq C 1cC w ∈ R D w in mathbb{R}^{D} wRD 为可学习向量 )计算每个类别的 logit,再通过最小化 − l o g ( e x p ( s [ y ] ) ∑ c e x p ( s [ c ] ) ) -log left( rac{exp (s[y])}{sum_{c} exp (s[c])} ight) log(cexp(s[c])exp(s[y])) 来更新 P P P
  2. Prompt-CAM-Deep:Prompt-CAM-Shallow 存在潜在缺陷,早期层特征区分度不足且提示需承担多种功能。Prompt-CAM-Deep 借鉴 VPT-Deep 设计并解耦提示角色。VPT-Deep 给每个层的输入添加可学习提示,在 Prompt-CAM-Deep 中,深层提示的 ViT 公式为 [ Z i , E i , x i ] = L i ( [ P i − 1 , E i − 1 , x i − 1 ] ) , i = 1 , ⋯   , N left[Z_{i}, E_{i}, x_{i} ight]=L_{i}left(left[P_{i - 1}, E_{i - 1}, x_{i - 1} ight] ight), i = 1, cdots, N [Zi,Ei,xi]=Li([Pi1,Ei1,xi1]),i=1,,N.
    这里 Z N Z_{N} ZN 用于分类,最小化交叉熵损失后,最后一层输入的提示 P N − 1 = [ p N − 1 1 , ⋯   , p N − 1 C ] P_{N - 1}=[p_{N - 1}^{1}, cdots, p_{N - 1}^{C}] PN1=[pN11,,pN1C] 具有类特异性,而其他层输入的提示 P i = [ p i 1 , ⋯   , p i C ] P_{i}=[p_{i}^{1}, cdots, p_{i}^{C}] Pi=[pi1,,piC] i = 0 , ⋯   , N − 2 i = 0, cdots, N - 2 i=0,,N2 )保持类无关性。这种方式学习到用于特征定位的类特异性提示和用于适应任务的类无关提示,且类特异性提示仅关注最后一层输入的 patch 特征 E N − 1 E_{N - 1} EN1,解决了 Prompt-CAM-Shallow 的问题。后续内容主要围绕 Prompt-CAM-Deep 展开 。


图3. 提示类注意力图(Prompt-CAM)概述。对于一个有 N N N 层的预训练视觉Transformer(ViT)和一个有 c c c 个类别的下游任务,我们探索了两种变体:(a) Prompt-CAM-Deep:在最后一层的输入中插入 c c c 个可学习的 “类特定 ” token,并在其他 N − 1 N-1 N1 层的每一层输入中插入 c c c 个可学习的 “类无关 ” token;(b) Prompt-CAM-Shallow:在第一层的输入中插入 c c c 个可学习的 “类特定 ” token。在训练过程中,只有提示和预测头被更新;整个 ViT 保持冻结状态。

特征识别与定位-Trait Identification and Localization

该部分主要介绍了 Prompt-CAM-Deep 在特征识别和定位方面的应用,包括预测标签、特征识别、确定最具判别力的特征以及分析错误分类原因,具体内容如下:

  1. 预测标签:在推理阶段,Prompt-CAM-Deep 给定图像 I I I,先提取 patch 嵌入 E 0 = [ e 0 1 , ⋯   , e 0 M ] E_{0}=[e_{0}^{1}, cdots, e_{0}^{M}] E0=[e01,,e0M],然后依据相关公式得到 Z N Z_{N} ZN 和每个类别的分数 s [ c ] s[c] s[c] ,预测标签 y ^ hat{y} y^ 通过公式 y ^ = a r g m a x c ∈ { 1 , ⋯   , C } s [ c ] hat{y}=arg max _{c in{1, cdots, C}} s[c] y^=argmaxc{1,,C}s[c] 确定。
  2. 特征识别:为确定类别 c c c 的特征,收集真实类别和预测类别均为 c c c 的图像,可视化由 p N − 1 c p_{N - 1}^{c} pN1c L N L_{N} LN 层查询得到的多头注意力图。在 L N L_{N} LN 层有 R R R 个注意力头,patch 特征 E N − 1 ∈ R D × M E_{N - 1} in mathbb{R}^{D ×M} EN1RD×M 会被投影成 R R R 个键矩阵 K N − 1 r ∈ R D ′ × M K_{N - 1}^{r} in mathbb{R}^{D' ×M} KN1rRD×M r = 1 , ⋯   , R r = 1, cdots, R r=1,,R ), p N − 1 c p_{N - 1}^{c} pN1c 会被投影成 R R R 个查询向量 q N − 1 c , r ∈ R D r q_{N - 1}^{c, r} in mathbb{R}^{D^{r}} qN1c,rRDr ,第 r r r 个注意力头的注意力图 α N − 1 c , r lpha_{N - 1}^{c, r} αN1c,r 通过公式 α N − 1 c , r = s o f t m a x ( ( K N − 1 r ) T q N − 1 c , r D ′ ) ∈ R M lpha_{N - 1}^{c, r}=softmax( rac{(K_{N - 1}^{r})^{T} q_{N - 1}^{c, r}}{D'}) in mathbb{R}^{M} αN1c,r=softmax(D(KN1r)TqN1c,r)RM计算。从第 r r r 个注意力头的角度看,权重 α N − 1 c , r [ j ] lpha_{N - 1}^{c, r}[j] αN1c,r[j] 表明第 j j j 个 patch 对类别 c c c 分类的重要性,从而定位图像中的特征。通过可视化每个注意力图,Prompt-CAM 最多可识别出 R R R 个不同特征。
  3. 确定最具判别力的特征:对于区分度明显的类别,如 “红翅黑鹂”,少数特征就能将其与其他类别区分开。为自动识别这些最具判别力的特征,采用贪心算法。假设类别 c c c 是真实类别且图像被正确分类,在每个贪心步骤中,对于每个未模糊的注意力头 r ′ r' r ,将 α N − 1 c , r ′ lpha_{N - 1}^{c, r'} αN1c,r 替换为 1 M 1 rac{1}{M} 1 M11 1 ∈ R M 1 in mathbb{R}^{M} 1RM 为全1向量) ,重新计算 s [ c ] s[c] s[c]。使模糊后 s [ c ] s[c] s[c] 最高的注意力头是最不重要的,逐步模糊直到图像被误分类,剩下的注意力图突出的特征就是对分类足够重要的特征。
  4. 分析错误分类原因:当 y ^ ≠ y hat{y} ≠ y y^=y 时,可视化真实类别 y y y 和预测类别 y ^ hat{y} y^ 的注意力图 α N − 1 y , r r = 1 R {lpha_{N - 1}^{y, r}}_{r = 1}^{R} αN1y,rr=1R α N − 1 y ^ , r r = 1 R {lpha_{N - 1}^{hat{y}, r}}_{r = 1}^{R} αN1y^,rr=1R,可分析分类器做出错误预测的原因。例如,可能是类别 y y y 的某些特征在图像 I I I 中不可见或不清晰,或者图像 I I I 中的对象由于光照等条件呈现出类别 y ^ hat{y} y^ 的视觉特征。

变体与扩展-Variants and Extensions

该部分主要介绍了 Prompt-CAM 的设计变体和应用扩展,具体内容如下:

  1. 其他 Prompt-CAM 设计:除了在第一层(Prompt-CAM-Shallow)或最后一层(Prompt-CAM-Deep)注入类特定提示,还探索了两者的插值方式。在第 i i i 层引入类似 Prompt-CAM-Shallow 的类特定提示,并在第 1 1 1 i − 1 i - 1 i1 层引入类似 Prompt-CAM-Deep 的类无关提示,相关比较在补充材料中给出。
  2. Prompt-CAM 用于发现分类学关键特征:在生物学等包含众多细粒度类别的领域,研究人员常构建层次决策树辅助分类,如分类学。分类学中每个中间“树节点”的作用是将一类子集划分为多个组,每个组具有特定的特征(即分类学关键特征)。Prompt-CAM 的简单性使其可高效训练多组提示,用于每个中间树节点,进而有可能重新发现分类学关键特征。在训练前,只需将同一组的类别重新标记为单个标签。预期在从根节点到叶节点的路径上,每个中间树节点能在叶节点的同一图像上关注不同的组级特征。文中给出了初步结果展示其潜力。

Prompt-CAM 适用于什么?-What is Prompt-CAM suited for?

该部分主要探讨了 Prompt-CAM 的适用场景,通过与传统分类器对比,说明了它更适合细粒度分析的原因,具体内容如下:

  1. Prompt-CAM 的设计目的:Prompt-CAM 专注于细粒度分析,旨在识别和定位有助于区分不同类别的特征,但这并不意味着它在细粒度分类准确性上表现卓越。因为现代神经网络参数众多,若模型训练主要追求准确性而无约束,会发现数据中的“捷径”,这些“捷径”虽有助于分类,但不利于分析。
  2. 与传统分类器的对比
    • 传统分类器的问题:传统分类器在 ViT 的基础上使用全连接层进行预测,以一个简化的单头注意力 Transformer 层为例,其预测公式为 y ^ = a r g m a x c w c ⊤ ( ∑ j α ∗ [ j ] × v j ) hat{y} = arg max _{c} w_{c}^{ op}left(sum_{j} lpha^{*}[j] × v^{j} ight) y^=argmaxcwc(jα[j]×vj)。这种公式可能存在“迂回”情况,即模型可以在不依赖有意义的注意力权重的情况下正确分类图像,通过生成整体有区分性但不保留空间分辨率的特征,使 v j v^{j} vj w y w_{y} wy 对齐,即便 α ∗ lpha^{*} α 的值无实际意义,只要满足 softmax 默认的和为1的条件,预测结果也不受影响 。
    • Prompt-CAM 的优势:Prompt-CAM 的预测公式为 y ^ = a r g m a x c w ⊤ ( ∑ j α c [ j ] × v j ) hat{y} = arg max _{c} w^{ op}left(sum_{j} lpha^{c}[j] × v^{j} ight) y^=argmaxcw(jαc[j]×vj),其中 w w w 是共享二进制分类器。这一公式从根本上改变了模型行为,使模型难以在 v j v^{j} vj 的通道中存储类别的区分信息,因为没有 w c w_{c} wc 与之对齐。而且模型不能再生成无空间分辨率的整体特征,否则无法区分不同类别,因为所有类别的分数 s [ c ] s[c] s[c] 会完全相同。
  3. Prompt-CAM 的能力要求:为最小化交叉熵误差,使用 Prompt-CAM 的模型必须具备两种能力:一是生成突出图像判别性 patch(如翅膀上的红色斑点)的局部化特征 v j v^{j} vj;二是生成不同类别的独特注意力权重 α c lpha^{c} αc,每个权重聚焦于该类中常见的特征。这些特性正是细粒度分析所需要的。Prompt-CAM 通过注入类无关提示,从预训练 ViT 的 patch 特征中提取局部化、特定于特征的信息,避免 patch 特征编码类别的整体区分信息。

实验-Experiments

该部分主要介绍了针对 Prompt-CAM 所开展的实验,涵盖实验设置、结果以及进一步的分析讨论,以此验证该方法的性能和效果,具体内容如下:

  1. 实验设置
    • 数据集:选用 13 个来自不同领域的细粒度图像分类数据集,包含以动物为基础的(像 CUB-200-2011、Birds-525 等)、以植物和真菌为基础的(例如 iNaturalist-2021-Fungi、Oxford Flowers 等)以及以物体为基础的(如 Stanford Cars、Food 101)数据集,对其进行数据处理和统计。
    • 模型:采用 DINO、DINOv2 和 BioCLIP 这三种预训练的 ViT 骨干网络,且在应用 Prompt-CAM 时骨干网络保持完全冻结状态,实验主要以 DINO 为主。
    • 基线方法:将 Prompt-CAM 与 Grad-CAM、Layer-CAM、Eigen-CAM 等可解释方法,以及 ProtoPFormer、TesNet、ProtoConcepts、INTR 等可解释模型进行对比。
  2. 实验结果
    • Prompt-CAM 的忠实性:通过使用插入和删除指标进行评估,Prompt-CAM 的插入分数更高(达到0.61),删除分数更低(为0.09),这表明它更专注于图像的判别特征,解释性比标准的事后算法更强。
      表1. 基于插入和删除分数的忠实度评估。插入分数越高且删除分数越低,则表明结果越好。这些结果是使用 DINO 骨干网络对 CUB 的验证图像进行评估得到的。
    • 特征识别(人类评估):通过定量的人类研究评估特征识别质量,参与者对 Prompt-CAM 生成的特征识别率平均达到60.49%,显著优于 TesNet(39.14%)和ProtoConcepts(30.39%),突出了该方法在有效强调和传达相关特征方面的优越性。
    • 分类精度比较:与线性探测相比,Prompt-CAM 的分类精度略有下降。原因在于它依据类特定的局部特征进行分类,当这些特征因遮挡、异常姿态或光照等因素不可见时,就会导致分类失败。例如,在一些图像中,“Red-breasted Grosbeak” 的红色胸部特征难以看见,Prompt-CAM 就会误分类,而线性探测利用全局信息能够正确分类。
      表2. 使用 DINO 骨干网络的准确率(%)对比。


      图5. 被 Prompt-CAM 误分类但被线性探测正确分类的图像。特定物种的特征,比如“玫胸白斑翅雀”的红色胸部,在被误分类的图像中几乎看不见,而线性探测利用身体形状、姿势和背景等全局特征做出正确预测。
    • 与可解释模型的比较:定性分析显示,与其他可解释方法相比,Prompt-CAM 能够捕捉到更广泛、更精细的特征。例如,在对 “Lazuli Bunting” 的图像分析中,它能关注到更多独特的特征,而其他方法的关注点往往较为狭窄或重复。

      图6. 可解释模型的比较。以“蓝翅莺”的示例图像为例,展示了(Prompt-CAM 和 INTR)注意力头的四个最活跃响应或每种方法的原型的可视化演示(热图和边界框)。
  3. 进一步分析和讨论
    • 不同骨干网络上的 Prompt-CAM:实验表明 Prompt-CAM 与不同的 ViT 骨干网络兼容。以“Scott Oriole”的图像为例,使用 DINO、DINOv2 和 BioCLIP 骨干网络时,Prompt-CAM 都能一致地识别出用于物种识别的关键特征。

      图7. 不同骨干网络上的 Prompt-CAM。这里展示了 Prompt-CAM 在(a)DINO、(b)DINOv2和(c)BioCLIP骨干网络上的顶级注意力图。这三组注意力头都指向“斯科特拟鹂”这一物种一致的关键特征——黄色腹部、黑色头部和黑色胸部。
    • 不同数据集上的Prompt-CAM:在不同领域的多个数据集上,Prompt-CAM 都能有效地捕捉到每个物种的重要特征,准确识别物种,展现出良好的泛化性和广泛的适用性。

      图4. PROMPT-CAM 在不同数据集上的可视化结果。我们展示了每个正确分类的测试样本由真实类别触发的前四个注意力图(从左到右)。
    • Prompt-CAM 对特征操作的识别和解释:通过反事实风格的分析,如对 “Red-winged Blackbird” 图像的处理,当去除其红色翅膀斑点后,模型不再将其预测为该物种,而是“Boat-tailed Grackle”,这展示了 Prompt-CAM 对特征差异的敏感性和在细粒度识别中的可解释性。

      图8. 特征操控。顶行展示了一张被正确分类为“红翅黑鹂”的图像的注意力图。第二行中,鸟翅膀上的红色斑点被去除,Prompt-CAM 随后将其分类为“船尾拟八哥”,如参考列所示。
    • Prompt-CAM 检测有意义特征的能力:Prompt-CAM 能够检测出生物学和分类学上有意义的特征。它可以识别同一物种图像中的一致特征,还能通过可视化不同类别的提示来发现物种间的共同特征。在基于层次框架训练时,它能从粗粒度到细粒度地关注不同层次的特征,有助于识别分类学关键特征。

      图9. Prompt-CAM 能够检测出具有分类学意义的特征。以物种“克氏双锯鱼(Amophiprion Clarkii)”的图像为例,Prompt-CAM 会突出显示其腹鳍和双条纹,以便在物种层面将它与“黑背双锯鱼(Amophiprion Melanopus)”区分开来。在属的层面上,Prompt-CAM 会观察身体和尾巴的图案,从而将图像归类到“双锯鱼属(Amophiprion)”。再往上到科的层面,不同鱼类在外观上差异明显。Prompt-CAM 仅需观察尾巴和腹鳍,就能将图像归类到“雀鲷科(Pomacentridae)”。

结论-Conclusion

该部分总结了 Prompt-CAM 方法的核心要点、优势及研究意义,具体内容如下:

  1. 方法概述:提出Prompt Class Attention Map(Prompt-CAM),这是一种简单有效的可解释方法,借助预训练的视觉Transformer(ViT)来识别和定位用于细粒度分类的判别性特征。
  2. 方法优势:Prompt-CAM 易于实施和训练,仅需对视觉提示调整(VPT)的预测头进行修改,使用标准交叉熵损失和随机梯度下降(SGD)算法即可完成训练。
  3. 研究意义:大量实证研究充分验证了 Prompt-CAM 的强大性能,展示了其在将标准模型用于可解释性方面的潜力,为后续相关研究和应用提供了重要的参考和借鉴。

本文地址:https://www.vps345.com/11476.html

搜索文章

Tags

PV计算 带宽计算 流量带宽 服务器带宽 上行带宽 上行速率 什么是上行带宽? CC攻击 攻击怎么办 流量攻击 DDOS攻击 服务器被攻击怎么办 源IP docker 容器 运维 java-rabbitmq java 服务器安全 网络安全策略 防御服务器攻击 安全威胁和解决方案 程序员博客保护 数据保护 安全最佳实践 人工智能 自动化 linux 服务器 centos python 机器学习 深度学习 deepseek DeepSeek-R1 API接口 游戏 云计算 Deepseek Deepseek-R1 大模型 私有化部署 推理模型 网络工程师 网络管理 软考 2024 2024年上半年 下午真题 答案 javascript 前端 chrome edge 数据库 oracle 关系型 安全 分布式 c++ tcp/ip 网络 服务器无法访问 ip地址无法访问 无法访问宝塔面板 宝塔面板打不开 神经网络 计算机视觉 卷积神经网络 开发语言 redis ddos android 网络安全 web安全 DNS harmonyos 华为 镜像源 ubuntu ssh AIGC 人工智能生成内容 Dify 物联网 无人机 机器人 arm开发 架构 https Ubuntu DeepSeek DeepSeek Ubuntu DeepSeek 本地部署 DeepSeek 知识库 DeepSeek 私有化知识库 本地部署 DeepSeek DeepSeek 私有化部署 vue.js audio vue音乐播放器 vue播放音频文件 Audio音频播放器自定义样式 播放暂停进度条音量调节快进快退 自定义audio覆盖默认样式 CH340 单片机 嵌入式硬件 串口驱动 CH341 uart 485 FTP服务器 RTSP xop RTP RTSPServer 推流 视频 数据库系统 flutter Google pay Apple pay conda git npm github ai nlp springsecurity6 oauth2 授权服务器 前后端分离 django nginx 负载均衡 Ollama 模型联网 API CherryStudio Flask FastAPI Waitress Gunicorn uWSGI Uvicorn YOLO pytorch vscode yolov5 php 笔记 C 环境变量 进程地址空间 进程 云原生 iventoy VmWare OpenEuler 信息与通信 mysql 学习 llama 算法 opencv 自然语言处理 语言模型 c语言 gnu unix 网络协议 ROS 自动驾驶 gcc centos 7 操作系统 进程控制 Ubuntu macos pycharm ide 英语 ip协议 agi rpc windows 计算机外设 bug deepseek-r1 大模型本地部署 kubernetes 学习方法 经验分享 程序人生 远程桌面 mcp oracle fusion oracle中间件 MacMini Mac 迷你主机 mini Apple 游戏引擎 Qwen2.5-coder 离线部署 网络结构图 udp prometheus grafana spring boot outlook 错误代码2603 无网络连接 2603 指令 华为云 华为od YOLOv8 NPU Atlas800 A300I pro asi_bench 策略模式 node.js kafka qps 高并发 opengl 阿里云 stm32 mysql离线安装 ubuntu22.04 mysql8.0 ipython 服务器配置 生物信息学 本地环回 bind axure 富文本编辑器 ui ArkUI 鸿蒙系统 ArkTS apache grub 版本升级 扩容 eureka mount挂载磁盘 wrong fs type LVM挂载磁盘 Centos7.9 typescript 鸿蒙 ollama 压力测试 大模型压力测试 EvalScope USB转串口 SRS 流媒体 直播 智能体开发 AI 银河麒麟 jvm 虚拟机 智能路由器 dell服务器 ssh漏洞 ssh9.9p2 CVE-2025-23419 fstab iftop 网络流量监控 adb ip 缓存 科技 个人开发 react next.js 部署 部署next.js microsoft 外网访问 内网穿透 端口映射 程序 编程 内存 性能分析 linux环境变量 spring cloud compose 持续部署 CPU 使用率 系统监控工具 linux 命令 交换机 硬件 设备 GPU PCI-Express 远程工作 Ubuntu20.04 GLIBC 2.35 性能优化 cron crontab日志 AutoDL adobe 面试 职场和发展 tomcat UEFI Legacy MBR GPT U盘安装操作系统 交互 腾讯云 数据分析 react.js 前端面试题 Linux xrdp 远程连接 环境迁移 快捷键 旋转屏幕 自动操作 qt arm gitea ACL 流量控制 基本ACL 规则配置 dify 知识库 本地化部署 cursor FTP 服务器 并查集 leetcode ansible RAID RAID技术 磁盘 存储 vnc http c# asp.net大文件上传 asp.net大文件上传下载 asp.net大文件上传源码 ASP.NET断点续传 devops elasticsearch 华为OD 华为OD机试真题 可以组成网络的服务器 像素流送api 像素流送UE4 像素流送卡顿 像素流送并发支持 svn spring 后端 Linux 维护模式 vue3 excel 在线预览 xlsx xls文件 在浏览器直接打开解析xls表格 前端实现vue3打开excel 文件地址url或接口文档流二进 网络药理学 生信 gromacs 分子动力学模拟 MD 动力学模拟 JDK Java LInux Windows IM即时通讯 QQ 微信 企业微信 剪切板对通 HTML FORMAT ffmpeg 音视频 视频编解码 pip 开源 rdp 远程服务 visualstudio intellij-idea AI编程 jenkins maven rust腐蚀 rocketmq perf k8s dash json 正则表达式 实时音视频 filezilla 无法连接服务器 连接被服务器拒绝 vsftpd 331/530 工具分享 教程 环境搭建 Maven ubuntu 18.04 安装教程 MCP 实时互动 嵌入式 Alexnet burpsuite 安全工具 mac安全工具 burp安装教程 渗透工具 阻塞队列 生产者消费者模型 服务器崩坏原因 大数据 spark hive 灵办AI uni-app 计算机网络 selenium IMM VMware 虚拟现实 glibc 媒体 vite websocket milvus rsyslog centos-root /dev/mapper yum clean all df -h / du -sh 串口服务器 mcu 数据结构 目标检测 雨云 NPS virtualenv C语言 gitlab unity gitee matplotlib fonts-noto-cjk 开发环境 fastapi mcp-proxy mcp-inspector fastapi-mcp agent sse pygame debian PVE postman 测试工具 list live555 rtsp rtp 自定义客户端 SAS flask word图片自动上传 word一键转存 复制word图片 复制word图文 复制word公式 粘贴word图文 粘贴word公式 Doris搭建 docker搭建Doris Doris搭建过程 linux搭建Doris Doris搭建详细步骤 Doris部署 jellyfin nas 浪潮信息 AI服务器 数据挖掘 kylin vim 多线程服务器 Linux网络编程 zabbix mariadb 爬虫 ssl cpu 实时 使用 nohup 异步执行 电脑 NVML nvidia-smi aws 建站 图像处理 rtsp服务器 rtsp server android rtsp服务 安卓rtsp服务器 移动端rtsp服务 大牛直播SDK 私有化 本地部署 DeepSeek Chatbox jupyter mongodb samba jar sql GPU环境配置 Ubuntu22 CUDA PyTorch Anaconda安装 AI-native gpt 课程设计 efficientVIT YOLOv8替换主干网络 TOLOv8 firewall IIS .net core Hosting Bundle .NET Framework vs2022 IIS服务器 IIS性能 日志监控 llm transformer mac ollama api ollama外网访问 命名管道 客户端与服务端通信 进程程序替换 execl函数 execv函数 execvp函数 execvpe函数 putenv函数 ubuntu20.04 开机黑屏 虚拟显示器 远程控制 VMware安装mocOS macOS系统安装 上传视频文件到服务器 uniApp本地上传视频并预览 uniapp移动端h5网页 uniapp微信小程序上传视频 uniapp app端视频上传 uniapp uview组件库 rust stm32项目 宝塔面板访问不了 宝塔面板网站访问不了 宝塔面板怎么配置网站能访问 宝塔面板配置ip访问 宝塔面板配置域名访问教程 宝塔面板配置教程 linux驱动开发 微信小程序 zotero WebDAV 同步失败 代理模式 反向代理 AI大模型 大模型技术 本地部署大模型 QT 5.12.12 QT开发环境 Ubuntu18.04 cuda Qualcomm WoS Python QNN AppBuilder 大语言模型 LLMs 一切皆文件 EtherNet/IP串口网关 EIP转RS485 EIP转Modbus EtherNet/IP网关协议 EIP转RS485网关 EIP串口服务器 集成学习 集成测试 高级IO epoll nvm bash remote-ssh C# MQTTS 双向认证 emqx 虚拟局域网 wsl maxkb ARG 统信 国产操作系统 虚拟机安装 前端框架 冯诺依曼体系 EtherCAT转Modbus EtherCAT转485网关 ECT转485串口服务器 ECT转Modbus485协议 ECT转Modbus串口网关 ECT转Modbus串口服务器 孤岛惊魂4 LDAP iot golang hadoop asm JAVA grep 多层架构 解耦 ros ros1 Noetic 20.04 apt 安装 微信分享 Image wxopensdk 镜像下载 freebsd gpu算力 VMware Tools vmware tools安装 vmwaretools安装步骤 vmwaretools安装失败 vmware tool安装步骤 vm tools安装步骤 vm tools安装后不能拖 vmware tools安装步骤 Hyper-V WinRM TrustedHosts TCP WebServer 华为认证 计算生物学 生物信息 基因组 Kali Linux 黑客 渗透测试 信息收集 VM搭建win2012 win2012应急响应靶机搭建 攻击者获取服务器权限 上传wakaung病毒 应急响应并溯源 挖矿病毒处置 应急响应综合性靶场 HarmonyOS Next DevEco Studio 目标跟踪 OpenVINO 推理应用 ssrf 失效的访问控制 ue4 着色器 ue5 虚幻 postgresql chatgpt oneapi Ubuntu 22.04 MySql 算家云 算力租赁 区块链 行情服务器 股票交易 速度慢 切换 股票量化接口 股票API接口 网易邮箱大师 运维开发 webdav 系统安全 miniapp 真机调试 调试 debug 断点 网络API请求调试方法 pillow eclipse 知识图谱 LLM 大模型教程 直播推流 编辑器 防火墙 端口号 开放端口 访问列表 驱动开发 C++ python2 ubuntu24.04 Cursor 1024程序员节 升级 CVE-2024-7347 漏洞 小程序 微信小程序域名配置 微信小程序服务器域名 微信小程序合法域名 小程序配置业务域名 微信小程序需要域名吗 微信小程序添加域名 WSL2 IP 地址 MobaXterm 文件传输 硬件工程 链表 openvpn server openvpn配置教程 centos安装openvpn windows 服务器安装 vr web3.py odoo 服务器动作 Server action .netcore rag ragflow 大模型部署 ip命令 新增网卡 新增IP 启动网卡 温湿度数据上传到服务器 Arduino HTTP 多线程 tcp 安卓模拟器 oceanbase 传统数据库升级 银行 shell 磁盘监控 嵌入式实习 Hive环境搭建 hive3环境 Hive远程模式 arkUI arkTs 命令 Ubuntu22.04 虚拟化 开发人员主页 flash-attention 报错 Trae IDE AI 原生集成开发环境 Trae AI 系统架构 go file server http server web server GaN HEMT 氮化镓 单粒子烧毁 辐射损伤 辐照效应 KingBase Cline open webui burp suite 抓包 WLAN Kylin-Server 服务器安装 Maxkb RAG技术 本地知识库 rc.local 开机自启 systemd 麒麟 Mermaid 可视化图表 自动化生成 智能手机 Linux无人智慧超市 LInux多线程服务器 QT项目 LInux项目 单片机项目 智能体 autogen openai coze Agent CrewAI 大文件分片上传断点续传及进度条 如何批量上传超大文件并显示进度 axios大文件切片上传详细教 node服务器合并切片 vue3大文件上传报错提示错误 vu大文件秒传跨域报错cors iTerm2 cnn ufw express p2p protobuf 序列化和反序列化 安装 mock mock server 模拟服务器 mock服务器 Postman内置变量 Postman随机数据 常用命令 文本命令 目录命令 监控k8s集群 集群内prometheus ci/cd 代码规范 big data PX4 聚类 vmware 卡死 openEuler ai小智 语音助手 ai小智配网 ai小智教程 智能硬件 esp32语音助手 diy语音助手 matlab windwos防火墙 defender防火墙 win防火墙白名单 防火墙白名单效果 防火墙只允许指定应用上网 防火墙允许指定上网其它禁止 sqlserver Invalid Host allowedHosts vue 毕设 安全威胁分析 powerpoint 电子信息 通信工程 毕业 kernel 云电竞 云电脑 todesk MacOS录屏软件 Linux Vim 实战案例 信号处理 tcpdump ESP32 jdk frp MCP server C/S xcode visual studio code googlecloud Linux PID vSphere vCenter 软件定义数据中心 sddc jmeter 软件测试 webrtc openjdk dubbo ocr 硬件架构 gateway Clion Nova ResharperC++引擎 Centos7 远程开发 java-ee pdf chatbox 其他 王者荣耀 html5 firefox 管道 匿名管道 vm css css3 录音麦克风权限判断检测 录音功能 录音文件mp3播放 小程序实现录音及播放功能 RecorderManager 解决录音报错播放没声音问题 linuxdeployqt 打包部署程序 appimagetool 安卓 java-rocketmq KylinV10 麒麟操作系统 Vmware kali 共享文件夹 7z notepad 桥接模式 windows虚拟机 虚拟机联网 大模型应用 GCC aarch64 编译安装 HPC Redis Desktop ECT转Modbus协议 EtherCAT转485协议 ECT转Modbus网关 3d 数学建模 实验 etcd 数据安全 RBAC HP Anyware openssl 程序员创富 网络爬虫 es6 qt6.3 g726 ruoyi 软件需求 vasp安装 话题通信 服务通信 智慧农业 开源鸿蒙 团队开发 券商 股票交易接口api 类型 特点 intellij idea sublime text numpy kotlin android studio iphone 中间件 iis 蓝桥杯C++组 蓝桥杯 源码剖析 rtsp实现步骤 流媒体开发 硅基流动 ChatBox 磁盘挂载 新盘添加 partedUtil 高效日志打印 串口通信日志 服务器日志 系统状态监控日志 异常记录日志 yolov8 读写锁 大模型入门 termux IPMI DigitalOcean GPU服务器购买 GPU服务器哪里有 GPU服务器 SSH Xterminal ecmascript nextjs reactjs 压测 ECS NFS camera Arduino 国产数据库 瀚高数据库 数据迁移 下载安装 程序员 进程优先级 调度队列 进程切换 MQTT 消息队列 localhost 大模型微调 yum docker-compose docker compose DevOps 软件交付 数据驱动 应用场景 思科 桌面环境 移动端开发 智能合约 哈希算法 高效I/O RDP diskgenius clickhouse Docker Desktop python3.11 pyside6 界面 热榜 回显服务器 UDP的API使用 macbook springboot CNNs 图像分类 RustDesk自建服务器 rustdesk服务器 docker rustdesk html shell脚本免交互 expect linux免交互 web kubeless lighttpd安装 Ubuntu配置 Windows安装 性能测试 服务器优化 执法记录仪 智能安全帽 smarteye rustdesk 微服务 HTML audio 控件组件 vue3 audio音乐播放器 Audio标签自定义样式默认 vue3播放音频文件音效音乐 自定义audio播放器样式 播放暂停调整声音大小下载文件 CPU 主板 电源 网卡 系统 黑苹果 zip unzip n8n 工作流 ios 昇腾 大模型训练/推理 推理问题 mindie 考试 linux内核 alias unalias 别名 conda配置 conda镜像源 远程过程调用 Windows环境 VSCode gpt-3 多产物 mac设置host 文心一言 Dell R750XS 联网 easyconnect 代理 VMware安装Ubuntu Ubuntu安装k8s iperf3 带宽测试 r语言 数据可视化 源码 毕业设计 混合开发 环境安装 用户管理 僵尸进程 .net DocFlow 测试用例 功能测试 redhat k8s集群资源管理 云原生开发 webgl Carla 智能驾驶 v10 软件 Linux的权限 TrueLicense Netty NAS 海康 监控k8s 监控kubernetes ShapeFile GeoJSON Nginx Docker Hub docker pull daemon.json 安全漏洞 信息安全 搜索引擎 全文检索 图搜索算法 数据集 rabbitmq 网卡的名称修改 eth0 ens33 AnythingLLM AnythingLLM安装 信息可视化 echarts 视频监控 网站 NAT转发 NAT Server edge浏览器 高德地图 鸿蒙接入高德地图 HarmonyOS5.0 Termux Samba harmonyOS面试题 WebVM 计算机系统 网络编程 MAVROS 四旋翼无人机 基础环境 自动化运维 流水线 脚本式流水线 rpa GPU训练 Linux24.04 deepin stable diffusion 游戏程序 Mac软件 photoshop nuxt3 cmos SSE database docker run 数据卷挂载 交互模式 软件工程 软件构建 laravel 自动化编程 openwrt make命令 makefile文件 visual studio selete scikit-learn 沙盒 镜像 ros2 moveit 机器人运动 rancher 软件卸载 系统清理 vscode 1.86 pyicu elk 进程信号 产品经理 mamba Vmamba Docker引擎已经停止 Docker无法使用 WSL进度一直是0 镜像加速地址 软件开发 信任链 export import save load 迁移镜像 Attention NLP ROS2 低代码 单例模式 zookeeper 豆瓣 追剧助手 迅雷 网络用户购物行为分析可视化平台 大数据毕业设计 弹性计算 云服务器 裸金属服务器 弹性裸金属服务器 隐藏文件 图论 xml zerotier unity3d 拓扑图 5G H3C 锁屏不生效 dns openstack Xen KVM db VMware创建虚拟机 EVE-NG nftables 具身智能 Isaac Sim 虚拟仿真 Linux权限 权限命令 特殊权限 云服务 HCIE 数通 Windsurf Office c ftp服务 文件上传 TRAE 日志分析 系统取证 SecureCRT sublime text3 bcompare Beyond Compare P2P HDLC netty 个人博客 initramfs Linux内核 Grub kamailio sip VoIP ICMP 框架搭建 gradle GRE 政务 分布式系统 监控运维 Prometheus Grafana React Next.js 开源框架 深度求索 私域 动静态库 云计算面试题 中兴光猫 换光猫 网络桥接 自己换光猫 ukui 麒麟kylinos openeuler 数码 联机 僵尸毁灭工程 游戏联机 开服 SSH 密钥生成 SSH 公钥 私钥 生成 主从复制 VPS fpga开发 kylin v10 麒麟 v10 iBMC UltraISO 推荐算法 kvm seatunnel 腾讯云大模型知识引擎 env 变量 tar WSL resolv.conf 笔灵AI AI工具 计算机科学与技术 域名服务 DHCP 符号链接 配置 WebRTC K8S k8s管理系统 换源 国内源 Debian 聊天服务器 套接字 客户端 Socket autoware vmamba mysql安装报错 windows拒绝安装 开发 内网渗透 靶机渗透 docker搭建nacos详解 docker部署nacos docker安装nacos 腾讯云搭建nacos centos7搭建nacos Reactor 设计模式 nohup后台启动 sysctl.conf vm.nr_hugepages 进程间通信 单一职责原则 DrissionPage trae ECS服务器 VPN wireguard 显示器 YOLOv12 su sudo sudo原理 su切换 HiCar CarLife+ CarPlay QT RK3588 服务器数据恢复 数据恢复 存储数据恢复 raid5数据恢复 磁盘阵列数据恢复 分析解读 银河麒麟操作系统 国产化 EMQX 通信协议 nvidia langchain deep learning sqlite3 物联网开发 安装MySQL kind firewalld ESXi WSL2 上安装 Ubuntu 源代码管理 arcgis web3 区块链项目 api wps 显卡驱动持久化 GPU持久化 内网环境 语音识别 pyautogui 大文件秒传跨域报错cors AD域 ragflow 源码启动 Mac内存不够用怎么办 迁移指南 threejs 3D lvm 磁盘分区 onlyoffice Trae叒更新了? windows日志 cudnn anaconda bot Docker 宝塔 服务器扩容没有扩容成功 矩阵 教育电商 创意 社区 MS Materials 京东云 Docker Compose Kubernetes 宝塔面板无法访问 电路仿真 multisim 硬件工程师 硬件工程师学习 电路图 电路分析 仪器仪表 keepalived OpenCore umeditor粘贴word ueditor粘贴word ueditor复制word ueditor上传word图片 ueditor导入word ueditor导入pdf ueditor导入ppt fork wait waitpid exit 工具 Claude Desktop Claude MCP Windows Cli MCP 状态管理的 UDP 服务器 Arduino RTOS win11 无法解析服务器的名称或地址 IP配置 netplan 服务器部署 本地拉取打包 armbian u-boot 可信计算技术 linux上传下载 论文阅读 nacos 密码学 deepseak 豆包 KIMI 腾讯元宝 webpack 设置代理 实用教程 大屏端 ftp 离线部署dify 键盘 Kali 渗透 智能电视 权限 嵌入式系统开发 互信 k8s部署 MySQL8.0 高可用集群(1主2从) UOS 统信操作系统 LLM Web APP Streamlit WebUI DeepSeek V3 统信UOS bonding 链路聚合 GameFramework HybridCLR Unity编辑器扩展 自动化工具 需求分析 提示词 电脑桌面出现linux图标 电脑桌面linux图标删除不了 电脑桌面Liunx图标删不掉 linux图标删不掉 弹性服务器 llama3 Chatglm 开源大模型 log4j 图文教程 VMware虚拟机 macOS系统安装教程 macOS最新版 虚拟机安装macOS Sequoia Web应用服务器 飞腾处理器 程序化交易 量化交易 高频交易 计算机 CUPS 打印机 Qt5 prometheus数据采集 prometheus数据模型 prometheus特点 安防软件 HistoryServer Spark YARN jobhistory iDRAC R720xd Xinference RAGFlow WINCC 网络文件系统 docker命令大全 x64 SIGSEGV xmm0 mq 服务器ssl异常解决 概率论 考研 命令行 基础入门 mybatis X11 Xming 浏览器自动化 rtc NVM Node Yarn PM2 分布式账本 共识算法 打不开xxx软件 无法检查其是否包含恶意软件 银河麒麟服务器操作系统 系统激活 uni-file-picker 拍摄从相册选择 uni.uploadFile H5上传图片 微信小程序上传图片 embedding mvc 相机 在线office Open WebUI 云桌面 微软 AD域控 证书服务器 FunASR ASR playbook 剧本 HarmonyOS Tabs组件 TabContent TabBar TabsController 导航页签栏 滚动导航栏 esp32 蓝牙 Pyppeteer Playwright RoboVLM 通用机器人策略 VLA设计哲学 vlm fot robot 视觉语言动作模型 交叉编译 chrome 浏览器下载 chrome 下载安装 谷歌浏览器下载 博客 g++ g++13 玩机技巧 软件分享 软件图标 rime minio 鲲鹏 npu jetty undertow Claude 大模型面经 大模型学习 deepseek-v3 ktransformers 远程登录 telnet OD机试真题 服务器能耗统计 ebpf uprobe 显示管理器 lightdm gdm 输入法 Ubuntu Server Ubuntu 22.04.5 uv webstorm shard 智能音箱 智能家居 动态规划 飞牛NAS 飞牛OS MacBook Pro 邮件APP 免费软件 MNN Qwen scapy 游戏机 minicom 串口调试工具 即时通信 NIO 强制清理 强制删除 mac废纸篓 SWAT 配置文件 服务管理 网络共享 MQTT协议 消息服务器 代码 gaussdb dba dns是什么 如何设置电脑dns dns应该如何设置 less mm-wiki搭建 linux搭建mm-wiki mm-wiki搭建与使用 mm-wiki使用 mm-wiki详解 DeepSeek行业应用 Heroku 网站部署 小番茄C盘清理 便捷易用C盘清理工具 小番茄C盘清理的优势尽显何处? 教你深度体验小番茄C盘清理 C盘变红?!不知所措? C盘瘦身后电脑会发生什么变化? 半虚拟化 硬件虚拟化 Hypervisor USB网络共享 micropython mqtt Ark-TS语言 ssh远程登录 技术 Typore 3GPP 卫星通信 浏览器开发 AI浏览器 TCP服务器 qt项目 qt项目实战 qt教程 腾讯云服务器 轻量应用服务器 linux系统入门 linux命令 国标28181 监控接入 语音广播 流程 SIP SDP RAGFLOW 机架式服务器 1U工控机 国产工控机 算力 高效远程协作 TrustViewer体验 跨设备操作便利 智能远程控制 etl hibernate 网络攻击模型 图形化界面 支持向量机 nac 802.1 portal 重启 排查 系统重启 日志 原因 切换root 社交电子 MAC 云耀服务器 开机自启动 桌面快捷方式 文件存储服务器组件 环境配置 免密 登录 公钥 私钥 直流充电桩 充电桩 Ubuntu共享文件夹 共享目录 Linux共享文件夹 gunicorn dity make okhttp junit wireshark 显示过滤器 Wireshark安装 CLion W5500 OLED u8g2 充电桩平台 充电桩开源平台 SEO copilot wsl2 vsxsrv 文件系统 路径解析 LLaMA-Factory retry 重试机制 prompt AI提示词优化 宝塔面板 同步 备份 Ubuntu 24 常用命令 Ubuntu 24 Ubuntu vi 异常处理 k8s资源监控 annotations自动化 自动化监控 监控service 监控jvm 端口开放 Github加速 Mac上Github加速 Chrome浏览器插件 docker desktop 网络穿透 PPI String Cytoscape CytoHubba Nuxt.js ajax netlink libnl3 DBeaver 数据仓库 kerberos ping++ 系统开发 binder 车载系统 framework 源码环境 top Linux top top命令详解 top命令重点 top常用参数 CORS 跨域 docker搭建pg docker搭建pgsql pg授权 postgresql使用 postgresql搭建 NFC 近场通讯 智能门锁 免费 视觉检测 恒源云 Ardupilot 线程 cfssl 大版本升 升级Ubuntu系统 能力提升 面试宝典 IT信息化 机柜 1U 2U 医疗APP开发 app开发 边缘计算 移动云 CDN 监控 csrf CentOS Stream CentOS 信号 code-server mosquitto c/s 框架 IO Kylin OS DIFY ubuntu安装 linux入门小白 隐藏目录 管理器 通配符 EMUI 回退 降级 Reactor反应堆 AISphereButler AI代码编辑器 大数据平台 linux安装配置 nfs 网页设计 yaml Ultralytics 可视化 AimRT 跨域请求 massa sui aptos sei 显卡驱动 影刀 wordpress 黑客技术 序列化反序列化 gitee go 单元测试 IPv4 子网掩码 公网IP 私有IP pyqt 金融 java-zookeeper springboot容器部署 springboot容器化部署 微服务容器化负载均衡配置 微服务容器多节点部署 微服务多节点部署配置负载均衡 sdkman cpp-httplib 底层实现 opensearch helm MVS 海康威视相机 卸载 列表 服务器主板 AI芯片 rclone AList fnOS 产测工具框架 IMX6ULL 管理框架 powerbi 空间 查错 Linux的基础指令 ux 树莓派 VNC 向日葵 RTMP 应用层 Echarts图表 折线图 柱状图 异步动态数据 鸿蒙开发 可视化效果 IPMITOOL BMC 硬件管理 opcua opcda KEPServer安装 磁盘清理 string模拟实现 深拷贝 浅拷贝 经典的string类问题 三个swap 游戏服务器 TrinityCore 魔兽世界 实时内核 跨平台 springboot远程调试 java项目远程debug docker远程debug java项目远程调试 springboot远程 代码调试 ipdb 开源软件 lio-sam SLAM 雨云服务器 金仓数据库 2025 征文 数据库平替用金仓 金仓数据库概述 金仓数据库的产品优化提案 token sas safari SVN Server tortoise svn 群晖 文件分享 pppoe radius 多进程 终端 Node-Red 编程工具 流编程 Masshunter 质谱采集分析软件 使用教程 科研软件 远程看看 远程协助 AP配网 AK配网 小程序AP配网和AK配网教程 WIFI设备配网小程序UDP开 ubuntu24.04.1 服务器部署ai模型 生活 自学笔记 小米 澎湃OS Android lsb_release /etc/issue /proc/version uname -r 查看ubuntu版本 word 负载测试 workflow 三级等保 服务器审计日志备份 element-ui 上传视频并预览视频 vue上传本地视频及进度条功能 vue2选择视频上传到服务器 upload上传视频组件插件 批量上传视频 限制单个上传视频 c/c++ 串口 ldap 图片增强 增强数据 iNode Macos rnn 安全架构 fd 文件描述符 流式接口 宠物 免费学习 宠物领养 宠物平台 小艺 Pura X 软链接 硬链接 小智 模拟实现 ArkTs 数据采集 Crawlee Cookie 7-zip SenseVoice ShenTong PyQt PySide6 网工 systemctl composer WireGuard 异地组网 perl ELF加载 Portainer搭建 Portainer使用 Portainer使用详解 Portainer详解 Portainer portainer chromium dpi AI写作 asp.net上传文件夹 asp.net上传大文件 .net core断点续传 .net mvc断点续传 yum源切换 更换国内yum源 音乐服务器 Navidrome 音流 springcloud cmake Unity Dedicated Server Host Client 无头主机 分子对接 autodock mgltools PDB PubChem 飞牛nas fnos Docker快速入门 授时服务 北斗授时 DeepSeek r1 服务器管理 配置教程 网站管理 cd 目录切换 玩游戏 CosyVoice 健康医疗 设备树 OpenManus 版本 thingsboard 华为证书 HarmonyOS认证 华为证书考试 视频平台 录像 视频转发 视频流 Bug解决 Qt platform OpenCV 华为机试 相差8小时 UTC 时间 工业4.0 apt 远程 执行 sshpass 操作 xshell termius iterm2 harmonyosnext neo4j 数据库开发 数据库架构 ArcTS ArcUI GridItem js 微信公众平台 微信开放平台 微信公众号配置 beautifulsoup 办公自动化 pdf教程 ollama下载加速 xpath定位元素 我的世界 我的世界联机 终端工具 远程工具 EasyConnect fpga Webserver 异步 双系统 加解密 Yakit yaklang 自动化测试 Wi-Fi linux 命令 sed 命令 curl wget vscode1.86 1.86版本 ssh远程连接 servlet OpenHarmony 自动化任务管理 代理服务器 Web服务器 多线程下载工具 PYTHON 上传视频至服务器代码 vue3批量上传多个视频并预览 如何实现将本地视频上传到网页 element plu视频上传 ant design vue vue3本地上传视频及预览移除 hosts hosts文件管理工具 网络原理 RagFlow RAG tensorflow llamafactory 微调 内核 强化学习 Xshell SSL证书 DenseNet Linux awk awk函数 awk结构 awk内置变量 awk参数 awk脚本 awk详解 小游戏 五子棋 深度优先 并集查找 换根法 树上倍增 client-go k8s二次开发 AI作画 LVM lvresize 磁盘扩容 pvcreate 蓝耘科技 元生代平台工作流 ComfyUI ruby nano pgpool 端口测试 田俊楠 wpf Dell HPE 联想 浪潮 对比 meld DiffMerge ubuntu24 vivado24 聊天室 裸机装机 linux磁盘分区 裸机安装linux 裸机安装ubuntu 裸机安装kali 裸机 免费域名 域名解析 linux子系统 忘记密码 regedit 开机启动 OpenManage 稳定性 看门狗 virtualbox muduo 配置原理 脚本 Charles Sealos Jellyfin node 怎么卸载MySQL MySQL怎么卸载干净 MySQL卸载重新安装教程 MySQL5.7卸载 Linux卸载MySQL8.0 如何卸载MySQL教程 MySQL卸载与安装 vllm pxe Helm k8s集群 PostgreSQL15数据库 fiddler Python基础 Python教程 Python技巧 #影刀RPA# 实习 网站搭建 serv00 miniconda Linux环境 自定义登录信息展示 motd 美化登录 pycharm安装 大模型推理 VGG网络 卷积层 池化层 材料工程 qemu libvirt jdk11安装 jdk安装 openjdk11 openjdk11安装 磁盘镜像 服务器镜像 服务器实时复制 实时文件备份 能源 swift GoogLeNet IPv4/IPv6双栈 双栈技术 网路规划设计 ensp综合实验 IPv4过渡IPv6 IPv4与IPv6 繁忙 服务器繁忙 解决办法 替代网站 汇总推荐 AI推理 电视剧收视率分析与可视化平台 HTTP 服务器控制 ESP32 DeepSeek Zoertier 内网组网 mapreduce 银河麒麟桌面操作系统 增强现实 沉浸式体验 技术实现 案例分析 AR deepseek r1 问题解决 可执行程序 idea saltstack 思科模拟器 Cisco Linux find grep 虚幻引擎 can 线程池 GPUGEEK sqlite 模拟退火算法 物理地址 页表 虚拟地址 阿里云ECS YashanDB 崖山数据库 yashandb SoC Obsidian Dataview 性能调优 安全代理 流程图 mermaid 技能大赛 文件共享 UDP 银河麒麟高级服务器 外接硬盘 Kylin MinIO 计算机学习路线 编程语言选择 accept eNSP 网络规划 VLAN 企业网络 星河版 HarmonyOS NEXT 原生鸿蒙 软件商店 信创 livecd systemtools chfs ubuntu 16.04 Apache Beam 批流统一 案例展示 数据分区 容错机制 网页服务器 web服务器 工厂方法模式 searxng 火绒安全 logstash 内网服务器 内网代理 内网通信 NTP服务器 pthread lvs archlinux kde plasma 本地部署AI大模型 论文笔记 检索增强生成 文档解析 大模型垂直应用 飞书 comfyui comfyui教程 uniapp 百度云 矩池云 数据下载 数据传输 备选 调用 示例 TCP协议 抗锯齿 欧拉系统 postgres Dify重启后重新初始化 致远OA OA服务器 服务器磁盘扩容 子系统 互联网医院 GRUB引导 Linux技巧 医院门诊管理系统 Logstash 日志采集 信创终端 中科方德 商用密码产品体系 动态库 GCC编译器 -fPIC -shared 模拟器 业界资讯 无法访问wordpess后台 打开网站页面错乱 linux宝塔面板 wordpress更换服务器 web开发 XCC Lenovo 导航栏 ceph 匿名FTP 邮件传输代理 SSL支持 chroot监狱技术 lb 协议 wsgiref Web 服务器网关接口 glm4 dock 加速 anythingllm open-webui docker国内镜像 SSL 域名 skynet 嵌入式Linux IPC ai工具 做raid 装系统 Java Applet URL操作 服务器建立 Socket编程 网络文件读取 LORA 多端开发 智慧分发 应用生态 鸿蒙OS 容器技术 企业风控系统 互联网反欺诈 DDoS攻击 SQL注入攻击 恶意软件和病毒攻击 Python学习 Python编程 软考设计师 中级设计师 SQL 软件设计师 URL jina 项目部署到linux服务器 项目部署过程 cocos2d 3dcoat h.264 创业创新 数据库管理 ranger MySQL8.0 MI300x seleium chromedriver 顽固图标 启动台 open Euler dde 端口聚合 windows11 android-studio 达梦 DM8 crosstool-ng hdc 惠普服务器 惠普ML310e Gen8 惠普ML310e Gen8V2 Radius PTrade QMT 量化股票 历史版本 下载 System V共享内存 进程通信 飞牛 软负载 mybase #STC8 #STM32 image 端口 查看 ss swoole vpn 无桌面 风扇控制软件 内存管理 GIS 遥感 WebGIS Alist mount 挂载 网盘 fast SPI banner 联想开天P90Z装win10 用户缓冲区 多个客户端访问 IO多路复用 TCP相关API openvino 支付 微信支付 开放平台 bootstrap notepad++ llama.cpp autodl Linux的基础开发工具 xfce easyui 运维监控 可用性测试 宕机切换 服务器宕机 OpenGL 图形渲染 cocoapods IMX317 MIPI H265 VCU idm vue-i18n 国际化多语言 vue2中英文切换详细教程 如何动态加载i18n语言包 把语言json放到服务器调用 前端调用api获取语言配置文件 VR手套 数据手套 动捕手套 动捕数据手套 钉钉 数据管理 数据治理 数据编织 数据虚拟化 IPv6 IPv6测试 IPv6测速 IPv6检测 IPv6查询 solidworks安装 av1 电视盒子 机顶盒ROM 魔百盒刷机 抓包工具 代码托管服务 MDK 嵌入式开发工具 trea sonoma 自动更新 finebi gru broadcom 轮播图 qt5 客户端开发 XFS xfs文件系统损坏 I_O error es NLP模型 UOS1070e bat d3d12 源代码 服务网格 istio AD 域管理 risc-v chrome devtools 佛山戴尔服务器维修 佛山三水服务器维修 docker部署Python rsync 我的世界服务器搭建 合成模型 扩散模型 图像生成 Bandizip Mac解压 Mac压缩 压缩菜单 docker部署翻译组件 docker部署deepl docker搭建deepl java对接deepl 翻译组件使用 cpolar 定义 核心特点 优缺点 适用场景 Spring Security 技术共享 bigdata 线性代数 电商平台 毕昇JDK SysBench 基准测试 服务器时间 ecm bpm 实时云渲染 云渲染 3D推流 Qwen3 qwen3 32b csrutil mac恢复模式进入方法 恢复模式 pyscenic 生信教程 SSH 服务 SSH Server OpenSSH Server 备份SQL Server数据库 数据库备份 傲梅企业备份网络版 Minecraft DOIT 四博智联 SystemV GeneCards OMIM TTD Ubuntu 24.04.1 轻量级服务器 静态IP 三次握手 手机 brew mcp协议 go-zero mcp服务器 查看显卡进程 fuser ArtTS 存储维护 NetApp存储 EMC存储 whistle 计算虚拟化 弹性裸金属 漏洞报告生成 超融合 Web3 Telegram bert Async注解 网络库 yum换源 ISO镜像作为本地源 蜂窝网络 频率复用 射频单元 无线协议接口RAN 主同步信号PSS 游戏开发 docker search Multi-Agent 移动魔百盒 figma 接口返回 VM虚拟机 Erlang OTP gen_server 热代码交换 事务语义 MLLMs VLM gpt-4v minecraft hugo 制造 Python 视频爬取教程 Python 视频爬取 Python 视频教程 Qt QModbus xss client close 粘包问题 AI agent react native 查询数据库服务IP地址 SQL Server easyTier 组网 分布式训练 NVIDIA 线程同步 线程互斥 条件变量 LVS 环境 非root 本地知识库部署 DeepSeek R1 模型 paddle Modbus TCP 根服务器 finalsheel proxy模式 烟花代码 烟花 元旦 CPU架构 服务器cpu 青少年编程 网络建设与运维 网络搭建 神州数码 神州数码云平台 云平台 navicat UFW web环境 规格说明书 vmware tools 多路转接 输入系统 deekseek homeassistant win向maOS迁移数据 北亚数据恢复 oracle数据恢复 搭建个人相关服务器 qtcreator devmem h.265 项目部署 动态域名 Headless Linux watchtower Putty 花生壳 OpenSSH 设计规范 RK3568 flink vue在线预览excel和编辑 vue2打开解析xls电子表格 浏览器新开页签或弹框内加载预览 文件url地址或接口二进制文档 解决网页打不开白屏报错问题 isaacgym OS ubantu 大大通 第三代半导体 碳化硅 欧标 OCPP lua 红黑树封装map和set 事件驱动 智能问答 向量数据库 Spring AI Milvus 音乐库 模板 泛型编程 AI员工 fabric tidb IO模型 烟雾检测 yolo检测 消防检测 实时日志 logs 僵尸世界大战 游戏服务器搭建 Anolis nginx安装 linux插件下载 Qwen2.5-VL aac deployment daemonset statefulset cronjob AI Agent 字节智能运维 nosql GKI KMI 接口优化 MacOS 架构与原理 LSTM 流量 webview 能效分析 access blocked 破解 triton 模型分析 win服务器架设 windows server 知行EDI 电子数据交换 知行之桥 EDI 集群管理 IDEA 语法 AzureDataStudio 鸿蒙NEXT 超级终端 多任务操作 提高工作效率 解决方案 状态模式 midjourney sentinel VS Code 机械臂 小智AI服务端 xiaozhi TTS hexo GRANT REVOKE post.io 企业邮箱 搭建邮箱 干货分享 黑客工具 密码爆破 tailscale derp derper 中转 企业网络规划 华为eNSP 流量运营 C++软件实战问题排查经验分享 0xfeeefeee 0xcdcdcdcd 动态库加载失败 程序启动失败 程序运行权限 标准用户权限与管理员权限 移动开发 带外管理 学习路线 极限编程 sequoiaDB 捆绑 链接 谷歌浏览器 youtube google gmail lrzsz mujoco Unity插件 ABAP 命令模式 authing Metastore Catalog 基本指令 零售 进程池实现 macOS 西门子PLC 通讯 AWS solr 代码复审 wifi驱动 风扇散热策略 曙光 海光 宁畅 中科可控 HAProxy 苹果电脑装windows系统 mac安装windows系统 mac装双系统 macbook安装win10双 mac安装win10双系统 苹果电脑上安装双系统 mac air安装win pythonai PlaywrightMCP 搜狗输入法 中文输入法 STL 数字证书 签署证书 火山引擎 容器化 Serverless nginx默认共享目录 vCenter服务器 ESXi主机 监控与管理 故障排除 日志记录 socket ardunio BLE caddy qwen2vl 服务器正确解析请求体 元服务 应用上架 集成 janus BCLinux Ubuntu 24.04 搜狗输入法闪屏 Ubuntu中文输入法 appium 4 - 分布式通信、分布式张量 orbslam2 rtcp anonymous 华为鸿蒙系统 ArkTS语言 Component 生命周期 条件渲染 Image图片组件 tar.gz tar.xz linux压缩 安装部署 milvus安装 nmcli 网络配置 李心怡 java毕业设计 微信小程序医院预约挂号 医院预约 医院预约挂号 小程序挂号 RockyLinux 数字比特流 模拟信号 将二进制数据映射到模拟波形上 频谱资源 振幅频率相位 载波高频正弦波 RAGflow 静态NAT 影视app 华为昇腾910b3 scrapy issue 通用环境搭建 MySQL CAD瓦片化 栅格瓦片 矢量瓦片 Web可视化 DWG解析 金字塔模型 站群 多IP ANDROID_HOME zshrc AppLinking 应用间跳转 证书 签名 sse_starlette Starlette Server-Sent Eve 服务器推送事件 IP地址 计算机基础 互联网实用编程指南 python高级编程 Ansible elk stack 系统内核 Linux版本 MCP 服务器 JADX-AI 插件 5分钟快速学 docker入门 树莓派项目 jQuery 排序算法 选择排序 Linux的进程概念 RNG 状态 可复现性 随机数生成 linq rtmp 光电器件 LED