最新资讯

  • RoboVLM——通用机器人策略的VLA设计哲学:如何选择骨干网络、如何构建VLA架构、何时添加跨本体数据

RoboVLM——通用机器人策略的VLA设计哲学:如何选择骨干网络、如何构建VLA架构、何时添加跨本体数据

2025-04-27 09:37:47 34 阅读

前言

本博客内解读不少VLA模型了,包括π0等,且如此文的开头所说

前两天又重点看了下openvla,和cogact,发现

  • 目前cogACT把openvla的动作预测换成了dit,在模型架构层面上,逼近了π0
  • ​那为了进一步逼近,感觉可能会有人把cogACT中的VLM模块(dinov2+sigclip+llama2)换成paligemma

总之,各种vlm + 各种动作预测头/方法,会出来很多vla

当然,各种VLA我在此文《24年具身智能模型汇总:从训练数据、动作预测、训练方法到Robotics VLM、VLA》已经详细介绍过

而适用于通用机器人策略的VLA也不是随意设计的,背后都有一整套的设计哲学、逻辑、方法论,本文便基于RoboVLMs探讨这背后的设计哲学

  1. 其对应的论文为《Towards Generalist Robot Policies: What Matters inBuilding Vision-Language-Action Models》
  2. 对应的作者为
    Xinghang Li1,2∗, Peiyan Li2,3∗, Minghuan Liu2,4∗, Dong Wang1,2∗, Jirong Liu2,4∗,Bingyi Kang2, Xiao Ma2, Tao Kong2, Hanbo Zhang5, Huaping Liu1
    他们各自来自
    1Tsinghua University, 2ByteDance Research, 3CASIA MAIS-NLPR,4Shanghai Jiao Tong University, 5National University of Singapore

尽管有的设计哲学——动作空间是连续的还是离散的,在之前诸多模型的效果PK上,我们早已看出来,但为系统起见,还是也放在本文的介绍中

第一部分 RoboVLMs

1.1 引言与相关工作

1.1.1 VLM骨干和结构的研究

在构建通用机器人策略的其中一种途径是基于VLM微调并进行一定的架构调整来学习机器人基础模型,从而最终成为VLA

而这个途径之所以广受欢迎,在于VLMs在通过对网络规模数据的广泛训练中展示了学习多模态数据(如文本、图像/视频)的通用且鲁棒的表示的强大能力。这种能力可以激发机器人基础模型的适应,以弥合高度多样化的开放世界场景和有限的机器人数据之间的差距

然而,大规模视觉-语言预训练在多大程度上促进通用机器人策略仍然是一个未解决的问题。此外,伴随着不同类型的LLM骨干、训练数据、模型规模、架构和训练方案,迅速涌现出大量多样化的不同VLMs

故,哪种VLM骨干更适合机器人操作也是成功开发VLAs的一个关键问题

除了不同骨架的多样性之外,对于通用机器人策略,包括VLA,其结构更加复杂且形式多样

基于现有的最流行的工作[4-π0,7-Rt-2,20-Vima,22-Openvla,24-Vision-language foundation models as effective robot imitators,34-R3m,35-Open x-embodiment,39-Octo,47-Unleashing large-scale video generative pre-training for visual robot manipulation,55-3d-vla]——这其中大部分的工作,都可以在此文 《24年具身智能模型汇总:从训练数据、动作预测、训练方法到Robotics VLM、VLA》里看到对应的介绍链接

作者提出了一种分类方法,基于

  1. 历史和动作信息如何在VLA中被整合
  2. 动作空间是连续的还是离散的

如下图图2所示,考虑了4种结构形式「根据两个主要层次对VLA结构进行分类:1)动作空间(纵轴);2)是否整合了历史信息(横轴)——比如左边是one-step 右边是historical。此外,对于涉及历史的VLAs,根据历史信息的组织模式将涉及历史的VLAs分为策略头和交错形式。请注意,这种分类不仅考虑了从预训练的VLMs中派生的模型,还包括那些虽然没有在VLMs上预训练(因此不被称为VLAs),但可以为将VLMs转变为VLAs提供见解的策略架构

对于历史信息建模,识别出两种形式:

  1. 一步建模one-step modeling——见上图左侧●,仅利用当前状态或观察来产生动作;
  2. 历史建模history modeling,处理历史状态或观察的滑动窗口

关于历史信息的聚合,将其分为两种方法:

  1. 交错建模interleaved modeling▲——见上图右上角、右下角,将历史观察和动作序列以交错格式整合
  2. 策略头policy head ▀——见上图中间偏右上,分别处理每个历史步骤,并在一个独立的策略头中融合信息以进行动作预测

不同的结构以不同的方式利用预训练的VLMs。因此,当面临不同类型的环境和任务时,它们在鲁棒性、泛化能力和数据效率方面可能具有不同的特征

1.1.2 数据的质量、多样性、跨本体数据、训练方法的研究

除了VLA本身,用于开发VLA的训练数据的质量和多样性同样重要。随着著名VLA的近期进展[4-π0,7-Rt-2,22-Openvla,35-Open x-embodiment,39-Octo],来自不同来源的大规模数据对于在对抗分布外任务和环境的鲁棒性和泛化方面进一步提高性能非常重要

然而,它们在详细的训练方法上存在很大差异:一些利用额外的数据进一步预训练VLMs,使表示更接近机器人操作任务[4-π0],而另一些则与领域内任务共同训练VLA[7-Rt-2,22-Openvla,35-Open x-embodiment,39-Octo]

此外,通过充分预训练在多样化操作技能上,期望机器人策略能以最少的示范学习新技能[13]。因此,在开发高效VLA的情况下,何时利用大规模跨化身数据成为一个有趣的问题

为了彻底研究上述问题并找到VLA的最有效解决方案,作者的研究选择了4种VLA结构、8种不同骨架和3种不同的训练数据方案来训练VLA模型

1.1.3 RoboVLMs:使任何VLM能轻松集成到VLA中

在作者的实验中,他们提出了一个新的框架,RoboVLMs,将VLM转移到VLA,并提供了一个统一、灵活、易于使用的开源框架,使任何VLM能轻松集成到VLA中,几乎不需要额外努力,允许机器人从业者研究、比较和部署未来的VLA

此外,他们还在一个自收集的真实世界机器人操作数据集上训练和评估了建成的VLA,该数据集由100个操作任务和总共74K条轨迹组成

  1. 具体来说,他们最初选择了三个常用的VLMs——LLaVA、Flamingo和KosMos 作为骨架,将它们与四种VLA结构结合起来,检查动作空间、观察视野和历史聚合方法的效果

    对于应该如何制定VLA
    通过广泛的研究和实验,连续动作始终优于自回归离散动作,同时结合历史背景对于提高性能和解决部分可观测性至关重要

    发现连续动作空间的策略头建模表现最佳后,又比较了8种不同的VLMs作为骨架与策略头形式,以回答哪个骨架更适合

    对于哪种VLM骨干更适合用于VLA
    作者对8种不同的VLM骨干进行的广泛研究显示,两种杰出的VLM骨干,即KosMos [36]和Paligemma [3],显著优于其他骨干。这些结果强调,全面的视觉-语言预训练对于实现卓越的VLA性能至关重要
  2. 同时,比较了不同VLA结构的泛化和数据效率
    对于模型架构,直接与策略头集成的视觉-语言模型(VLM)表现优于其他形式,因为一致使用,即视觉-语言token应以其原始预训练格式进行处理,并添加策略头以整合过去的视觉和本体感知观察以进行有效决策

    对于数据效率
    更大的VLM进一步提高效率,需更少的数据即可实现更高的性能
  3. 对于何时利用跨化身数据的问题
    虽然普遍认为使用跨体数据进行预训练或后训练能提高性能,但这一观点尚未得到严格验证。他们的研究结果表明,使用跨体数据进行预训练并不总能显著改善最终性能。然而,在目标数据集上对跨体预训练模型进行后训练可以显著提高性能

    故作者比较了
      预训练(使用Open X-Embodiment训练的VLA)
      微调(使用目标数据集训练的VLA)
      后训练(使用Open X-Embodiment预训练并进一步用目标数据集微调的VLA)——相当于预训练 + 微调
  4. 最后,为了确认具有最佳配置的VLA在真实世界中的适用性,作者在真实世界机器人操作场景中训练和评估了它们,展示了在
    1)未见的干扰物
    2)未见的背景
    3)未见的目标对象
    4)新技能描述方面的泛化能力

此外,利用相同机器人或任务的操作数据可以明显提升性能

例如,模块化方法利用预训练的视觉和语言模块来编码多模态输入的潜在表示 [6- Rt-1,31-What matters in language conditioned robotic imitation learning over unstructured data],而替代方法则依赖于使用多样化的机器人数据集进行直接训练 [39-Octo]。即使在VLA研究中,对于架构或训练方案也没有共识 [7-Rt-2, 8-Gr-2, 22-Openvla, 24-Vision-language foundation models as effective robot imitators]

1.2 主要结果及发现

利用RoboVLMs这个框架,作者进行了广泛的实验以解决几个关键问题

  1. 为什么更喜欢 VLA?
  2. 应该如何制定 VLA?
  3. 哪种 VLM 主干更适合 VLA?
  4. 应该何时利用跨实体数据集?

如下表 I 所示

作者进一步将 4 个基本问题分为 6 个研究问题,并实施 VLA 的连续实验以回答每个研究问题。使用适当的主干和结构构建的 VLA 模型可以大幅超越最新的通用机器人策略

为了全面评估 VLA 的性能,在这项工作中,作者对所有模型进行了基准测试,具体而言,如下图图 3 所示

选择了两个知名且广泛使用的模拟基准(CALVIN[32] 和 SimplerEnv[40])以及一个现实世界的机器人操作实验来评估 VLA 模型

  • CALVIN[32] 是一个用于多任务桌面操作的模拟基准,数据集根据不同的场景设置分为 A、B、C和 D 四个部分,并提供 34 个基本任务,总共包含 24K 人工远程操作演示,并附有语言指令注释
    评估指标包括完成1 ∼5 个连续任务的成功率,以及成功执行的任务平均数量(简称为Avg. Len.)
  • 真实机器人基准测试[8]包括超过70K的远程操作人类轨迹,用于微调机器人策略,涵盖105个操作任务
    为了评估模型在该基准测试上的性能,采用[23- Gr-mg: Leveraging partially annotated data via multi-modal goal conditioned policy]中概述的方法,在一个简单设置和四个具有挑战性的未见设置中测试每个模型

    这些设置的示例如下图图4所示

    总共,在20个任务中评估每个VLA,每个任务有5个设置,每个设置有3次执行,并报告每个设置的平均成功率。基准测试的详细描述见附录K和附录D。这些基准测试中包含的所有任务都由单臂机器人驱动,导致7个自由度的动作——夹持器的6D姿态和一维的开/关状态。机器人观测可以从本体感受器信息、视觉观测和语言输入中获得

1.2.1 为什么偏爱VLA?——是否合适构建通用策略、现实世界中的表现如何

1.2.1.1 是否合适构建通用策略

关于为什么需要VLA?可以先回答

问题1:VLA是否是构建通用机器人策略的合适选择?

具体来说,作者展示了研究中表现最好的VLA,它在CALVIN和SimplerEnv基准测试中创造了新的最先进成果,以明显优势超越了所有其他机器人策略

所有结果如表II和图5所示「在CALVIN基准上的模拟性能,所有模型均在拆分ABCD/ABC上训练,并在拆分D上评估。KosMos P.H.代表使用KosMos-2作为骨干和策略头作为架构的VLA,且使用RoboVLMs框架构建,最大训练5个周期——即KosMos P.H. represents the VLA utilizing KosMos-2 as backbone and policy head as architecture, built with theRoboVLMs framework, and is maximally trained for 5 epochs

从这些表格中,可以看到,RoboVLM大幅超越了现有的最先进通用策略,并为机器人操作任务在模拟和实际实验中建立了一个强有力的基准

具体来说,可以轻松观察到以下事实

  • 在CALVIN 基准测试中,RoboVLM模型在所有指标上都达到了最高性能,并在从ABC 转移到D(一个在训练分割中未见过的新场景)时展示了卓越的泛化能力,单个任务执行的绝对提升为12.6 %,连续5 个任务的总提升为30.3 %
    平均而言,在零样本设置下,RoboVLM可以在每次单独展开中完成5 个任务中的4.25 个,超越了之前的SOTA 模型(GR-1)1.09 个任务
  • 在SimplerEnv 中,RoboVLM在WidowX + Bridge 和Google Robol 环境中都实现了最高的平均性能,展示了对不同设置和多样化操作任务的普遍有效性和鲁棒性

此外,作者还研究了视觉-语言预训练对泛化和数据效率的影响(图6和表IV),详细结果见附录H

  1. 在CALVIN的泛化中,作者采用官方设置:在ABC的分割上训练模型,并在D上验证性能
  2. 为了评估数据效率,我们在模型规模从3B到9B和各种数据规模上进行实验:10%的训练数据(0.1x ABCD),标准设置(ABCD),以及500%的训练数据(5x ABCD),额外的数据来自于官方发布的未标记数据集,遵循Wu等人[47]中介绍的设置,不同数据规模的详细结果见附录E

可以看到,视觉-语言预训练对于泛化和数据效率都是至关重要的。这个观察是直观的,因为对齐的视觉-语言表示提供了一个稳固的视觉理解基础,使策略能够专注于学习操作技能。因此,可以得出结论

发现1:VLA是通用机器人策略的有前途路径

1.2.1.2 VLA在现实世界的场景中的表现如何

然而,尽管VLA在模拟中表现良好,由于模拟到现实的差距[54],VLA是否适合实际机器人应用仍然是一个未解的问题,故,作者提出第二个开放问题

问题 2:在现实世界的场景中,VLA 的表现如何?

如上所述,作者在现实世界的场景中部署了表现最佳的RoboVLM模型,即基于仅解码器KosMos的模型,以验证其有效性

如下图图4所示,作者的实验涉及20个具有多种技能的任务,包括打开、关闭、按按钮、拾取和放置等任务

对于每项任务,我们评估五次执行,包含基本设置、新技能描述、未见过的干扰因素、未见过的目标对象和未见过的背景

  • 该机器人系统用于真实实验,基于一个7自由度的Kinova Gen3机械臂,配备Robotiq 2F-85夹爪,更多关于真实机器人的细节请参见第四节
  • 输入方面,分别获取机器人头部和手腕上的两台摄像机的RGB图像
    头部摄像机提供工作空间的概览,而夹爪摄像机则提供末端执行器与环境之间交互区域的近距离观察

在真实机器人基准上微调由RoboVLMs构建的Octo-Base、OpenVLA和KosMos P.H.,并比较它们的性能。结果如图7所示

他们观察到,由RoboVLMs构建的最佳VLA(KosMos P.H.)在所有评估设置中均表现最佳,尤其是在简单和未见过的背景上,展示了其有效性和泛化能力,这与SimplerEnv和CALVIN模拟中的结果一致

至于定性结果在附录K中展示,包括各种设置下的成功执行和一些具有代表性的失败案例。KosMos P.H.不仅在基本设置任务如打开抽屉、拾取茄子等方面优于基线模型,而且在未见过的物体、干扰物和背景上也能实现更好的性能

此外,如下图图8所示

KosMos P.H. 展现出自我纠正能力,它能够识别末端执行器的不正确位置,并纠正其未来的轨迹以成功完成任务。请注意,这种能力在其他测试的基线中没有出现,而这种数据不包含在训练数据集中

如此可以得到

发现2:由RoboVLMs构建的最佳设置的VLA在实际场景中表现出强大的有效性和鲁棒性

1.2.2 如何制定VLA?策略头结合历史观测和连续动作,且提高泛化和数据效率

1.2.2.1 如何对机器人操作任务中的观测、状态和动作进行建模

更具体地说,应该如何在VLA的背景下对机器人操作任务中的观测、状态和动作进行建模?

为了解决这个问题,作者实现了几种变体,利用了各种开源VLM骨干网络,如OpenFlamingo [35]、LLaVA [28]和KosMos [36-Kosmos-2: Grounding multimodal large language models to the world]

这些变体结合了不同的历史信息建模策略和动作空间,如在Sec.I中讨论和分类的那样。CALVIN中各种VLA结构的性能总结在表III中「下图中,one-step代表一步模型,interleaved代表交错,policy head代表策略头,discrete代表离散,continuous代表连续

根据这些结果,可以得出以下关键观察:

  1. 连续动作很重要
    通过比较两种类型的动作空间,连续和离散,如表III所示,观察到在单帧公式下,连续动作空间始终优于离散动作,尤其是在任务时间跨度增加时
    这一发现是直观的:连续动作可以表示高精度的浮点值,而离散动作仅限于索引动作区间。对于长时间跨度任务,累积的复合错误显著降低了离散动作的性能
  2. 历史观察事项History observation matters
    如表 III 所示,在相同的 VLM 结构下(无论是编码器-解码器还是仅解码器),将历史观察作为输入的模型始终优于一步模型,在所有任务中均实现了显著更高的成功率「models incorporating history observations as input consistently outperform one-step models」。这种改进不受历史融合策略的影响
    此外,增加可观察历史的长度可以提高性能,尽管会带来更高的计算开销
  3. 策略头policy head改进历史融合
    在利用历史信息的各种公式中,交错历史公式的表现不如通过额外的策略头合并历史信息的效果好「Among the formulations utilizing history, the interleaved history formulationperforms worse than merging history via an additional policy head」。假设策略头保留VLM 的原始视觉-语言融合能力,同时有效地整合历史信息
    此外,交错的公式在训练和推理过程中会导致显著更高的内存和 FLOP 成本。这表明,通过附加的策略头来结合历史信息对于 VLAs 是一种更有效和高效的方法

发现3:VLA在使用多步骤的历史观测作为输入和连续动作作为输出时,其性能最佳。为了将历史与连续动作空间结合,策略头结构表现更佳

1.2.2.2 不同的公式化如何影响VLAs的泛化和数据效率?

然而,除了性能本身之外,现代VLA面临的最重要挑战之一是实现对新对象和环境设置的泛化,这对于在各种机器人和场景中的实际部署至关重要

因此,VLA应在开放世界环境中继承VLM的泛化能力,同时在有额外域内训练样本可用时保持高数据效率。因此,他们进一步探讨以下问题

问题4:不同的公式化如何影响VLAs的泛化和数据效率?

为了解决这个问题,作者对各种VLA公式的泛化和数据效率进行了实证研究和评估,旨在为训练高性能的VLA提供实用见解

具体来说,他们通过在不同数据规模上使用CALVIN数据集训练不同架构和公式的模型,评估由RoboVLMs构建的不同VLA的泛化和数据效率

如前所述,他们重点比较交错和策略头公式——使用OpenFlamingo和KosMos骨干网络,这些配置在所有配置中显示出强大的潜力

请注意,交错的公式只能与仅解码器结构配对。图9和表IV中展示的结果导致以下观察

  • 关于泛化性能(图9),作者的最佳模型基于KosMos骨干网络,并利用策略头进行历史融合,在零样本设置中仅表现出轻微的性能下降

    相比之下,其他公式化方法则经历了显著的性能下降。这个发现强调了模型架构对泛化的显著影响
    这一结论在图5的结果中得到了进一步支持,其中评估集中的任务与新指令配对;
    以及在图7中,他们的最佳模型在所有未见任务上大幅领先于其他模型
  • 对于数据效率,他们观察到与泛化类似的趋势
    他们的最佳模型在训练数据缩减时始终实现最高性能,并且与其他公式相比,性能下降速度显著较慢
    此外,不同规模的编码器-解码器VLA比较显示,较大的模型往往更具数据效率

如此,得出

发现4:在泛化能力和数据效率方面,利用策略头进行历史融合是最好的

1.2.3 哪种VLM骨干网络更适合VLA?KosMos和Paligemma证明:充分视觉-语言预训练很有用

在大规模视觉-语言数据集上训练VLMs需要极高的资源。因此,他们基于多样化选择的预训练大规模视觉-语言骨干进行VLAs,它们具有不同的架构、训练数据规模、模型大小和潜在嵌入

这些包括

  1. Flamingo模型家族[1](编码器-解码器)
  2. 以及一系列仅解码器的VLMs,包括LLaVA[28]、Qwen-VL[2]、MoonDream[44]、UForm[41]、Paligemma[3]和KosMos[36]

值得注意的是,在本节中,为了公平比较,所有模型均使用静态图像进行训练,而非同时使用静态和手持相机。尽管这种方法可能无法提供完全受控的比较,但他们的广泛实验旨在提供关于不同VLM骨干对VLA影响的见解

结果如表V所示,揭示了以下观察

KosMos和Paligemma表现出明显更好的性能:从表V可以看出,这两个骨干比其他骨干有显著的优势。它们的优越性能得益于在大型视觉语言数据集上进行的充分视觉语言预训练——也从侧面解释了为何目前的vla sota模型π0,选择PaliGemma作为其中的VLM结构部分的原因

这一结果是直观的,因为广泛的预训练促进了视觉和语言特征之间更强的对齐——这种对齐对语言条件操控任务至关重要

从而也就说明了

发现5:VLAs从VLMs主干的“大型视觉语言数据集上进行的充分视觉-语言预训练”中受益——即VLAs benefit from the sufficient vision-language pre-training on large vision-language datasets of VLMsbackbone

1.2.4 应该何时利用跨实体数据集?大规模跨体预训练可提高机器人操作和泛化能力

在最近的研究中,利用大规模跨形态机器人操作数据集来提高VLAs的性能已成为一种主流趋势[4-π0, 7- Rt-2, 22-Openvla, 35- Open x-embodiment]。然而,是否真正有帮助仍不完全清楚,一个重要的问题仍然存在:

问题6:大规模跨形态数据集如何对VLAs做出贡献?

为了解决这个问题,作者将其分解为两个子问题:

  1. 从大规模跨载体数据集中获取哪些类型的数据对构建VLA最有利?
  2. 何时以及如何有效地利用这些数据?

在本节中,他们进行了一系列实验,以研究使用外部大规模跨实体数据集的不同策略。具体来说,作者探讨了两种主要的设置

  • 预训练:使用领域内操作数据和跨实体数据集对模型进行预训练。这种方法已在RT-2 [7]、OpenVLA [22] 和OCTO[39] 中进行探索
    ——如下图所示,该图来自此文《GRAPE——RLAIF微调VLA模型:通过偏好对齐提升机器人策略的泛化能力(含24年具身模型汇总)》的开头

  • 后训练:首先在跨实体数据集上训练VLMs,然后通过领域内操作任务进行微调。这一策略已被π0 [4] 采用

本节中的实验使用表现最佳的KosMos骨干网与用于历史融合的策略头作为基础模型。他们使用Open X-Embodiment (OXE) [35] 作为跨实体数据集,该数据集包含了全球收集的多种机器人操作数据,是最近研究中使用最广泛的[比如广泛应用于4-π0, 7- Rt-2, 22-Openvla, 39-Octo]

为了进行比较,他们还评估了一个基线设置Finetune,其中VLA仅在域内数据上进行训练

此外,对于Google Robot,包括了RT Partial Finetune和RT Finetune

  • 其中RT Partial Finetune仅涉及与评估任务相同任务类型的轨迹
  • 而RT Finetune涉及使用来自同一机器人在不同任务中的额外数据对策略进行协同微调
    and RT Finetune involves co-fine tuning the policy with additional data from the same robot across different task

对于Bridge,只评估Bridge Finetune,它使用整个Bridge-V2数据集微调策略,因为训练数据集中不包含具有相同评估任务指令的轨迹

为了更全面地评估跨体数据集的影响,他们还在CALVIN上进行了实验,CALVIN不属于OXE。对于CALVIN,他们省略了共同训练设置,主要关注跨体数据集是否有利于机器人操控在分布外任务上的少样本学习

因此,他们在CALVIN上仅使用每个任务10条轨迹进行实验(CALVIN少样本)

为了保持设置一致,他们仅使用来自静态头顶摄像头的图像作为输入。在不同训练阶段利用跨化身的比较如图10所示

从上到下,该图显示了SimplerEnv-Google Robot和SimplerEnv-Bridge的评估结果。此外,关于是否在CALVIN few-shot上整合跨化身预训练的比较如图11所示

可以得出以下观察结果

  1. 使用跨体现数据进行预训练并没有显著帮助
    比较OXE Pre-train和RT-Partial Finetune可以发现,对于谷歌机器人和Bridge,使用跨体现数据进行共同训练并没有带来实质性的性能提升
    特别是对于谷歌机器人来说,使用额外的领域内数据进行训练(RT Finetune)——即便是来自不同任务的数据——也能实现更高的成功率(相比于RT-Partial Finetune)
    这表明领域内

    即使是与任务无关的数据,也比跨载体数据更有效地提高模型性能
  2. 在跨载体预训练后进行后训练显示出潜在的好处
    后训练模型的平均性能(在Google Robot 上为52 %,在Bridge 上为38 %)超过了仅在域内数据上微调的模型(在Google Robot 上为48 %,在Bridge 上为31 %)
    这表明跨载体预训练可以提供一个有用的初始化,从而有利于随后的微调
  3. 预训练提高了少样本学习性能
    在CALVIN 的少样本设置中,使用单视角头部摄像头,预训练显著提高了性能,单任务执行提高了17.2 %,每次回合多执行0.25 个任务
    可以得出结论,在大规模跨载体数据集上进行预训练有利于学习更有效的机器人操作表示,这可以快速适应包含未见过的物体和环境设置的新操作任务

从而得出发现6

发现6:即使来自不同任务的额外领域内数据也显示出有益,并且大规模跨体现预训练进一步提高了整体以及少样本性能

1.3 小结:相关结论

1.3.1 解决的4个基本问题

这项实证研究主要关注于构建视觉-语言-动作模型(VLA)时的重要因素。作者提出了四个构建VLA的基本问题:

  • 为什么我们需要VLA而不是其他通用策略,并通过大幅超越现有方法,说明研究VLA的必要性
  • 接下来,描述了构建基于VLM的VLA的关键组件:
    应该使用哪种VLM骨干——对应上文的1.2.3 哪种VLM骨干网络更适合VLA?KosMos和Paligemma证明:充分视觉-语言预训练很有用
    如何训练模型生成动作——对应上文的1.2.2 如何制定VLA?策略头结合历史观测和连续动作,且提高泛化和数据效率
    以及何时应将跨载体数据添加到训练阶段

为回答这些问题,作者建立了一个统一框架,以便对VLA进行公平比较,并设计了一系列自下而上的系统实验

为此,作者在三个模拟器中进行了广泛的实验,涉及20个任务中的240多次实际场景的执行

可以从实验中得出结论:

  1. 对于为什么的问题,VLA能够实现高性能和泛化,是通用机器人策略的有前途的路径;
  2. 对于哪个问题,发现在大规模视觉-语言数据集进行“充分视觉-语言预训练”的VLM适合构建VLA
    For the Which problem, we find that VLMs with sufficient vision-languagepre-training over large scale vision-language datasets is suitable for constructing VLAs.
  3. 对于如何的问题,可以研究不同VLA结构的性能、泛化和数据效率,发现整合历史观察对于VLA至关重要,并且相比交错,策略头是一种更有效和高效的历史聚合方法
  4. 对于何时的问题,我们比较了在不同阶段整合跨载体的三种训练方法,并得出结论,额外的域内数据显示出有益,并且大规模跨载体预训练进一步提高了整体以及少样本性能

作为对提出问题的答案的副产品,作者构建了一个易于使用的框架,便于整合任意VLM并将其转换为VLA,名为RoboVLMs

1.3.2 研究中的观察与限制

在作者的实验中,他们发现基于 Qwen-VL 和 LLaVA 构建的 VLA,其性能出奇的低,与其在视觉语言任务中的原始性能相比。 在视觉编码器后添加感知重采样器后,他们发现基于 Qwen-VL 和 LLaVA 的 VLA 可以获得显著的性能提升并达到合理的性能。他们假设性能提升与输入标记序列中的图像分辨率和视觉标记数量有关。

尽管他们尽力研究构建视觉语言代理 (VLA) 的关键挑战,但这项工作仍处于初步阶段,目前存在一些限制

  1. 为了快速和简单地扩展现有的视觉语言模型 (VLM),他们保留了 VLM 中的多模态交互结构(例如,注意力掩码、专家混合)
    在此基础上,他们进一步发展了视觉、语言和动作之间的交互,这在大多数现有作品中是一种常见的方法 [22,24]
    然而,针对架构和与动作的多模态交互的专门设计有可能产生更优异的性能(例如,π0 模型 [4]),值得进一步探索
  2. 出于 (1) 中所述原因,这里考虑的VLA 分类和公式是简化和有限的
  3. 本工作中未充分探索动作标记化、策略头和相应的训练目标。 例如,像 VQ-VAE [42]、扩散模型 [9,17] 和流匹配 [4,12,26] 这样的技术在 VLA 上下文中仍未得到充分探索
  4. 本研究中考虑的 VLM 骨干网络集是有限的,可以积极扩展
  5. 将如此大型的模型用于实时机器人控制仍然是一个重大挑战

对于未来的工作,作者设想了几个推进通用机器人策略的潜在方向

  1. 如前所述,他们当前的方法在 VLM 的内部结构、策略头和相应的训练目标的设计上存在局限性。 进一步研究 VLA 的更细粒度设计选择可能非常有价值,因为最近的研究表明它们在提高效率和效果方面发挥了重要作用 [4-π0]
  2. 除了语义泛化之外,理想的通用机器人策略应该能够处理长时间的复杂任务指令(例如,做早餐),逐步推理可执行的动作,并与环境产生有意义的物理交互「例如,[52-Robotic control via embodiedchain-of-thought reasoning],相当于CoT赋能具身模型,本博客后面会解读下
    故作者设想,在他们未来的工作中,他们旨在探索开发具有这些高级能力的策略所需的关键要素

第二部分 通用方法论与各类VLA模型的总结

接下来,考虑基于语言指令 和每个时间步t 的历史观测(最大历史长度为H)来控制机器人完成一组任务的问题

  1. 在本文中,主要考虑一个桌面机器人手臂,因此观测 是传感器输入和图像,例如,,来自第三视角相机、夹持器相机或两者兼有
  2. 建立了一个控制策略,其中动作a 被建模为一个7 维向量,包括夹持器的6 自由度位姿及其开/关状态

2.1 视觉语言模型

如RoboVLM论文中所说,视觉语言模型(VLMs),也称为多模态大型语言模型,将视觉整合到其输入模态中,使其能够处理和推理视觉和文本信息

通常,VLMs通过图像和/或文本生成文本[1,2,3,28,41,44],从而促进图像字幕生成、视觉问答和目标导向的规划等应用。这个过程可以形式化地描述为

这里, 和 分别表示图像和文本提示,而 代表由VLM 生成的文本输出。例如,在视觉问答任务中,对应于问题,而 对应于生成答案的Ground Turth

训练VLM 通常涉及最小化交叉熵损失以预测离散语言token,其可以表示为

其中, 是真实文本。通过在数百万甚至数十亿对视觉-语言数据上进行预训练,VLMs 获得了视觉和文本模态的鲁棒表示

为了有效处理这两种不同的模态,VLMs 通常使用视觉处理器和语言解码器,通过各种视觉-语言特征融合机制连接。在可用的选项中,视觉变换器(ViTs)[11] 和感知重采样器[18] 是视觉处理器的广泛采用选择[24,29,39,47]。ViT 模块将每个输入图像I 重塑为补丁,并将其编码为视觉token[OBS]

其中,N 表示标记数量, 表示第i 个token,在ViT 中,是一个编码输入图像块的嵌入向量

编码器-解码器架构由两个主要组件组成:

  1. 编码器通常负责使用如上所述的输入嵌入模块从输入中提取特征
  2. 解码器则生成输出(例如,文本或多模态预测)自回归

编码器和解码器之间的特征融合通常通过解码器中的交叉注意力层实现。由于其能够在生成之前显式编码多模态信息,这种结构在需要对输入模态进行详细理解的任务中表现优异,如图像字幕生成和视觉推理。代表性模型包括Flamingo [1]和OFA [46]


至于仅解码器架构则依赖于统一的transformer框架,其中输入模态(视觉和文本)和输出序列在同一个自回归解码器中处理

  1. 在这些模型中,视觉特征首先嵌入为类似token的表示(通过视觉处理器),然后与文本token连接并传递通过解码器。多模态特征融合自然地通过自注意力机制发生,使解码器能够在token生成过程中建模视觉和文本输入之间的依赖关系
  2. 仅解码器架构更加灵活和可扩展,适合于如指令跟随、多模态问答和开放式生成等任务。仅解码器模型的例子包括GPT-4V [49]和LLaVA [28]

2.2 视觉-语言-动作模型

视觉-语言-动作模型(VLA)主要应用于机器人任务中,它们作为通用机器人策略π,能够处理复杂任务。形式上,VLA根据当前时间步t的先前观测来预测动作序列

其中, 是一系列预测的7 维动作, 是动作序列长度, 是历史观测长度。与VLMs 不同,VLAs 的观测 通常包含本体状态,例如关节角度和末端执行器位置——除了视觉输入之外

作者将VLAs 抽象并分类为基于1)历史信息建模和2)动作空间的四种代表性结构。在以形式描述这些不同模型之前,首先介绍在处理不同动作空间中的机器人动作时的一般预处理和预测原则

  1. 动作预处理
    一方面是动作归一化
    对于连续和离散动作空间,对7 自由度动作的每个维度进行归一化。按照Kim 等人的方法[22],计算训练数据中动作的第1st 和第99th 分位数,并使用这些分位数来限制动作的每个维度[7]


    其中 是动作a 的第i 维的限制值。接下来,使用动作的第1st 和99th 分位数来标准化限制动作的每一维

    是归一化的动作,每个维度的范围是[−1, 1],最后一个维度表示夹爪的开/闭状态∈{−1, 1}。在推理时,将反向映射预测的动作为未归一化的动作

    二方面是动作离散化
    对于离散动作表示,需要进一步离散化归一化的动作。根据Brohan et al. [7], Kim et al. [22]的方法,将连续的机器人动作映射到VLM的分词器使用的离散token

    具体来说,将每个机器人动作维度单独离散化为256个箱子中的一个。对于每个维度,设置箱子的宽度,以均匀划分训练数据中动作的第1和第99百分位之间的区间。使用这种离散化,将转换为,其中包含7个离散整数∈[0...255]
    且为了避免损害语言分词器中原有的特殊token位置,添加一个偏移量(默认设置为10),并用离散化的索引替换最后的偏移∼256+偏移token
  2. 动作预测
    对于连续动作
    优化预测动作序列与真实动作序列的均方误差(MSE)和二元交叉熵(BCE)

    MSE 损失是针对前六个维度计算的,而BCE 损失是针对最后一个夹持器维度计算的,计算在预测动作 和真实值,λ 是平衡权重

    对于离散动作
    离散动作模型为每个动作维度预测动作token。这些token是从按维度离散化的连续动作中得到的区间索引,可以很容易地去标记化以恢复动作向量
    优化目标具有类似于VLM训练中广泛使用的文本生成的交叉熵(CE)格式


    其中, 表示在时间i 时预测动作标记[ACT] 的第 维度的区间索引,而 是对应的真实值。在推理过程中,获得预测动作标记 后,我们将离散token重新投影到对应区间的中心——以连续形式实现任务

2.3 VLA结构:一步连续动作、一步离散动作、交错连续动作、策略头连续动作

如下图图12所示「所考虑的VLA(可变长动作)公式的示意图,包括几种流行的设计。例如,RoboFlamingo[24] 是一种策略头连续型VLA——对应于右下角RT-2 [7] 和 OpenVLA [22] 对应于一步离散动作型VLA——对应于下图左下角。Octo[39] 和 GR [47] 对应于具有固定窗口大小的交错连续动作型VLA——对应于下图右上角

VLA结构主要根据动作空间和历史聚合方法分为四类,即

  1. 一步连续动作模型,对应于上图左上角
  2. 一步离散动作模型,对应于上图左下角
  3. 交错连续动作模型,对应于上图右上角
  4. 策略头连续动作模型,对应上图右下角

请注意,RoboVLMs框架可以轻松将VLMs转移到任意VLA结构

2.3.1 一步模型:含一步连续动作模型与一步离散动作模型——分别以ACT/π0、RT2/OpenVLA为代表

一步模型仅使用当前时间步t的观测值预测未来动作序列,即历史长度为1

对于一步模型,有两个变体:连续动作模型和离散动作模型型

  • 对于连续动作模型:VLM模型首先使用VLM骨干网络预测一个可学习的token[LRN]

    这通过融合视觉和语言token(在编码器-解码器架构中)或连接多模态token(在仅解码器架构中)来实现


    然后使用一个MLP来预测动作向量


    一步连续动作模型包括ACT [53]、BC-Z [19]、MVP [37]、R3M [34]、VIMA [20]、3D Diffuser [21]、RoboMamba [29]和π0[4]
  • 对于离散动作模型,直接遵循与VLMs相同的简单下一个词预测,其中动作被离散化为类似文本的token


    一步离散动作模型包括RT-1 [6]、RT-2 [7]、3D-VLA [55]、LAPA [50]、OpenVLA [22]和Embodied-COT [52]

2.3.2 交错-连续动作模型:以Octo/GR2为代表

交错模型接收观测-动作序列:

其中, 表示时刻 的输入token,[OBS] 表示观测token,[LRN] 表示可学习的动作token,并重复H 次,以交错格式插入到

VLM 骨干网络融合此序列(在仅解码器结构中)并通过基于每个动作token的MLP 预测动作序列

用于预测动作块,表示插入在之后并在t 之前与观测融合的[LRN]。损失和动作非标准化过程与单步连续动作模型相同

在推理的时刻t

  1. 输入序列仅包含当前观测 和语言指令 ,作者在输入序列的末尾添加可学习的token[ACT],并将序列传递给VLM 以预测动作
  2. 在机器人执行预测动作后,再将新的观测和语言指令 添加到输入序列中以预测当前步骤的动作

交错连续动作模型包括GR-1 [47]、OCTO[39]、GR-2 [8]。注意,像GATO [38] 和RoboCat [5] 这样的交错离散动作模型不在考虑范围内

2.3.3 策略头连续动作模型:以字节的RoboFlamingo为代表

策略头连续动作模型:与在VLM骨干中融合历史信息的交错模型不同,策略头VLA仅要求VLM在每个时间步提供单步多模态表示

历史信息随后被建模,并通过额外的策略头预测动作,例如RNN [10,15,30]、 transformer [14, 43]或扩散模型 [9]:

动作块 的序列长度为,是基于可学习的token预测的——每个[ LRN ]t 都是相同的

需要注意的是,交错连续动作模型仅适用于仅解码器的骨干网络。策略头连续动作模型可以基于具有编码器-解码器和仅解码器结构的VLM 骨干网络构建

他们的主要区别在于语言解码器

  1. 编码器-解码器VLM 的输入序列融合仅包含文本和可学习动作token,它通过交叉注意力融合多模态输入,其中文本token与可学习token结合作为键和值,视觉token作为查询
  2. 仅解码器的骨干网络直接将视觉、语言和可学习token串联作为输入,并利用自注意力融合多模态特征

策略头连续动作模型包括RoboFlamingo [24]、RoboUniview [27] 和DeeRVLA [51]

在每个推理步骤t

  1. 当前观测[OBS]t 和语言指令 以及一个可学习的token[LRN] 被连接为一个完整的输入序列,然后传递到VLM 主干中
  2. 在策略头部获取[LRN] 并预测当前动作序列后,机器人根据预测的动作进行操作,并获得下一轮预测的新观测

// 待更

本文地址:https://www.vps345.com/3146.html

搜索文章

Tags

docker 容器 运维 java-rabbitmq java PV计算 带宽计算 流量带宽 服务器带宽 上行带宽 上行速率 什么是上行带宽? 流量攻击 DDOS攻击 服务器被攻击怎么办 源IP CC攻击 攻击怎么办 服务器 网络 远程连接 vscode 安全 linux 嵌入式硬件 AI Dify 大模型应用 macos ubuntu 无人机 机器人 ide ai nlp wireshark python c++ php 部署 边缘计算 开源 自动化 n8n dity make 人工智能 LLM 大模型面经 大模型 职场和发展 Deepseek 大模型学习 Linux 维护模式 ubuntu24.04 todesk pytorch tensorflow 语言模型 AI大模型 DeepSeek agi qt linuxdeployqt 打包部署程序 appimagetool 搜索引擎 程序员 prompt linux环境变量 智能驾驶 BEVFusion Ubuntu rag ragflow ollama 大模型部署 flutter Google pay Apple pay 硬件工程 单片机 物联网 windows conda 机器学习 chatgpt gpu算力 数据库 postgresql pgpool 游戏引擎 学习 IPMI appium 软件测试 自动化测试 功能测试 程序人生 具身智能 强化学习 虚拟机 Qwen3 qwen3 32b vllm 本地部署 uniapp vue Agent llama CrewAI springsecurity6 oauth2 授权服务器 前后端分离 github ROS 自动驾驶 经验分享 中间件 网络安全 web安全 可信计算技术 安全架构 网络攻击模型 远程工作 centos 深度学习 android studio 交互 后端 websocket android debian wps 安卓 intellij-idea r语言 数据挖掘 数据可视化 数据分析 MacMini Mac 迷你主机 mini Apple 计算机视觉 c# 开发语言 网络协议 阿里云 云计算 spring boot spring ESXi MCP vite Svelte harmonyos 华为 华为云 华为od 技能大赛 Linux AIGC comfyui comfyui教程 django zabbix oracle 关系型 分布式 onlyoffice 在线office 1024程序员节 相机 milvus fiddler 爬虫 http 云原生 iventoy VmWare OpenEuler tcp/ip c语言 web3 区块链 区块链项目 nginx 蓝桥杯 HTTP 服务器控制 ESP32 DeepSeek 智能路由器 mysql adb gpt transformer 自然语言处理 Java进程管理 DevOps自动化 脚本执行 跨平台开发 远程运维 Apache Exec JSch WSL2 上安装 Ubuntu 大数据 政务 分布式系统 监控运维 Prometheus Grafana 网络工程师 华为认证 微信开放平台 flask 微信公众平台 微信公众号配置 vmware vmamba mac 截图 录屏 gif 工具 kubernetes 网页服务器 web服务器 Nginx YOLO yolov5 Apache Flume 数据采集 安装部署 配置优化 高级功能 大数据工具集成 FTP服务器 ssh 环境迁移 MQTT mosquitto 消息队列 服务器扩容没有扩容成功 流程图 mermaid 远程 命令 执行 sshpass 操作 ShapeFile GeoJSON Python pip Kali 渗透 Docker Docker Compose Kubernetes 算法 opencv 神经网络 H3C pycharm mcu hadoop big data 编辑器 rtsp h.265 webpack kvm qemu libvirt Claude Desktop Claude MCP Windows Cli MCP 动态库 GCC编译器 -fPIC -shared ffmpeg 音视频 视频编解码 DNS 知识图谱 大模型教程 GIS 遥感 WebGIS Dell HPE 联想 浪潮 tidb GLIBC 分布式账本 智能合约 信任链 共识算法 nac 802.1 portal prometheus grafana 服务器安全 网络安全策略 防御服务器攻击 安全威胁和解决方案 程序员博客保护 数据保护 安全最佳实践 卷积神经网络 word图片自动上传 word一键转存 复制word图片 复制word图文 复制word公式 粘贴word图文 粘贴word公式 oceanbase 传统数据库升级 银行 集成学习 集成测试 存储维护 NetApp存储 EMC存储 deepseek 科技 mcp mcp协议 go-zero mcp服务器 鸿蒙 鸿蒙系统 前端 前端框架 fpga开发 重启 排查 系统重启 日志 原因 CosyVoice rocketmq 程序 编程 内存 性能分析 主从复制 remote-ssh Cline rc.local 开机自启 systemd 麒麟 Windows ai工具 p2p servlet chrome chrome devtools selenium chromedriver 笔记 企业微信 架构 游戏 SSE 交换机 硬件 设备 GPU PCI-Express arm开发 hdc 鸿蒙NEXT 快捷键 旋转屏幕 自动操作 车载系统 ssh漏洞 ssh9.9p2 CVE-2025-23419 金融 cron crontab日志 毕设 王者荣耀 FTP 服务器 typescript ansible playbook 自动化运维 tomcat AI-native elasticsearch 7-zip 飞腾处理器 硬件架构 国产化 ipython CH340 串口驱动 CH341 uart 485 GCC crosstool-ng 嵌入式 linux驱动开发 redis 线程 多线程 ragflow 源码启动 javascript react.js 前端面试题 node.js 持续部署 卸载 软件 列表 负载均衡 压力测试 大模型压力测试 EvalScope devops LSTM 工作流自动化工具 bushujiaocheng 部署教程 算家云 AI算力 租算力 到算家云 AI编程 目标检测 golang mamba notepad 隐藏文件 操作系统 cursor 智能手机 计算机网络 Ollama Vmamba pygame eclipse flash-attention 报错 vue3 nohup 异步执行 AI提示词优化 嵌入式Linux IPC 考研 学习方法 ruoyi fastapi mcp-proxy mcp-inspector fastapi-mcp agent sse MCP server C/S open webui 驱动开发 嵌入式实习 gitlab vue.js NAS Termux Samba 多线程服务器 TCP服务器 qt项目 qt项目实战 qt教程 matlab chatbox gitee gitee go HTTP状态码 客户端错误 服务器端错误 API设计 harmonyOS面试题 数据结构 cocoapods xcode virtualenv arm visual studio code ddos UEFI Legacy MBR GPT U盘安装操作系统 openssl vim RockyLinux 网络结构图 yaml Ultralytics 可视化 DevOps 软件交付 数据驱动 应用场景 数据安全 go docker desktop 镜像 计算机学习路线 编程语言选择 进程间通信 信息与通信 Trae IDE AI 原生集成开发环境 Trae AI Linux网络编程 jenkins maven svn Kylin-Server 国产操作系统 服务器安装 udp Deepseek-R1 私有化部署 推理模型 CUDA PyTorch aarch64 编译安装 HPC IM即时通讯 QQ 微信 剪切板对通 HTML FORMAT PyQt PySide6 电脑 NVML nvidia-smi muduo 网络库 maxkb ARG GPU训练 wsl ros 树莓派项目 react native YOLOv12 群晖 低代码 计算生物学 生物信息学 生物信息 基因组 Apache Beam 批流统一 性能优化 案例展示 数据分区 容错机制 k8s 系统安全 stm32 visualstudio https 卡死 程序员创富 桌面环境 gcc g++ g++13 终端工具 远程工具 系统架构 Python教程 pycharm安装 策略模式 mac安装软件 mac卸载软件 mac book json rpc 实时音视频 实时互动 Docker引擎已经停止 Docker无法使用 WSL进度一直是0 镜像加速地址 缓存 eureka spring cloud 框架搭建 opengl top Linux top top命令详解 top命令重点 top常用参数 图形化界面 智能体开发 超级终端 多任务操作 提高工作效率 git 远程过程调用 Windows环境 dash 正则表达式 bug 运维开发 SSH Xterminal armbian u-boot LLM Web APP Streamlit BMC 带外管理 jar jupyter 安全漏洞 信息安全 电路仿真 multisim 硬件工程师 硬件工程师学习 电路图 电路分析 仪器仪表 ip 微服务 源码 毕业设计 课程设计 jvm 实时内核 打不开xxx软件 无法检查其是否包含恶意软件 ollama api ollama外网访问 arkUI arkTs 图像处理 SecureCRT nvm cuda csrf css css3 js python3.11 5G 3GPP 卫星通信 网络爬虫 单例模式 cudnn nvidia EVE-NG llm RTSP xop RTP RTSPServer 推流 视频 SRS 流媒体 直播 sql bash unix 大模型推理 RAID RAID技术 磁盘 存储 我的世界 我的世界联机 数码 音乐服务器 Navidrome 音流 网工 llama3 Chatglm 开源大模型 iot FunASR ASR CDN Chatbox 信号处理 tcpdump es6 qt6.3 g726 localhost rsync openEuler python2 iNode Macos iTerm2 测试工具 node 创业创新 面试 Kali Linux rpa rnn k8s部署 MySQL8.0 高可用集群(1主2从) 京东云 RustDesk自建服务器 rustdesk服务器 docker rustdesk 自定义客户端 SAS 虚拟化 哈希算法 微信小程序 notepad++ sdkman 混合开发 环境安装 JDK 计算机外设 虚拟显示器 远程控制 Mac内存不够用怎么办 ubuntu20.04 开机黑屏 安卓模拟器 gnu 数据集 Python基础 Python技巧 拓扑图 抓包工具 7z edge tar openjdk 显卡驱动持久化 GPU持久化 powerpoint 软考设计师 中级设计师 SQL 软件设计师 gru RagFlow RAG 升级 CVE-2024-7347 漏洞 xrdp 远程桌面 服务器配置 ssl grub 版本升级 扩容 midjourney AI写作 数据库架构 数据管理 数据治理 数据编织 数据虚拟化 webrtc 视频平台 录像 视频转发 性能测试 视频流 语音识别 虚幻 ftp服务 文件上传 element-ui 上传视频并预览视频 vue上传本地视频及进度条功能 vue2选择视频上传到服务器 upload上传视频组件插件 批量上传视频 限制单个上传视频 密码学 商用密码产品体系 昇腾 华为昇腾910b3 概率论 云计算面试题 jmeter sqlite 串口服务器 万物互联 工业自动化 工厂改造 fstab nohup后台启动 burpsuite 安全工具 mac安全工具 burp安装教程 渗透工具 sqlserver chromium dpi WSL resolv.conf mac设置host 火绒安全 mybase 鸿蒙面试 面试题 知识库 RAGFlow 本地知识库部署 DeepSeek R1 模型 openwrt USB网络共享 Portainer搭建 Portainer使用 Portainer使用详解 Portainer详解 Portainer portainer docker-compose ip协议 centos 7 Doris搭建 docker搭建Doris Doris搭建过程 linux搭建Doris Doris搭建详细步骤 Doris部署 kali 共享文件夹 镜像源 UOS 开机自启动 桌面快捷方式 dns是什么 如何设置电脑dns dns应该如何设置 rdp 实验 kylin 华为机试 C++ Java AD域 物联网开发 服务器无法访问 ip地址无法访问 无法访问宝塔面板 宝塔面板打不开 rsyslog kind string模拟实现 深拷贝 浅拷贝 经典的string类问题 三个swap opensearch helm 大大通 第三代半导体 碳化硅 gaussdb 弹性计算 云服务器 裸金属服务器 弹性裸金属服务器 llama.cpp NFC 近场通讯 智能门锁 finebi 3d bigdata 生信 Cursor 智慧农业 开源鸿蒙 团队开发 mysql安装报错 windows拒绝安装 软件需求 grep 进程信号 Ubuntu20.04 2.35 华为鸿蒙系统 ArkTS语言 Component 生命周期 条件渲染 Image图片组件 swift stable diffusion IP地址 IPv4 IPv6 端口号 计算机基础 nacos Claude arcgis 人工智能生成内容 ros2 moveit 机器人运动 ubuntu安装 linux入门小白 jdk MLLMs VLM gpt-4v NVIDIA lvs Autoware 辅助驾驶 云电竞 云电脑 oneapi 数据库系统 模拟退火算法 YOLOv8 NPU Atlas800 A300I pro 状态管理的 UDP 服务器 Arduino RTOS 大文件分片上传断点续传及进度条 如何批量上传超大文件并显示进度 axios大文件切片上传详细教 node服务器合并切片 vue3大文件上传报错提示错误 vu大文件秒传跨域报错cors uni-app 上传视频文件到服务器 uniApp本地上传视频并预览 uniapp移动端h5网页 uniapp微信小程序上传视频 uniapp app端视频上传 uniapp uview组件库 Pyppeteer Playwright gunicorn 程序化交易 量化交易 高频交易 mariadb apache Python 视频爬取教程 Python 视频爬取 Python 视频教程 RK3568 OpenGL 图形渲染 socket 5090 显卡 AI性能 SenseVoice 我的世界服务器搭建 minecraft openvpn server openvpn配置教程 centos安装openvpn VMware Tools vmware tools安装 vmwaretools安装步骤 vmwaretools安装失败 vmware tool安装步骤 vm tools安装步骤 vm tools安装后不能拖 vmware tools安装步骤 其他 ArkUI ArkTS 移动端开发 MobaXterm 文件传输 向量数据库 milvus安装 WSL2 IP 地址 进程等待 内存泄漏 rk3588 npu rknn-toolkit2 pdf 办公自动化 自动化生成 pdf教程 seleium 网络药理学 gromacs 分子动力学模拟 MD 动力学模拟 Linux Vim 安装MySQL 物理地址 页表 虚拟地址 宝塔面板 easyTier 内网穿透 组网 excel BCLinux 切换root langchain 代理模式 C语言 命名管道 客户端与服务端通信 spark HistoryServer Spark YARN jobhistory 大模型微调 AutoDL 模型联网 API CherryStudio 服务器繁忙 KVM 计算虚拟化 弹性裸金属 联想开天P90Z装win10 Java Applet URL操作 服务器建立 Socket编程 网络文件读取 kafka 代码调试 ipdb 上传视频至服务器代码 vue3批量上传多个视频并预览 如何实现将本地视频上传到网页 element plu视频上传 ant design vue vue3本地上传视频及预览移除 Web服务器 多线程下载工具 网络编程 PYTHON lighttpd安装 Ubuntu配置 Windows安装 服务器优化 树莓派 规格说明书 设计规范 .netcore .net microsoft 小程序 计算机系统 ftp 进程 进程控制 yum apt make命令 makefile文件 Linux find grep Ubuntu 22.04 MySql 算力租赁 安装教程 Bug解决 Qt platform OpenCV OpenCore 权限 产品经理 vnc docker run 数据卷挂载 环境变量 端口映射 交互模式 网络用户购物行为分析可视化平台 大数据毕业设计 kernel 换源 国内源 Debian GeneCards OMIM TTD 网络管理 软考 2024 2024年上半年 下午真题 答案 分子对接 autodock mgltools PDB PubChem docker compose LVM 磁盘分区 lvresize 磁盘扩容 pvcreate unity 欧拉系统 大模型入门 gitea web3.py Headless Linux nuxt3 文件分享 WebDAV Anolis nginx安装 linux插件下载 Windsurf 镜像下载 freebsd 银河麒麟 锁屏不生效 pythonai PlaywrightMCP lua umeditor粘贴word ueditor粘贴word ueditor复制word ueditor上传word图片 性能监控 sequoiaDB 飞牛NAS 飞牛OS MacBook Pro 中兴光猫 换光猫 网络桥接 自己换光猫 邮件APP 免费软件 向日葵 系统开发 binder framework 源码环境 MacOS shell脚本免交互 expect linux免交互 termux 环境搭建 图文教程 VMware虚拟机 macOS系统安装教程 macOS最新版 虚拟机安装macOS Sequoia wsl2 vsxsrv hive ranger MySQL8.0 jdk11安装 jdk安装 openjdk11 openjdk11安装 渗透测试 tar.gz tar.xz linux压缩 mac cocoapods macos cocoapods OpenSSH yolov8 ui 软链接 硬链接 虚拟局域网 searxng etcd RBAC 安全威胁分析 dify 本地化部署 小智 论文笔记 android-studio ACL 流量控制 基本ACL 规则配置 deepseek-v3 ktransformers scrapy 腾讯云 v10 雨云 NPS EasyConnect LDAP 在线预览 xlsx xls文件 在浏览器直接打开解析xls表格 前端实现vue3打开excel 文件地址url或接口文档流二进 孤岛惊魂4 反向代理 监控 PVE 黑客 信息收集 X11 Xming zookeeper db 媒体 Jellyfin nas 迅雷 飞牛 浪潮信息 AI服务器 deepseek-r1 大模型本地部署 html5 ios AI员工 ecmascript aws gitlab服务器 深度优先 NFS Qwen2.5-coder 离线部署 软件工程 稳定性 看门狗 设计模式 电子信息 通信工程 毕业 list jellyfin kotlin iphone export env 变量 pthread 系统 磁盘挂载 新盘添加 partedUtil 统信UOS libreoffice word转pdf 安装 环境部署 开发环境 VSCode 开发工具 微软 openssh NVIDIA显卡安装 Ubuntu开机黑屏 RTX5090 torch2.7.0 eNSP 企业网络规划 华为eNSP 网络规划 热榜 ShenTong deep learning elk Logstash 日志采集 PPI String Cytoscape CytoHubba 自动化任务管理 ip命令 新增网卡 新增IP 启动网卡 perl yum换源 设置代理 实用教程 c/c++ 串口 nftables 防火墙 私有化 Mermaid 可视化图表 ros1 Noetic 20.04 apt 安装 centos-root /dev/mapper yum clean all df -h / du -sh xml autoware Reactor Reactor反应堆 文件共享 健康医疗 仙盟大衍灵机 东方仙盟 仙盟创梦IDE pppoe radius rust 网卡的名称修改 eth0 ens33 EMQX 通信协议 pillow 常用命令 文本命令 目录命令 dell服务器 HTML audio 控件组件 vue3 audio音乐播放器 Audio标签自定义样式默认 vue3播放音频文件音效音乐 自定义audio播放器样式 播放暂停调整声音大小下载文件 react next.js 部署next.js cpu 实时 使用 IMM 豆瓣 追剧助手 adobe frp 内网服务器 内网代理 内网通信 rust腐蚀 express 测试用例 asp.net大文件上传 asp.net大文件上传源码 ASP.NET断点续传 asp.net上传文件夹 asp.net上传大文件 .net core断点续传 .net mvc断点续传 毕昇JDK 鲲鹏 机柜 1U 2U 录音麦克风权限判断检测 录音功能 录音文件mp3播放 小程序实现录音及播放功能 RecorderManager 解决录音报错播放没声音问题 shell word 框架 匿名FTP 邮件传输代理 SSL支持 chroot监狱技术 vmware tools VMware linq GPU状态 客户端-服务器架构 点对点网络 服务协议 网络虚拟化 网络安全防御 Cache Aside Read/Write Write Behind raid 智能硬件 SFTP SFTP服务端 GaN HEMT 氮化镓 单粒子烧毁 辐射损伤 辐照效应 Redis Desktop protobuf 序列化和反序列化 匿名管道 英语 进程优先级 调度队列 进程切换 电脑桌面出现linux图标 电脑桌面linux图标删除不了 电脑桌面Liunx图标删不掉 linux图标删不掉 gpt-3 大版本升 升级Ubuntu系统 IP配置 netplan brew 虚拟现实 裸机装机 linux磁盘分区 裸机安装linux 裸机安装ubuntu 裸机安装kali 裸机 MAC devmem RAGflow 腾讯云大模型知识引擎 minicom 串口调试工具 QT 5.12.12 QT开发环境 Ubuntu18.04 cnn DenseNet okhttp 增强现实 沉浸式体验 技术实现 案例分析 AR 流水线 脚本式流水线 ai小智 语音助手 ai小智配网 ai小智教程 esp32语音助手 diy语音助手 MVS 海康威视相机 宝塔 minio 文心一言 iftop 网络流量监控 DBeaver 版本 国产数据库 瀚高数据库 数据迁移 下载安装 qt5 客户端开发 ROS2 开放端口 访问列表 Crawlee axure 轮播图 GPUGEEK 三维重建 微信小程序域名配置 微信小程序服务器域名 微信小程序合法域名 小程序配置业务域名 微信小程序需要域名吗 微信小程序添加域名 rustdesk 统信 虚拟机安装 nextjs reactjs HCIE 数通 外网访问 iis 游戏程序 项目部署到linux服务器 项目部署过程 银河麒麟高级服务器 外接硬盘 Kylin AI作画 大数据平台 计算机 云服务 SWAT 配置文件 服务管理 网络共享 网站搭建 serv00 博客 UOS1070e Qwen2.5-VL postman Qualcomm WoS QNN AppBuilder web 建站 fpga 零日漏洞 CVE linux cpu负载异常 mysql离线安装 ubuntu22.04 mysql8.0 ArcTS 登录 ArcUI GridItem Ubuntu Server Ubuntu 22.04.5 DevEco Studio HarmonyOS OpenHarmony 真机调试 prometheus数据采集 prometheus数据模型 prometheus特点 VMware安装mocOS macOS系统安装 PX4 Ubuntu共享文件夹 共享目录 Linux共享文件夹 本地部署AI大模型 软件构建 Ubuntu DeepSeek DeepSeek Ubuntu DeepSeek 本地部署 DeepSeek 知识库 DeepSeek 私有化知识库 本地部署 DeepSeek DeepSeek 私有化部署 initramfs Linux内核 Grub Obsidian Dataview 代码 对比 meld Beyond Compare DiffMerge firewall powerbi 系统内核 Linux版本 latex FS 文件系统 mount bootfs rootfs linux目录 ufw 二级页表 SSH 服务 SSH Server OpenSSH Server 工作流 workflow Open WebUI pyautogui openstack Xen Hyper-V 怎么卸载MySQL MySQL怎么卸载干净 MySQL卸载重新安装教程 MySQL5.7卸载 Linux卸载MySQL8.0 如何卸载MySQL教程 MySQL卸载与安装 大语言模型 单元测试 Docker Hub docker pull daemon.json 网络建设与运维 网络搭建 神州数码 神州数码云平台 云平台 miniapp 调试 debug 断点 网络API请求调试方法 性能调优 安全代理 监控k8s 监控kubernetes 读写锁 cfssl 云原生开发 接口优化 k8s二次开发 富文本编辑器 Helm k8s集群 工具分享 大屏端 postgres Docker Desktop Dify重启后重新初始化 rtc Alist rclone 挂载 网盘 MAVROS 四旋翼无人机 企业风控系统 互联网反欺诈 DDoS攻击 SQL注入攻击 恶意软件和病毒攻击 dns Playwright MCP 模拟器 pnet 百度 pnetlab 技术 odoo 服务器动作 Server action ssrf 失效的访问控制 单一职责原则 CORS 跨域 live555 源码剖析 rtsp实现步骤 流媒体开发 无桌面 命令行 直播推流 致远OA OA服务器 服务器磁盘扩容 firefox micropython esp32 mqtt asm W5500 OLED u8g2 ABAP KylinV10 麒麟操作系统 Vmware 客户端 java-ee C# MQTTS 双向认证 emqx AP配网 AK配网 小程序AP配网和AK配网教程 WIFI设备配网小程序UDP开 less samba 硅基流动 ChatBox 联机 僵尸毁灭工程 游戏联机 开服 笔灵AI AI工具 numpy IIS 跨域请求 华为OD 华为OD机试真题 可以组成网络的服务器 pyside6 界面 ECS服务器 实时传输 矩阵乘法 3D深度学习 bcompare Hive环境搭建 hive3环境 Hive远程模式 灵办AI AList webdav fnOS 个人开发 ArkTs GPU环境配置 Ubuntu22 Anaconda安装 pyicu burp suite 抓包 推荐算法 rime 设备树 材料工程 线程同步 线程互斥 条件变量 vm harmonyosnext function address 函数 地址 内核 paddle HarmonyOS Next 管道 pipe函数 管道的大小 匿名管道的四种情况 文档 lvgl8.3 lvgl9.2 lvgl lvgl安装 深度求索 私域 实习 AI代码编辑器 数据仓库 kerberos DocFlow springboot远程调试 java项目远程debug docker远程debug java项目远程调试 springboot远程 springboot Xinference easyui docker搭建pg docker搭建pgsql pg授权 postgresql使用 postgresql搭建 DeepSeek r1 Alexnet compose qps 高并发 宝塔面板无法访问 WireGuard 异地组网 进程地址空间 写时拷贝 Linux的进程调度队列 活动队列 Apache OpenNLP 句子检测 分词 词性标注 核心指代解析 stm32项目 DeepSeek-R1 API接口 Kylin OS dubbo pyqt 游戏服务器 TrinityCore 魔兽世界 ESP32 ukui 麒麟kylinos openeuler ldap Netty 即时通信 NIO bonding 链路聚合 vue-i18n 国际化多语言 vue2中英文切换详细教程 如何动态加载i18n语言包 把语言json放到服务器调用 前端调用api获取语言配置文件 剧本 信创 信创终端 中科方德 outlook 错误代码2603 无网络连接 2603 免费 大模型训练/推理 推理问题 mindie log4j java-zookeeper Putty 花生壳 科勘海洋 数据采集浮标 浮标数据采集模块 proto actor actor model Actor 模型 Featurize Mobilenet 分割 教程 deepseek r1 RAGFLOW 检索增强生成 文档解析 大模型垂直应用 anaconda 用户缓冲区 can 线程池 perf linux内核 星河版 photoshop mybatis 苹果电脑装windows系统 mac安装windows系统 mac装双系统 macbook安装win10双 mac安装win10双系统 苹果电脑上安装双系统 mac air安装win 信息可视化 direct12 Mac部署 Ollama模型 Openwebui 配置教程 AI模型 uni-app x vr 北亚数据恢复 数据恢复 服务器数据恢复 数据库数据恢复 oracle数据恢复 GoogLeNet TRAE VLAN 企业网络 RoboVLM 通用机器人策略 VLA设计哲学 vlm fot robot 视觉语言动作模型 SSH 密钥生成 SSH 公钥 私钥 生成 Linux24.04 deepin firewalld yum源切换 更换国内yum源 docker搭建nacos详解 docker部署nacos docker安装nacos 腾讯云搭建nacos centos7搭建nacos ue5 mq rabbitmq Linux无人智慧超市 LInux多线程服务器 QT项目 LInux项目 单片机项目 电视剧收视率分析与可视化平台 database mongodb html LInux VGG网络 卷积层 池化层 ci/cd 远程服务 IO client-go Masshunter 质谱采集分析软件 使用教程 科研软件 DrissionPage 冯诺依曼体系 可用性测试 开发 飞书 搜狗输入法 中文输入法 双系统 多系统 回显服务器 UDP的API使用 个人博客 UDP .net core Hosting Bundle .NET Framework vs2022 autodl audio vue音乐播放器 vue播放音频文件 Audio音频播放器自定义样式 播放暂停进度条音量调节快进快退 自定义audio覆盖默认样式 做raid 装系统 Flask FastAPI Waitress Gunicorn uWSGI Uvicorn 僵尸世界大战 游戏服务器搭建 glibc 银河麒麟桌面操作系统 open Euler dde 磁盘监控 mock mock server 模拟服务器 mock服务器 Postman内置变量 Postman随机数据 Dell R750XS java-rocketmq 崖山数据库 YashanDB nfs 备份SQL Server数据库 数据库备份 傲梅企业备份网络版 思科模拟器 思科 Cisco 网络穿透 netty 半虚拟化 硬件虚拟化 Hypervisor OD机试真题 服务器能耗统计 wordpress 无法访问wordpess后台 打开网站页面错乱 linux宝塔面板 wordpress更换服务器 服务器管理 配置教程 网站管理 MQTT协议 消息服务器 云桌面 AD域控 证书服务器 React Next.js 开源框架 HP Anyware asp.net大文件上传下载 EtherCAT转Modbus EtherCAT转485网关 ECT转485串口服务器 ECT转Modbus485协议 ECT转Modbus串口网关 ECT转Modbus串口服务器 c/s vCenter服务器 ESXi主机 监控与管理 故障排除 日志记录 源代码管理 CPU架构 服务器cpu DICOM neo4j 数据库开发 edge浏览器 embedding matplotlib Linux PID 键盘 ruby 沙盒 华为证书 HarmonyOS认证 华为证书考试 CPU 使用率 系统监控工具 linux 命令 csrutil mac恢复模式进入方法 SIP 恢复模式 diskgenius 动静态库 可执行程序 Maxkb RAG技术 本地知识库 SPI C orbslam2 Android ANDROID_HOME zshrc 基础指令 指令 charles chrome历史版本下载 chrominum下载 cuda驱动 代码复审 codereview code-review 环境配置 ssh远程登录 iperf3 带宽测试 P2P HDLC 自动化编程 监控k8s集群 集群内prometheus deekseek Typore 输入系统 AzureDataStudio su sudo sudo原理 su切换 命令模式 linux子系统 忘记密码 进程池实现 dify部署 CAN 多总线 Typescript Quixel Fab Unity UE5 游戏商城 虚幻引擎 高考 省份 年份 分数线 数据 authorized_keys 密钥 弹性 c MS Materials mount挂载磁盘 wrong fs type LVM挂载磁盘 Centos7.9 kylin v10 麒麟 v10 rtp SSL证书 filezilla 无法连接服务器 连接被服务器拒绝 vsftpd 331/530 同步 备份 统信操作系统 黑客技术 ISO镜像作为本地源 IIS服务器 IIS性能 日志监控 echarts C++软件实战问题排查经验分享 0xfeeefeee 0xcdcdcdcd 动态库加载失败 程序启动失败 程序运行权限 标准用户权限与管理员权限 uni-file-picker 拍摄从相册选择 uni.uploadFile H5上传图片 微信小程序上传图片 LORA NLP 存储数据恢复 AD 域管理 音乐库 client close windows 服务器安装 CNNs 图像分类 显示器 massa sui aptos sei 文件存储服务器组件 logstash janus 证书 签名 站群服务器 OSB Oracle中间件 SOA LangGraph 模型上下文协议 MultiServerMCPC load_mcp_tools load_mcp_prompt 若依 内存不足 outofmemory Key exchange 主包过大 麒麟OS Lenovo System X GNOME 英语六级 TCP 多进程 TCP回显服务器 小游戏 五子棋 VMware安装Ubuntu Ubuntu安装k8s 鸿蒙开发 移动开发 chrome 浏览器下载 chrome 下载安装 谷歌浏览器下载 网络文件系统 cmake Isaac Sim 虚拟仿真 Xshell Ubuntu 24 常用命令 Ubuntu 24 Ubuntu vi 异常处理 免密 公钥 私钥 Charles JAVA 互联网实用编程指南 dnf 编译 烧录 linux/cmake tftp 药品管理 鸿蒙项目 产测工具框架 IMX6ULL 管理框架 ue4 着色器 x64 SIGSEGV xmm0 Zoertier 内网组网 考试 Multi-Agent LLaMA-Factory python高级编程 Ansible elk stack 服务注册与发现 安全性测试 Jenkins流水线 声明式流水线 SoC 原子操作 AXI lstm LSTM-SVM 时间序列预测 BMS 储能 CKA dataworks maxcompute 去中心化 libtorch LLMs windwos防火墙 defender防火墙 win防火墙白名单 防火墙白名单效果 防火墙只允许指定应用上网 防火墙允许指定上网其它禁止 国标28181 视频监控 监控接入 语音广播 流程 SDP 聊天室 高效日志打印 串口通信日志 服务器日志 系统状态监控日志 异常记录日志 备选 网站 api 调用 示例 Minecraft tcp 磁盘镜像 服务器镜像 服务器实时复制 实时文件备份 影刀 配置原理 yashandb 日志分析 系统取证 #STC8 #STM32 支持向量机 mvc web开发 gateway Arduino 电子信息工程 网络带宽 问题排查 分类 过期连接 笔记本电脑 gemini gemini国内访问 gemini api gemini中转搭建 Cloudflare 宠物 免费学习 宠物领养 宠物平台 trae HiCar CarLife+ CarPlay QT RK3588 npm archlinux kde plasma NVM Node Yarn PM2 zip unzip miniconda 软件商店 livecd systemtools nano 泰山派 根文件系统 嵌入式实时数据库 linux常用命令 leetcode IMX317 MIPI H265 VCU AnythingLLM AnythingLLM安装 软负载 camera intellij idea deployment daemonset statefulset cronjob image SystemV IPv4/IPv6双栈 双栈技术 网路规划设计 ensp综合实验 IPv4过渡IPv6 IPv4与IPv6 VM虚拟机 visual studio d3d12 蜂窝网络 频率复用 射频单元 无线协议接口RAN 主同步信号PSS 百度云 openresty 转换 智能体 软路由 STP 生成树协议 PVST RSTP MSTP 防环路 网络基础 多媒体 BitTorrent 搜索 根目录 机器人操作系统 issue coze 调试方法 Valgrind 内存分析工具 sse_starlette Starlette Server-Sent Eve 服务器推送事件 asi_bench kamailio sip VoIP thingsboard VNC iBMC UltraISO saltstack 智能电视 zerotier deepseak 豆包 KIMI 腾讯元宝 网络原理 qwen2vl cocos2d 3dcoat pyscenic 生信教程 LVS anonymous 全栈 CPU 网络IO 队列 数据库占用空间 MateBook 客户端/服务器架构 分布式应用 三层架构 Web应用 跨平台兼容性 Spring AI 大模型应用开发 AI 应用商业化 jvm调优 LRU策略 内存增长 垃圾回收 xshell termius iterm2 高级IO epoll Maven beautifulsoup Echarts图表 折线图 柱状图 异步动态数据 可视化效果 CUPS 打印机 Qt5 STL 导航栏 PostgreSQL15数据库 迁移 debezium 数据变更 容器清理 大文件清理 空间清理 模块测试 homebrew windows转mac ssh密匙 Mac配brew环境变量 HP打印机 sublime text electron 空Ability示例项目 讲解 ceph ubuntu24.04.1 bot 显示过滤器 ICMP Wireshark安装 redhat 计算机科学与技术 webview 隐藏目录 管理器 通配符 web环境 学习路线 目标跟踪 代理配置 企业级DevOps 深度强化学习 深度Q网络 Q_Learning 经验回收 电子器件 二极管 三极管 MinerU 软件安装 局域网 驱动器映射 批量映射 win32wnet模块 网络驱动器映射工具 lsof linux命令 zotero 同步失败 Invalid Host allowedHosts vscode1.86 1.86版本 ssh远程连接 阻塞队列 生产者消费者模型 服务器崩坏原因 opcua opcda KEPServer安装 图论 并集查找 换根法 树上倍增 file server http server web server 三级等保 服务器审计日志备份 远程看看 远程协助 swoole 繁忙 解决办法 替代网站 汇总推荐 AI推理 充电桩 欧标 OCPP WebServer oracle fusion oracle中间件 券商 股票交易接口api 类型 特点 股票量化接口 股票API接口 PTrade QMT 量化股票 aac pxe openvino 惠普服务器 惠普ML310e Gen8 惠普ML310e Gen8V2 http状态码 请求协议 机器人仿真 模拟仿真 DELL R730XD维修 全国服务器故障维修 视频服务器 相机标定 teamspeak 材质 贴图 three.js JavaWeb Echo 链表 USB转串口 数学建模 ArtTS Linux的权限 composer lsb_release /etc/issue /proc/version uname -r 查看ubuntu版本 GRANT REVOKE OS wifi驱动 Linux的进程控制 机床 仿真 课件 教学 课程 gstreamer zephyr 编译器 Ubuntu22.04 #影刀RPA# MDK 嵌入式开发工具 运维监控 docker部署翻译组件 docker部署deepl docker搭建deepl java对接deepl 翻译组件使用 烟花代码 烟花 元旦 GRUB引导 Linux技巧 OpenVINO 推理应用 免费域名 域名解析 WebVM 大模型技术 本地部署大模型 lb 协议 开发人员主页 scapy 全文检索 图搜索算法 烟雾检测 yolo检测 消防检测 llamafactory 微调 Qwen Linux系统编程 生成对抗网络 聚类 unionFS OverlayFS OCI docker架构 写时复制 xfce 客户端和服务器端 Nginx报错413 Request Entity Too Large 的客户端请求体限制 思科实验 高级网络互联 ping++ 宝塔面板访问不了 宝塔面板网站访问不了 宝塔面板怎么配置网站能访问 宝塔面板配置ip访问 宝塔面板配置域名访问教程 宝塔面板配置教程 VM搭建win2012 win2012应急响应靶机搭建 攻击者获取服务器权限 上传wakaung病毒 应急响应并溯源 挖矿病毒处置 应急响应综合性靶场 DeepSeek行业应用 Heroku 网站部署 银河麒麟操作系统 triton 模型分析 干货分享 黑客工具 密码爆破 ECT转Modbus协议 EtherCAT转485协议 ECT转Modbus网关 浏览器自动化 像素流送api 像素流送UE4 像素流送卡顿 像素流送并发支持 话题通信 服务通信 Carla 蓝桥杯C++组 AimRT 事件驱动 量子计算 进程管理 struts 物联网嵌入式开发实训室 物联网实训室 嵌入式开发实训室 物联网应用技术专业实训室 AudioLM SQI iOS Server Trust Authentication Challenge 医疗APP开发 app开发 lvm 高德地图 鸿蒙接入高德地图 HarmonyOS5.0 Metastore Catalog java毕业设计 微信小程序医院预约挂号 医院预约 医院预约挂号 小程序挂号 clipboard 剪贴板 剪贴板增强 文件权限 CTE AGE 进程程序替换 execl函数 execv函数 execvp函数 execvpe函数 putenv函数 Python学习 Python编程 illustrator 美食 MAC地址 jina 金仓数据库 2025 征文 数据库平替用金仓 TCP协议 bat telnet 远程登录 AI Agent 字节智能运维 飞牛nas fnos selete 自学笔记 小米 澎湃OS K8S k8s管理系统 容器化 Serverless 内存管理 risc-v 本地环回 bind nacos容器环境变量 docker启动nacos参数 nacos镜像下载 电脑操作 回归 AOD-PONO-Net 图像去雾技术 muduo库 huggingface SSM 项目实战 页面放行 TraeAgent shell编程 ecm bpm WinRM TrustedHosts vSphere vCenter 软件定义数据中心 sddc EtherNet/IP串口网关 EIP转RS485 EIP转Modbus EtherNet/IP网关协议 EIP转RS485网关 EIP串口服务器 googlecloud WebRTC 创意 社区 DOIT 四博智联 IPMITOOL 硬件管理 rtsp服务器 rtsp server android rtsp服务 安卓rtsp服务器 移动端rtsp服务 大牛直播SDK 状态模式 小智AI服务端 xiaozhi TTS 阿里云ECS 主板 电源 网卡 服务器部署 本地拉取打包 弹性服务器 环境 非root vue在线预览excel和编辑 vue2打开解析xls电子表格 浏览器新开页签或弹框内加载预览 文件url地址或接口二进制文档 解决网页打不开白屏报错问题 asp.net ueditor导入word 大学大模型可视化教学 全球气象可视化 大学气象可视化 服务器租用 物理机 进度条 cn2 带宽 多端开发 智慧分发 应用生态 鸿蒙OS 微信分享 Image wxopensdk EMUI 回退 降级 Linux awk awk函数 awk结构 awk内置变量 awk参数 awk脚本 awk详解 Linux的基础指令 mm-wiki搭建 linux搭建mm-wiki mm-wiki搭建与使用 mm-wiki使用 mm-wiki详解 fonts-noto-cjk systemctl 更换镜像源 elementui 若依框架 Makefile Make 蓝耘科技 元生代平台工作流 ComfyUI k8s资源监控 annotations自动化 自动化监控 监控service 监控jvm k8s集群资源管理 WebUI DeepSeek V3 并查集 virtualbox Docker快速入门 一切皆文件 RDP post.io 企业邮箱 搭建邮箱 需求分析 知行EDI 电子数据交换 知行之桥 EDI 漏洞报告生成 Web3 Telegram isaacgym Arduino下载开发板 esp32开发板 esp32-s3 wpf dsp开发 Linux权限 权限掩码 粘滞位 青少年编程 编程与数学 冯诺依曼体系结构 迭代器模式 mysql 8 mysql 8 忘记密码 MySQL pytorch3d Docker 部署es9 Docker部署es Docker搭建es9 Elasticsearch9 Docker搭建es 高效远程协作 TrustViewer体验 跨设备操作便利 智能远程控制 网页设计 多个客户端访问 IO多路复用 TCP相关API XFS xfs文件系统损坏 I_O error Spring Security 移动云 显示管理器 lightdm gdm 服务器主板 AI芯片 VMware创建虚拟机 工业4.0 域名服务 DHCP 符号链接 配置 VS Code Web应用服务器 服务器ssl异常解决 行情服务器 股票交易 速度慢 切换 软件开发 三次握手 MinIO 机架式服务器 1U工控机 国产工控机 RNG 状态 可复现性 随机数生成 大厂程序员 硅基计算 碳基计算 认知计算 生物计算 AGI 系统架构设计 软件哲学 程序员实现财富自由 热键 slave AI导航站 信创国产化 达梦数据库 CLI JavaScript langgraph.json Scoket 套接字 零售 flink flinkcdc alphafold3 mcp client mcp server webgl 服务网格 istio 捆绑 链接 谷歌浏览器 youtube google gmail 基础入门 sonoma 自动更新 玩机技巧 软件分享 软件图标 cmos safari 软件卸载 系统清理 curl wget Tabs组件 TabContent TabBar TabsController 导航页签栏 滚动导航栏 容器技术 影视app 蓝牙 Bluetooth 配对 Linux指令 软硬链接 文件 ebpf vscode-server ubuntu18.04 springcloud CLion 端口聚合 win11 windows11 ubuntu 18.04 import save load 迁移镜像 权限命令 特殊权限 kubeless 桥接模式 windows虚拟机 虚拟机联网 游戏机 恒玄BES podman registries Agentic Web NLWeb 自然语言网络 微软build大会 能效分析 数字化转型 Spring Boot es 进程状态 僵尸进程 Radius webstorm RTMP 应用层 unity3d 银河麒麟服务器操作系统 系统激活 VPS raid5数据恢复 磁盘阵列数据恢复 聊天服务器 Socket 大文件秒传跨域报错cors Dedicated Host Client 无头主机 算力 执法记录仪 智能安全帽 smarteye wsgiref Web 服务器网关接口 温湿度数据上传到服务器 Arduino HTTP 田俊楠 西门子PLC 通讯 小番茄C盘清理 便捷易用C盘清理工具 小番茄C盘清理的优势尽显何处? 教你深度体验小番茄C盘清理 C盘变红?!不知所措? C盘瘦身后电脑会发生什么变化? ocr glm4 shard 教育电商 腾讯云服务器 轻量应用服务器 linux系统入门 物理服务器 云服务器租用 物理机租用 独立服务器 RHEL 雾锁王国 messages dmesg blender 数字孪生 决策树 滑动验证码 反爬虫 抽象工厂模式 加密 HarmonyOS5 软件高CPU占用 ProcessExplorer Process Hacker System Informer Windbg 线程的函数调用堆栈 alias unalias 别名 黑苹果 多层架构 解耦 threejs 3D 历史版本 下载 vpn 空间 查错 nginx默认共享目录 高可用 底层实现 命令键 vr看房 在线看房系统 房产营销 房产经济 三维空间 数码相机 全景相机 设备选择 实用技巧 数字空间 服务 源码软件 单用户模式 nvcc A100 linux上传下载 etl 子网掩码 公网IP 私有IP ubuntu24 vivado24 路径解析 序列化反序列化 efficientVIT YOLOv8替换主干网络 TOLOv8 显卡驱动 lio-sam SLAM Node-Red 编程工具 流编程 嵌入式系统开发 输入法 钉钉 NLP模型 rancher scikit-learn 脚本 autogen openai 代码规范 通用环境搭建 影刀证书 分享 记账软件 容器部署 自动化测试框架 简单工厂模式 计算机八股 开启关闭防火墙 WebFuture 改行学it 重构 c盘 磁盘清理 人工智能作画 requests python库 WIFI7 无线射频 高通 射频校准 射频调试 射频匹配 SVN Server tortoise svn Ubuntu 24.04.1 轻量级服务器 junit HAProxy 直流充电桩 DigitalOcean GPU服务器购买 GPU服务器哪里有 GPU服务器 MI300x cpp-httplib 宕机切换 服务器宕机 Erlang OTP gen_server 热代码交换 事务语义 tailscale derp derper 中转 能力提升 面试宝典 IT信息化 加解密 Yakit yaklang sqlite3 技术共享 搭建个人相关服务器 gradle TrueLicense dba banner 内网渗透 靶机渗透 实时云渲染 云渲染 3D推流 光电器件 LED eventfd 高性能 ECS 漫展 开发效率 Windmill 观察者模式 访问公司内网 华为OD机考 机考真题 需要广播的服务器数量 SPP 前端项目部署 微前端 linux安装配置 Attention conda配置 conda镜像源 cd 目录切换 trea idea Cookie 终端 macbook Github加速 Mac上Github加速 Chrome浏览器插件 Bandizip Mac解压 Mac压缩 压缩菜单 多路转接 PATH 命令行参数 main的三个参数 react Native token 实战项目 入门 精通 HarmonyOS 5开发环境 离线部署dify fd 文件描述符 ollama下载加速 浏览器开发 AI浏览器 抗锯齿 OpenManus System V共享内存 进程通信 Sealos copilot 图片增强 增强数据 网易邮箱大师 IPv6测试 IPv6测速 IPv6检测 IPv6查询 静态IP 源代码 anythingllm open-webui docker国内镜像 finalsheel hosts hosts文件管理工具 开源软件 4 - 分布式通信、分布式张量 fabric 集成 HBase分布式集群 HBase环境搭建 HBase安装 HBase完全分布式环境 pandas 麒麟kos 网络检测 ping TiDB测试集群 csapp 缓冲区 NAT转发 NAT Server vasp安装 流式接口 根服务器 SSL 域名 windows日志 AI agent MNN 社交电子 服务器部署ai模型 KingBase 雨云服务器 Clion Nova ResharperC++引擎 Centos7 远程开发 ardunio BLE skynet 矩阵 视觉检测 智能音箱 智能家居 win服务器架设 windows server 安防软件 互信 代码托管服务 联网 easyconnect 代理 solidworks安装 ueditor导入pdf ueditor导入ppt laravel 海康 Webserver 异步 Qt QModbus 矩池云 数据下载 数据传输 rtcp 静态NAT MCP 服务器 JADX-AI 插件 rtmp 网络接口 时间间隔 所有接口 多网口 OpenAI 磁盘IO iostat nvidia驱动 Tesla显卡 cs144 医药 快速入门 av1 电视盒子 机顶盒ROM 魔百盒刷机 元服务 应用上架 MacOS录屏软件 regedit 开机启动 分析解读 代理服务器 模拟实现 HarmonyOS NEXT 原生鸿蒙 查看显卡进程 fuser DIFY Office 提示词 ubantu GKI KMI 本地不受DeepSeek 路径规划 文件清理 Unlocker 视频号 嵌入式软件 RTOS docker命令大全 seatunnel dock 加速 proxy模式 交叉编译 问题解决 uprobe 生活 netlink libnl3 论文阅读 UFW CAD瓦片化 栅格瓦片 矢量瓦片 Web可视化 DWG解析 金字塔模型 springboot容器部署 springboot容器化部署 微服务容器化负载均衡配置 微服务容器多节点部署 微服务多节点部署配置负载均衡 sql注入 打包工具 物理层 dnn 无法解析服务器的名称或地址 hibernate h.264 查询数据库服务IP地址 SQL Server 内网环境 sas sysctl.conf vm.nr_hugepages 业界资讯 hugo 架构与原理 XCC Lenovo 迁移指南 服务器正确解析请求体 nosql 云耀服务器 授时服务 北斗授时 动态规划 负载测试 accept 自定义登录信息展示 motd 美化登录 动态域名 事件分析 边缘服务器 利旧 AI识别 EF Core 客户端与服务器评估 查询优化 数据传输对象 查询对象模式 服务发现 js逆向 labview 接口隔离原则 科研绘图 生信服务器 HTTP3 全双工通信 多路复用 实时数据传输 移动魔百盒 信号 小艺 Pura X navicat 合成模型 扩散模型 图像生成 Linux环境 CentOS Stream CentOS Ark-TS语言 支付 微信支付 开放平台 强制清理 强制删除 mac废纸篓 基础环境 fork wait waitpid exit 多产物 跨平台 Mac软件 玩游戏 sublime text3 cpolar NTP服务器 AppLinking 应用间跳转 时间轮 亲测 bpf bpfjit pcap 更新apt 安装hadoop前的准备工作 IO模型 figma 互联网医院 xpath定位元素 linux 命令 sed 命令 实战案例 端口 查看 ss WLAN 解决方案 GameFramework HybridCLR Unity编辑器扩展 自动化工具 ajax solr Trae叒更新了? 红黑树封装map和set 医院门诊管理系统 mapreduce 5分钟快速学 docker入门 dockerfile 仓库 proxy_pass AI控制浏览器 Browser user pavucontrol 蓝牙耳机 汇编 vb openGauss code-server bootstrap SEO 相差8小时 UTC 时间 ux URL 游戏开发 sentinel 分布式训练 SysBench 基准测试 超融合 端口测试 clickhouse VPN wireguard 金仓数据库概述 金仓数据库的产品优化提案 AWS caddy OpenManage uv 能源 access blocked 破解 排序算法 选择排序 分布式数据库 集中式数据库 业务需求 选型误 机架式 IDC aiohttp asyncio 报警主机 豪恩 VISTA120 乐可利 霍尼韦尔 枫叶 时刻 udp回显服务器 算法协商 故障排查 哥sika 支付宝小程序 云开发 tengine web负载均衡 WAF 语法 VR手套 数据手套 动捕手套 动捕数据手套 keepalived 极限编程 用户管理 retry 重试机制 Ardupilot 子系统 Linux的基础开发工具 顽固图标 启动台 实时日志 logs 自定义shell当中管道的实现 匿名和命名管道 红黑树 C/C++ Navigation 路由跳转 鸿蒙官方推荐方式 鸿蒙原生开发 GenAI LLM 推理优化 LLM serving 云盘 安全组 智能手表 Pura80 WATCH 5 南向开发 北向开发 体验鸿蒙电脑操作系统 Windows电脑能装鸿蒙吗 I/O 设备管理 uboot 部署方案 docker部署Python ELF加载 GRE 智能问答 Milvus 定义 核心特点 优缺点 适用场景 broadcom 基本指令 模板 共享 设置 ICMPv6 gerrit 触觉传感器 GelSight GelSightMini GelSight触觉传感器 SonarQube 网络配置 路由配置 mcp-server coze扣子 AI口播视频 飞影数字人 coze实战 ipv6 光猫设置 路由器设置 myeclipse 压测 恒源云 Wi-Fi vscode 1.86 jetty undertow Nuxt.js xss Unity插件 chfs ubuntu 16.04 IDEA WINCC 流量 风扇散热策略 曙光 海光 宁畅 中科可控 jQuery A2A 服务器托管 云托管 数据中心 idc机房 鼠标 FreeRTOS MQTT Broker GMQT BIO Java socket Java BIO Java NIO Java 网络编程 pve java18 粘包问题 whistle win向maOS迁移数据 数据库管理 接口返回 mujoco Ubuntu 24.04 搜狗输入法闪屏 Ubuntu中文输入法 ps命令 手动分区 系统完整性 越狱设备 线程安全 tvm安装 深度学习编译器 RHCE 程序地址空间 恢复 对话框showDialog showActionMenu 操作列表ActionSheet CustomDialog 文本滑动选择器弹窗 消息提示框 警告弹窗 infini-synapse Bilibili B站 fast 李心怡 项目部署 集群管理 watchtower homeassistant nmcli containerd CodeBuddy首席试玩官 rxjava 电子学会 数据链路层 Jenkins 配置凭证 Searxng paddlepaddle iDRAC R720xd AISphereButler 流量运营 hexo 高效I/O 充电桩平台 充电桩开源平台 泛型编程 制造 站群 多IP 低成本 bug定位 缺陷管理 webserver 国产芯片 风扇控制软件 qtcreator 端口开放 coffeescript webgis cesium Eigen CMake 自动化编译工具 达梦 DM8 docker search 手机 Modbus TCP 系统架构设计师 机床主轴 热误差补偿 风电齿轮箱 故障诊断 物理-数据融合 预测性维护 2025一带一路金砖国家 金砖国家技能大赛 技能发展与技术创新大赛 首届网络系统虚拟化管理与运维 比赛样题 服务器时间 idm 数字证书 签署证书 lrzsz 火山引擎 Async注解 工厂方法模式 Modbustcp服务器 参数服务器 分布式计算 数据并行 openlayers bmap tile server ESP8266简单API服务器 Arduino JSON 集群 uni-popup报错 连接服务器超时 点击屏幕重试 uniapp编译报错 uniapp vue3 imported module TypeError macOS bert IT 护眼模式 Linux的进程概念 重置密码 android-ndk VUE Mysql Windows Hello 摄像头 指纹 生物识别 C++11 lambda 包装类 杂质 CKEditor5 PCB PDF 图片 表格 文档扫描 发票扫描 vmvare mysql8.4.5 CAN总线 进程操作 理解进程 机械臂 数字比特流 模拟信号 将二进制数据映射到模拟波形上 频谱资源 振幅频率相位 载波高频正弦波 MobileNetV3 微信自动化工具 微信消息定时发送 ROS1/ROS2 Wayland VAD 视频异常检测 VAR 视频异常推理 推理数据集 强化微调 GRPO FCN 实时语音识别 流式语音识别 gin 视频会议 工作流自动化 AI智能体 scala 佛山戴尔服务器维修 佛山三水服务器维修 authing Windows 11 重装电脑系统 pikachu靶场 XSS漏洞 XSS DOM型XSS Web测试 协作 转流 rtsp取流 rtmp推流 EasyTier Windows应急响应 应急响应 webshell 网络攻击防御 网络攻击 octomap_server 九天画芯 铁电液晶 显示技术 液晶产业 技术超越 HarmonyOS SDK Map Kit 地图 桶装水小程序 在线下单送水小程序源码 桶装水送货上门小程序 送水小程序 订水线上商城 CTF 时序数据库 iotdb vsode arkts arkui 路由器 系统升级 16.04 nvm安装 time时间函数 上架 mac完美终端 HDC2025 HarmonyOS 6 docker安装mysql win下载mysql镜像 mysql基本操作 docker登陆私仓 docker容器 deepseek与mysql 集合 List 中文分词 UDS Bootloader 概率与统计 随机化 位运算 几何计算 数论 PP-OCRv5 ubuntu20.04 OCR 线性代数 线程同步与互斥 电商平台 zipkin cangjie Java 日志框架 Log4j2 Logback SLF4J 结构化日志 企业级应用 FS100P mobaxterm 泛微OA 视频直播物理服务器租用 KingbaseES 分布式总线 激光雷达 镭眸 云解析 云CDN SLS日志服务 云监控 CUDA Toolkit FreeLearning 苹果 黑马 苍穹外卖 线程互斥与同步 安全整改 黑屏 Win10修改MAC 原创作者 MVVM 鸿蒙5.0 备忘录应用 ai编程 N8N docker 失效 docker pull失效 docker search超时 最新微服务 BiSheng 扩展错误 vue2 开启黑屏 gpu 虚拟主机 物理机服务器 食用文档 开闭原则 物理服务器租用 汽车 English #Linux #shell #脚本 EulerOS 版本对应 Linux 发行版 企业级操作系统 开源社区 GDB调试 Ubuntu环境 四层二叉树 断点设置 cp 进度显示 skywalking pow 指数函数 优化 NAT usb typec 责任链模式 信奥 Cilium 几何绘图 三角函数 pi0 lerobot aloha act 敏捷开发 NGINX POD CSDN开发云 siteground siteground安装wp 一键安装wordpress 服务器安装wordpress 小亦平台 运维问题解决方法 gaussdb问题解决 dos 批处理 日期 学习笔记 分布式锁 效率 FreeFileSync 定时备份 OpenTiny funasr asr 语音转文字 proteus iptables Termius Vultr 远程服务器 ohmyzsh network NetworkManager dockercompose安装 compose.yml文件详解 dockercompose使用 rtsp转rtmp 海康rtsp转rtmp 摄像头rtsp到rtmp rtsp转发 rtsp摄像头转rtmp rtsp2rtmp 地平线5 dfs RustDesk 搭建服务器 cordova 跨域开发 统信uos 进程创建 进程退出 WinCC OT与IT SCADA 智能制造 MES guava SpringBoot redisson tty2