最新资讯

  • 混合专家模型MoE的全面指南(二)路由机制、负载均衡

混合专家模型MoE的全面指南(二)路由机制、负载均衡

2025-04-27 18:37:43 2 阅读

三、路由机制

既然我们有了这么一帮专家,那模型咋知道该用哪个专家呢?在专家前面加了个门控网络,它会学着挑出给定词用哪个专家。

1、路由器

路由器(门控网络)也是前馈神经网络,根据特定输入来选专家。它会输出概率,用这些概率来挑出最匹配的专家:

专家层会返回选中的专家的输出乘以门控值(选择概率)。

路由器加上专家(只选几个)就组成了专家混合(MoE)层:

一个MoE层有两种尺寸,要么是稀疏的,要么是密集的专家混合。

两者都用路由器选专家,但稀疏MoE只挑几个,密集MoE虽然全选,但可能按不同分布来选。

比如,给定一串词,MoE会把词分给所有专家,而稀疏MoE就只挑几个专家。

在目前大型语言模型(LLM)的状况下,看到‘MoE’一般指稀疏MoE,因为它能用专家的一个子集。这样计算成本低,对大型语言模型来说很重要。

2、专家的选择

门控网络可以说是专家混合(MoE)里最重要的部分,因为它不仅决定了推理时用哪些专家,训练时也一样。

最基础的形式下,我们把输入(x)和路由器的权重矩阵(W)相乘:

然后,对输出应用 SoftMax 函数,为每个专家生成一个概率分布

路由器用这个概率分布来挑出给定输入最适合的专家。

最后,我们把每个路由器的输出和每个选中的专家的输出相乘,再把结果加起来。

咱们把所有步骤串起来,看看输入是怎么通过路由器和专家的:

3、路由的复杂性

不过,这个简单的函数常常会导致路由器总是选同一个专家,因为有些专家可能学得比其他专家快:

这不仅会导致专家选择的分布不均,还会使一些专家几乎不被训练,从而在训练和推理过程中引发问题。

为了解决这个问题,我们希望在训练和推理过程中,所有专家都能得到平等的重视,这被称为负载均衡。这样可以防止模型过度依赖少数几个专家,从而避免过拟合。

四、负载均衡

为了平衡专家的重要性,我们需要关注路由器,因为它是决定在特定时间选择哪些专家的主要组件。

1、KeepTopK

一种负载均衡路由器的方法是通过一个简单的扩展,称为 KeepTopK。通过引入可训练的高斯噪声,有助于打破对特定专家的偏好,使选择更加随机化,这样我们可以防止总是选择相同的专家:

然后,除了你想要激活的顶部 k 个专家(例如 2 个)之外,其他专家的权重会被设置为 −∞:

通过将这些权重设置为 −∞,SoftMax 函数在这些权重上的输出将导致概率为 0:

SoftMax 函数的性质: SoftMax 函数将一个向量转换为概率分布,每个元素的值在 0 和 1 之间,且所有元素的和为 1。 SoftMax 函数的公式为:

其中,是输入向量,是向量的长度,是向量的第 个元素。 设置权重为 :

当某个元素的值为 时,的值为 0。

因此,对于任何包含的向量,SoftMax 函数将这些元素的输出概率设置为 0。 具体步骤

假设我们有中间向量 ,其中某些元素被设置为:

应用 SoftMax 函数:

具体计算:由于e^{-infty} = 0,上述表达式简化为: ext{SoftMax}(math

计算具体值: ext{SoftMax}(mathbf{z}_{ ext{top-k}}) = left, rac{1.6487}{1.6487 + $2.22$55}, 0, rac{2.2255}{1.6487 + 2.2255}, 0 ight] = left[ 0, 0.4256, 0,0.5744, 0 ight]

结果

通过将权重设置为 ,SoftMax 函数确保了这些专家的激活概率为 0,从而只激活顶部 个专家。

优点

负载均衡: 确保每个专家都有机会被激活,避免某些专家过度使用而其他专家闲置。

防止过拟合: 通过引入噪声,防止模型过度依赖少数几个专家,从而提高模型的泛化能力。

灵活性: 可以根据具体需求调整的值,灵活控制专家的选择数量。

KeepTopK 策略是许多大型语言模型(LLM)仍在使用的一种方法,尽管有许多有前景的替代方案。需要注意的是,KeepTopK 也可以在不添加额外噪声的情况下使用。

Token Choice

KeepTopK 策略将每个词路由到几个选定的专家。这种方法称为 Token Choice,允许给定的词被发送到一个专家(top-1 路由)或多个专家(top-k 路由)。

或者发送到多个专家(top-k 路由):

辅助损失

一个主要的好处是,它允许对各个专家的贡献进行加权和整合。

为了在训练过程中实现专家的更均匀分布,辅助损失(也称为负载均衡损失)被添加到了网络的常规损失中。

它增加了一个约束,迫使专家具有相等的重要性。 这个辅助损失的第一个组成部分是在整个批次中对每个专家的路由器值进行求和:

这为我们提供了每个专家的重要性分数,这些分数表示无论输入是什么,给定专家被选中的可能性。

我们可以利用这些分数来计算变异系数(CV),它告诉我们专家之间的重要性分数的差异程度。

例如,如果重要性分数差异很大,变异系数(CV)将会很高:

相反,如果所有专家的重要性分数相似,变异系数(CV)将会很低(这是我们所期望的):

利用这个 CV 分数,我们可以在训练过程中更新辅助损失,使其尽可能降低 CV 分数(从而给予每个专家相等的重要性):

最后,辅助损失作为单独的损失在训练过程中进行优化。

2、专家容量

不平衡不仅存在于被选择的专家中,还存在于发送到专家的令牌分布中。

例如,如果输入令牌不成比例地发送到一个专家而不是另一个专家,这可能会导致训练不足。

这里,问题不仅仅在于使用了哪些专家,还在于对它们的使用程度。

一个解决方案是限制给定专家可以处理的令牌数量,即专家容量(Expert Capacity)。当一个专家达到其容量时,后续的令牌将被发送给下一位专家。

如果两个专家都达到容量了,这个词就不会被任何专家处理,而是直接送到下一层。这就叫做词溢出。

简单来说,就好比有两个专家在处理任务,但他们都忙不过来了,手上的活儿已经堆得满满的。这时候再来的新任务,他们就没办法处理了,只能把这个任务往后传,让下一层的专家或者别的机制来处理。这就叫词溢出。

3、用 Switch Transformer 简化 MoE

最早解决 MoE 训练不稳定性问题(如负载均衡)的基于 Transformer 的 MoE 模型之一是 Switch Transformer。它极大地简化了架构和训练过程,同时提高了训练的稳定性。

Switch Transformer

Switch Transformer 是 Google 在 2022 年发表的一篇论文中提出的一种模型,它简化了 MoE 的路由算法,减少了计算量和通信量,同时支持 bfloat16 精度进行训练。基于 T5-Base 和 T5-Large 设计的模型在相同的算力下训练速度提升了 7 倍;同时发布了 1.6 万亿参数的 MoE 模型,相比 T5-XXL 模型训练速度提升了 4 倍。

模型介绍

Switch Transformer 是一个 T5 模型(编码器-解码器),它用切换层替换了传统的前馈神经网络层。切换层是一个稀疏的 MoE 层,它为每个词元选择一个专家(Top-1 路由)。

简化稀疏路由

在传统的 MoE 层中,网络接收一个输入词元 ,输出会路由到 top-K 个专家进行计算。Switch Transformer 采用了一种简化的路由策略,即每次只发给一个专家,这样可以显著减少路由的计算量,同时保证模型的性能。

高效稀疏路由

Switch Transformer 通过以下方式实现高效稀疏路由:

路由计算量减少: 只有一个专家被激活,减少了计算量。

专家容量减半: 专家中的 batch_size 至少减半,进一步减少了计算量。

简化路由实现: 减少了传统 MoE 方法中通信的代价。

分布式 Switch 实现

Switch Transformer 的分布式实现中,所有核心被分配给数据分区维度 ,这也对应于模型中的专家数量。对于每个核心的每个词元,路由器会本地计算分配给专家的分配。输出是一个大小为 的二进制矩阵,该矩阵在第一维度上进行分区,并确定专家的分配。

负载均衡损失

为了促使每个专家都可以拿到近似均匀分布的样本,Switch Transformer 引入了负载均衡损失。 当 时,损失是最小的。

切换层

Switch Transformer 是一个 T5 模型(编码器-解码器),它用切换层替换了传统的前馈神经网络层。切换层是一个稀疏的 MoE 层,它为每个词元选择一个专家(Top-1 路由)。

简单来说,就是路由器在挑专家的时候,就是按照老规矩来,把输入数据和专家的权重相乘,然后用 SoftMax 函数处理一下,看看哪个专家最合适。没有啥复杂的操作,就是常规操作。

Switch Transformer 用了一种很简单的办法 来挑专家。以前的方法是让每个词元找好几个专家来处理,这种方法叫 top-k 路由。但 Switch Transformer 说,其实每个词元找一个专家就足够了,这种方法叫 top-1 路由。这样做的好处是,计算量变小了,通信成本也降低了,而且训练起来更稳定。

容量因子

容量因子就像是给每个专家分配任务的“额度”。这个值很重要,因为它决定了每个专家能处理多少个词元。Switch Transformer 在这方面做了改进,通过直接调整容量因子来控制每个专家的处理能力。这样做的好处是,可以更好地平衡每个专家的负载,避免有些专家忙不过来,而有些专家却很闲。

tokens per batch: 每个批次中的令牌总数。

number of experts: 专家的数量。

capacity factor: 容量因子,通常大于 1,以提供额外的缓冲空间。

专家容量的组成部分其实挺简单的。专家容量主要由两个因素决定:每个批次中的令牌数量和专家的数量。

如果我们把容量因子调大,每个专家就能处理更多的词元。这听起来好像挺好的,因为专家们能干更多的活儿。

但是,如果把这个因子调得太大,就会浪费很多计算资源,因为有些专家可能会闲着没事干。反过来,如果容量因子太小,专家们就会忙不过来,处理不了所有的词元,这就叫令牌溢出。结果就是,模型的性能会变差,因为有些词元没被处理好。所以,容量因子得找个合适的值,这样才能让专家们既不过载,也不闲置,模型性能也能保持在最佳状态。

辅助损失

辅助损失这个东西,就是为了防止模型在处理数据时丢掉一些重要的信息。想象一下,每个专家都有自己的工作量,我们希望这些工作量分配得均匀一些。为了达到这个目的,我们引入了一个简化的辅助损失函数。

这个辅助损失函数不是去计算那些复杂的变异系数,而是直接看每个专家被分配到的令牌比例和路由器预测的概率。具体来说,我们希望每个专家处理的令牌数量和它们被选中的概率都差不多,也就是每个专家都能均匀地分到活儿干。

α 这个超参数就像是一个调节旋钮,用来控制这个辅助损失在训练过程中的重要性。如果 α 值设得太高,辅助损失就会太强势,把主要的损失函数都盖过去了;如果 α 值太低,那这个辅助损失就起不到什么作用,专家们的工作量还是不平衡。所以,α 值需要好好调整,才能让模型既不丢信息,又能让每个专家都忙得过来。


如何系统学习掌握AI大模型?

AI大模型作为人工智能领域的重要技术突破,正成为推动各行各业创新和转型的关键力量。抓住AI大模型的风口,掌握AI大模型的知识和技能将变得越来越重要。

学习AI大模型是一个系统的过程,需要从基础开始,逐步深入到更高级的技术。

这里给大家精心整理了一份全面的AI大模型学习资源,包括:AI大模型全套学习路线图(从入门到实战)、精品AI大模型学习书籍手册、视频教程、实战学习、面试题等,资料免费分享

1. 成长路线图&学习规划

要学习一门新的技术,作为新手一定要先学习成长路线图方向不对,努力白费

这里,我们为新手和想要进一步提升的专业人士准备了一份详细的学习成长路线图和规划。可以说是最科学最系统的学习成长路线。

2. 大模型经典PDF书籍

书籍和学习文档资料是学习大模型过程中必不可少的,我们精选了一系列深入探讨大模型技术的书籍和学习文档,它们由领域内的顶尖专家撰写,内容全面、深入、详尽,为你学习大模型提供坚实的理论基础(书籍含电子版PDF)

3. 大模型视频教程

对于很多自学或者没有基础的同学来说,书籍这些纯文字类的学习教材会觉得比较晦涩难以理解,因此,我们提供了丰富的大模型视频教程,以动态、形象的方式展示技术概念,帮助你更快、更轻松地掌握核心知识

4. 2024行业报告

行业分析主要包括对不同行业的现状、趋势、问题、机会等进行系统地调研和评估,以了解哪些行业更适合引入大模型的技术和应用,以及在哪些方面可以发挥大模型的优势。

5. 大模型项目实战

学以致用 ,当你的理论知识积累到一定程度,就需要通过项目实战,在实际操作中检验和巩固你所学到的知识,同时为你找工作和职业发展打下坚实的基础。

6. 大模型面试题

面试不仅是技术的较量,更需要充分的准备。

在你已经掌握了大模型技术之后,就需要开始准备面试,我们将提供精心整理的大模型面试题库,涵盖当前面试中可能遇到的各种技术问题,让你在面试中游刃有余。

全套的AI大模型学习资源已经整理打包,有需要的小伙伴可以微信扫描下方CSDN官方认证二维码,免费领取【保证100%免费

本文地址:https://www.vps345.com/3717.html

搜索文章

Tags

PV计算 带宽计算 流量带宽 服务器带宽 上行带宽 上行速率 什么是上行带宽? CC攻击 攻击怎么办 流量攻击 DDOS攻击 服务器被攻击怎么办 源IP 服务器 linux 运维 游戏 云计算 python MCP javascript 前端 chrome edge 进程 操作系统 进程控制 Ubuntu ssh 阿里云 网络 网络安全 网络协议 llama 算法 opencv 自然语言处理 神经网络 语言模型 ubuntu deepseek Ollama 模型联网 API CherryStudio RTSP xop RTP RTSPServer 推流 视频 android harmonyos typescript 鸿蒙 fastapi mcp mcp-proxy mcp-inspector fastapi-mcp agent sse filezilla 无法连接服务器 连接被服务器拒绝 vsftpd 331/530 numpy 华为 开发语言 计算机网络 flutter 数据库 centos oracle 关系型 安全 分布式 YOLO 深度学习 pytorch udp unity 物联网 iot websocket 笔记 C 环境变量 进程地址空间 uni-app php c++ 深度优先 图论 并集查找 换根法 树上倍增 ollama ai 人工智能 llm spring boot 后端 java tomcat ffmpeg 音视频 宝塔面板访问不了 宝塔面板网站访问不了 宝塔面板怎么配置网站能访问 宝塔面板配置ip访问 宝塔面板配置域名访问教程 宝塔面板配置教程 pip conda docker pycharm ide vue.js audio vue音乐播放器 vue播放音频文件 Audio音频播放器自定义样式 播放暂停进度条音量调节快进快退 自定义audio覆盖默认样式 github AI Agent rust http ssl 目标检测 计算机视觉 前端框架 LDAP HCIE 数通 maven intellij idea adb nginx 监控 自动化运维 智能路由器 外网访问 内网穿透 端口映射 容器 golang 运维开发 node.js json html5 firefox windows tcp/ip 微服务 springcloud 面试 性能优化 jdk intellij-idea 架构 GaN HEMT 氮化镓 单粒子烧毁 辐射损伤 辐照效应 WSL win11 无法解析服务器的名称或地址 django flask web3.py vim jmeter 软件测试 live555 rtsp rtp sqlserver Hyper-V WinRM TrustedHosts macos 计算机外设 电脑 mac 软件需求 web安全 Kali Linux 黑客 渗透测试 信息收集 vue3 HTML audio 控件组件 vue3 audio音乐播放器 Audio标签自定义样式默认 vue3播放音频文件音效音乐 自定义audio播放器样式 播放暂停调整声音大小下载文件 产品经理 agi microsoft asm 创意 社区 Flask FastAPI Waitress Gunicorn uWSGI Uvicorn Windsurf cpu 内存 实时 使用 react.js 前端面试题 持续部署 jenkins transformer 机器学习 Dell R750XS 科技 个人开发 eNSP 网络规划 VLAN 企业网络 部署 服务器配置 华为云 wireshark 显示过滤器 安装 ICMP Wireshark安装 AI编程 rabbitmq safari Mac 系统 系统架构 学习 经验分享 linux环境变量 dell服务器 go 代理模式 硬件架构 IIS .net core Hosting Bundle .NET Framework vs2022 XFS xfs文件系统损坏 I_O error 低代码 ArcTS 登录 ArcUI GridItem java-ee 压力测试 测试工具 测试用例 功能测试 mysql 集成学习 集成测试 生物信息学 openEuler prometheus k8s资源监控 annotations自动化 自动化监控 监控service 监控jvm 安装教程 GPU环境配置 Ubuntu22 CUDA PyTorch Anaconda安装 html ansible 自动化 playbook 剧本 sql KingBase Docker Compose docker compose docker-compose AI大模型 LLM 大模型 spring cloud TRAE jetty undertow UOS 统信操作系统 yum oceanbase rc.local 开机自启 systemd 麒麟 c语言 HarmonyOS Next DevEco Studio pygame 小游戏 五子棋 chatgpt llama3 Chatglm 开源大模型 AIGC 音乐服务器 Navidrome 音流 软件工程 ping++ Qwen2.5-coder 离线部署 kylin RAID RAID技术 磁盘 存储 智能手机 NAS Termux Samba Linux threejs 3D postman mock mock server 模拟服务器 mock服务器 Postman内置变量 Postman随机数据 僵尸进程 ESP32 Dify 学习方法 ESXi Dell HPE 联想 浪潮 kubernetes VMware安装Ubuntu Ubuntu安装k8s k8s ruoyi mysql离线安装 ubuntu22.04 mysql8.0 Trae AI代码编辑器 DeepSeek行业应用 DeepSeek Heroku 网站部署 postgresql 混合开发 环境安装 JDK vscode 嵌入式硬件 IIS服务器 IIS性能 日志监控 react next.js 部署next.js centos-root /dev/mapper yum clean all df -h / du -sh redis asp.net大文件上传 asp.net大文件上传源码 ASP.NET断点续传 asp.net上传文件夹 asp.net上传大文件 .net core断点续传 .net mvc断点续传 nuxt3 实时音视频 单片机 温湿度数据上传到服务器 Arduino HTTP bash 腾讯云大模型知识引擎 Deepseek YOLOv8 NPU Atlas800 A300I pro 银河麒麟服务器操作系统 系统激活 缓存 企业微信 Linux24.04 deepin 数据库系统 博客 安全威胁分析 https springboot远程调试 java项目远程debug docker远程debug java项目远程调试 springboot远程 vscode 1.86 unix 负载均衡 Ubuntu Server Ubuntu 22.04.5 gitlab 漏洞 .net YOLOv12 银河麒麟 kylin v10 麒麟 v10 spring 网络穿透 云服务器 Nuxt.js SSH Xterminal gpu算力 豆瓣 追剧助手 迅雷 nas 微信 Reactor 设计模式 C++ unity3d CPU 主板 电源 网卡 express okhttp CORS 跨域 Linux awk awk函数 awk结构 awk内置变量 awk参数 awk脚本 awk详解 多进程 1024程序员节 远程 命令 执行 sshpass 操作 大模型微调 腾讯云 虚拟化 半虚拟化 硬件虚拟化 Hypervisor 远程工作 firewalld dubbo .netcore gateway Clion Nova ResharperC++引擎 Centos7 远程开发 code-server MQTT mosquitto 消息队列 word图片自动上传 word一键转存 复制word图片 复制word图文 复制word公式 粘贴word图文 粘贴word公式 微信小程序 小程序 pillow shell 文件系统 路径解析 kamailio sip VoIP mongodb 大数据 大数据平台 echarts 信息可视化 数据分析 网页设计 gitee stm32 W5500 OLED u8g2 TCP服务器 统信 国产操作系统 虚拟机安装 cuda cudnn anaconda jar 云原生 pyqt 微信小程序域名配置 微信小程序服务器域名 微信小程序合法域名 小程序配置业务域名 微信小程序需要域名吗 微信小程序添加域名 嵌入式 linux驱动开发 arm开发 指令 WebRTC gpt 华为od OD机试真题 华为OD机试真题 服务器能耗统计 ux 多线程 protobuf 序列化和反序列化 程序人生 webrtc 强制清理 强制删除 mac废纸篓 oneapi ollama下载加速 开源 curl wget 服务器数据恢复 数据恢复 存储数据恢复 北亚数据恢复 oracle数据恢复 服务器繁忙 多线程服务器 Linux网络编程 android studio springsecurity6 oauth2 授权服务器 token sas FTP 服务器 DeepSeek-R1 API接口 devops springboot 设置代理 实用教程 pdf 虚拟机 VMware list 数据结构 raid5数据恢复 磁盘阵列数据恢复 zabbix visualstudio minicom 串口调试工具 蓝耘科技 元生代平台工作流 ComfyUI IDE AI 原生集成开发环境 Trae AI 3d fpga开发 编辑器 鸿蒙系统 流式接口 DigitalOcean GPU服务器购买 GPU服务器哪里有 GPU服务器 apache Kylin-Server 服务器安装 qt EasyConnect Cline ecmascript nextjs reactjs 交互 hadoop mount挂载磁盘 wrong fs type LVM挂载磁盘 Centos7.9 搜索引擎 wsl2 wsl openwrt 系统开发 binder 车载系统 framework 源码环境 debian GCC crosstool-ng 代码调试 ipdb c# elasticsearch 微信分享 Image wxopensdk NPS 雨云服务器 雨云 Ubuntu 24 常用命令 Ubuntu 24 Ubuntu vi 异常处理 virtualenv 能力提升 面试宝典 技术 IT信息化 环境迁移 源码剖析 rtsp实现步骤 流媒体开发 tcpdump 相差8小时 UTC 时间 Java 爬虫 数据集 直播推流 es jvm 大模型面经 职场和发展 大模型学习 串口服务器 状态管理的 UDP 服务器 Arduino RTOS ci/cd kvm 无桌面 命令行 git gitea 媒体 微信公众平台 C语言 excel svn jupyter matlab web Socket asi_bench ecm bpm mybatis 宕机切换 服务器宕机 WSL2 统信UOS bonding 链路聚合 VR手套 数据手套 动捕手套 动捕数据手套 命名管道 客户端与服务端通信 idm ddos av1 电视盒子 机顶盒ROM 魔百盒刷机 stm32项目 向日葵 k8s集群资源管理 云原生开发 数学建模 freebsd PVE zotero WebDAV 同步失败 远程桌面 iDRAC R720xd 前后端分离 华为认证 网络工程师 chrome devtools selenium chromedriver 交换机 telnet 远程登录 dify 历史版本 下载 服务器无法访问 ip地址无法访问 无法访问宝塔面板 宝塔面板打不开 云服务 etl xcode arkUI 服务网格 istio 磁盘监控 kind hive DBeaver 数据仓库 kerberos X11 Xming 数据挖掘 网络用户购物行为分析可视化平台 大数据毕业设计 其他 uni-file-picker 拍摄从相册选择 uni.uploadFile H5上传图片 微信小程序上传图片 nvidia Cursor bug visual studio code arm FunASR ASR perf file server http server web server openstack Xen KVM mariadb c/c++ 串口 语法 远程连接 rdp 实验 技术共享 游戏程序 王者荣耀 ip命令 新增网卡 新增IP 启动网卡 Wi-Fi DNS minio Spring Security sdkman elk Logstash 日志采集 阻塞队列 生产者消费者模型 服务器崩坏原因 无人机 Playwright 自动化测试 Linux无人智慧超市 LInux多线程服务器 QT项目 LInux项目 单片机项目 系统安全 ISO镜像作为本地源 nac 802.1 portal 支付 微信支付 开放平台 云电竞 云电脑 todesk SysBench 基准测试 黑苹果 硬件 设备 GPU PCI-Express 信息与通信 ip ui 备份SQL Server数据库 数据库备份 傲梅企业备份网络版 alias unalias 别名 课程设计 Erlang OTP gen_server 热代码交换 事务语义 技能大赛 MNN Qwen ROS 自动驾驶 regedit 开机启动 版本 政务 分布式系统 监控运维 Prometheus Grafana 游戏机 pppoe radius 网络结构图 yaml Ultralytics 可视化 hugo Netty 即时通信 NIO SWAT 配置文件 服务管理 网络共享 实时互动 ceph gaussdb 源码 毕业设计 银河麒麟桌面操作系统 Kylin OS 国产化 Linux环境 xss 程序员 在线预览 xlsx xls文件 在浏览器直接打开解析xls表格 前端实现vue3打开excel 文件地址url或接口文档流二进 AI写作 AI作画 QQ 聊天室 中间件 可信计算技术 安全架构 网络攻击模型 机器人 大模型应用 京东云 ocr micropython esp32 mqtt AI agent 深度求索 私域 知识库 思科模拟器 思科 Cisco 交叉编译 基础入门 编程 gpt-3 文心一言 Hive环境搭建 hive3环境 Hive远程模式 saltstack vasp安装 rocketmq qt项目 qt项目实战 qt教程 muduo 金融 矩阵 seatunnel 服务器管理 宝塔面板 配置教程 网站管理 国标28181 视频监控 监控接入 语音广播 流程 SIP SDP flash-attention 报错 r语言 数据可视化 算力 IPv4 子网掩码 公网IP 私有IP etcd 数据安全 RBAC Radius googlecloud npm frp EMQX 通信协议 VS Code kafka hibernate Linux的基础指令 epoll 弹性计算 计算虚拟化 弹性裸金属 工业4.0 windwos防火墙 defender防火墙 win防火墙白名单 防火墙白名单效果 防火墙只允许指定应用上网 防火墙允许指定上网其它禁止 根服务器 clickhouse 客户端 社交电子 高效远程协作 TrustViewer体验 跨设备操作便利 智能远程控制 飞牛NAS 飞牛OS MacBook Pro cnn laravel grafana 毕设 小智AI服务端 xiaozhi TTS 直流充电桩 充电桩 IPMI JAVA junit AD 域管理 键盘 网站搭建 serv00 chfs ubuntu 16.04 小番茄C盘清理 便捷易用C盘清理工具 小番茄C盘清理的优势尽显何处? 教你深度体验小番茄C盘清理 C盘变红?!不知所措? C盘瘦身后电脑会发生什么变化? 显示管理器 lightdm gdm 双系统 GRUB引导 Linux技巧 移动魔百盒 微信开放平台 微信公众号配置 USB转串口 CH340 同步 备份 建站 火绒安全 需求分析 规格说明书 裸金属服务器 弹性裸金属服务器 p2p 链表 自学笔记 小米 澎湃OS Android prompt dns NFS IO模型 大模型入门 上传视频至服务器代码 vue3批量上传多个视频并预览 如何实现将本地视频上传到网页 element plu视频上传 ant design vue vue3本地上传视频及预览移除 HTTP 服务器控制 ESP32 DeepSeek aws 我的世界服务器搭建 minecraft ios css 备选 网站 api 调用 示例 AD域 vSphere vCenter 软件定义数据中心 sddc 反向代理 致远OA OA服务器 服务器磁盘扩容 AutoDL dba eureka iphone rpc n8n 工作流 workflow iftop 网络流量监控 边缘计算 智能硬件 查询数据库服务IP地址 SQL Server make命令 makefile文件 MS Materials openssl 密码学 业界资讯 鲲鹏 模拟退火算法 gcc g++ g++13 Cookie pgpool 端口测试 计算机 田俊楠 安卓 sqlite AISphereButler Portainer搭建 Portainer使用 Portainer使用详解 Portainer详解 Portainer portainer 自定义客户端 SAS ue4 着色器 ue5 虚幻 outlook 目标跟踪 OpenVINO 推理应用 银河麒麟高级服务器 外接硬盘 Kylin flink 单例模式 开机自启动 华为机试 Python 回显服务器 UDP的API使用 Java Applet URL操作 服务器建立 Socket编程 网络文件读取 armbian u-boot 大模型教程 remote-ssh MacOS录屏软件 ukui 麒麟kylinos openeuler rust腐蚀 mamba Vmamba Jellyfin 框架搭建 bot Docker 宝塔 mcu ftp 串口驱动 CH341 uart 485 VPS VM搭建win2012 win2012应急响应靶机搭建 攻击者获取服务器权限 上传wakaung病毒 应急响应并溯源 挖矿病毒处置 应急响应综合性靶场 DeepSeek r1 Open WebUI RAGFLOW RAG 检索增强生成 文档解析 大模型垂直应用 超融合 RustDesk自建服务器 rustdesk服务器 docker rustdesk 医疗APP开发 app开发 eclipse big data 图像处理 昇腾 npu opensearch helm 游戏引擎 飞书 策略模式 模拟器 教程 孤岛惊魂4 uniapp vue 恒源云 tcp 进程信号 vscode1.86 1.86版本 ssh远程连接 CLion open Euler dde RTMP 应用层 LLM Web APP Streamlit IPMITOOL BMC 硬件管理 opcua opcda KEPServer安装 open webui 大语言模型 游戏服务器 TrinityCore 魔兽世界 sysctl.conf vm.nr_hugepages adobe 传统数据库升级 银行 LLMs 单一职责原则 网络编程 聊天服务器 套接字 TCP VSCode xml 移动云 Ubuntu DeepSeek DeepSeek Ubuntu DeepSeek 本地部署 DeepSeek 知识库 DeepSeek 私有化知识库 本地部署 DeepSeek DeepSeek 私有化部署 kali 共享文件夹 linux 命令 sed 命令 XCC Lenovo Ark-TS语言 RoboVLM 通用机器人策略 VLA设计哲学 vlm fot robot 视觉语言动作模型 具身智能 spark HistoryServer Spark YARN jobhistory 繁忙 解决办法 替代网站 汇总推荐 AI推理 CDN Headless Linux EMUI 回退 降级 升级 群晖 飞牛 asp.net大文件上传下载 文件分享 iis linux安装配置 ruby skynet SSH 服务 SSH Server OpenSSH Server ragflow 僵尸世界大战 游戏服务器搭建 软件构建 银河麒麟操作系统 权限 zookeeper nfs 虚拟显示器 远程控制 服务器部署ai模型 自动化任务管理 embedding SSL 域名 rsyslog cmos Anolis nginx安装 linux插件下载 easyui langchain 灵办AI v10 镜像源 软件 重启 排查 系统重启 日志 原因 fd 文件描述符 飞牛nas fnos VMware安装mocOS macOS系统安装 单元测试 阿里云ECS 驱动开发 硬件工程 嵌入式实习 LORA NLP yum源切换 更换国内yum源 黑客技术 URL 本地部署 架构与原理 图形化界面 多个客户端访问 IO多路复用 TCP相关API docker命令大全 大文件分片上传断点续传及进度条 如何批量上传超大文件并显示进度 axios大文件切片上传详细教 node服务器合并切片 vue3大文件上传报错提示错误 大文件秒传跨域报错cors 5G 3GPP 卫星通信 网工 压测 ECS ssrf 失效的访问控制 MI300x tensorflow trae Google pay Apple pay SSE 服务器主板 AI芯片 多层架构 解耦 LInux vue-i18n 国际化多语言 vue2中英文切换详细教程 如何动态加载i18n语言包 把语言json放到服务器调用 前端调用api获取语言配置文件 怎么卸载MySQL MySQL怎么卸载干净 MySQL卸载重新安装教程 MySQL5.7卸载 Linux卸载MySQL8.0 如何卸载MySQL教程 MySQL卸载与安装 xrdp string模拟实现 深拷贝 浅拷贝 经典的string类问题 三个swap Unity Dedicated Server Host Client 无头主机 开发环境 SSL证书 Linux PID selete 高级IO VMware创建虚拟机 性能测试 odoo 服务器动作 Server action Docker Hub docker pull daemon.json tidb GLIBC 常用命令 文本命令 目录命令 崖山数据库 YashanDB 视频编解码 监控k8s 监控kubernetes Ubuntu 24.04.1 轻量级服务器 redhat 视觉检测 分析解读 midjourney WebUI DeepSeek V3 netty 代码托管服务 远程看看 远程协助 远程过程调用 Windows环境 Claude c AnythingLLM AnythingLLM安装 高效日志打印 串口通信日志 服务器日志 系统状态监控日志 异常记录日志 三级等保 服务器审计日志备份 efficientVIT YOLOv8替换主干网络 TOLOv8 FTP服务器 DenseNet MacMini 迷你主机 mini Apple risc-v wordpress 无法访问wordpess后台 打开网站页面错乱 linux宝塔面板 wordpress更换服务器 宠物 免费学习 宠物领养 宠物平台 CrewAI 蓝桥杯 qemu libvirt 佛山戴尔服务器维修 佛山三水服务器维修 小艺 Pura X ipython 软考 并查集 leetcode 匿名管道 联想开天P90Z装win10 can 线程池 Invalid Host allowedHosts GoogLeNet gradle 干货分享 黑客工具 密码爆破 bootstrap C# MQTTS 双向认证 emqx camera Arduino 电子信息 执法记录仪 智能安全帽 smarteye Redis Desktop tailscale derp derper 中转 triton 模型分析 线性代数 电商平台 IDEA 互信 C++软件实战问题排查经验分享 0xfeeefeee 0xcdcdcdcd 动态库加载失败 程序启动失败 程序运行权限 标准用户权限与管理员权限 linux上传下载 USB网络共享 监控k8s集群 集群内prometheus docker run 数据卷挂载 交互模式 vmware 卡死 cursor 自动化编程 MCP server C/S windows日志 数据库架构 数据管理 数据治理 数据编织 数据虚拟化 7z Minecraft 输入法 DOIT 四博智联 ssh漏洞 ssh9.9p2 CVE-2025-23419 lua ros2 moveit 机器人运动 matplotlib thingsboard ai小智 语音助手 ai小智配网 ai小智教程 esp32语音助手 diy语音助手 音乐库 keepalived 安防软件 H3C Kali Unity插件 iventoy VmWare OpenEuler 磁盘清理 powerpoint 环境配置 dity make 云桌面 微软 AD域控 证书服务器 个人博客 序列化反序列化 实战案例 searxng 网络药理学 生信 PPI String Cytoscape CytoHubba Docker引擎已经停止 Docker无法使用 WSL进度一直是0 镜像加速地址 人工智能生成内容 镜像 合成模型 扩散模型 图像生成 鸿蒙开发 移动开发 vpn UDP rtsp服务器 rtsp server android rtsp服务 安卓rtsp服务器 移动端rtsp服务 大牛直播SDK cfssl TCP协议 抗锯齿 拓扑图 AP配网 AK配网 小程序AP配网和AK配网教程 WIFI设备配网小程序UDP开 产测工具框架 IMX6ULL 管理框架 HarmonyOS OpenHarmony 真机调试 neo4j 知识图谱 firewall sequoiaDB grub 版本升级 扩容 捆绑 链接 谷歌浏览器 youtube google gmail 用户缓冲区 模拟实现 P2P HDLC Typore 游戏开发 milvus ArkTs ArkUI 图形渲染 PX4 QT 5.12.12 QT开发环境 Ubuntu18.04 健康医疗 互联网医院 带外管理 MacOS 大模型推理 聚类 相机 程序 性能分析 Mac内存不够用怎么办 MVS 海康威视相机 cocoapods 磁盘镜像 服务器镜像 服务器实时复制 实时文件备份 prometheus数据采集 prometheus数据模型 prometheus特点 SenseVoice 强化学习 llama.cpp rustdesk proxy模式 yolov8 win服务器架设 windows server 渗透 虚拟局域网 dns是什么 如何设置电脑dns dns应该如何设置 MQTT协议 消息服务器 代码 迁移指南 显卡驱动 考研 onlyoffice 在线office OpenSSH webgl 分布式训练 Ubuntu22.04 开发人员主页 状态模式 trea idea 玩机技巧 软件分享 软件图标 容器技术 SVN Server tortoise svn su sudo jina chrome 浏览器下载 chrome 下载安装 谷歌浏览器下载 SSH 密钥生成 SSH 公钥 私钥 生成 主从复制 私有化 UOS1070e 线程 HAProxy seleium edge浏览器 物联网开发 composer MySql docker搭建pg docker搭建pgsql pg授权 postgresql使用 postgresql搭建 wps Ubuntu共享文件夹 共享目录 Linux共享文件夹 iperf3 带宽测试 harmonyOS面试题 hexo 邮件APP 免费软件 对比 工具 meld Beyond Compare DiffMerge SEO 开发 docker搭建nacos详解 docker部署nacos docker安装nacos 腾讯云搭建nacos centos7搭建nacos 代理服务器 内网服务器 内网代理 内网通信 lio-sam SLAM uv glibc ubuntu24.04.1 毕昇JDK deepseek r1 软负载 AI-native Docker Desktop HiCar CarLife+ CarPlay QT RK3588 Node-Red 编程工具 流编程 AI Agent 字节智能运维 办公自动化 自动化生成 pdf教程 粘包问题 rnn fast 端口 查看 ss deployment daemonset statefulset cronjob 读写锁 远程服务 语音识别 EtherNet/IP串口网关 EIP转RS485 EIP转Modbus EtherNet/IP网关协议 EIP转RS485网关 EIP串口服务器 x64 SIGSEGV xmm0 arcgis wpf 查看显卡进程 fuser navicat word IMX317 MIPI H265 VCU pyautogui wsgiref Web 服务器网关接口 ShenTong rag ragflow 源码启动 ABAP 运维监控 less Attention Linux find grep 钉钉 做raid 装系统 信号处理 ardunio BLE 代理 webstorm 存储维护 NetApp存储 EMC存储 TrueLicense nvm whistle 抓包工具 项目部署到linux服务器 项目部署过程 CentOS CVE-2024-7347 cd 目录切换 OpenManus 网络建设与运维 bcompare web3 miniapp 调试 debug 断点 网络API请求调试方法 apt 国内源 autodl docker desktop image IMM xpath定位元素 bat 智能音箱 智能家居 docker部署翻译组件 docker部署deepl docker搭建deepl java对接deepl 翻译组件使用 嵌入式Linux IPC Windows python3.11 nlp 多端开发 智慧分发 应用生态 鸿蒙OS IM即时通讯 剪切板对通 HTML FORMAT 企业网络规划 华为eNSP 中兴光猫 换光猫 网络桥接 自己换光猫 ros ai工具 java-rocketmq ldap GIS 遥感 WebGIS log4j 大大通 第三代半导体 碳化硅 元服务 应用上架 换源 Debian Xinference RAGFlow vr 内网环境 h.264 网卡的名称修改 eth0 ens33 kotlin cpp-httplib DocFlow mq fstab ubuntu24 vivado24 免费域名 域名解析 Linux的权限 top Linux top top命令详解 top命令重点 top常用参数 deekseek SRS 流媒体 直播 perl 防火墙 NAT转发 NAT Server Deepseek-R1 私有化部署 推理模型 李心怡 ubuntu20.04 ros1 Noetic 20.04 apt 安装 本地部署AI大模型 WLAN react native deep learning 影刀 #影刀RPA# dash 正则表达式 Python基础 Python教程 Python技巧 db 软链接 硬链接 sqlite3 css3 信号 实习 sentinel 信创 信创终端 中科方德 WebVM swoole 基础环境 流水线 脚本式流水线 figma rime 金仓数据库 2025 征文 数据库平替用金仓 加解密 Yakit yaklang 我的世界 我的世界联机 数码 ssh远程登录 服务器时间 流量运营 KylinV10 麒麟操作系统 Vmware 问题解决 gromacs 分子动力学模拟 MD 动力学模拟 程序员创富 aarch64 编译安装 HPC rclone AList webdav fnOS EtherCAT转Modbus ECT转Modbus协议 EtherCAT转485网关 ECT转Modbus串口网关 EtherCAT转485协议 ECT转Modbus网关 浏览器开发 AI浏览器 iBMC UltraISO xshell termius iterm2 数据库开发 database 烟花代码 烟花 元旦 域名服务 DHCP 符号链接 配置 性能调优 安全代理 本地知识库部署 DeepSeek R1 模型 软件卸载 系统清理 lsb_release /etc/issue /proc/version uname -r 查看ubuntu版本 sonoma 自动更新 树莓派 VNC js 网络搭建 神州数码 神州数码云平台 云平台 IO Qwen2.5-VL vllm 多路转接 项目部署 推荐算法 dock 加速 kernel 本地化部署 云耀服务器 达梦 DM8 visual studio 嵌入式系统开发 极限编程 conda配置 conda镜像源 数字证书 签署证书 智能电视 稳定性 看门狗 大模型部署 rpa ArtTS 端口聚合 windows11 System V共享内存 进程通信 AI员工 热榜 macOS 服务器正确解析请求体 西门子PLC 通讯 接口优化 k8s二次开发 mm-wiki搭建 linux搭建mm-wiki mm-wiki搭建与使用 mm-wiki使用 mm-wiki详解 离线部署dify hosts gnu MDK 嵌入式开发工具 论文笔记 sublime text nosql 解决方案 HarmonyOS NEXT 原生鸿蒙 MobaXterm 搜狗输入法 中文输入法 docker部署Python 风扇控制软件 搭建个人相关服务器 CentOS Stream yum换源 网络爬虫 开机黑屏 沙盒 yolov5 增强现实 沉浸式体验 应用场景 技术实现 案例分析 AR 虚幻引擎 virtualbox ranger MySQL8.0 Sealos 论文阅读 欧标 OCPP