最新资讯

  • 零代码构建AI知识库:基于亮数据网页抓取API的维基百科数据自动化采集实战

零代码构建AI知识库:基于亮数据网页抓取API的维基百科数据自动化采集实战

2025-04-25 18:59:46 3 阅读

 1. 人工智能从算法驱动到知识驱动的进化

当前,以GPT-4、Claude等为代表的大语言模型(LLM)虽然展现出强大的生成能力,但其局限性也日益凸显:依赖历史训练数据导致知识滞后,面对专业领域问题时易产生“幻觉”(Hallucination),且缺乏对动态实时信息的响应能力。
为解决这些问题,AI技术正经历从“算法驱动”到“知识驱动”的范式升级。知识库(Knowledge Base) 成为连接通用大模型与垂直领域应用的桥梁:

  • 知识增强:通过RAG(检索增强生成)技术,将知识库中的结构化信息注入大模型输入,提升回答的可信度与专业性。
  • 动态更新:智能体(Agent)依赖知识库的持续更新实现长期记忆,例如金融领域Agent需实时整合股票行情、政策法规等数据以支持投资决策。
  • 降低算力成本:知识库可缓存高频查询结果,减少对大模型的重复调用。

2. 爬虫技术:概念与背景

2.1. 爬虫的定义与作用

网络爬虫,又称为网页蜘蛛、机器人或网络漫游器,是一种自动化脚本或程序,设计用于系统地浏览互联网并提取信息。爬虫的主要作用包括:

  • 信息收集:爬虫可以快速地从大量网站中收集数据,帮助用户获得所需的信息。
  • 搜索引擎优化:搜索引擎使用爬虫来抓取网页并索引内容,以便提供准确的搜索结果。
  • 市场分析:企业使用爬虫来监测竞争对手的动态、分析市场趋势和消费者行为。
  • 数据集构建:研究人员利用爬虫创建数据集以进行进一步的分析和模型训练。

2.2. 爬虫的工作原理

网络爬虫的工作流程通常包括以下几个步骤:

  1. 请求:爬虫向目标网站发送HTTP请求以获取网页内容。
  2. 响应:服务器响应请求并返回网页的HTML内容。
  3. 解析:爬虫使用解析器(如正则表达式、BeautifulSoup等)分析HTML,提取所需的信息。
  4. 存储:将提取的数据存储到数据库或文件中,以便后续处理和分析。

爬虫可以配置为定期更新数据,以确保信息的实时性和准确性。

2.3. 爬虫面临的挑战

在实际操作中,爬虫技术面临着多种挑战:

  • 反爬机制:许多网站使用技术手段检测和阻止爬虫访问,例如通过设置机器人排除协议(robots.txt)或使用CAPTCHA验证。
  • IP封禁:当同一IP地址频繁访问网站时,可能会被视为恶意行为而遭到封禁。使用代理IP轮换可以缓解这一问题。
  • 数据动态加载:一些网站使用JavaScript动态加载数据,爬虫需要支持JavaScript解析或使用浏览器自动化工具(如Selenium)来抓取这些数据。

2.4. 合法爬虫的边界与注意事项

在实施爬虫技术时,遵循法律和伦理标准至关重要:

  • 遵循robots.txt文件:尊重网站的robots.txt文件中规定的爬行规则和限制。
  • 避免过度抓取:控制爬虫的抓取频率和范围,以避免对目标网站造成不必要的负担。
  • 数据隐私:确保不侵犯用户隐私,不抓取敏感信息。
  • 合法使用数据:确保获取的数据用于合法和道德的目的,不用于侵犯版权或其他法律权利。

在实施爬虫技术时,始终保持透明度和责任感,以维护良好的互联网生态环境。

3. 传统爬虫技术

传统爬虫技术是数据采集领域中最基础的工具之一,通过编写简单的脚本即可实现数据抓取。然而,随着互联网技术的发展,传统爬虫逐渐暴露出其局限性。本章将深入探讨传统爬虫的技术栈、示例代码以及面临的痛点。

3.1. 传统爬虫的技术栈

传统爬虫通常使用Python编程语言,结合Requests库和BeautifulSoup库来实现数据抓取:

  • Python:以其简洁的语法和丰富的库支持成为爬虫开发的首选语言。
  • Requests库:用于发送HTTP请求并接收响应。它简化了网络通信,使开发者能够轻松地获取网页内容。
  • BeautifulSoup库:用于解析HTML和XML文档,提供便捷的方法来提取和处理网页中的数据。

这种技术栈适合于静态网页的抓取,易于学习和使用。

3.2. 使用亮数据代理ip爬取维基百科页面

接下来,我们一起来看下如何使用传统爬虫技术爬取维基百科,获取准确有价值的优质知识。

3.2.1. 维基百科关键词搜索api

GET https://en.wikipedia.org/w/api.php?action=query&list=search&srsearch={关键词}&srlimit={最大结果数}&format=json

{
  "batchcomplete": "",
  "continue": {
    "sroffset": 10,
    "continue": "-||"
  },
  "query": {
    "searchinfo": {
      "totalhits": 45,
      "suggestion": "人工智能n",
      "suggestionsnippet": "人工智能n"
    },
    "search": [
      {
        "ns": 0,
        "title": "DeepSeek",
        "pageid": 78452842,
        "size": 61495,
        "wordcount": 5930,
        "snippet": "organization Jevons paradox – Efficiency leads to increased demand Chinese: 杭州深度求索人工智能基础技术研究有限公司. Sometimes simply referred to in English as Hangzhou DeepSeek Artificial",
        "timestamp": "2025-03-25T02:01:11Z"
      },
      {
        "ns": 0,
        "title": "Artificial intelligence industry in China",
        "pageid": 57024219,
        "size": 87277,
        "wordcount": 7944,
        "snippet": "ISBN 978-981-19-8504-1 "【人民网】世界人工智能国际联合大会今秋将首次在中国举行----中国科学院". www.cas.cn. Archived from the original on 2023-05-04. Retrieved 2023-05-05. "科学网—首届吴文俊人工智能科学技术奖颁奖". news",
        "timestamp": "2025-03-13T21:04:04Z"
      },
      {
        "ns": 0,
        "title": "Generative artificial intelligence",
        "pageid": 73291755,
        "size": 163769,
        "wordcount": 13713,
        "snippet": "Archived from the original on July 27, 2023. Retrieved July 13, 2023. "生成式人工智能服务管理暂行办法". July 13, 2023. Archived from the original on July 27, 2023. Retrieved",
        "timestamp": "2025-03-22T15:24:03Z"
      },
      {
        "ns": 0,
        "title": "Alexandr Wang",
        "pageid": 75806942,
        "size": 10972,
        "wordcount": 920,
        "snippet": "你要知的8件事!創業6年25歲身家達10億美元成最年輕白手起家富翁". www.esquirehk.com. "DeepSeek:中國AI公司的驚人崛起帶來人工智能的「Sputnik時刻」還是「珍珠港事件」?". BBC News 中文 (in Traditional Chinese). January 28",
        "timestamp": "2025-03-03T16:04:26Z"
      },
      {
        "ns": 0,
        "title": "Beijing Academy of Artificial Intelligence",
        "pageid": 73400769,
        "size": 9766,
        "wordcount": 803,
        "snippet": "Beijing Academy of Artificial Intelligence (BAAI) (Chinese: 北京智源人工智能研究院; pinyin: Běijīng Zhìyuán réngōng zhìnéng yánjiùyuàn), also known as Zhiyuan Institute",
        "timestamp": "2025-01-01T19:02:51Z"
      },
      {
        "ns": 0,
        "title": "Interim Measures for the Management of Generative AI Services",
        "pageid": 74437860,
        "size": 7196,
        "wordcount": 825,
        "snippet": "Interim Measures for the Management of Generative AI Services (Chinese: 生成式人工智能服务管理暂行办法; pinyin: Shēngchéng shì réngōng zhìnéng fúwù guǎnlǐ zànxíng bànfǎ)",
        "timestamp": "2025-01-21T04:55:36Z"
      },
      {
        "ns": 0,
        "title": "Political repression",
        "pageid": 1297768,
        "size": 21504,
        "wordcount": 2283,
        "snippet": "Watch. 14 January 2020. Retrieved 2 March 2023. 孟宝勒 (2018-07-17). "中国的威权主义未来:人工智能与无孔不入的监控" (in Chinese). 纽约时报中文网. Archived from the original on 2019-10-16",
        "timestamp": "2025-02-28T17:24:22Z"
      },
      {
        "ns": 0,
        "title": "Kai-Fu Lee",
        "pageid": 2273087,
        "size": 31001,
        "wordcount": 2817,
        "snippet": "published February 2011, Beijing Xiron Books Co., Ltd) Artificial Intelligence (《人工智能》, published May 2017, Beijing Xiron Books Co., Ltd) AI 2041: Ten Visions",
        "timestamp": "2025-03-23T09:20:01Z"
      },
      {
        "ns": 0,
        "title": "Ted Chiang",
        "pageid": 325507,
        "size": 36433,
        "wordcount": 2738,
        "snippet": "Bibliography). Retrieved October 4, 2012. Klein, Ezra (March 3, 2023). "人工智能真正的恐怖之处" [The Imminent Danger of A.I. Is One We’re Not Talking About]. The",
        "timestamp": "2025-02-23T11:21:06Z"
      },
      {
        "ns": 0,
        "title": "VITAL (machine learning software)",
        "pageid": 63804242,
        "size": 19234,
        "wordcount": 1913,
        "snippet": "(PDF). Cadogan Consulting Group. Retrieved 6 May 2020. Lin, Shaowei (2018). "人工智能对公司法的影响:挑战与应对" [The impact of artificial intelligence on company law: challenges",
        "timestamp": "2024-04-23T00:00:38Z"
      }
    ]
  }
}

可以看到,人工智能的搜索结果有45条数据,但是我们设置了srlimit为10,所以API只给我们返回了10条,每条数据包含了百科标题等摘要性信息。

3.2.2. 爬取维基百科内容页内容

GET https://en.wikipedia.org/wiki/{空格替换为_后的title}

获取到网页内容之后,使用BeautifulSoup库解析网页源代码相关标签,得到需要的信息即可。

3.2.3. 获取亮数据代理ip

访问亮数据官网:购买住宅代理网络IP - 免费试用。点击开始免费试用按钮。

输入邮箱,点击创建账号按钮进行账号注册,然后登录网站。

登录成功后,点击左侧的Proxies & Scraping按钮。

找到住宅动态IP,点击开始使用按钮。

在基本设置里,找到通道名称,使用默认名称或者自己都可以。代理类型选共享(按GB收费),其它保持默认,然后点击右侧的添加按钮即可完成代理ip的设置。

代理ip配置成功后,可以看到账号、密码和ip获取域名、测试命令等信息,我们可以直接点击username:password@host:port右侧的复制按钮一键复制代理ip配置,下一步会用到。

3.2.4. 完整代码

以下是从维基百科搜索资料并进行爬取内容的完整代码。将开头的代理ip替换上一步一键复制的信息即可。

import requests
from bs4 import BeautifulSoup
import json

# 亮数据代理ip配置(需要替换为自己的用户名、密码)
proxy = {
    'http': '用户名:密码@brd.superproxy.io:33335',
}

class WikipediaScraper:
    def __init__(self, url):
        self.url = url
        self.headers = {
        'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/91.0.4472.124 Safari/537.36'
        }

    def scrape_page(self):
        try:
            response = requests.get(self.url, headers=self.headers,  timeout=5)
            response.raise_for_status()
            soup = BeautifulSoup(response.text, 'html.parser')
            
            title = soup.find('h1', {'id': 'firstHeading'}).text
            
            content = ''
            for paragraph in soup.find_all('p'):
                content += paragraph.text + '
'
            
            return {
                'title': title,
                'content': content.strip()
            }
        except requests.exceptions.RequestException as e:
            print(f'网络请求失败: {e}')
        except Exception as e:
            print(f'解析页面时出错: {e}')
        return None


class WikipediaKeywordSearch:
    def __init__(self, keyword):
        self.keyword = keyword
        self.headers = {
        'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/91.0.4472.124 Safari/537.36'
        }

    def search_articles(self, max_results=10):
        """通过Wikipedia API搜索包含关键字的文章"""
        url = f'https://en.wikipedia.org/w/api.php?action=query&list=search&srsearch={self.keyword}&srlimit={max_results}&format=json'
        
        try:
            response = requests.get(url, headers=self.headers, verify=False, timeout=10)
            response.raise_for_status()
            data = response.json()
            
            articles = []
            for result in data['query']['search']:
                article_url = f'https://en.wikipedia.org/wiki/{result["title"].replace(" ", "_")}'
                scraper = WikipediaScraper(article_url)
                page_content = scraper.scrape_page()
                
                articles.append({
                    'title': result['title'],
                    'url': article_url,
                    'content': page_content['content'] if page_content else ''
                })
            return articles
        except requests.exceptions.RequestException as e:
            print(f'搜索失败: {e}')
            return []

    def save_results(self, articles, file_name='wikipedia_search_results.json'):
        """保存搜索结果到JSON文件"""
        with open(file_name, 'w', encoding='utf-8') as f:
            json.dump(articles, f, ensure_ascii=False, indent=2)
        print(f'搜索结果已保存为 {file_name}')

if __name__ == '__main__':
    keyword = 'Artificial Intelligence'
    search = WikipediaKeywordSearch(keyword)
    articles = search.search_articles(max_results=10)
    if articles:
        search.save_results(articles)

如下所示,是爬虫爬取到的与人工智能相关的内容,包含了百科标题、网址和完整内容:

3.3. 传统爬虫的技术局限性

虽然传统爬虫技术在静态网页数据抓取中表现良好,但其局限性也显而易见:

  • 动态内容处理:传统爬虫无法直接处理JavaScript动态加载的内容,需要借助其他工具(如Selenium)来模拟浏览器行为。
  • 反爬策略:网站常常采用反爬策略如CAPTCHA验证、IP封禁等,传统爬虫难以绕过这些限制。
  • 数据量和效率:面对大规模数据需求时,传统爬虫的抓取速度和效率可能不足,需优化代码或采用分布式爬虫技术。
  • 维护和升级:随着网站结构的变化,爬虫代码需要频繁更新和维护,以确保数据抓取的准确性。

4. 亮数据网页抓取API:零代码网页抓取解决方案

4.1. 亮数据API的核心优势

亮数据的网页抓取API以零代码配置、全球网络支撑及动态渲染能力为核心,为企业与个人提供高效数据采集方案,具体优势如下:

  1. 无需编码:亮数据API允许用户通过可视化界面配置采集规则,无需编写复杂的代码。用户只需选择目标网站并设定抓取需求,API即可自动执行数据采集任务。这种简化的流程降低了技术门槛,使非技术人员也能参与数据抓取。
  2. 全球代理网络规避反爬限制:亮数据API集成了全球代理网络,能够有效规避IP封禁和其他反爬机制。通过智能代理切换,API可以模拟不同的地理位置和设备,提高数据采集的成功率和稳定性。
  3. 动态页面渲染支持(自动处理JavaScript):面对越来越多使用JavaScript动态加载内容的网站,亮数据API具备动态页面渲染支持。它能够自动处理JavaScript,确保动态内容的准确抓取。用户无需担心传统爬虫无法获取动态数据的问题。

4.2. 零代码实战:维基百科数据自动化采集

4.2.1. 选择爬取目标

访问亮数据官网:网页抓取工具 - 网页爬虫工具 - 免费试用。点击开始免费试用按钮。

输入邮箱,点击创建账号按钮进行账号注册,然后登录网站。

登录成功后,点击左侧的Web Scrapers按钮。

然后点击Web爬虫库,进入网络爬虫市场。

从网络爬虫市场中找到用于AI的数据,然后选择en.wikipedia.org。

继续找到Wikipedia articles - discover by keyword,也就是按关键字搜索的方式。

4.2.2. 网页爬取配置

选择无代码抓取器,点击下一个按钮。

到此,就真正进入了爬虫配置页面,可以看到,我们只需要配置关键词,其它的编码参数和细节亮数据都帮我们搞定并且隐藏起来了(可以切换到词典页查看抓取的信息都有哪些),非常简单。配置好关键字之后,点击右下角的Start collecting按钮,就会自动启动抓取任务了。

4.2.3. 数据下载

任务启动之后,重新回到Web Scrapers页面,等待刚才启动的任务状态变为Ready之后,点击进入任务详情。

可以看到,我们配置的这个爬虫运行了26秒,收集到了45条数据,数据量5.3MB。然后点击下载按钮,选择需要的格式即可将爬取的数据下载到本地了。

如下所示,是亮数据网页爬取API采集到的json格式数据,可以看到,比我们前面使用传统爬虫技术爬取到的数据量更多,知识更加优质!!

5. AI知识库的应用

AI知识库是智能系统的核心组成部分,通过收集、存储和组织大量数据,支持AI应用做出准确的决策和提供智能服务。以我们爬取的人工智能相关维基百科内容为例,这些信息可以通过智能体知识库发挥价值。

人工智能相关的维基百科内容涵盖广泛的知识,包括AI的基本概念、历史发展、技术应用、伦理问题等。这些信息可以被整合到智能体知识库中,支持智能体(如虚拟助手、聊天机器人等)提供更为丰富和准确的交互体验。

  • 知识查询与回答:智能体知识库利用维基百科的结构化信息,帮助智能体快速检索和提供准确的知识回答。例如,用户询问“什么是机器学习?”时,智能体能够从知识库中提取相关定义和应用实例进行解释。
  • 语境理解与推理:通过维基百科的内容,智能体知识库可以增强语境理解和推理能力。智能体能够结合上下文信息提供更有深度的回答,支持复杂问题的解答。
  • 持续更新与扩展:维基百科内容不断更新,智能体知识库可以实现动态更新,以保持与最新知识同步。这确保了智能体能够提供及时和准确的信息。

6. 高效的数据采集赋能AI快速发展

数据是驱动AI发展的核心要素。通过高效的数据采集方法,我们能够构建丰富的知识库,为AI应用提供强大的支持。亮数据的网页抓取API通过零代码方案大幅降低了数据采集的技术和人力成本。随着零代码方案的崛起,企业将能够更轻松地获取和利用数据,释放数据的潜在价值,推动AI应用的创新和发展。在未来,数据采集技术将继续演进,帮助我们更好地理解和利用数据,赋能各类AI应用场景。

好消息:点击链接注册新账号直接送$2美金,可以免费试用爬取动态代理和自动采集API功能!!!

本文地址:https://www.vps345.com/1028.html

搜索文章

Tags

PV计算 带宽计算 流量带宽 服务器带宽 上行带宽 上行速率 什么是上行带宽? CC攻击 攻击怎么办 流量攻击 DDOS攻击 服务器被攻击怎么办 源IP 服务器 linux 运维 游戏 云计算 javascript 前端 chrome edge python MCP llama 算法 opencv 自然语言处理 神经网络 语言模型 阿里云 网络 网络安全 网络协议 ssh ubuntu 进程 操作系统 进程控制 Ubuntu deepseek Ollama 模型联网 API CherryStudio 科技 ai java 人工智能 个人开发 rust http 开发语言 数据库 centos oracle 关系型 安全 分布式 fastapi mcp mcp-proxy mcp-inspector fastapi-mcp agent sse Flask FastAPI Waitress Gunicorn uWSGI Uvicorn RTSP xop RTP RTSPServer 推流 视频 运维开发 云原生 harmonyos 华为 typescript 计算机网络 宝塔面板访问不了 宝塔面板网站访问不了 宝塔面板怎么配置网站能访问 宝塔面板配置ip访问 宝塔面板配置域名访问教程 宝塔面板配置教程 vue.js audio vue音乐播放器 vue播放音频文件 Audio音频播放器自定义样式 播放暂停进度条音量调节快进快退 自定义audio覆盖默认样式 学习 uni-app YOLO efficientVIT YOLOv8替换主干网络 TOLOv8 深度学习 目标检测 计算机视觉 HarmonyOS Next spring boot websocket 命名管道 客户端与服务端通信 pycharm ide pytorch WSL2 macos 向日葵 开源 nginx dubbo 机器学习 ai小智 语音助手 ai小智配网 ai小智教程 智能硬件 esp32语音助手 diy语音助手 笔记 C 环境变量 进程地址空间 ssl 物联网 ESP32 c++ 单片机 前端框架 golang 后端 ESXi filezilla 无法连接服务器 连接被服务器拒绝 vsftpd 331/530 HCIE 数通 ollama 大模型 mac 编辑器 node.js json html5 firefox android 鸿蒙 vue3 HTML audio 控件组件 vue3 audio音乐播放器 Audio标签自定义样式默认 vue3播放音频文件音效音乐 自定义audio播放器样式 播放暂停调整声音大小下载文件 kubernetes 容器 学习方法 经验分享 程序人生 numpy asm github 创意 社区 flask AI编程 AIGC docker DeepSeek-R1 API接口 c# cpu 内存 实时 使用 flutter Hyper-V WinRM TrustedHosts 面试 性能优化 jdk intellij-idea 架构 camera Arduino 电子信息 mount挂载磁盘 wrong fs type LVM挂载磁盘 Centos7.9 GaN HEMT 氮化镓 单粒子烧毁 辐射损伤 辐照效应 cuda cudnn anaconda debian PVE go 代理模式 Windsurf iot 鸿蒙系统 计算机外设 电脑 软件需求 tcp/ip 统信UOS 麒麟 bonding 链路聚合 adb php Dell R750XS vim 华为云 嵌入式硬件 温湿度数据上传到服务器 Arduino HTTP udp unity mongodb windows 银河麒麟服务器操作系统 系统激活 微服务 k8s 持续部署 信息与通信 web安全 博客 Docker Hub docker pull 镜像源 daemon.json Linux 微信小程序 AP配网 AK配网 小程序AP配网和AK配网教程 WIFI设备配网小程序UDP开 windwos防火墙 defender防火墙 win防火墙白名单 防火墙白名单效果 防火墙只允许指定应用上网 防火墙允许指定上网其它禁止 sql KingBase zabbix tcpdump 数据结构 c语言 负载均衡 AI Agent 小程序 QQ 机器人 bot Docker conda vscode 智能手机 NAS Termux Samba 弹性计算 云服务器 裸金属服务器 弹性裸金属服务器 虚拟化 ollama下载加速 mysql 跨域 tomcat postman mock mock server 模拟服务器 mock服务器 Postman内置变量 Postman随机数据 vue express LDAP 并查集 leetcode micropython esp32 mqtt rpc 实时音视频 微信 IIS服务器 IIS性能 日志监控 腾讯云 VMware安装Ubuntu Ubuntu安装k8s 自动化 maven intellij idea MQTT mosquitto 消息队列 unix r语言 数据挖掘 数据可视化 数据分析 arkUI .netcore word图片自动上传 word一键转存 复制word图片 复制word图文 复制word公式 粘贴word图文 粘贴word公式 git ansible django sqlite YOLOv8 NPU Atlas800 A300I pro 服务器管理 宝塔面板 配置教程 服务器安装 网站管理 蓝耘科技 元生代平台工作流 ComfyUI 工业4.0 客户端 java-ee matplotlib RoboVLM 通用机器人策略 VLA设计哲学 vlm fot robot 视觉语言动作模型 具身智能 高效远程协作 TrustViewer体验 跨设备操作便利 智能远程控制 spring cloud kafka hibernate 课程设计 kamailio sip VoIP sqlserver chatgpt DeepSeek 交换机 telnet 远程登录 rust腐蚀 arm开发 漏洞 spring apache safari pip Mac 系统 系统架构 .net 安全威胁分析 pygame 小游戏 五子棋 安装教程 GPU环境配置 Ubuntu22 CUDA PyTorch Anaconda安装 豆瓣 追剧助手 迅雷 nas 远程工作 unity3d dns 孤岛惊魂4 nvidia gpu算力 低代码 aws googlecloud 恒源云 jenkins vSphere vCenter 软件定义数据中心 sddc 致远OA OA服务器 服务器磁盘扩容 软件工程 华为od OD机试真题 华为OD机试真题 服务器能耗统计 gitlab okhttp CORS 音视频 僵尸进程 jmeter 软件测试 kylin arm opcua opcda KEPServer安装 大模型微调 threejs 3D 智能路由器 外网访问 内网穿透 端口映射 爬虫 数据集 缓存 centos-root /dev/mapper yum clean all df -h / du -sh Qwen2.5-coder 离线部署 多线程服务器 Linux网络编程 京东云 hadoop 监控 自动化运维 gateway Clion Nova ResharperC++引擎 Centos7 远程开发 outlook 大数据 政务 分布式系统 监控运维 Prometheus Grafana visualstudio 大数据平台 Dify pillow https AISphereButler live555 rtsp rtp Trae IDE AI 原生集成开发环境 Trae AI 框架搭建 WSL win11 无法解析服务器的名称或地址 网络用户购物行为分析可视化平台 大数据毕业设计 1024程序员节 微信小程序域名配置 微信小程序服务器域名 微信小程序合法域名 小程序配置业务域名 微信小程序需要域名吗 微信小程序添加域名 yum 飞牛NAS 飞牛OS MacBook Pro Kali Linux 黑客 渗透测试 信息收集 web3.py Ubuntu Server Ubuntu 22.04.5 金融 Reactor 设计模式 C++ jupyter 测试工具 string模拟实现 深拷贝 浅拷贝 经典的string类问题 三个swap 代码调试 ipdb adobe Python 网络编程 聊天服务器 套接字 TCP Socket eureka 源码剖析 rtsp实现步骤 流媒体开发 LLM NPS 雨云服务器 雨云 springsecurity6 oauth2 授权服务器 token sas 远程控制 远程看看 远程协助 多进程 rsyslog list 串口服务器 ecmascript KVM redis C语言 ipython 硬件工程 DigitalOcean GPU服务器购买 GPU服务器哪里有 GPU服务器 Cookie bootstrap html asi_bench nextjs react reactjs stm32 wireshark llm 本地部署 api gitee ue4 着色器 ue5 虚幻 thingsboard postgresql prometheus dell服务器 rabbitmq 直播推流 进程信号 腾讯云大模型知识引擎 Deepseek AI大模型 程序员 中间件 可信计算技术 安全架构 网络攻击模型 n8n 工作流 workflow firewalld 服务器配置 生物信息学 fpga开发 react.js 前端面试题 kvm devops springboot Ark-TS语言 mybatis YOLOv12 UOS 统信操作系统 svn oceanbase rc.local 开机自启 systemd ping++ 深度优先 图论 并集查找 换根法 树上倍增 ddos iBMC UltraISO qt stm32项目 llama3 Chatglm 开源大模型 springcloud VMware安装mocOS VMware macOS系统安装 transformer zotero WebDAV 同步失败 agi ffmpeg 嵌入式 linux驱动开发 mcu webrtc 产品经理 microsoft 微信分享 Image wxopensdk asp.net大文件上传 asp.net大文件上传源码 ASP.NET断点续传 asp.net上传文件夹 asp.net上传大文件 .net core断点续传 .net mvc断点续传 部署 ocr 媒体 Linux PID 大语言模型 矩阵 LInux 服务器繁忙 playbook 剧本 muduo 个人博客 X11 Xming bash 宠物 毕业设计 免费学习 宠物领养 宠物平台 网络工程师 华为认证 集成学习 集成测试 游戏程序 小艺 Pura X excel NFS elasticsearch 监控k8s 监控kubernetes 系统安全 minio mariadb Ubuntu DeepSeek DeepSeek Ubuntu DeepSeek 本地部署 DeepSeek 知识库 DeepSeek 私有化知识库 本地部署 DeepSeek DeepSeek 私有化部署 计算虚拟化 弹性裸金属 MacMini 迷你主机 mini Apple IPMI WebUI DeepSeek V3 硬件 设备 GPU PCI-Express pyautogui 职场和发展 vscode 1.86 网站搭建 serv00 jetty undertow Linux无人智慧超市 LInux多线程服务器 QT项目 LInux项目 单片机项目 grafana langchain 高级IO epoll 蓝桥杯 SSH 远程连接 VR手套 数据手套 动捕手套 动捕数据手套 p2p CrewAI log4j ip 银河麒麟 kylin v10 麒麟 v10 虚拟机 qemu libvirt av1 电视盒子 机顶盒ROM 魔百盒刷机 jvm SWAT 配置文件 服务管理 网络共享 ruoyi 3d 数学建模 银河麒麟桌面操作系统 Kylin OS 国产化 网络结构图 DeepSeek行业应用 Heroku 网站部署 迁移指南 游戏机 hugo 输入法 Netty 即时通信 NIO keepalived 思科模拟器 思科 Cisco sonoma 自动更新 nuxt3 gpt 图像处理 远程 命令 执行 sshpass 操作 Redis Desktop xshell termius iterm2 边缘计算 远程桌面 neo4j 数据仓库 数据库开发 数据库架构 database 半虚拟化 硬件虚拟化 Hypervisor DevEco Studio 其他 Cline 自动化编程 ArcTS 登录 ArcUI GridItem 链表 算力 selenium 计算机 npm k8s集群资源管理 云原生开发 chrome devtools chromedriver openssl 密码学 模拟退火算法 SSH 服务 SSH Server OpenSSH Server 田俊楠 ros2 moveit 机器人运动 Ubuntu 24 常用命令 Ubuntu 24 Ubuntu vi 异常处理 数据库系统 Cursor 直流充电桩 充电桩 W5500 OLED u8g2 TCP服务器 chfs ubuntu 16.04 kind 微信开放平台 微信公众平台 微信公众号配置 同步 备份 建站 c dity make Java Applet URL操作 服务器建立 Socket编程 网络文件读取 显示过滤器 安装 ICMP Wireshark安装 大模型入门 大模型教程 remote-ssh 图形渲染 Xterminal ci/cd 黑苹果 bug sdkman minicom 串口调试工具 openEuler rime 网络穿透 火绒安全 Nuxt.js 飞书 ip命令 新增网卡 新增IP 启动网卡 uniapp css CPU 主板 电源 网卡 alias unalias 别名 mysql离线安装 ubuntu22.04 mysql8.0 源码 docker命令大全 5G 3GPP 卫星通信 混合开发 环境安装 JDK echarts matlab 传统数据库升级 银行 LLMs 服务器数据恢复 数据恢复 存储数据恢复 北亚数据恢复 oracle数据恢复 监控k8s集群 集群内prometheus 能力提升 面试宝典 技术 IT信息化 oneapi 无人机 open webui hive Hive环境搭建 hive3环境 Hive远程模式 code-server pgpool XCC Lenovo 移动云 MS Materials android studio 业界资讯 鲲鹏 命令行 基础入门 编程 nfs 信息可视化 网页设计 dify SSL 域名 skynet 虚拟局域网 开发环境 selete 硬件架构 flash-attention 报错 自定义客户端 SAS shell embedding 国产操作系统 ukui 麒麟kylinos openeuler 统信 虚拟机安装 gpt-3 文心一言 云桌面 微软 AD域控 证书服务器 大大通 第三代半导体 碳化硅 jar 回显服务器 UDP的API使用 大模型面经 大模型学习 LORA NLP 显卡驱动 pyqt EasyConnect k8s资源监控 annotations自动化 自动化监控 监控service 监控jvm cnn 邮件APP 免费软件 RustDesk自建服务器 rustdesk服务器 docker rustdesk 黑客技术 URL ftp web rustdesk VPS ssrf 失效的访问控制 企业微信 Linux24.04 deepin MI300x WebRTC openwrt ux 多线程 vscode1.86 1.86版本 ssh远程连接 open Euler dde Java RTMP 应用层 docker run 数据卷挂载 交互模式 big data opensearch helm ruby ui 服务器主板 AI芯片 xrdp Playwright 自动化测试 SRS 流媒体 直播 游戏服务器 TrinityCore 魔兽世界 P2P HDLC SSL证书 技能大赛 linux上传下载 elk 交互 docker搭建nacos详解 docker部署nacos docker安装nacos 腾讯云搭建nacos centos7搭建nacos IPMITOOL BMC 硬件管理 deepseek r1 springboot远程调试 java项目远程debug docker远程debug java项目远程调试 springboot远程 USB网络共享 iftop 网络流量监控 崖山数据库 YashanDB VMware创建虚拟机 vmware 卡死 繁忙 解决办法 替代网站 汇总推荐 AI推理 RAID RAID技术 磁盘 存储 Ubuntu 24.04.1 轻量级服务器 MQTT协议 消息服务器 代码 redhat make命令 makefile文件 dash 正则表达式 dba tidb GLIBC uv pdf 群晖 文件分享 eNSP 网络规划 VLAN 企业网络 iis VSCode 云服务 odoo 服务器动作 Server action 视觉检测 linux环境变量 FTP 服务器 搜索引擎 银河麒麟操作系统 远程过程调用 Windows环境 安卓 服务器部署ai模型 sqlite3 Linux awk awk函数 awk结构 awk内置变量 awk参数 awk脚本 awk详解 Anolis nginx安装 linux插件下载 AI代码编辑器 毕设 wps raid5数据恢复 磁盘阵列数据恢复 ios 无桌面 rdp 远程服务 risc-v 驱动开发 嵌入式实习 文件系统 路径解析 linux安装配置 三级等保 服务器审计日志备份 Docker Compose docker compose docker-compose mamba Vmamba 联想开天P90Z装win10 nac 802.1 portal Kylin-Server DBeaver kerberos 多个客户端访问 IO多路复用 TCP相关API TRAE 软考 etcd 数据安全 RBAC 流式接口 MacOS录屏软件 Docker引擎已经停止 Docker无法使用 WSL进度一直是0 镜像加速地址 Portainer搭建 Portainer使用 Portainer使用详解 Portainer详解 Portainer portainer RAGFLOW RAG 检索增强生成 文档解析 大模型垂直应用 宕机切换 服务器宕机 小番茄C盘清理 便捷易用C盘清理工具 小番茄C盘清理的优势尽显何处? 教你深度体验小番茄C盘清理 C盘变红?!不知所措? C盘瘦身后电脑会发生什么变化? 目标跟踪 OpenVINO 推理应用 Google pay Apple pay 开机自启动 压力测试 rag ragflow ragflow 源码启动 网工 visual studio code 压测 ECS ceph DOIT 四博智联 医疗APP开发 app开发 数据管理 数据治理 数据编织 数据虚拟化 idm bcompare Beyond Compare windows日志 环境迁移 深度求索 私域 知识库 python3.11 lio-sam SLAM glibc rocketmq 性能测试 功能测试 OpenManus EMUI 回退 降级 升级 protobuf 序列化和反序列化 IIS .net core Hosting Bundle .NET Framework vs2022 webstorm 匿名管道 XFS xfs文件系统损坏 I_O error es kali 共享文件夹 frp CLion 实时互动 相差8小时 UTC 时间 netty gitea curl wget 大模型应用 强制清理 强制删除 mac废纸篓 file server http server web server 状态管理的 UDP 服务器 Arduino RTOS JAVA 单元测试 Invalid Host allowedHosts 实验 昇腾 npu linux 命令 sed 命令 gradle xml 王者荣耀 Wi-Fi 灵办AI DNS C# MQTTS 双向认证 emqx wsl 设置代理 实用教程 virtualenv cmos 云电竞 云电脑 todesk 自动化任务管理 图形化界面 SysBench 基准测试 ecm bpm tensorflow EtherCAT转Modbus ECT转Modbus协议 EtherCAT转485网关 ECT转Modbus串口网关 EtherCAT转485协议 ECT转Modbus网关 trae Minecraft GCC crosstool-ng Erlang OTP gen_server 热代码交换 事务语义 MNN Qwen yum源切换 更换国内yum源 备份SQL Server数据库 数据库备份 傲梅企业备份网络版 wsl2 音乐服务器 Navidrome 音流 线程 gaussdb vr gcc 多层架构 解耦 在线预览 xlsx xls文件 在浏览器直接打开解析xls表格 前端实现vue3打开excel 文件地址url或接口文档流二进 Dell HPE 联想 浪潮 iDRAC R720xd freebsd 系统开发 binder 车载系统 framework 源码环境 分析解读 指令 mq 测试用例 磁盘监控 英语 AI写作 AI作画 next.js 部署next.js 聊天室 yolov8 xcode IMX317 MIPI H265 VCU Linux的权限 uni-file-picker 拍摄从相册选择 uni.uploadFile H5上传图片 微信小程序上传图片 办公自动化 自动化生成 pdf教程 本地部署AI大模型 飞牛 李心怡 信号 edge浏览器 g++ g++13 docker部署Python arcgis 运维监控 游戏开发 idea 显示管理器 lightdm gdm 阻塞队列 生产者消费者模型 服务器崩坏原因 DIFY grub 版本升级 扩容 策略模式 单例模式 流水线 脚本式流水线 程序员创富 推荐算法 磁盘镜像 服务器镜像 服务器实时复制 实时文件备份 DenseNet 代理 大模型推理 WebVM banner prompt HTTP 服务器控制 ESP32 DeepSeek 增强现实 沉浸式体验 应用场景 技术实现 案例分析 AR Xinference RAGFlow xss nlp HarmonyOS 7z llama.cpp 我的世界服务器搭建 minecraft cd 目录切换 virtualbox DocFlow 信号处理 ubuntu24 vivado24 网络药理学 生信 gromacs 分子动力学模拟 MD 动力学模拟 vasp安装 查询数据库服务IP地址 SQL Server 分布式训练 语音识别 AutoDL apt 国内源 国标28181 视频监控 监控接入 语音广播 流程 SIP SDP centos 7 Open WebUI 服务网格 istio 视频编解码 Radius rclone AList webdav fnOS qt项目 qt项目实战 qt教程 deep learning 银河麒麟高级服务器 外接硬盘 Kylin 根服务器 clickhouse 序列化反序列化 社交电子 lsb_release /etc/issue /proc/version uname -r 查看ubuntu版本 Linux的基础指令 UOS1070e EMQX 通信协议 VS Code 代码托管服务 WLAN fd 文件描述符 小智AI服务端 xiaozhi ASR TTS junit OpenHarmony 真机调试 AD 域管理 实习 历史版本 下载 语法 做raid 装系统 laravel etl 内网服务器 内网代理 内网通信 VM搭建win2012 win2012应急响应靶机搭建 攻击者获取服务器权限 上传wakaung病毒 应急响应并溯源 挖矿病毒处置 应急响应综合性靶场 需求分析 规格说明书 反向代理 searxng PPI String Cytoscape CytoHubba 捆绑 链接 谷歌浏览器 youtube google gmail 毕昇JDK WSL2 上安装 Ubuntu 金仓数据库 2025 征文 数据库平替用金仓 上传视频至服务器代码 vue3批量上传多个视频并预览 如何实现将本地视频上传到网页 element plu视频上传 ant design vue vue3本地上传视频及预览移除 prometheus数据采集 prometheus数据模型 prometheus特点 像素流送api 像素流送UE4 像素流送卡顿 像素流送并发支持 vpn 备选 网站 调用 示例 autodl c/c++ 串口 AD域 firewall 互信 Typore regedit 开机启动 用户缓冲区 模拟实现 ArkTs ArkUI 支付 微信支付 开放平台 影刀 #影刀RPA# EtherNet/IP串口网关 EIP转RS485 EIP转Modbus EtherNet/IP网关协议 EIP转RS485网关 EIP串口服务器 webgl Headless Linux SenseVoice tcp 安防软件 端口测试 怎么卸载MySQL MySQL怎么卸载干净 MySQL卸载重新安装教程 MySQL5.7卸载 Linux卸载MySQL8.0 如何卸载MySQL教程 MySQL卸载与安装 考研 Mac内存不够用怎么办 CDN ROS 自动驾驶 聚类 cocoapods chrome 浏览器下载 chrome 下载安装 谷歌浏览器下载 私有化 flink 版本 figma 华为机试 玩机技巧 软件分享 软件图标 Kali 渗透 强化学习 MySql GoogLeNet 交叉编译 Jellyfin powerpoint TrueLicense Claude Windows ai工具 armbian u-boot AnythingLLM AnythingLLM安装 移动魔百盒 基础环境 USB转串口 CH340 Ubuntu22.04 开发人员主页 超融合 trea 实战案例 h.264 主从复制 人工智能生成内容 su sudo 项目部署到linux服务器 项目部署过程 CVE-2024-7347 cfssl web3 拓扑图 SSE can 线程池 LLM Web APP Streamlit cpp-httplib 游戏引擎 IMM 本地知识库部署 DeepSeek R1 模型 虚拟现实 ssh远程登录 sysctl.conf vm.nr_hugepages QT 5.12.12 QT开发环境 Ubuntu18.04 单一职责原则 双系统 GRUB引导 Linux技巧 键盘 程序 spark HistoryServer Spark YARN jobhistory 代理服务器 asp.net大文件上传下载 浏览器开发 AI浏览器 ssh漏洞 ssh9.9p2 CVE-2025-23419 iphone 僵尸世界大战 游戏服务器搭建 yaml Ultralytics 可视化 IM即时通讯 剪切板对通 HTML FORMAT zookeeper saltstack 软负载 openvpn server openvpn配置教程 centos安装openvpn 镜像 高效日志打印 串口通信日志 服务器日志 系统状态监控日志 异常记录日志 GIS 遥感 WebGIS 阿里云ECS swoole FTP服务器 v10 软件 ldap rnn seatunnel 内网环境 x64 SIGSEGV xmm0 稳定性 看门狗 perf 架构与原理 openstack Xen seleium 上传视频文件到服务器 uniApp本地上传视频并预览 uniapp移动端h5网页 uniapp微信小程序上传视频 uniapp app端视频上传 uniapp uview组件库 IDEA composer 串口驱动 CH341 uart 485 产测工具框架 IMX6ULL 管理框架 tailscale derp derper 中转 Ubuntu共享文件夹 共享目录 Linux共享文件夹 triton 模型分析 less 大文件分片上传断点续传及进度条 如何批量上传超大文件并显示进度 axios大文件切片上传详细教 node服务器合并切片 vue3大文件上传报错提示错误 大文件秒传跨域报错cors k8s二次开发 集群管理 Logstash 日志采集 Unity Dedicated Server Host Client 无头主机 Linux环境 aarch64 编译安装 HPC Deepseek-R1 私有化部署 推理模型 开发 模拟器 教程 MCP server C/S vue-i18n 国际化多语言 vue2中英文切换详细教程 如何动态加载i18n语言包 把语言json放到服务器调用 前端调用api获取语言配置文件 宝塔 常用命令 文本命令 目录命令 性能分析 DeepSeek r1 ubuntu24.04.1 NLP模型 sentinel 服务器无法访问 ip地址无法访问 无法访问宝塔面板 宝塔面板打不开 自学笔记 小米 澎湃OS Android jina miniapp 调试 debug 断点 网络API请求调试方法 HiCar CarLife+ CarPlay QT RK3588 信创 信创终端 中科方德 Node-Red 编程工具 流编程 midjourney 嵌入式Linux IPC 中兴光猫 换光猫 网络桥接 自己换光猫 wordpress 无法访问wordpess后台 打开网站页面错乱 linux宝塔面板 wordpress更换服务器 bat 端口 查看 ss FunASR 佛山戴尔服务器维修 佛山三水服务器维修 OpenSSH 读写锁 AI Agent 字节智能运维 干货分享 黑客工具 密码爆破 Spring Security 技术共享 我的世界 我的世界联机 数码 IPv4 子网掩码 公网IP 私有IP SSH 密钥生成 SSH 公钥 私钥 生成 虚拟显示器 ISO镜像作为本地源 KylinV10 麒麟操作系统 Vmware 相机 eclipse 权限 ShenTong 执法记录仪 智能安全帽 smarteye 软件构建 换源 Debian easyui 线性代数 电商平台 服务器时间 C++软件实战问题排查经验分享 0xfeeefeee 0xcdcdcdcd 动态库加载失败 程序启动失败 程序运行权限 标准用户权限与管理员权限 IO模型 飞牛nas fnos lua ros 重启 排查 系统重启 日志 原因 cursor 域名服务 DHCP 符号链接 配置 dns是什么 如何设置电脑dns dns应该如何设置 音乐库 H3C pppoe radius deekseek AI agent iventoy VmWare OpenEuler AI-native Docker Desktop 免费域名 域名解析 前后端分离 ubuntu20.04 ros1 Noetic 20.04 apt 安装 CentOS perl top Linux top top命令详解 top命令重点 top常用参数 react native MDK 嵌入式开发工具 论文笔记 sublime text Qwen2.5-VL vllm vnc rtsp服务器 rtsp server android rtsp服务 安卓rtsp服务器 移动端rtsp服务 大牛直播SDK hexo nosql CentOS Stream zip unzip 软链接 硬链接 网络爬虫 onlyoffice win服务器架设 windows server 电视剧收视率分析与可视化平台 虚幻引擎 问题解决 离线部署dify kotlin SVN Server tortoise svn 企业网络规划 华为eNSP xpath定位元素 状态模式 Sealos 论文阅读 ABAP rancher 物联网开发 烟花代码 烟花 元旦 性能调优 安全代理 合成模型 扩散模型 图像生成 区块链 嵌入式系统开发 磁盘清理 HAProxy 软件卸载 系统清理 SEO 鸿蒙开发 移动开发 Linux权限 权限命令 特殊权限 网络建设与运维 网络搭建 神州数码 神州数码云平台 云平台 visual studio ip协议 sequoiaDB MAC SecureCRT ranger MySQL8.0 抗锯齿 nftables 防火墙 知识图谱 PX4 MacOS ubuntu 18.04 进程优先级 调度队列 进程切换 本地化部署 MVS 海康威视相机 wpf 在线office Python基础 Python教程 Python技巧 proxy模式 wsgiref Web 服务器网关接口 dock 加速 ardunio BLE 浏览器自动化 kernel 存储维护 NetApp存储 EMC存储 环境配置 java-rocketmq 容器技术 harmonyOS面试题 开机黑屏 word 多路转接 docker搭建pg docker搭建pgsql pg授权 postgresql使用 postgresql搭建 vu大文件秒传跨域报错cors 智能音箱 智能家居 对比 工具 meld DiffMerge 健康医疗 互联网医院 粘包问题 项目部署 极限编程 安装MySQL 通信工程 毕业 deployment daemonset statefulset cronjob navicat 大模型部署 Attention React Next.js 开源框架 云耀服务器 TCP协议 查看显卡进程 fuser ArtTS 网卡的名称修改 eth0 ens33 nvm whistle NAT转发 NAT Server 端口聚合 windows11 milvus 钉钉 树莓派 VNC db System V共享内存 进程通信 gnu css3 docker desktop image fast 多端开发 智慧分发 应用生态 鸿蒙OS 智能电视 加解密 Yakit yaklang UDP docker部署翻译组件 docker部署deepl docker搭建deepl java对接deepl 翻译组件使用 hosts iperf3 带宽测试 带外管理 元服务 应用上架 流量运营 rpa Linux find grep 欧标 OCPP 沙盒 计算生物学 生物信息 基因组 AI员工 HarmonyOS NEXT 原生鸿蒙 抓包工具 fstab Unity插件 风扇控制软件 视频平台 录像 视频转发 视频流 搜狗输入法 中文输入法 yum换源 热榜 Web服务器 多线程下载工具 PYTHON yolov5 MobaXterm java-rabbitmq js copilot UEFI Legacy MBR GPT U盘安装操作系统 mcp服务器 client close MAVROS 四旋翼无人机 西门子PLC 通讯 机柜 1U 2U 搭建个人相关服务器 conda配置 conda镜像源 Reactor反应堆 国产数据库 瀚高数据库 数据迁移 下载安装 本地环回 bind 达梦 DM8 powerbi macOS 数字证书 签署证书 话题通信 服务通信 接口优化 mm-wiki搭建 linux搭建mm-wiki mm-wiki搭建与使用 mm-wiki使用 mm-wiki详解 WebServer 解决方案 服务器正确解析请求体 IO