跳转到主要内容 跳转到页脚
Bricks Templates
  • 首页
  • 模型列表
  • 文档
进入API中转站

基础教程

7
  • 快速了解 FastGPT
  • 快速上手
  • AI 相关参数配置说明
  • Web 站点同步
  • 知识库搜索方案和参数
  • 外部文件知识库
  • 对话问题引导

高级编排

2
  • AI 对话
  • 高级编排介绍

模块介绍

12
  • AI 对话
  • 自定义反馈
  • 内容提取
  • HTTP 模块
  • Laf 函数调用
  • 对话入口
  • 工具调用
  • 知识库搜索
  • 问题分类
  • 指定回复
  • 判断器
  • 文本加工

编绘示例

5
  • 固定开头和结尾内容
  • 接入谷歌搜索
  • 实验室预约
  • Dalle3 绘图
  • 发送飞书webhook通知
  • 首页
  • 文档
  • FastGPT
  • 基础教程
  • Web 站点同步

Web 站点同步

FastGPT Web 站点同步功能介绍和使用方式

该功能目前仅向商业版用户开放。

什么是 Web 站点同步  #

Web 站点同步利用爬虫的技术,可以通过一个入口网站,自动捕获同域名下的所有网站,目前最多支持200个子页面。出于合规与安全角度,FastGPT 仅支持静态站点的爬取,主要用于各个文档站点快速构建知识库。

Tips: 国内的媒体站点基本不可用,公众号、csdn、知乎等。可以通过终端发送curl请求检测是否为静态站点

如何使用  #

1. 新建知识库,选择 Web 站点同步  #

2. 点击配置站点信息  #

3. 填写网址和选择器  #

好了, 现在点击开始同步,静等系统自动抓取网站信息即可。

创建应用,绑定知识库  #

选择器如何使用  #

选择器是 HTML CSS JS 的产物,你可以通过选择器来定位到你需要抓取的具体内容,而不是整个站点。使用方式为:

首先打开浏览器调试面板(通常是 F12,或者【右键 – 检查】)  #

输入对应元素的选择器  #

菜鸟教程 css 选择器,具体选择器的使用方式可以参考菜鸟教程。

上图中,我们选中了一个区域,对应的是div标签,它有 data-prismjs-copy, data-prismjs-copy-success, data-prismjs-copy-error 三个属性,这里我们用到一个就够。所以选择器是: div[data-prismjs-copy]

除了属性选择器,常见的还有类和ID选择器。例如:

上图 class 里的是类名(可能包含多个类名,都是空格隔开的,选择一个即可),选择器可以为:.docs-content

多选择器使用  #

在开头的演示中,我们对 FastGPT 文档是使用了多选择器的方式来选择,通过逗号隔开了两个选择器。

我们希望选中上图两个标签中的内容,此时就需要两组选择器。一组是:.docs-content .mb-0.d-flex,含义是 docs-content 类下同时包含 mb-0和d-flex 两个类的子元素;

另一组是.docs-content div[data-prismjs-copy],含义是docs-content 类下包含data-prismjs-copy属性的div元素。

把两组选择器用逗号隔开即可:.docs-content .mb-0.d-flex, .docs-content div[data-prismjs-copy]

您的感觉是什么
还有问题?我们能帮忙吗?

需要什么帮助?

更新 2024-06-18
AI 相关参数配置说明知识库搜索方案和参数
内容目录
  • 什么是 Web 站点同步 
  • 如何使用 
    • 1. 新建知识库,选择 Web 站点同步 
    • 2. 点击配置站点信息 
    • 3. 填写网址和选择器 
  • 创建应用,绑定知识库 
  • 选择器如何使用 
    • 首先打开浏览器调试面板(通常是 F12,或者【右键 - 检查】) 
    • 输入对应元素的选择器 
    • 多选择器使用 
© 2020-2024 默拉智能API中转站