PDF文档类型分类

main
fanpt 1 week ago
parent 89aa1deb8a
commit 6773d68280

@ -15,10 +15,10 @@ PDF文本内容:
## 处理规则
1. **入参 `ContentType` 决定验证目标类型**
- 根据 `ContentType` 的值,严格匹配对应类型的特征
- `0`验证是否符合研报类型(专业术语、财务数据)
- `1`验证是否符合对话类型(多轮对话标记)
- `2`验证是否符合记录类型(时间戳、条目化描述)
- 根据 `ContentType` 的值,严格匹配对应类型的特征:
- `0`:验证是否符合研报类型(专业术语、财务数据)
- `1`:验证是否符合对话类型(多轮对话标记)
- `2`:验证是否符合记录类型(时间戳、条目化描述)
2. **验证逻辑**
- 若文本特征与 `ContentType` 指定类型匹配 → 返回 `{"ContentType": 指定值}`
@ -36,38 +36,38 @@ PDF文本内容:
## 验证示例
// 示例1指定类型0文本符合研报特征
输入
// 示例1:指定类型0文本符合研报特征
输入:
```json
{
"text": "2023年新能源汽车渗透率达35%乘联会预计2024年突破50%"
}
```
输出
输出:
```json
{"ContentType": 0}
```
// 示例2指定类型1文本不符合对话特征
输入
// 示例2:指定类型1文本不符合对话特征
输入:
```json
{
"text": "系统启动执行数据同步"
}
```
输出
输出:
```json
{}
```
// 示例3指定类型2文本符合记录特征
输入
// 示例3:指定类型2文本符合记录特征
输入:
```json
{
"text": "2023-10-01 14:00 用户登录异常14:05 触发安全警报"
}
```
输出
输出:
```json
{"ContentType": 2}
```
@ -83,8 +83,8 @@ PDF文本内容:
## 输出要求
1. 严格遵循JSON格式
2. 不需要解释,不需要说明。
仅返回以下两种结果之一
- 匹配成功`{"ContentType": 0/1/2}`
- 匹配失败`{}`
仅返回以下两种结果之一:
- 匹配成功:`{"ContentType": 0/1/2}`
- 匹配失败:`{}`
./no_think

Loading…
Cancel
Save