|
|
|
@ -0,0 +1,79 @@
|
|
|
|
|
# PDF文档类型分类器提示词
|
|
|
|
|
|
|
|
|
|
## 功能说明
|
|
|
|
|
根据指定的固定分类类型(`ContentType`),验证输入的PDF文本是否符合该类型特征,并返回JSON格式结果。
|
|
|
|
|
|
|
|
|
|
## 分类类型
|
|
|
|
|
{ContentType}
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
## 输入参数
|
|
|
|
|
|
|
|
|
|
PDF文本内容:
|
|
|
|
|
{text}
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
## 处理规则
|
|
|
|
|
1. **入参 `ContentType` 决定验证目标类型**
|
|
|
|
|
- 根据 `ContentType` 的值,严格匹配对应类型的特征:
|
|
|
|
|
- `0`:验证是否符合研报类型(专业术语、财务数据)
|
|
|
|
|
- `1`:验证是否符合对话类型(多轮对话标记)
|
|
|
|
|
- `2`:验证是否符合记录类型(时间戳、条目化描述)
|
|
|
|
|
|
|
|
|
|
2. **验证逻辑**
|
|
|
|
|
- 若文本特征与 `ContentType` 指定类型匹配 → 返回 `{"ContentType": 指定值}`
|
|
|
|
|
- 若文本特征不匹配 → 返回 `{}`(表示类型不符)
|
|
|
|
|
|
|
|
|
|
3. **类型定义**
|
|
|
|
|
```json
|
|
|
|
|
{
|
|
|
|
|
"0": "研报类型(行业分析、财务数据)",
|
|
|
|
|
"1": "对话类型(会议记录、问答交流)",
|
|
|
|
|
"2": "记录类型(操作日志、事务记录)"
|
|
|
|
|
}
|
|
|
|
|
```
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
## 验证示例
|
|
|
|
|
```json
|
|
|
|
|
// 示例1:指定类型0,文本符合研报特征
|
|
|
|
|
输入:
|
|
|
|
|
{
|
|
|
|
|
"text": "2023年新能源汽车渗透率达35%(乘联会),预计2024年突破50%"
|
|
|
|
|
}
|
|
|
|
|
输出:
|
|
|
|
|
{"ContentType": 0}
|
|
|
|
|
|
|
|
|
|
// 示例2:指定类型1,文本不符合对话特征
|
|
|
|
|
输入:
|
|
|
|
|
{
|
|
|
|
|
"text": "系统启动执行数据同步"
|
|
|
|
|
}
|
|
|
|
|
输出:
|
|
|
|
|
{}
|
|
|
|
|
|
|
|
|
|
// 示例3:指定类型2,文本符合记录特征
|
|
|
|
|
输入:
|
|
|
|
|
{
|
|
|
|
|
"text": "2023-10-01 14:00 用户登录异常;14:05 触发安全警报"
|
|
|
|
|
}
|
|
|
|
|
输出:
|
|
|
|
|
{"ContentType": 2}
|
|
|
|
|
```
|
|
|
|
|
|
|
|
|
|
---
|
|
|
|
|
|
|
|
|
|
**设计说明**
|
|
|
|
|
- 入参 `ContentType` 为固定值,用于声明待验证的目标类型,而非自动分类。
|
|
|
|
|
- 输出结果仅表示文本是否符合声明的类型,实现“类型断言”功能。
|
|
|
|
|
- 参数命名与原文档保持一致,但调整了逻辑语义以符合用户需求。
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
## 输出要求
|
|
|
|
|
1. 严格遵循JSON格式
|
|
|
|
|
2. 不需要解释,不需要说明。
|
|
|
|
|
仅返回以下两种结果之一:
|
|
|
|
|
- 匹配成功:`{"ContentType": 0/1/2}`
|
|
|
|
|
- 匹配失败:`{}`
|
|
|
|
|
|
|
|
|
|
./no_think
|