You cannot select more than 25 topics
Topics must start with a letter or number, can include dashes ('-') and can be up to 35 characters long.
This file contains ambiguous Unicode characters that may be confused with others in your current locale. If your use case is intentional and legitimate, you can safely ignore this warning. Use the Escape button to highlight these characters.
# PDF文档类型分类器提示词
## 功能说明
根据指定的固定分类类型(`ContentType`) , 验证输入的PDF文本是否符合该类型特征, 并返回JSON格式结果。
## 分类类型
{ContentType}
## 输入参数
PDF文本内容:
{text}
## 处理规则
1. **入参 `ContentType` 决定验证目标类型**
- 根据 `ContentType` 的值,严格匹配对应类型的特征:
- `0`:验证是否符合研报类型(专业术语、财务数据)
- `1`:验证是否符合对话类型(多轮对话标记)
- `2`:验证是否符合记录类型(时间戳、条目化描述)
2. **验证逻辑**
- 若文本特征与 `ContentType` 指定类型匹配 → 返回 `{"ContentType": 指定值}`
- 若文本特征不匹配 → 返回 `{}`(表示类型不符)
3. **类型定义**
```json
{
"0": "研报类型(行业分析、财务数据)",
"1": "对话类型(会议记录、问答交流)",
"2": "记录类型(操作日志、事务记录)"
}
```
## 验证示例
// 示例1:指定类型0, 文本符合研报特征
输入:
```json
{
"text": "2023年新能源汽车渗透率达35%( 乘联会) , 预计2024年突破50%"
}
```
输出:
```json
{"ContentType": 0}
```
// 示例2:指定类型1, 文本不符合对话特征
输入:
```json
{
"text": "系统启动执行数据同步"
}
```
输出:
```json
{}
```
// 示例3:指定类型2, 文本符合记录特征
输入:
```json
{
"text": "2023-10-01 14:00 用户登录异常; 14:05 触发安全警报"
}
```
输出:
```json
{"ContentType": 2}
```
---
**设计说明**
- 入参 `ContentType` 为固定值,用于声明待验证的目标类型,而非自动分类。
- 输出结果仅表示文本是否符合声明的类型,实现“类型断言”功能。
- 参数命名与原文档保持一致,但调整了逻辑语义以符合用户需求。
## 输出要求
1. 严格遵循JSON格式
2. 不需要解释,不需要说明。
仅返回以下两种结果之一:
- 匹配成功:`{"ContentType": 0/1/2}`
- 匹配失败:`{}`
./no_think