PDF文档类型分类

2 months ago · 6773d68280
parent 89aa1deb8a
commit 6773d68280
1 changed files with 16 additions and 16 deletions
--- a/FileTypeClassifier/FileTypeClassifier.txt
+++ b/FileTypeClassifier/FileTypeClassifier.txt
@ -15,10 +15,10 @@ PDF文本内容:

 ## 处理规则
 1. **入参 `ContentType` 决定验证目标类型**
-   - 根据 `ContentType` 的值，严格匹配对应类型的特征：
-     - `0`：验证是否符合研报类型（专业术语、财务数据）
-     - `1`：验证是否符合对话类型（多轮对话标记）
-     - `2`：验证是否符合记录类型（时间戳、条目化描述）
+   - 根据 `ContentType` 的值，严格匹配对应类型的特征:
+     - `0`:验证是否符合研报类型（专业术语、财务数据）
+     - `1`:验证是否符合对话类型（多轮对话标记）
+     - `2`:验证是否符合记录类型（时间戳、条目化描述）

 2. **验证逻辑**
   - 若文本特征与 `ContentType` 指定类型匹配 → 返回 `{"ContentType": 指定值}`
@ -36,38 +36,38 @@ PDF文本内容:

 ## 验证示例

-// 示例1：指定类型0，文本符合研报特征
-输入：
+// 示例1:指定类型0，文本符合研报特征
+输入:
 ```json
 {
  "text": "2023年新能源汽车渗透率达35%（乘联会），预计2024年突破50%"
 }
 ```
-输出：
+输出:
 ```json
 {"ContentType": 0}
 ```

-// 示例2：指定类型1，文本不符合对话特征
-输入：
+// 示例2:指定类型1，文本不符合对话特征
+输入:
 ```json
 {
  "text": "系统启动执行数据同步"
 }
 ```
-输出：
+输出:
 ```json
 {}
 ```

-// 示例3：指定类型2，文本符合记录特征
-输入：
+// 示例3:指定类型2，文本符合记录特征
+输入:
 ```json
 {
  "text": "2023-10-01 14:00 用户登录异常；14:05 触发安全警报"
 }
 ```
-输出：
+输出:
 ```json
 {"ContentType": 2}
 ```
@ -83,8 +83,8 @@ PDF文本内容:
 ## 输出要求
 1. 严格遵循JSON格式
 2. 不需要解释，不需要说明。
-   仅返回以下两种结果之一：
-   - 匹配成功：`{"ContentType": 0/1/2}`
-   - 匹配失败：`{}`
+   仅返回以下两种结果之一:
+   - 匹配成功:`{"ContentType": 0/1/2}`
+   - 匹配失败:`{}`

 ./no_think