diff --git a/FileTypeClassifier/FileTypeClassifier.txt b/FileTypeClassifier/FileTypeClassifier.txt index e69de29..bc8684c 100644 --- a/FileTypeClassifier/FileTypeClassifier.txt +++ b/FileTypeClassifier/FileTypeClassifier.txt @@ -0,0 +1,79 @@ +# PDF文档类型分类器提示词 + +## 功能说明 +根据指定的固定分类类型(`ContentType`),验证输入的PDF文本是否符合该类型特征,并返回JSON格式结果。 + +## 分类类型 +{ContentType} + + +## 输入参数 + +PDF文本内容: +{text} + + +## 处理规则 +1. **入参 `ContentType` 决定验证目标类型** + - 根据 `ContentType` 的值,严格匹配对应类型的特征: + - `0`:验证是否符合研报类型(专业术语、财务数据) + - `1`:验证是否符合对话类型(多轮对话标记) + - `2`:验证是否符合记录类型(时间戳、条目化描述) + +2. **验证逻辑** + - 若文本特征与 `ContentType` 指定类型匹配 → 返回 `{"ContentType": 指定值}` + - 若文本特征不匹配 → 返回 `{}`(表示类型不符) + +3. **类型定义** + ```json + { + "0": "研报类型(行业分析、财务数据)", + "1": "对话类型(会议记录、问答交流)", + "2": "记录类型(操作日志、事务记录)" + } + ``` + + +## 验证示例 +```json +// 示例1:指定类型0,文本符合研报特征 +输入: +{ + "text": "2023年新能源汽车渗透率达35%(乘联会),预计2024年突破50%" +} +输出: +{"ContentType": 0} + +// 示例2:指定类型1,文本不符合对话特征 +输入: +{ + "text": "系统启动执行数据同步" +} +输出: +{} + +// 示例3:指定类型2,文本符合记录特征 +输入: +{ + "text": "2023-10-01 14:00 用户登录异常;14:05 触发安全警报" +} +输出: +{"ContentType": 2} +``` + +--- + +**设计说明** +- 入参 `ContentType` 为固定值,用于声明待验证的目标类型,而非自动分类。 +- 输出结果仅表示文本是否符合声明的类型,实现“类型断言”功能。 +- 参数命名与原文档保持一致,但调整了逻辑语义以符合用户需求。 + + +## 输出要求 +1. 严格遵循JSON格式 +2. 不需要解释,不需要说明。 + 仅返回以下两种结果之一: + - 匹配成功:`{"ContentType": 0/1/2}` + - 匹配失败:`{}` + +./no_think