From 2d9e59cfee5e7ca2f1f91e33ef086a8bed7f43c4 Mon Sep 17 00:00:00 2001 From: fanpt <320622572@qq.com> Date: Wed, 4 Jun 2025 15:27:07 +0800 Subject: [PATCH] =?UTF-8?q?=E6=B7=BB=E5=8A=A0=E8=AF=B4=E6=98=8E=E6=96=87?= =?UTF-8?q?=E6=A1=A3?= MIME-Version: 1.0 Content-Type: text/plain; charset=UTF-8 Content-Transfer-Encoding: 8bit --- ProcessFlow.md | 13 ------------- README.md | 24 ++++++++++++++++++++++++ 2 files changed, 24 insertions(+), 13 deletions(-) delete mode 100644 ProcessFlow.md create mode 100644 README.md diff --git a/ProcessFlow.md b/ProcessFlow.md deleted file mode 100644 index 4023c91..0000000 --- a/ProcessFlow.md +++ /dev/null @@ -1,13 +0,0 @@ -以下是基于提示词模块的文本处理流程图: - -```mermaid -graph LR - A[FileTypeClassifier
识别文档类型] - A--> B[FileIndustryClassifier
识别文档所属行业] - B --> C[TextIntentExtractor
从训练数据中找出意图列表] - C --> D[TextIntentDetector
判断文本是否在预定义意图列表中] - D --> E[IntentMetadataExtractor
根据意图提取领域元数据和属性名] - E --> F[AttributeTripleExtractor
提取与领域元数据对应的属性信息] - F --> G[QAIntentDetection
提取用户问题对应的意图列表] - G --> H[Text2Cypher
将意图转换为Cypher查询] - H --> I[QAAssistant
使用查询出的数据回答用户问题] \ No newline at end of file diff --git a/README.md b/README.md new file mode 100644 index 0000000..b6c37e2 --- /dev/null +++ b/README.md @@ -0,0 +1,24 @@ +# PDF-QA提示词处理流程说明 + +以下是基于提示词模块的文本处理流程图: + +```mermaid +graph LR +A[FileTypeClassifier
识别文档类型] --> B[FileIndustryClassifier
识别文档所属行业] +B --> C[TextIntentExtractor
从训练数据中找出意图列表] +C --> D[TextIntentDetector
判断文本是否在预定义意图列表中] +D --> E[IntentMetadataExtractor
根据意图提取领域元数据和属性名] +E --> F[AttributeTripleExtractor
提取与领域元数据对应的属性信息] +F --> G[QAIntentDetection
提取用户问题对应的意图列表] +G --> H[Text2Cypher
将意图转换为Cypher查询] +H --> I[QAAssistant
使用查询出的数据回答用户问题] +``` + +## 注意事项 + +1. **模型版本更新说明**:当前使用模型已由原先的 `qwen3:30b-a3b` 替换为 **`qwen3:32b`**,请同步更新模型相关配置。 +2. **思考模式使用情况**: + - 仅 **`TextIntentExtractor`(从训练数据中找出意图列表)** 使用了“思考模式”。 + - 其他模块均使用“非思考模式”进行处理。 +3. **模块衔接要求**:各模块依赖上游输出,请确保数据格式一致性与有效性。 +4. **Cypher转换模块说明**:`Text2Cypher` 模块需依赖图谱结构定义,请在运行前加载好相关 schema。