Просмотр исходного кода

docs(M2): 知识库结构设计 - 7大分类、分段策略、元数据标注、维护规范

xieke 1 неделю назад
Родитель
Сommit
79178eaba2
2 измененных файлов: 213 добавлений и 3 удалений
  1. 210
    0
      docs/knowledge-base-structure.md
  2. 3
    3
      tasks.md

+ 210
- 0
docs/knowledge-base-structure.md Просмотреть файл

@@ -0,0 +1,210 @@
1
+# 企业知识库结构设计
2
+
3
+> 西安云美电子科技有限公司 - 企业知识库
4
+> 文档版本:v1.0
5
+> 创建时间:2026-06-06
6
+
7
+---
8
+
9
+## 1. 知识库总体架构
10
+
11
+云美电子科技企业知识库采用 **分层分类** 结构,覆盖公司运营全链路:
12
+
13
+```
14
+企业知识库
15
+├── 📁 公司概况
16
+│   ├── 公司简介
17
+│   ├── 组织架构
18
+│   ├── 发展历程
19
+│   └── 联系方式
20
+│
21
+├── 📁 产品技术
22
+│   ├── 产品手册(按产品线分类)
23
+│   ├── 技术规范
24
+│   ├── 技术方案
25
+│   ├── 研发文档
26
+│   └── 常见技术问题 FAQ
27
+│
28
+├── 📁 质量管理
29
+│   ├── 质量管理体系(QMS)
30
+│   ├── 检测标准
31
+│   ├── 计量规程
32
+│   ├── 不合格品处理流程
33
+│   └── 质量案例库
34
+│
35
+├── 📁 制度流程
36
+│   ├── 行政管理制度
37
+│   ├── 财务管理制度
38
+│   ├── 人力资源制度
39
+│   ├── 采购管理制度
40
+│   └── 项目管理流程
41
+│
42
+├── 📁 培训学习
43
+│   ├── 新员工入职培训
44
+│   ├── 岗位技能培训
45
+│   ├── 安全培训
46
+│   └── 外部培训资料
47
+│
48
+├── 📁 项目档案
49
+│   ├── 项目立项文档
50
+│   ├── 项目验收报告
51
+│   ├── 客户资料
52
+│   └── 合同模板
53
+│
54
+└── 📁 常见问题 FAQ
55
+    ├── 通用 FAQ
56
+    ├── IT 支持 FAQ
57
+    ├── 行政 FAQ
58
+    └── 产品售后 FAQ
59
+```
60
+
61
+## 2. 分类详细说明
62
+
63
+### 2.1 公司概况
64
+
65
+| 子分类 | 内容说明 | 更新频率 |
66
+|--------|---------|---------|
67
+| 公司简介 | 公司介绍、业务范围、核心优势 | 半年 |
68
+| 组织架构 | 部门设置、岗位职责、汇报关系 | 季度 |
69
+| 发展历程 | 大事记、里程碑事件 | 年度 |
70
+| 联系方式 | 内外联系方式、通讯录 | 按需 |
71
+
72
+### 2.2 产品技术
73
+
74
+| 子分类 | 内容说明 | 更新频率 |
75
+|--------|---------|---------|
76
+| 产品手册 | 各产品线的产品说明书、操作指南 | 随产品更新 |
77
+| 技术规范 | 行业标准、企业标准、检测依据 | 按需 |
78
+| 技术方案 | 项目技术方案、可行性分析 | 按需 |
79
+| 研发文档 | 研发过程中的技术记录、设计文档 | 持续 |
80
+| 技术 FAQ | 产品使用中的技术问题及解答 | 持续 |
81
+
82
+### 2.3 质量管理
83
+
84
+| 子分类 | 内容说明 | 更新频率 |
85
+|--------|---------|---------|
86
+| 质量管理体系 | ISO 体系文件、质量手册、程序文件 | 年度审核 |
87
+| 检测标准 | 各类检测方法标准、判定依据 | 按标准更新 |
88
+| 计量规程 | 设备计量校准规程、管理要求 | 年度 |
89
+| 不合格品处理 | 不合格品处理流程、评审记录模板 | 按需 |
90
+| 质量案例库 | 典型质量问题案例、改进措施 | 持续 |
91
+
92
+### 2.4 制度流程
93
+
94
+| 子分类 | 内容说明 | 更新频率 |
95
+|--------|---------|---------|
96
+| 行政管理 | 考勤、出差、办公用品、车辆管理 | 年度 |
97
+| 财务管理 | 报销流程、费用标准、审批权限 | 年度 |
98
+| 人力资源 | 招聘、绩效考核、薪酬福利 | 年度 |
99
+| 采购管理 | 采购流程、供应商管理、审批流程 | 年度 |
100
+| 项目管理 | 项目立项、执行、验收、归档流程 | 年度 |
101
+
102
+### 2.5 培训学习
103
+
104
+| 子分类 | 内容说明 | 更新频率 |
105
+|--------|---------|---------|
106
+| 新员工培训 | 入职培训材料、公司文化介绍 | 年度 |
107
+| 岗位技能 | 各岗位专业技能培训材料 | 按需 |
108
+| 安全培训 | 安全生产、消防安全培训 | 年度 |
109
+| 外部培训 | 外部培训资料、行业学习资源 | 按需 |
110
+
111
+### 2.6 项目档案
112
+
113
+| 子分类 | 内容说明 | 更新频率 |
114
+|--------|---------|---------|
115
+| 立项文档 | 项目立项申请、可行性分析 | 按项目 |
116
+| 验收报告 | 项目验收报告、交付文档 | 按项目 |
117
+| 客户资料 | 客户信息、需求文档、沟通记录 | 按需 |
118
+| 合同模板 | 各类合同标准模板 | 年度 |
119
+
120
+### 2.7 FAQ
121
+
122
+| 子分类 | 内容说明 | 更新频率 |
123
+|--------|---------|---------|
124
+| 通用 FAQ | 公司常见问题(工作地点、福利等) | 持续 |
125
+| IT 支持 | 系统使用、软件安装、网络问题 | 持续 |
126
+| 行政 FAQ | 报销、请假、出差等流程问题 | 持续 |
127
+| 产品售后 | 产品使用、售后问题 | 持续 |
128
+
129
+## 3. 文档分段策略
130
+
131
+### 3.1 分段参数配置
132
+
133
+| 参数 | 推荐值 | 说明 |
134
+|------|--------|------|
135
+| 分段长度 | 500 tokens | 约 300-400 个中文字符 |
136
+| 重叠长度 | 50 tokens | 上下文重叠,保持语义连贯 |
137
+| 最大分段数/文件 | 20 | 单文件最大分段数 |
138
+| 分隔符 | `\n`、`\n\n`、`。`、`!`、`?`、`;` | 中文优先分隔符 |
139
+
140
+### 3.2 分段优先级规则
141
+
142
+1. **按标题分层**:一级标题 → 二级标题 → 三级标题
143
+2. **按段落分割**:在自然段落边界处分割
144
+3. **按句号分割**:超出长度限制时在句号处分割
145
+4. **硬截断兜底**:超出最大长度时强制截断
146
+
147
+### 3.3 不同文档类型的分段建议
148
+
149
+| 文档类型 | 建议分段长度 | 特殊处理 |
150
+|----------|-------------|---------|
151
+| 产品手册 | 300-500 tokens | 保留产品型号、参数表格 |
152
+| 技术规范 | 500-800 tokens | 保留规范编号、章节号 |
153
+| 管理制度 | 400-600 tokens | 保留条款编号 |
154
+| FAQ | 按问答对分段 | 每对为一个分段 |
155
+| 培训材料 | 500-700 tokens | 保留课程结构 |
156
+| 合同模板 | 按条款分段 | 保留条款编号和标题 |
157
+
158
+### 3.4 元数据标签建议
159
+
160
+每个知识库文档建议添加以下元数据标签,便于精准检索:
161
+
162
+```
163
+- department: 所属部门(产品部/质量部/行政部...)
164
+- doc_type: 文档类型(手册/规范/制度/FAQ...)
165
+- product: 关联产品(如适用)
166
+- version: 文档版本号
167
+- status: 状态(有效/废止/草稿)
168
+- last_updated: 最后更新时间
169
+```
170
+
171
+## 4. 知识库导入流程
172
+
173
+### 4.1 批量导入步骤
174
+
175
+1. **文件整理**:按上述分类结构整理文件目录
176
+2. **格式检查**:确保文件为支持的格式(PDF、Word、Markdown、TXT、Excel)
177
+3. **元数据标注**:为每个文件添加元数据标签
178
+4. **创建知识库**:在 Dify 中按分类创建独立知识库
179
+5. **上传文档**:按分类批量上传,应用对应分段策略
180
+6. **索引验证**:检查分段结果,确认无明显截断错误
181
+7. **测试检索**:使用典型问题测试检索效果
182
+
183
+### 4.2 知识库命名规范
184
+
185
+```
186
+KB-{分类英文缩写}-{名称}
187
+
188
+示例:
189
+KB-COMP-公司概况
190
+KB-PROD-产品技术
191
+KB-QUAL-质量管理
192
+KB-RULE-制度流程
193
+KB-TRAIN-培训学习
194
+KB-PROJ-项目档案
195
+KB-FAQ-常见问题
196
+```
197
+
198
+## 5. 维护策略
199
+
200
+| 维护类型 | 频率 | 负责人 | 说明 |
201
+|----------|------|--------|------|
202
+| 内容更新 | 按需 | 各部门 | 文档有更新时同步上传 |
203
+| 索引重建 | 月度 | IT 部 | 检查分段质量,优化检索 |
204
+| 过期清理 | 季度 | 管理部 | 标记/移除过期文档 |
205
+| 效果评估 | 月度 | IT 部 | 检索准确率、用户满意度 |
206
+| 备份 | 每日 | IT 部 | 数据库、向量库自动备份 |
207
+
208
+---
209
+
210
+_最后更新: 2026-06-06_

+ 3
- 3
tasks.md Просмотреть файл

@@ -19,9 +19,9 @@
19 19
 
20 20
 ## M2: 知识库结构设计与文档编写
21 21
 
22
-- [ ] M2.1.1 调研云美电子科技典型知识库分类(产品手册、技术规范、管理制度、培训资料等)
23
-- [ ] M2.1.2 编写 `docs/knowledge-base-structure.md`(知识库分类结构设计)
24
-- [ ] M2.1.3 设计知识库分段策略(文档分块大小、重叠策略)
22
+- [x] M2.1.1 调研云美电子科技典型知识库分类(产品手册、技术规范、管理制度、培训资料等)
23
+- [x] M2.1.2 编写 `docs/knowledge-base-structure.md`(知识库分类结构设计)
24
+- [x] M2.1.3 设计知识库分段策略(文档分块大小、重叠策略)
25 25
 
26 26
 ---
27 27