Files
bigwo/PROJECT_STRUCTURE.md
2026-03-12 12:47:56 +08:00

9.8 KiB
Raw Blame History

大沃项目 — 目录结构

项目包含 4 个独立模块 + 若干根目录资源文件

bigwo/
│
├── 📄 根目录资源文件
│   ├── agents_prompts.txt          # Agent 提示词汇总15 个角色)
│   ├── 大沃.doc                     # 原始 Word 文档
│   ├── 大沃_clean.txt               # 清洗后的纯文本
│   └── 大沃_content.txt             # 提取的完整内容
│
│
├── 📦 ai-knowledge-splitter/        # 模块一AI 知识库文档智能分块工具
│   │                                 # Python CLIDeepSeek API 语义分块
│   │
│   ├── main.py                      # CLI 入口(单文件/批量模式)
│   ├── splitter.py                  # 主协调器(解析→分块→输出流程)
│   ├── chunker.py                   # AI 分块器(预切分 + API 语义分块)
│   ├── api_client.py                # DeepSeek API 客户端(含重试)
│   ├── prompts.py                   # 分块提示词(文档/表格/问答/图片 4 种策略)
│   ├── writer.py                    # 输出写入器Markdown / JSON
│   ├── models.py                    # 数据结构Chunk / ProcessResult
│   ├── exceptions.py                # 自定义异常
│   ├── batch.py                     # 批量处理(递归扫描 + 容错 + 汇总)
│   ├── categorizer.py               # 分类合并器(按业务标签归类)
│   ├── batch_convert.py             # 批量 doc/docx → Markdown 转换脚本
│   ├── ai_restructure.py            # AI 整理已有 MD 文件(格式优化)
│   ├── doc_extractor.py             # .doc 二进制格式文本提取器olefile
│   ├── requirements.txt             # Python 依赖
│   ├── .env                         # 环境变量DEEPSEEK_API_KEY
│   │
│   ├── parsers/                     # 文件解析器(策略模式)
│   │   ├── base.py                  #   BaseParser 抽象基类 + ParserRegistry
│   │   ├── pdf_parser.py            #   PDFPyMuPDF
│   │   ├── doc_parser.py            #   Word .docxpython-docx
│   │   ├── legacy_doc_parser.py     #   Word .docWord 97-2003
│   │   ├── xlsx_parser.py           #   Excel .xlsxopenpyxl
│   │   ├── xls_parser.py            #   Excel .xlsxlrd
│   │   ├── csv_parser.py            #   CSV
│   │   ├── html_parser.py           #   HTMLBeautifulSoup
│   │   ├── text_parser.py           #   TXT / Markdown
│   │   └── image_parser.py          #   图片base64 → Vision API
│   │
│   ├── tests/                       # 单元测试pytest
│   │   ├── test_main.py
│   │   ├── test_splitter.py
│   │   ├── test_chunker.py
│   │   ├── test_api_client.py
│   │   ├── test_prompts.py
│   │   ├── test_writer.py
│   │   ├── test_models.py
│   │   ├── test_exceptions.py
│   │   ├── test_parsers_base.py
│   │   ├── test_pdf_parser.py
│   │   ├── test_doc_parser.py
│   │   ├── test_xlsx_parser.py
│   │   ├── test_xls_parser.py
│   │   ├── test_csv_parser.py
│   │   ├── test_html_parser.py
│   │   ├── test_text_parser.py
│   │   └── test_image_parser.py
│   │
│   ├── test_results/                # 测试输出样本
│   │
│   └── 2026火山知识库用/             # 知识库源文档(待处理)
│       └── 2026火山知识库用/
│           ├── *.doc / *.docx / *.md   # 各类源文档
│           ├── 整理后/                  # AI 整理后的 MD 文件
│           └── 标注的图片知识库/         # 产品图片
│
│
├── 📦 coze_config/                  # 模块二Coze Bot 配置与 Agent 提示词
│   │                                 # 15 个专业角色 Agent 的提示词定义
│   │
│   ├── README.md                    # 模块说明
│   ├── Coze平台操作指南.md           # Coze 平台操作指南
│   ├── coze_bot_config.json         # Bot 完整配置JSON
│   ├── orchestrator_prompt.md       # 编排器(主控 Agent提示词
│   │
│   └── agents/                      # 15 个子 Agent 提示词
│       ├── 01_事业招商_zhaoshang.md
│       ├── 02_产品宣传_xuanchuan.md
│       ├── 03_趋势前瞻_qianzhan.md
│       ├── 04_产品互动_hudong.md
│       ├── 05_自我介绍_ziwojieshao.md
│       ├── 06_活动促销_cuxiao.md
│       ├── 07_产品文化_wenhua.md
│       ├── 08_生活感悟_ganwu.md
│       ├── 09_公司介绍_gongsijieshao.md
│       ├── 10_营养科普_kepu.md
│       ├── 11_问候_wenhou.md
│       ├── 12_误区厘清_wuquliqing.md
│       ├── 13_工作复盘_fupan.md
│       ├── 14_事业顾问_guwen.md
│       └── 15_客户成交_chengjiao.md
│
│
├── 📦 coze_api/                     # 模块三Coze API 客户端
│   │                                 # PythonCoze v3 Chat API 调用封装
│   │
│   ├── README.md
│   ├── coze_client.py               # Coze API 客户端(创建对话/轮询/获取回复)
│   ├── test_coze_api.py             # 测试脚本
│   ├── requirements.txt             # Python 依赖
│   ├── .env                         # 环境变量COZE_API_TOKEN / BOT_ID
│   └── .env.example                 # 环境变量模板
│
│
└── 📦 test2/                        # 模块四:混合编排语音通话 + 文字对话系统
    │                                 # 全栈 Web App火山 S2S + Coze Bot
    │
    ├── E2E_HYBRID_MODE_PLAN.md      # 混合编排方案详细设计文档
    ├── E2E_VOICE_MODULE.md          # 端到端语音模块技术方案
    ├── KNOWLEDGE_BASE_GUIDE.md      # 知识库配置与使用指南
    │
    ├── client/                      # 前端React + Vite + TailwindCSS
    │   ├── package.json
    │   ├── vite.config.js           #   Vite 配置(含 /api 代理到 :3001
    │   ├── index.html
    │   └── src/
    │       ├── main.jsx             #   入口
    │       ├── index.css            #   全局样式
    │       ├── App.jsx              #   主组件(语音/文字模式切换)
    │       ├── components/
    │       │   ├── VoicePanel.jsx   #     语音通话面板
    │       │   ├── ChatPanel.jsx    #     文字对话面板
    │       │   ├── SubtitleDisplay.jsx  # 字幕展示
    │       │   └── SettingsPanel.jsx    # 设置面板
    │       ├── hooks/
    │       │   └── useVoiceChat.js  #     语音通话 Hook
    │       └── services/
    │           ├── rtcService.js    #     WebRTC 连接管理
    │           ├── voiceApi.js      #     语音 API 调用
    │           └── chatApi.js       #     文字对话 API 调用
    │
    └── server/                      # 后端Express.js
        ├── package.json
        ├── app.js                   #   Express 入口(端口 3001
        ├── .env                     #   环境变量(火山/Coze 凭证)
        ├── .env.example             #   环境变量模板
        ├── config/
        │   ├── voiceChatConfig.js   #     StartVoiceChat 配置构建器
        │   └── tools.js             #     5 个工具定义(天气/订单/知识库/时间/计算)
        ├── routes/
        │   ├── voice.js             #     语音通话路由start/stop/subtitle/tool-callback
        │   └── chat.js              #     文字对话路由start/send/send-stream
        └── services/
            ├── volcengine.js        #     火山引擎 OpenAPIV4 签名 + RTC Token
            ├── arkChatService.js    #     方舟 LLM 服务(流式/工具调用循环)
            ├── cozeChatService.js   #     Coze Bot 对话服务(流式/非流式)
            └── toolExecutor.js      #     工具执行器(知识库三级 fallback

模块关系

┌─────────────────────────┐
│  ai-knowledge-splitter  │  文档 → 分块 → 上传知识库
└───────────┬─────────────┘
            │ 产出知识库数据
            ▼
┌─────────────────────────┐     ┌──────────────┐
│       coze_config        │────►│   coze_api    │
│  Bot 配置 / Agent 提示词  │     │  API 客户端   │
└───────────┬─────────────┘     └──────┬───────┘
            │ 配置 Coze Bot              │ 调用 Coze API
            ▼                           ▼
┌─────────────────────────────────────────────────┐
│                    test2                          │
│  语音通话(火山 S2S+ 文字对话Coze Bot          │
│  最终用户交互入口                                   │
└─────────────────────────────────────────────────┘