Files
bigwo/models.py

36 lines
947 B
Python
Raw Normal View History

"""核心数据结构定义"""
from dataclasses import dataclass
from datetime import datetime
from typing import List, Optional
@dataclass
class Chunk:
"""语义分块单元"""
title: str # AI 生成的摘要标题
content: str # 分块的文本内容
tag: str = "" # 业务分类标签(如:产品说明、问答、培训、招商等)
@dataclass
class ProcessResult:
"""处理结果"""
source_file: str # 源文件路径
output_file: str # 输出文件路径
chunks: List[Chunk] # 分块列表
process_time: datetime # 处理时间
total_chunks: int # 总分块数
@dataclass
class CLIArgs:
"""命令行参数"""
input_file: str # 输入文件路径(必需)
api_key: str # DeepSeek API Key必需
output_file: Optional[str] = None # 输出文件路径(可选,默认同名 .md
delimiter: str = "---" # 分块分隔符(可选,默认 ---