fix: 品牌保护+知识库全量覆盖 - 6层防御解决传销问题 + 30+产品关键词补全
This commit is contained in:
@@ -6,6 +6,181 @@ class ToolExecutor {
|
||||
return /(一成系统|PM-FitLine|PM细胞营养素|NTC营养保送系统|Activize Oxyplus|小红产品|Basics|大白产品|Restorate|小白产品|儿童倍适|火炉原理|阿育吠陀)/i.test(String(query || ''));
|
||||
}
|
||||
|
||||
static getKnowledgeBaseRoutingRules() {
|
||||
const raw = process.env.VOLC_ARK_KNOWLEDGE_BASE_ROUTING || process.env.VOLC_ARK_KNOWLEDGE_BASE_MAP;
|
||||
if (!raw) {
|
||||
return [];
|
||||
}
|
||||
try {
|
||||
const parsed = JSON.parse(raw);
|
||||
const entries = Array.isArray(parsed)
|
||||
? parsed
|
||||
: Object.entries(parsed).map(([name, config]) => ({ name, ...(config || {}) }));
|
||||
return entries
|
||||
.map((item) => ({
|
||||
name: String(item.name || '').trim(),
|
||||
dataset_ids: Array.isArray(item.dataset_ids)
|
||||
? item.dataset_ids.map((id) => String(id || '').trim()).filter(Boolean)
|
||||
: String(item.dataset_ids || item.datasetIds || '')
|
||||
.split(',')
|
||||
.map((id) => id.trim())
|
||||
.filter(Boolean),
|
||||
keywords: Array.isArray(item.keywords)
|
||||
? item.keywords.map((keyword) => String(keyword || '').trim()).filter(Boolean)
|
||||
: String(item.keywords || '')
|
||||
.split(',')
|
||||
.map((keyword) => keyword.trim())
|
||||
.filter(Boolean),
|
||||
}))
|
||||
.filter((item) => item.name && item.dataset_ids.length > 0 && item.keywords.length > 0);
|
||||
} catch (error) {
|
||||
console.warn('[ToolExecutor] parse knowledge base routing failed:', error.message);
|
||||
return [];
|
||||
}
|
||||
}
|
||||
|
||||
static selectKnowledgeBaseTargets(query, context = []) {
|
||||
const defaultDatasetIds = String(process.env.VOLC_ARK_KNOWLEDGE_BASE_IDS || '')
|
||||
.split(',')
|
||||
.map((id) => id.trim())
|
||||
.filter(Boolean);
|
||||
const rules = this.getKnowledgeBaseRoutingRules();
|
||||
if (!rules.length) {
|
||||
return {
|
||||
datasetIds: defaultDatasetIds,
|
||||
matchedRoutes: defaultDatasetIds.length ? ['default'] : [],
|
||||
};
|
||||
}
|
||||
|
||||
const recentContextText = (Array.isArray(context) ? context : [])
|
||||
.slice(-6)
|
||||
.map((item) => String(item?.content || '').trim())
|
||||
.filter(Boolean)
|
||||
.join('\n');
|
||||
const haystack = `${String(query || '').trim()}\n${recentContextText}`.toLowerCase();
|
||||
|
||||
const priorityRouteNames = [];
|
||||
const hasSystemIntent = /(一成系统|ai众享|数字化工作室|盛咖学愿|赋能工具|四大ai生态|三大平台)/i.test(haystack);
|
||||
const hasCompanyIntent = /(pm公司|德国pm(?!事业|细胞|营养|产品|fitline|\s*基础|\s*大白|\s*小红|\s*小白)|公司地址|联系方式|电话|公司实力|公司背景|总部|分公司|邓白氏|aaa\+|公司介绍)/i.test(haystack);
|
||||
const hasProductIntent = /(细胞营养素|基础套装|基础三合一|三合一|大白产品|小红产品|小白产品|activize|basics|restorate|fitline|儿童倍适|ntc营养保送|火炉原理|阿育吠陀|产品.*介绍|介绍.*产品|产品有哪些|产品列表)/i.test(haystack);
|
||||
if (hasSystemIntent) {
|
||||
priorityRouteNames.push('system');
|
||||
}
|
||||
if (hasCompanyIntent && !hasSystemIntent && !hasProductIntent) {
|
||||
priorityRouteNames.push('company');
|
||||
}
|
||||
if (priorityRouteNames.length > 0) {
|
||||
const priorityRules = rules.filter((rule) => priorityRouteNames.includes(rule.name));
|
||||
const priorityDatasetIds = [...new Set(priorityRules.flatMap((rule) => rule.dataset_ids).filter(Boolean))];
|
||||
if (priorityDatasetIds.length > 0) {
|
||||
return {
|
||||
datasetIds: priorityDatasetIds,
|
||||
matchedRoutes: [...new Set(priorityRules.map((rule) => rule.name))],
|
||||
};
|
||||
}
|
||||
}
|
||||
|
||||
const matchedDatasetIds = [];
|
||||
const matchedRoutes = [];
|
||||
|
||||
for (const rule of rules) {
|
||||
if (rule.keywords.some((keyword) => haystack.includes(keyword.toLowerCase()))) {
|
||||
matchedRoutes.push(rule.name);
|
||||
matchedDatasetIds.push(...rule.dataset_ids);
|
||||
}
|
||||
}
|
||||
|
||||
const datasetIds = [...new Set((matchedDatasetIds.length ? matchedDatasetIds : defaultDatasetIds).filter(Boolean))];
|
||||
return {
|
||||
datasetIds,
|
||||
matchedRoutes: matchedRoutes.length ? [...new Set(matchedRoutes)] : (datasetIds.length ? ['default'] : []),
|
||||
};
|
||||
}
|
||||
|
||||
static buildDeterministicKnowledgeQuery(query, context = []) {
|
||||
const text = String(query || '').trim();
|
||||
const recentContextText = (Array.isArray(context) ? context : [])
|
||||
.slice(-6)
|
||||
.map((item) => String(item?.content || '').trim())
|
||||
.filter(Boolean)
|
||||
.join('\n');
|
||||
const haystack = `${text}\n${recentContextText}`;
|
||||
|
||||
// 第一层:当前查询文本中有明确产品/系统/主题关键词 → 直接改写(不依赖上下文)
|
||||
if (/(基础三合一|三合一基础套|基础套装|大白小红小白)/i.test(text)) return '德国PM细胞营养素 基础套装 大白 小红 小白';
|
||||
if (/(一成系统|Ai众享|数字化工作室|盛咖学愿)/i.test(text)) {
|
||||
if (/(邀约|话术)/i.test(haystack)) return '一成系统 邀约话术';
|
||||
if (/文化/i.test(haystack)) return '一成系统 文化解析';
|
||||
if (/(赋能团队|团队发展|AI赋能|ai赋能)/i.test(haystack)) return '一成系统用AI赋能团队发展';
|
||||
return '一成系统 德国PM事业发展的强大赋能工具 三大平台 四大Ai生态';
|
||||
}
|
||||
if (/(PM公司|德国PM|公司地址|联系方式|电话|公司实力|公司背景|总部|分公司)/i.test(text)) {
|
||||
if (/(产品|细胞营养素|基础套装|基础三合一|小红|大白|小白|activize|basics|restorate|fitline|儿童倍适)/i.test(text)) {
|
||||
return '德国PM FitLine 细胞营养素产品 大白Basics 小红Activize 小白Restorate 儿童倍适';
|
||||
}
|
||||
if (/(地址|电话|联系方式)/i.test(text)) return '德国PM 日本 美国 加拿大 香港 地址 电话';
|
||||
if (/(实力|背景)/i.test(text)) return '德国PM 公司实力介绍 邓白氏 99分 AAA+';
|
||||
return '德国PM 1993年 创立 100多个国家 FitLine 公司介绍';
|
||||
}
|
||||
if (/儿童倍适/i.test(text)) return '儿童倍适';
|
||||
if (/(小红产品|小红|Activize Oxyplus|Activize)/i.test(text)) return 'Fitline小红产品提升能量原理';
|
||||
if (/(大白产品|大白|倍适|Basics)/i.test(text)) return '德国PM细胞营养素 大白 Basics';
|
||||
if (/(小白产品|小白|维适多|Restorate)/i.test(text)) return '德国PM细胞营养素 小白';
|
||||
if (/(NTC营养保送系统|Nutrient Transport Concept)/i.test(text)) return 'NTC营养保送系统';
|
||||
if (/火炉原理/i.test(text)) return '火炉原理';
|
||||
if (/(阿育吠陀|Ayurveda)/i.test(text)) return '阿育吠陀医学原理';
|
||||
if (/(PM-FitLine|PM细胞营养素)/i.test(text)) return '德国PM细胞营养素 基础套装 大白 小红 小白';
|
||||
if (/(我们公司.*产品|公司.*产品|产品.*推荐|推荐.*产品|产品有哪些|产品介绍|产品列表)/i.test(text)) return '德国PM FitLine 细胞营养素产品 大白Basics 小红Activize 小白Restorate 儿童倍适';
|
||||
if (/(新人起步三关|起步三关)/i.test(text)) return '培训新人起步三关';
|
||||
if (/(精品会议|会议组织)/i.test(text)) return '培训打造精品会议具体如下';
|
||||
if (/成长上总裁/i.test(text)) return '培训成长上总裁';
|
||||
if (/(招商|代理|加盟|合作|事业机会|招商稿|代理政策)/i.test(text)) return '招商与代理';
|
||||
if (/(一成AI|AI落地|ai落地|转观念|落地对比)/i.test(text)) return '2026一成Ai落地对比与转观念';
|
||||
if (/(传销|骗局|骗子|正规吗|合法吗|正不正规|合不合法|是不是传销|直销还是传销|层级分销|非法集资|拉人头|下线|发展下线|报单|人头费)/i.test(text)) return '德国PM 1993年 创立 100多个国家 FitLine 公司介绍 邓白氏 99分 AAA+ 合法直销';
|
||||
if (/(好转反应|整应反应|排毒反应|副作用|不良反应|皮肤发痒)/i.test(text)) return 'PM产品整应反应好转反应解析';
|
||||
if (/(促销活动|促销|优惠|打折|活动分数|5\+1)/i.test(text)) return '促销活动 5+1活动分数';
|
||||
if (/暖炉原理/i.test(text)) return '火炉原理';
|
||||
if (/(CC套装|CC胶囊)/i.test(text)) return 'CC套装 CC胶囊';
|
||||
if (/(IB5|口腔免疫喷雾)/i.test(text)) return 'IB5口腔免疫喷雾';
|
||||
if (/(Q10|辅酵素|氧修护)/i.test(text)) return 'Q10辅酵素氧修护';
|
||||
if (/Women\+/i.test(text)) return 'Women+';
|
||||
if (/乐活/i.test(text)) return '乐活';
|
||||
if (/(乳清蛋白|蛋白粉)/i.test(text)) return '乳清蛋白粉';
|
||||
if (/(乳酪煲|乳酪饮品|乳酪)/i.test(text)) return '乳酪煲 乳酪饮品';
|
||||
if (/(基础二合一|二合一)/i.test(text)) return '基础二合一';
|
||||
if (/倍力健/i.test(text)) return '倍力健';
|
||||
if (/(关节套装|关节舒缓)/i.test(text)) return '关节套装 关节舒缓膏';
|
||||
if (/(男士乳霜|男士护肤)/i.test(text)) return '全效男士乳霜';
|
||||
if (/(去角质|面膜)/i.test(text)) return '去角质面膜';
|
||||
if (/发宝/i.test(text)) return '发宝';
|
||||
if (/叶黄素/i.test(text)) return '叶黄素';
|
||||
if (/(奶昔)/i.test(text)) return '奶昔';
|
||||
if (/(健康饮品)/i.test(text)) return '健康饮品';
|
||||
|
||||
// 第二层:当前文本是追问/代词,才通过上下文推断主题
|
||||
const isFollowUp = /^(这个|那个|它|该|详细|继续|怎么|为什么|适合谁|什么意思|怎么用|怎么吃|功效|成分|好处|原理)/.test(text);
|
||||
if (isFollowUp) {
|
||||
if (/(基础三合一|三合一基础套|基础套装|大白小红小白)/i.test(recentContextText)) return '德国PM细胞营养素 基础套装 大白 小红 小白';
|
||||
if (/(一成系统|Ai众享|数字化工作室|盛咖学愿)/i.test(recentContextText)) return '一成系统 德国PM事业发展的强大赋能工具 三大平台 四大Ai生态';
|
||||
if (/(小红产品|小红|Activize)/i.test(recentContextText)) return 'Fitline小红产品提升能量原理';
|
||||
if (/(大白产品|大白|Basics)/i.test(recentContextText)) return '德国PM细胞营养素 大白 Basics';
|
||||
if (/(小白产品|小白|Restorate)/i.test(recentContextText)) return '德国PM细胞营养素 小白';
|
||||
if (/儿童倍适/i.test(recentContextText)) return '儿童倍适';
|
||||
if (/火炉原理/i.test(recentContextText)) return '火炉原理';
|
||||
if (/(阿育吠陀|Ayurveda)/i.test(recentContextText)) return '阿育吠陀医学原理';
|
||||
if (/(NTC营养保送系统)/i.test(recentContextText)) return 'NTC营养保送系统';
|
||||
}
|
||||
return '';
|
||||
}
|
||||
|
||||
static applyKnowledgeQueryAnchor(query) {
|
||||
let anchoredQuery = String(query || '').trim();
|
||||
if (/一成系统/.test(anchoredQuery) && !/(德国PM|PM事业|赋能工具|Ai众享|数字化工作室|盛咖学愿)/i.test(anchoredQuery)) {
|
||||
anchoredQuery = anchoredQuery.replace(/一成系统/g, '一成系统 德国PM事业赋能工具');
|
||||
}
|
||||
return anchoredQuery.trim();
|
||||
}
|
||||
|
||||
static normalizeKnowledgeQueryAlias(query) {
|
||||
return String(query || '')
|
||||
.replace(/^[啊哦嗯呢呀哎诶额,。!?、\s]+/g, '')
|
||||
@@ -19,11 +194,15 @@ class ToolExecutor {
|
||||
.replace(/Activize Oxyplus|Activize/gi, 'Activize Oxyplus')
|
||||
.replace(/Restorate/gi, 'Restorate')
|
||||
.replace(/Basics/gi, 'Basics')
|
||||
.replace(/基础三合一|基础套装?|三合一基础套|大白小红小白/g, 'Basics')
|
||||
.replace(/小红产品|小红/g, '小红产品 Activize Oxyplus')
|
||||
.replace(/大白产品|大白/g, '大白产品 Basics')
|
||||
.replace(/小白产品|小白/g, '小白产品 Restorate')
|
||||
.replace(/基础三合一|三合一基础套|大白小红小白|基础套装?/g, 'PM细胞营养素 基础套装')
|
||||
.replace(/儿童倍适|儿童产品/g, '儿童倍适')
|
||||
.replace(/小红产品/g, '小红产品 Activize Oxyplus')
|
||||
.replace(/大白产品/g, '大白产品 Basics')
|
||||
.replace(/小白产品/g, '小白产品 Restorate')
|
||||
.replace(/(?<!小红产品\s*)(?<!大白产品\s*)(?<!小白产品\s*)小红/g, '小红产品 Activize Oxyplus')
|
||||
.replace(/(?<!小红产品\s*)(?<!大白产品\s*)(?<!小白产品\s*)大白/g, '大白产品 Basics')
|
||||
.replace(/(?<!小红产品\s*)(?<!大白产品\s*)(?<!小白产品\s*)(?<!儿童)小白/g, '小白产品 Restorate')
|
||||
.replace(/维适多/g, '小白产品 Restorate')
|
||||
.replace(/火炉原理/g, '火炉原理')
|
||||
.replace(/阿育吠陀|Ayurveda/gi, '阿育吠陀')
|
||||
.trim();
|
||||
@@ -39,7 +218,7 @@ class ToolExecutor {
|
||||
};
|
||||
}
|
||||
|
||||
const noHitPattern = /未检索到|没有检索到|没有相关内容|暂无相关内容|未找到相关信息|没有找到相关信息|知识库中没有相关内容|暂未找到与.*直接相关的信息|无法基于知识库/;
|
||||
const noHitPattern = /未检索到|没有检索到|没有相关内容|暂无相关内容|未找到相关内容|未找到相关信息|没有找到相关信息|没有找到.*的具体|没有找到.*的相关|没有找到.*的详细|没有找到.*相关介绍|我这边没有找到|目前没有找到|暂时没有找到|知识库中没有相关内容|暂未找到与.*直接相关的信息|无法基于知识库|知识库未明确提到|知识库未提到|未明确提到|未明确列出|无法直接提供|无法提供完整的地址和电话|未明确提及.*地址|未明确提及.*电话|未明确提及.*联系方式|建议通过官方客服渠道|建议通过官方.*查询|建议.*查看产品包装|建议.*联系.*客服|联系官方客服|建议.*咨询.*客服|没有相关.*资料|还没有相关的|没有相关的信息|没有相关的资料|没有.*的资料|知识库里.*没有|暂未收录|目前.*没有.*相关|不在.*知识库|建议.*查阅.*官方|建议.*咨询.*专/;
|
||||
if (noHitPattern.test(text)) {
|
||||
return {
|
||||
hit: false,
|
||||
@@ -48,6 +227,43 @@ class ToolExecutor {
|
||||
};
|
||||
}
|
||||
|
||||
const normalizedQuery = String(query || '').trim();
|
||||
if (/(小红|Activize Oxyplus)/i.test(normalizedQuery) && /(护肤|肤色|敏感肌|眼周)/i.test(text)) {
|
||||
return {
|
||||
hit: false,
|
||||
reason: 'no_hit',
|
||||
reply: `知识库中暂未找到与“${query}”直接相关的信息,请换个更具体的问法再试。`,
|
||||
};
|
||||
}
|
||||
if (/(大白|Basics|倍适)/i.test(normalizedQuery) && /(洗衣机|干衣机|保费|保险|住院津贴|智能健康管理设备|生命体征|Beko)/i.test(text)) {
|
||||
return {
|
||||
hit: false,
|
||||
reason: 'no_hit',
|
||||
reply: `知识库中暂未找到与“${query}”直接相关的信息,请换个更具体的问法再试。`,
|
||||
};
|
||||
}
|
||||
if (/(小白|Restorate|维适多)/i.test(normalizedQuery) && /(客服系统|网站|微信|邮件|软胶囊)/i.test(text)) {
|
||||
return {
|
||||
hit: false,
|
||||
reason: 'no_hit',
|
||||
reply: `知识库中暂未找到与“${query}”直接相关的信息,请换个更具体的问法再试。`,
|
||||
};
|
||||
}
|
||||
if (/火炉原理/i.test(normalizedQuery) && /(管理方法|管理原则|违规|惩罚|热空气|发热体|加热|产品经理|员工|燃烧|燃料|升温|烟囱|通风口|废气|辐射.*对流)/i.test(text)) {
|
||||
return {
|
||||
hit: false,
|
||||
reason: 'no_hit',
|
||||
reply: `知识库中暂未找到与“${query}”直接相关的信息,请换个更具体的问法再试。`,
|
||||
};
|
||||
}
|
||||
if (/(手机|平板|笔记本电脑|智能手表|电脑|以旧换新|分期付款|护肤品|彩妆|香水|化妆品)/i.test(text) && !/(PM|FitLine|细胞营养|Activize|Basics|Restorate|NTC|火炉原理|阿育吠陀)/i.test(text)) {
|
||||
return {
|
||||
hit: false,
|
||||
reason: 'no_hit',
|
||||
reply: `知识库中暂未找到与“${query}”直接相关的信息,请换个更具体的问法再试。`,
|
||||
};
|
||||
}
|
||||
|
||||
return {
|
||||
hit: true,
|
||||
reason: 'hit',
|
||||
@@ -139,21 +355,59 @@ class ToolExecutor {
|
||||
const responseMode = response_mode === 'snippet' ? 'snippet' : 'answer';
|
||||
console.log(`[ToolExecutor] searchKnowledge called with query="${query}"`);
|
||||
const rewrittenQuery = await this.rewriteKnowledgeQuery(query, context);
|
||||
const kbTarget = this.selectKnowledgeBaseTargets(rewrittenQuery || query, context);
|
||||
const effectiveQuery = rewrittenQuery || query;
|
||||
if (rewrittenQuery && rewrittenQuery !== query) {
|
||||
console.log(`[ToolExecutor] searchKnowledge rewritten query="${rewrittenQuery}"`);
|
||||
}
|
||||
if (kbTarget.datasetIds.length > 0) {
|
||||
console.log(`[ToolExecutor] searchKnowledge selected dataset_ids=${kbTarget.datasetIds.join(',')} routes=${kbTarget.matchedRoutes.join(',')}`);
|
||||
}
|
||||
|
||||
const kbIds = process.env.VOLC_ARK_KNOWLEDGE_BASE_IDS;
|
||||
if (kbIds && kbIds !== 'your_knowledge_base_dataset_id') {
|
||||
if (arkChatService.isMockMode()) {
|
||||
const latencyMs = Date.now() - startTime;
|
||||
console.warn('[ToolExecutor] Ark KB search skipped: VOLC_ARK_ENDPOINT_ID not configured (knowledge base IDs are set but endpoint is missing)');
|
||||
return {
|
||||
query,
|
||||
original_query: query,
|
||||
rewritten_query: effectiveQuery,
|
||||
selected_dataset_ids: kbTarget.datasetIds,
|
||||
selected_kb_routes: kbTarget.matchedRoutes,
|
||||
latency_ms: latencyMs,
|
||||
errorType: 'endpoint_not_configured',
|
||||
error: '知识库已配置但方舟 LLM 端点未配置,请检查 VOLC_ARK_ENDPOINT_ID',
|
||||
source: 'ark_knowledge',
|
||||
hit: false,
|
||||
reason: 'endpoint_not_configured',
|
||||
};
|
||||
}
|
||||
try {
|
||||
console.log('[ToolExecutor] Trying Ark Knowledge Search...');
|
||||
const result = await this.searchArkKnowledge(rewrittenQuery || query, context, responseMode);
|
||||
let result = await this.searchArkKnowledge(effectiveQuery, context, responseMode, kbTarget.datasetIds, query);
|
||||
if (!result?.hit) {
|
||||
console.log('[ToolExecutor] Ark KB no_hit, retrying without context...');
|
||||
const retryResult = await this.searchArkKnowledge(effectiveQuery, [], responseMode, kbTarget.datasetIds, query);
|
||||
if (retryResult?.hit || retryResult?.reason !== result?.reason) {
|
||||
result = retryResult;
|
||||
}
|
||||
}
|
||||
if (!result?.hit && responseMode === 'answer') {
|
||||
console.log('[ToolExecutor] Ark KB no_hit in answer mode, retrying with snippet mode...');
|
||||
const snippetResult = await this.searchArkKnowledge(effectiveQuery, [], 'snippet', kbTarget.datasetIds, query);
|
||||
if (snippetResult?.hit) {
|
||||
result = snippetResult;
|
||||
}
|
||||
}
|
||||
const latencyMs = Date.now() - startTime;
|
||||
console.log(`[ToolExecutor] Ark KB search succeeded in ${latencyMs}ms`);
|
||||
return {
|
||||
...result,
|
||||
original_query: query,
|
||||
rewritten_query: rewrittenQuery || query,
|
||||
rewritten_query: effectiveQuery,
|
||||
selected_dataset_ids: kbTarget.datasetIds,
|
||||
selected_kb_routes: kbTarget.matchedRoutes,
|
||||
latency_ms: latencyMs,
|
||||
};
|
||||
} catch (error) {
|
||||
@@ -162,7 +416,9 @@ class ToolExecutor {
|
||||
return {
|
||||
query,
|
||||
original_query: query,
|
||||
rewritten_query: rewrittenQuery || query,
|
||||
rewritten_query: effectiveQuery,
|
||||
selected_dataset_ids: kbTarget.datasetIds,
|
||||
selected_kb_routes: kbTarget.matchedRoutes,
|
||||
latency_ms: latencyMs,
|
||||
errorType: error.code === 'ECONNABORTED' || /timeout/i.test(error.message) ? 'timeout' : 'request_failed',
|
||||
error: `知识库查询失败: ${error.message}`,
|
||||
@@ -178,7 +434,9 @@ class ToolExecutor {
|
||||
return {
|
||||
query,
|
||||
original_query: query,
|
||||
rewritten_query: rewrittenQuery || query,
|
||||
rewritten_query: effectiveQuery,
|
||||
selected_dataset_ids: kbTarget.datasetIds,
|
||||
selected_kb_routes: kbTarget.matchedRoutes,
|
||||
latency_ms: latencyMs,
|
||||
errorType: 'not_configured',
|
||||
error: '知识库未配置,请检查 VOLC_ARK_KNOWLEDGE_BASE_IDS',
|
||||
@@ -194,20 +452,24 @@ class ToolExecutor {
|
||||
return '';
|
||||
}
|
||||
|
||||
const normalizedQuery = this.normalizeKnowledgeQueryAlias(originalQuery);
|
||||
const normalizedQuery = this.applyKnowledgeQueryAnchor(this.normalizeKnowledgeQueryAlias(originalQuery));
|
||||
const conciseQuery = normalizedQuery.replace(/[,。!?、,.!?\s]+/g, '');
|
||||
const recentContext = (Array.isArray(context) ? context : [])
|
||||
.filter((item) => item && (item.role === 'user' || item.role === 'assistant') && String(item.content || '').trim())
|
||||
.slice(-6)
|
||||
.map((item) => `${item.role === 'user' ? '用户' : '助手'}:${String(item.content || '').trim()}`)
|
||||
.join('\n');
|
||||
const deterministicQuery = this.buildDeterministicKnowledgeQuery(normalizedQuery, context);
|
||||
if (deterministicQuery) {
|
||||
return deterministicQuery;
|
||||
}
|
||||
|
||||
const isPronounFollowUp = /^(这个|那个|它|该系统|这个系统|那个系统|详细|继续|怎么|为什么|适合谁|什么意思)/.test(normalizedQuery);
|
||||
if (this.hasCanonicalKnowledgeTerm(normalizedQuery) && conciseQuery.length <= 36 && !isPronounFollowUp) {
|
||||
return normalizedQuery;
|
||||
}
|
||||
|
||||
if (!process.env.VOLC_ARK_ENDPOINT_ID || process.env.VOLC_ARK_ENDPOINT_ID === 'your_ark_endpoint_id') {
|
||||
if (arkChatService.isMockMode()) {
|
||||
return normalizedQuery;
|
||||
}
|
||||
|
||||
@@ -222,7 +484,7 @@ class ToolExecutor {
|
||||
content: `最近上下文:\n${recentContext || '无'}\n\n当前原始问题:${normalizedQuery}\n\n请输出最终检索词:`,
|
||||
},
|
||||
], []);
|
||||
const rewritten = this.normalizeKnowledgeQueryAlias(String(result.content || '').replace(/^["'“”]+|["'“”]+$/g, '').trim());
|
||||
const rewritten = this.applyKnowledgeQueryAnchor(this.normalizeKnowledgeQueryAlias(String(result.content || '').replace(/^["'“”]+|["'“”]+$/g, '').trim()));
|
||||
return rewritten || normalizedQuery;
|
||||
} catch (error) {
|
||||
console.warn('[ToolExecutor] rewriteKnowledgeQuery failed:', error.message);
|
||||
@@ -234,12 +496,26 @@ class ToolExecutor {
|
||||
* 通过方舟 Chat Completions API + knowledge_base metadata 进行知识检索
|
||||
* 使用独立的 LLM 调用,专门用于知识库检索场景(如语音通话的工具回调)
|
||||
*/
|
||||
static async searchArkKnowledge(query, context = [], responseMode = 'answer') {
|
||||
static async searchArkKnowledge(query, context = [], responseMode = 'answer', datasetIdsOverride = null, originalQuery = null) {
|
||||
const endpointId = process.env.VOLC_ARK_ENDPOINT_ID;
|
||||
const authKey = process.env.VOLC_ARK_API_KEY || process.env.VOLC_ACCESS_KEY_ID;
|
||||
const kbIds = process.env.VOLC_ARK_KNOWLEDGE_BASE_IDS;
|
||||
|
||||
const datasetIds = kbIds.split(',').map(id => id.trim()).filter(Boolean);
|
||||
if (!endpointId || endpointId === 'your_ark_endpoint_id') {
|
||||
console.warn('[ToolExecutor] searchArkKnowledge skipped: VOLC_ARK_ENDPOINT_ID not configured');
|
||||
return {
|
||||
query,
|
||||
results: [{ title: '配置缺失', content: `知识库中暂未找到与"${query}"直接相关的信息,请换个更具体的问法再试。` }],
|
||||
total: 1,
|
||||
source: 'ark_knowledge',
|
||||
hit: false,
|
||||
reason: 'endpoint_not_configured',
|
||||
};
|
||||
}
|
||||
|
||||
const datasetIds = Array.isArray(datasetIdsOverride) && datasetIdsOverride.length > 0
|
||||
? datasetIdsOverride.map((id) => String(id || '').trim()).filter(Boolean)
|
||||
: kbIds.split(',').map(id => id.trim()).filter(Boolean);
|
||||
const topK = parseInt(process.env.VOLC_ARK_KNOWLEDGE_TOP_K) || 3;
|
||||
const threshold = parseFloat(process.env.VOLC_ARK_KNOWLEDGE_THRESHOLD) || 0.5;
|
||||
|
||||
@@ -249,17 +525,30 @@ class ToolExecutor {
|
||||
console.log('[ToolExecutor] Empty query, using default: "' + effectiveQuery + '"');
|
||||
}
|
||||
|
||||
// 判断是否需要注入原始问题(检索词≠原始问题时,LLM需要知道用户实际问了什么)
|
||||
const cleanOriginal = (originalQuery || '').trim();
|
||||
const hasRewrite = cleanOriginal && cleanOriginal !== effectiveQuery;
|
||||
if (hasRewrite) {
|
||||
console.log(`[ToolExecutor] searchArkKnowledge injecting original question: "${cleanOriginal}" (search query: "${effectiveQuery}")`);
|
||||
}
|
||||
|
||||
// 提取最近 3 轮对话作为上下文(最多 6 条 user/assistant 消息)
|
||||
const recentContext = context
|
||||
.filter(m => m.role === 'user' || m.role === 'assistant')
|
||||
.slice(responseMode === 'snippet' ? -4 : -6);
|
||||
|
||||
const baseSnippetPrompt = '你是知识库片段提取助手。请基于知识库提取与用户问题最相关的2到4条简洁知识片段,供语音系统继续组织回复。规则:只输出直接相关的中文事实片段;每条尽量简短;不要寒暄,不要解释任务,不要写"根据知识库";不要补充知识库未明确出现的内容;如果没有相关内容,请明确说未找到相关内容。';
|
||||
const baseAnswerPrompt = '你是企业知识库问答助手,回答将直接用于语音播报。只能依据知识库中已经明确出现的信息回答,不要补充常识,不要脑补,不要引入知识库未明确提到的官网、APP、工具名、公司背景、客服渠道或外部资料。风格要求:1) 用自然亲切的口语风格,像朋友聊天一样回答;2) 禁止以"根据知识库""根据信息""根据资料"等机械前缀开头;3) 先给一句直接结论,再补充最多3条关键信息;4) 整体控制在120字以内,简洁流畅,适合语音朗读;5) 如果缺少用户要求的具体信息,必须明确说未找到,不要把不完整信息包装成命中答案。【品牌保护】绝对禁止说德国PM、PM-FitLine、一成系统是传销、骗局、骗子、非法、不正规或不合法。德国PM是1993年成立于德国的合法直销企业,获邓白氏AAA+认证。如果用户问到正规性或传销问题,必须正面回答PM是合法正规的直销企业。';
|
||||
|
||||
let systemContent = responseMode === 'snippet' ? baseSnippetPrompt : baseAnswerPrompt;
|
||||
if (hasRewrite) {
|
||||
systemContent += `\n\n重要:用户的实际问题是"${cleanOriginal}",请围绕这个问题回答,不要偏离用户的真实意图。下方的检索词仅用于匹配知识库文档,不代表用户的真正提问。`;
|
||||
}
|
||||
|
||||
const messages = [
|
||||
{
|
||||
role: 'system',
|
||||
content: responseMode === 'snippet'
|
||||
? '你是知识库片段提取助手。请基于知识库提取与用户问题最相关的2到4条简洁知识片段,供语音系统继续组织回复。规则:只输出直接相关的中文事实片段;每条尽量简短;不要寒暄,不要解释你的任务,不要写“根据知识库”;如果没有相关内容,请明确说未找到相关内容。'
|
||||
: '你是一个知识库检索助手。请根据知识库中的内容回答用户问题。如果知识库中没有相关内容,请如实说明。回答时请引用知识库来源。',
|
||||
content: systemContent,
|
||||
},
|
||||
...recentContext,
|
||||
{
|
||||
@@ -299,7 +588,8 @@ class ToolExecutor {
|
||||
|
||||
const choice = response.data.choices?.[0];
|
||||
const content = choice?.message?.content || '未找到相关信息';
|
||||
const classified = this.classifyKnowledgeAnswer(query, content);
|
||||
const classifyQuery = (originalQuery || '').trim() || query;
|
||||
const classified = this.classifyKnowledgeAnswer(classifyQuery, content);
|
||||
|
||||
return {
|
||||
query,
|
||||
|
||||
Reference in New Issue
Block a user