密级 | 公开 |
---|---|
版本 | 10D.2 |
AICP NLP 资源指南
#
1. 概述本文档描述 AICP-10 平台中 NLP 能力的相关资源的使用方法。
NLP 能力中的资源包括:
- 话术
- 质检规则
AICP 10 NLP 能力支持动态设置这些资源。设置方式有两种:
- 客户端通过 “统一资源管理接口” 上传资源并获取资源ID,然后在调用时在配置中指定资源ID。这类资源称为 “用户资源”。
- 通过 “管理后台” 上传资源,并配置到请求配置集中,则成为默认的资源。这类资源称为“系统资源”。
#
2. 资源介绍#
2.1 话术话术资源,其内容为JSON对象,UTF-8编码,包含字段如下表说明。
参数 | 类型 | 必选 | 缺省 | 说明 |
---|---|---|---|---|
pattern_* | Object | 是 | - | 话术检查点,一个话术资源下可以包含多个话术检查点 |
pattern_*.phrase | Array of String | 是 | - | 标准话术 |
pattern_*.range | Array of Integer | 否 | - | 话术匹配范围,只包含两个元素,形式为[min, max] 。 |
如果指定,则表示该 pattern 只匹配文档中指定范围的句子; | ||||
值为负数时,表示匹配倒数第几句。 | ||||
如果不指定,则表示该 pattern 匹配文档中所有句子。 | ||||
pattern_*.threshold | Float | 否 | 0.8 | 话术最低匹配阈值 |
话术资源对象下可包含多个前缀为pattern_
的键值对,每个pattern下range
代表这个pattern只匹配文档中指定范围的句子(-1,-2表示匹配倒数第二句到倒数第一句),threshold
表示最低匹配的百分比,phrase
表示匹配话术。
示例如下:
#
2.2 质检规则质检规则资源,其内容为JSON对象,UTF-8编码。,包含字段如下表说明。
参数 | 类型 | 必选 | 缺省 | 说明 |
---|---|---|---|---|
lexicon_* | Array of String | 否 | - | 公共词语集 |
pattern_* | Object | 是 | - | 质检点 |
pattern_*.lexicon_* | Array of String | 是 | - | 仅该 pattern 生效的词语集 |
pattern_*.phrase_* | Array of String | 是 | - | 仅该 pattern 生效的短语集 |
pattern_*.script | Array of String | 是 | - | 该 pattern 的质检句式集,可包含如下要素 |
lexicon、phrase、sentence、headword、question | ||||
pattern_*.sentence_* | Array of Object | 否 | - | 同义句检出规则,包含阈值及同义句。 |
形式为[阈值, "同义句1", "同义句2", ...] | ||||
pattern_*.sentence_*[0] | Float | 否 | 80 | 同义句检出阈值,取值 [0, 100] |
pattern_*.sentence_*[#] | String | 是 | - | 多个同义句。同义句个数无限制 |
pattern_*.headword_* | Object | 否 | - | 中心词肯定判断检出规则 |
pattern_*.headword_*.confirm | Bool | 是 | - | 判断逻辑,表明肯定中心词或者否定中心词 |
pattern_*.headword_*.keywords | Array of String | 是 | - | 待检查的中心词 |
pattern_*.headword_*.filter | Object | 否 | - | 目标句子过滤条件 |
pattern_*.question_* | Object | 否 | - | 问答肯定判断规则 |
pattern_*.question_*.answers | Array of String | 是 | - | 判断逻辑的任意组合,表明对中心词的态度。取值三选一 |
"negate": 否定,"confirm": 肯定,"notsure": 不确定 | ||||
pattern_*.question_*.keywords | Array of String | 是 | - | 待检查的中心词 |
pattern_*.question_*.filter | Object | 否 | - | 目标句子过滤条件 |
具体语法细节,参见《捷通华声iAnalyze9.6.0_AllEngine大数据分析引擎规则质检建模及优化指导手册》。
规则示例:
#
3. 资源管理接口客户端通过 “统一资源管理接口” 可以对上述的动态资源进行进行增、删、改、查的管理和维护操作。
统一资源管理接口如下:
添加资源
POST http://ip:port/v10/resource/user/nlp/{type}?appkey={appkey}&userId={userId}
修改资源
PUT http://ip:port/v10/resource/user/nlp/{type}/{resId}?appkey={appkey}&userId={userId}
查找资源
GET http://ip:port/v10/resource/user/nlp/{type}?appkey={appkey}&userId={userId}&offset={offset}&limit={limit}
查看资源
GET http://ip:port/v10/resource/user/nlp/{type}/{resId}?appkey={appkey}&userId={userId}
删除资源
DELETE http://ip:port/v10/resource/user/nlp/{type}/{resId}?appkey={appkey}&userId={userId}
支持的 type
如下:
cu | type | 说明 | 系统资源 | 用户共享资源 | 用户独享资源 |
---|---|---|---|---|---|
nlp | qarule | 质检规则 | ✓ | ✓ | |
talktrick | 话术 | ✓ | ✓ |
创建 NLP 动态优化资源时,有如下约束:
- 用户资源
- 各类型的资源,目前均只支持用户共享资源,因此不需要提供用户标识(userId),或者指定为 "*"
- 各类型的资源在同一个开发者下面是共享的,最多可以存储 10000 个用户资源
- 系统资源
- 各类型的资源,在一个开发者下都是支持最多10000个
具体的请求参数、请求消息和相应消息,请参见 《统一资源管理开发手册》。