灵云SDK开发手册(C API)  8.1
ASR能力描述

能力列表

下面列出灵云支持的ASR能力:

云端语法识别能力

能力Key 类别 语种 领域 所需本地资源文件
asr.cloud.grammar 语法识别 中文 N/A

云端自由说识别能力

asr.cloud.freetalk 自由说 中文 通用领域
asr.cloud.freetalk.cantonese 自由说 粤语 通用领域

asr.cloud.freetalk.english 自由说 英文 通用领域
asr.cloud.freetalk.uyghur 自由说 维吾尔语 通用领域
asr.cloud.freetalk.taiwan 自由说 台湾国语 通用领域

云端意图识别能力

能力Key 类别 语种 支持意图 所需本地资源文件
asr.cloud.dialog 意图识别 中文 weather,call,map,...

本地语音能力需要资源文件,可在灵云官网下载,地址:http://www.hcicloud.com/dev/application/viewres.html 本地语法模型现提供两种 model_carnav_common 通用模型 model_carnav_embeded 车载模型 本地自由说模型现提供三种 model_carnav_common 通用模型 model_carnav_embeded 车载模型 model_carnav_poi 导航模型 请针对不同场景,自行选择。

本地端语音识别能力:

能力Key 类别 语种支持 领域 所需本地资源文件
asr.local.grammar.v4 语法识别 中文 model_carnav_common 通用模型
model_carnav_embeded 车载模型
grm_decoder.conf
ispk_aux.dat
ispk_dnn.dat
ispk_g2p.dat
asr.local.freetalk 自由说识别 中文 model_carnav_common 通用模型
model_carnav_embeded 车载模型
model_carnav_poi 导航模型
ft_decoder.conf
ispk_dnn.dat
ispk_hclg.dat
ispk_blm.dat
ispk_slm.dat

实时反馈结果

hci_asr_session_start() 开启会话参数realtime设定为rt,当调用 hci_asr_recog() 识别结果 ASR_RECOG_RESULT 中的 psResultItemList 包含1个候选字,为一个JSON字符串:

{
"SegmentCount": 1,
"Segment": [{
"SegmentIndex": 1,
"Text": "北京",
"Score": 408,
"StartTime": 0,
"EndTime": 1600
}]
}

在持续调用 hci_asr_recog() 的过程中,返回结果如下:

// 实时第1次返回
{
"SegmentCount": 1,
"Segment": [{
"SegmentIndex": 1,
"Text": "北京",
"Score": 408,
"StartTime": 0,
"EndTime": 1600
}]
}
// 实时第2次返回
{
"SegmentCount": 1,
"Segment": [{
"SegmentIndex": 1,
"Text": "北京捷通华声",
"Score": 2980,
"StartTime": 0,
"EndTime": 1800
}]
}
// 实时第3次返回
{
"SegmentCount": 1,
"Segment": [{
"SegmentIndex": 1,
"Text": "北京捷通华声科技",
"Score": 596,
"StartTime": 0,
"EndTime": 2600
}]
}
// 实时第4次返回
{
"SegmentCount": 1,
"Segment": [{
"SegmentIndex": 1,
"Text": "北京捷通华声科技股份",
"Score": 1071,
"StartTime": 0,
"EndTime": 3200
}]
}
// 实时第5次返回
{
"SegmentCount": 1,
"Segment": [{
"SegmentIndex": 1,
"Text": "北京捷通华声科技股份有限公司",
"Score": 1361,
"StartTime": 0,
"EndTime": 3800
}]
}