1. 兼容性
灵云提供的lib和dll文件为32bit版本和64bit版本,支持在Windows32bit及64bit操作系统上进行开发,开发的程序可以运行在Windows32bit和64bit操作系统上。
2. 开发环境搭建
可以使用Visual Studio 2008以上版本进行开发。
3. 引入SDK文件
首先将灵云SDK提供的头文件(.h)和链接库(.lib)文件拷贝到您的工程目录下,并在工程中引入灵云SDK提供的头文件和链接库文件。 灵云提供的链接库是动态链接的方式,因此在运行时需要使用相应的动态链接库(.dll),这些文件也需要放置在运行目录下。
具体需要引入的文件和开发者所需要使用的能力有关。
3.1 ASR能力
3.1.1 基础API
灵云SDK头文件:
灵云SDK库文件:
运行时所需DLL文件
- 必选模块
- libhci_curl.dll
- hci_sys.dll
- hci_asr.dll
- 云端识别
- hci_asr_cloud_recog.dll
- jtspeex.dll 或者 jtopus.dll (根据所使用的编解码格式进行选择)
- 本地语法识别
- hci_asr_local_recog.dll
- iSpeakGrmDNNLite.dll
- 本地自由说识别
- hci_asr_local_ft_recog.dll
- iSpeakDNNLite.dll
- 本地意图识别(在ASR识别库的基础上还需要下边三个库)
- hci_nlu.dll
- hci_nlu_local_recog.dll
- iThinkDialog.dll
本地资源文件:
- 使用本地语音识别能力,需要相应的资源文件。具体可参照 ASR能力描述 进行选择。
3.1.2 ASR录音机
如果使用ASR录音机,在上述基础API所依赖的文件外,还需要增加下列文件
灵云SDK头文件:
灵云SDK库文件:
运行时所需DLL文件
3.2 TTS能力
3.2.1 基础API
灵云SDK头文件:
灵云SDK库文件:
运行时所需DLL文件
- 必选模块
- libhci_curl.dll
- hci_sys.dll
- hci_tts.dll
- 云端能力
- hci_tts_cloud_synth.dll
- jtspeex.dll 或者 jtopus.dll (根据所使用的编解码格式进行选择)
- 通用TTS能力
- hci_tts_local_synth.dll
- 歌唱TTS能力
- hci_tts_local_synth_sing.dll
本地资源文件:
- 使用本地语音合成能力,需要相应的资源文件。具体可参照 TTS能力描述 进行选择。
3.2.2 TTS播放器
如果使用TTS播放器,在上述基础API所依赖的文件外,还需要增加下列文件
灵云SDK头文件:
灵云SDK库文件:
运行时所需DLL文件
3.3 HWR能力
灵云SDK头文件:
灵云SDK库文件:
运行时所需DLL文件
- 必选模块
- libhci_curl.dll
- hci_sys.dll
- hci_hwr.dll
- 云端识别
- hci_hwr_cloud_recog.dll
- 本地识别
- hci_hwr_local_recog.dll
- 联想功能
- hci_hwr_associate.dll
- 拼音功能
- hci_hwr_pinyin.dll
- 笔形功能
- hci_hwr_penscript.dll
本地资源文件:
- 使用本地手写识别能力,需要相应的资源文件。具体可参照 HWR能力描述 进行选择。
3.4 OCR能力
灵云SDK头文件:
灵云SDK库文件:
运行时所需DLL文件
- 必选模块
- libhci_curl.dll
- hci_sys.dll
- hci_ocr.dll
- 云端识别
- hci_ocr_cloud_recog.dll
- 本地识别
- hci_ocr_local_recog.dll
- 模板识别
- iRead_Form.dll
- hci_ocr_local_recog_template.dll
- 名片识别
- iRead_BizCard.dll
- hci_ocr_local_recog_bizcard.dll
- 银行卡识别
- hci_ocr_local_recog_bankcard.dll
本地资源文件:
- 使用本地光学字符识别能力,需要相应的资源文件。具体可参照 OCR能力描述 进行选择。
3.5 MT能力
灵云SDK头文件:
灵云SDK库文件:
运行时所需DLL文件
- 必选模块
- libhci_curl.dll
- hci_sys.dll
- hci_mt.dll
- 云端识别
- hci_mt_cloud_trans.dll
- 本地识别(暂不支持)
3.6 NLU能力
灵云SDK头文件:
灵云SDK库文件:
运行时所需DLL文件
- 必选模块
- libhci_curl.dll
- hci_sys.dll
- hci_nlu.dll
- 云端识别
- hci_nlu_cloud_recog.dll
- 本地识别
- hci_nlu_local_recog.dll
3.7 KB能力
灵云SDK头文件:
灵云SDK库文件:
运行时所需DLL文件
- 必选模块
- libhci_curl.dll
- hci_sys.dll
- hci_kb.dll
- 本地识别
- hci_kb_local_recog.dll
3.8 VPR能力
灵云SDK头文件:
灵云SDK库文件:
运行时所需DLL文件
- 必选模块
- libhci_curl.dll
- hci_sys.dll
- hci_vpr.dll
- 云端识别
- hci_vpr_cloud_recog.dll
- jtspeex.dll 或者 jtopus.dll (根据所使用的编解码格式进行选择)
- 本地识别
- hci_vpr_local_recog.dll
- intel MKL库(注意区分32bit和64bit)
3.9 FPR能力
灵云SDK头文件:
灵云SDK库文件:
运行时所需DLL文件
- 必选模块
- libhci_curl.dll
- hci_sys.dll
- hci_fpr.dll
- 云端识别
- hci_fpr_cloud_recog.dll
- 本地识别
- hci_fpr_local_recog.dll
3.10 AFR能力
灵云SDK头文件:
灵云SDK库文件:
运行时所需DLL文件
- 必选模块
- libhci_curl.dll
- hci_sys.dll
- hci_afr.dll
- 云端识别
- hci_afr_cloud_recog.dll
- 本地识别
- hci_afr_local_recog.dll
本地资源文件:
- 使用本地人脸识别能力,需要相应的资源文件。具体可参照 AFR能力描述 进行选择。
3.11 注意
- jtopus.dll是opus编码库,jtspeex.dll是speex编码库,仅在使用云端ASR、TTS或者VPR时候用于音频压缩。 应用可以根据需要的编码方式(请参见 音频编解码库 ),选择其中合适的编码库,这样可以减少应用包的大小.
4. 本地资源文件
当使用本地能力时,需要在本地存放资源文件,并在能力初始化时通过指定dataPath告知资源所在路径。
每种本地能力,所需要的资源文件并不相同,在实际使用时,可以只拷贝所使用能力对应的资源文件, 这样可以减少所占用的外部存储空间。具体每种本地能力所需要的本地资源文件,请参见 能力列表 。