经销商 | 联系方式 |
---|---|
讯意迪科技 | 0571-88027356、18857123786 |
软件界面
软件功能
1、实时语音转写:对音频流做实时语音识别,可以做到“边说话边同步输出文字”的效果,支持中文普通话、英文、中英文混合。中文普通话引擎支持中文中夹带英文单词、简单的英文语句,中英文混合引擎可在中文和英文语境下自由切换;
2、语音识别准确率:清晰普通话中文语音实时转写确率最高可达 98%;实时语音转写速度≤200 毫秒,可实现 5-10 分钟完成 1 小时的音频识别;
3、支持多种音频编解码格式:实时语音转写支持 pcm、wav、speex、speex-wb、opus 等音频编解码算法。非实时转写支持 mp3、wav、wma、mp4、avi、pcm、m4a 格式音频;
4、文本后处理:支持对识别结果语句智能预测其对话语境,提供智能断句和标点符号的预测,同时也支持数字规整和替换列表能力;
5、热词优化:可将个性化人名、地名、建筑名、专业词汇等专有名词,添加到热词列表中,有效提升该热词的识别准确率。分为会话级热词和全局热词。会话级热词只对当前会话生效,会话结束后立即失效。全局热词需要在服务启动前配置好,且对所有会话请求都生效;
6、语言模型训练:针对客户的使用地域和业务范围优化语音识别模型,提升对口音、业务文本识别准确率。