语音识别与音频理解
它可以在一套流程里完成 ASR、语种识别、情绪识别和声音事件检测,适合做高频音频处理的基础层。
一个面向多语言场景的语音理解工具,用来快速完成转写、语种识别、情绪线索提取和音频内容初步判断。
它可以在一套流程里完成 ASR、语种识别、情绪识别和声音事件检测,适合做高频音频处理的基础层。
适合研究访谈整理、会议录音转写、多语言音频浏览和轻量级语音实验,能明显降低前期处理成本。
这个页面目前作为作品集展示入口使用,LyraLab 上还没有单独部署产品版,但上游仓库和文档已经公开。
下面放的是 SenseVoice WebUI 的实际界面截图,可以直接看上传音频、语言选择和结果输出的布局。