AI转写赛道新品频出 为讯飞消费者发布智能录音笔和智能耳机
而得益于全新升级的转写引擎,讯飞智能录音笔SR901和SR702两款新品在行业率先搭载了离线转写功能。无需4G/WIFI网络,用户也能实现语音实时转文字、转写后的文字内容即刻保存,离线转写准确率高达95%,无惧断网环境。同时离线转写也防止了高度机密信息的泄露,保障了用户信息安全和特有转写需求的实现。同时,通过SR901和SR702的摄像头可将图片上的文字内容提取出来并实时呈现,便于用户实现重要音频和图文信息的混合记录,用于后期记录及整理。同时,这两款新品还支持录制视频、实时收音并实时生成字幕,同时后期也可编辑字幕,打造多场景重要信息记录的全新AI交互体验。 讯飞智能录音笔SR901 在讯飞智能录音笔前端降噪处理上,通过讯飞原创神经网络与传统信号处理深度结合的降噪算法(SSA-IME),可以有效降低环境干扰噪声,并有效消除干扰说话人的声音,从而大幅降低语音识别的处理难度。在无喇叭的情况下3-10米远距离提升相对30%,有喇叭的情况超远距离(20-50m)演讲场景效果达到90%以上。而为了满足用户快速出稿的需求,讯飞大力投入语音识别后处理技术并运用到讯飞智能录音笔上,先后上线语气过滤词、口语规整、文本语义分段、文本智能摘要等文本理解能力。针对多人交谈会议场景,上线了分离与ASR联合建模的说话人分离方案,说话人分离的准确率达到95%让用户能够快速检索到目标说话人数据,提升编辑体验。 上述新品均搭载科大讯飞二十一年积累的先进AI技术,以语音转写功能应用到的语音识别技术为例,2020年的CHiME-6,在被称为“史上最难的语音识别任务”中,科大讯飞不仅在给定说话人边界的多通道语音识别两个参赛任务上夺冠,更一鼓作气刷新自己在CHiME-5中46.1%的语音识别错误率冠军成绩,直降至30.5%。而在说话人识别技术方面,近期VoxSRC国际说话人识别比赛限定训练数据任务中(公开刷榜阶段),科大讯飞刷新世界纪录,等错误率(EER)降低到0.81%。同时,科大讯飞在学术界公开测试集合VoxCeleb1上取得0.63%的EER,是截止目前的State Of The Art(最好结果)。 (编辑:应用网_阳江站长网) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |