星期一 , 12月 23 2024
首页 / 人工智能 / AI / 音书App:用AI让声音“看得见”

音书App:用AI让声音“看得见”

成立于2016年的音书科技,是一家创新型社会企业,致力于通过人工智能技术,实现听障人士的无障碍沟通。目前公司已经获得科大讯飞的战略投资。其产品主要是一款App,包括无障碍沟通软件、智能字幕速记系统,服务领域涵盖听障人士的日常交流、语言康复、学习培训等方面。目前注册用户已经达到40万人次。

让听障人士和健听人更好沟通的关键是:如何让前者感受到声音。而传统的方式较多的的是手语交流,但是这只能实现小范围的沟通。根据世界卫生组织估计,全球约有3.6亿听力障碍者。2017年,北京听力协会书记兼副会长王树峰曾透露了一组数据,目前估计中国残疾性听力障碍人士已达7200万。沟通的刚需在人工智能时代见到了曙光,2017年,百度利用人工智能将手势翻译为汉字,然后用手机读出来,使普通人可以懂聋哑残疾人士的手语。2018年,爱奇艺则发布了全球首个AI手语主播。

而说起与用户的需求贴合度,目前几乎没有产品可以可音书App媲美。因为,音书的CEO石城川在11岁因一场疾病失去听力,成为极重度听损人士。这些年,他自己尝试过很多助听器、手语等各式各样的方法,但是交流起来依然不便。大学毕业后,石城川有一份安稳的工作,不过很快他便辞职探索人工智能对于听障人士的帮助,音书App则是实践的成果。

从音书的业务板块上看,可以分为两类。一是无障碍沟通,即通过科大讯飞的语音识别、语音合成等技术服务用户群。其中,包括字幕单聊:App可以将聊天时对方说的话即时转化为文字;字幕视频聊天:听障人士在于别人视频聊天时,屏幕上会出现实时字幕;字幕速记:在会议上,App可以将发言人说的话翻译成文字显示在投影屏幕上。据音书的COO彭驷庆透露,音书的产品马上会做一些升级,除了一些免费的基础性服务之外,还有增值性服务。第一大业务版块的买单方主要是政府采购和相关机构的采购,如残疾人联合会,聋哑人协会等。此外,还有用户会自己购买服务。

另一类业务则是语言康复训练,即帮助用户群提高普通话的发音水平。彭驷庆介绍,这也是音书的重点产品。传统的康复模式是线下一对一的形式,康复成本非常高,一节课大概一个小时,费用在200到400元,每周需要3到5节课。而通过线上人工智能技术的结合,不仅可以提高他们言语康复的效率,同时也可以降低康复成本。

据悉,音书的语音训练功能,分成了拼音、词语、句子、文章四个维度,然后通过这四个维度,让用户基于智能手机终端做训练。用户训练的时候,系统通过语音评测技术,可以去捕捉到其哪些发音是有问题的。然后提供相应的练习,辅助用户进行自我训练。具体来说,如何让用户感受到声音呢?“我们把声音具象化。比如说通过图像的方式,让用户感知到发音原来是这样子,再通过去配合自己的呼吸系统,吞咽系统,发音系统,慢慢去尝试。”彭驷庆解释道。“如果用户发出来的声音很奇怪,我们可以告诉他现在有声音发出来了,但是你这声音还不是准确的发音,然后辅助他慢慢地靠近准确的发音。”他说。

从左至右:陈国强、石城川、彭驷庆

他表示,图像的中转方式只是目前比较基础的一个版本,接下来可能会加入声波等元素。“我们目前的产品版本,更适合有一定发音基础的人。接下来我们会再做进一步的迭代,希望能帮助到完全没有发音能力的用户群。”彭驷庆说。此外,值得一提的是,音书还在探索AR眼镜对于听障人士的帮助,即帮助用户将声音转化的文字投放到眼镜上。不过,彭驷庆表示,目前还没有计划把AR眼镜推向市场。“因为AR眼镜技术相对来说还不太成熟,体验上不够好。”他说。除了沟通问题,他表示以后希望还可以解决用户群的就业,技能培训等问题。

不得不说,音书是一个很具有公益价值和社会价值的企业。其App问世以来,也获得了很多用户的肯定。据彭驷庆透露,其种子轮投资人就是其用户。

关于 恰克

恰克
吃鸡吃鸡

检查

OpenAI重磅发布o3,再次突破AI极限

OpenAI迎来了年底AI春晚 …

发表评论

邮箱地址不会被公开。 必填项已用*标注