对话腾讯商世东:开放天籁AI技术,探索科技向善长效模式-全球热门
在以“生声不息 无界前行”为主题的第七届企业创新生态圈大会上,腾讯会议天籁实验室主任商世东演示了腾讯天籁级联麦克风音箱天籁AI降噪技术的效果。开启后,即便在电钻噪音的干扰下,采集到的人声依然能够清晰、准确地传达给大会现场的每一位听众。
这是一项应用于腾讯会议APP中的技术。为了给2亿多用户提供高质的会议体验,商世东带领腾讯会议天籁实验室,采集了上千小时的语音噪声数据,利用天籁AI算法和深度学习能力,成功消除300多种噪声,有效提升用户体验。
【资料图】
当天籁AI技术跨界助听领域,会碰撞出什么样的火花?
2020年9月27日国际聋人日上,腾讯公益慈善基金会、腾讯会议天籁实验室联合中国聋人协会、设备厂商共同发起“天籁行动”,免费开放腾讯会议背后的天籁AI技术,尝试解决听障、听损等社会问题。
两年以来,“天籁行动”探索出科技赋能公益的长效模式,用技术和行动助力信息无障碍建设,取得良好的帮扶效果和社会反馈,为更多听障人群带来便利。
11月10日,时代周报记者对话商世东,揭秘“天籁行动”的背后故事。
商世东在第七届企业创新生态圈大会上发表主题演讲,图源:企业供图
超6000万老人听力受损
南京大学新闻传播学院、腾讯研究院、腾讯会议天籁实验室等联合发布的2022年国内首份老年听障社会问题调研报告《敢问天籁·关于老年听力健康的十个问题》(以下简称《敢问天籁》)记录了听障老人唐臣等人的故事。
唐臣听过这片土地上所有动听的声音——春天里孩子在田间唱歌歌谣,秋天沉甸甸的扁担吱呀作响。但是,由于长期在密闭、嘈杂的环境下作业,步入晚年的唐臣面临听力障碍的困扰。和许多农村老人一样,他佩戴的是一两百元左右助听器,没有噪音分辨功能,在放大声音的同时,噪音也放大了,进一步加重了听力受损。
在中国,类似唐臣这样的听障人士,是一个庞大的群体。
世界卫生组织数据显示,全球65岁以上老年人中,约1/3存在中度或中度以上的听力损失。国家卫健委、全国老龄办发布的《2021年度国家老龄事业发展公报》显示,截至2021年年底,全国60岁以上老年人口达2.67亿,65岁以上人口则超过2亿。也就是说,超过6000万中国老人正在经历听力受损的困扰。
然而,《敢问天籁》的调查结果显示,我国中、重度听障老人使用助听器的比例仅有5%-10%,欧美的这一数字已达30%,人工耳蜗的植入率同样远远低于欧美等发达国家和地区,绝大多数听障老人生活在声音混沌不清的世界里。
商世东认为,助听器普及率低,其中一个原因在于采购价格的高昂和采购渠道的困难。“城市里有多少个眼镜店,但是有多少个助听器店?助听器的销售、服务渠道和用户真正的需求,还存在很大差距。”
甚至很多佩戴了人工耳蜗、助听器的听障人士,因为技术落后,在饭店、街道等嘈杂的环境下,依然会面临听不清的困扰。
商世东说:“当时我们就在想,能不能把我们在腾讯会议里经过多年的研发积累、数亿用户验证的语音降噪和增强技术用在助听设备里,让听障人士能够听得见、听得清、听得真?”
“天籁行动”由此诞生。
AI算法助力助听器性能大幅提升
2020年9月27日国际聋人日上,腾讯公益慈善基金会、腾讯会议天籁实验室联合中国聋人协会等正式发起“天籁行动”,向合作伙伴、开发者、厂商免费开放腾讯天籁AI技术。
美笛乐、科利尔、诺尔康和中国联通等国内外厂商,已接入腾讯天籁AI技术。
商世东介绍,“天籁行动”与美笛乐合作,帮助听损者提高单音节的识别率达到66%;和科利尔在频率测听、声消并音以及听能康复训练方面深度合作,为听障人士提供从测听到听觉提升的全链条解决方案;和诺尔康在设备上进一步提升人工耳蜗的清晰度和可懂度达40%;和中国联通推出了联通网卡升级版,用于辅听和字幕识别,让听障人士不仅听得清,还能够看得清。
截至目前,腾讯已经帮助446万用户进行听力水平筛查、帮助35.1万畅听王卡用户提升语音通话和字幕识别效果、为超1.1万听障人士进行言语康复训练及发放耳蜗植入补贴等,为听障群体更好融入数字社会提供力所能及的帮助。
不仅如此。商世东和团队一直在思考,如何能做得更多一些,如何能覆盖到更多的听障、听损人士。
今年3月3日全国爱耳日上,“天籁行动”2.0升级版启动,将腾讯天籁AI技术开放给助听器厂商智听科技。腾讯会议天籁实验室和智听科技经过半年“背靠背”研发,诞生了天籁inside助听器。
申万宏源发布的《2022年助听器行业研究报告》指出,助听器的技术竞争正从“听得见”向“听得清”、“听得懂”转变,新技术层出不穷,助听器性能的好坏极大程度取决于数字处理算法的好坏。目前主流的核心算法包括啸叫抑制/语音增强、降噪算法/多通道响度补偿/回波反馈消除等,主要致力于降低机器及环境的噪音,增强语言的理解程度,提升患者满意度和体验感。
“在我们搭建的兼容国际IEC 60118和ANSI S3.22标准测试环境下,对助听器的六大关键指标进行了测量,系统延迟直接决定了整个助听器的佩戴体验,满档增益进一步决定了对中重度患者的听力补偿,语音质量、空间噪声决定了在安静环境下的音质体验,家居噪声和街道噪声则是听障老人平时花时间最多的场景。在这六大关键指标上,天籁inside助听器的表现非常出色。”商世东表示。
基于腾讯会议完全自研实现的助听器核心算法解决方案,天籁inside助听器将复杂场景下的语音清晰度和可懂度提升了85%。
商世东表示,天籁inside助听器还有很大的优化空间,比如双耳听学、场景识别等。“现在助听器用的是单边麦克风,两个助听器独立工作。因为头部的掩蔽效应,听障患者一个很大的痛点是没有方向感,我们希望在双耳助听器这方面能研发出专利技术帮助到厂商。”
他补充称,听障患者需要不同的配置识别不同的场景,安静的环境下、嘈杂的环境下,助听器的不同技术怎么来配合协调工作,都需要解决。
商世东说,通信服务的终极目标是原音重现,“为了保证通信体验的真实和自然,我们也会保留适度的底噪和相应的一些环境声音,鼓掌声、笑声在很多时候也是必要的。”
他希望,原音重现这一目标在助听领域也能够达成。“我们希望能够达成,我们也相信未来能够达成,这是一个长期的过程。我希望真的有一天,助听器能够像眼镜这样,实实在在地帮助听障人士解决听不见的问题。”
探索科技向善长效模式
腾讯创始人马化腾在2021年年底为腾讯文化出品的年度特刊《选择》一书撰写了一篇文章。他认为,现在我们面临新的蓝海,是一个由科技向善所推动的跨界创新的蓝海。在乡村振兴、适老化、碳中和等各个社会议题上,有很多还未被充分满足的社会需求,也是长久以来的社会痛点。
“怎么更好地利用和发挥我们现有的能力,把它们应用到更多更需要的场景中,为社会创造价值,这是我们正在努力思考的难题”,马化腾在文章中写道。
“天籁行动”正是腾讯科技向善的一个创新尝试和标杆。“腾讯具备技术领先性,又是有一定影响力、传播力的大公司,承担这方面的社会责任,和公司倡导‘科技向善’的原则相一致。多做一些互联网公司这方面的工作,帮助更多实体企业,用上更先进的技术,带来更好的体验,是一件有意义的事情。”商世东说。
事实上,“天籁行动”不仅限于向合作伙伴开放天籁AI技术,更在积极探索可持续的技术公益新模式,包括联合政府开展公益测听及老年义诊活动、成立“中国老龄事业发展基金会天籁银发关爱专项基金”、开展韶关等地区专项救助试点等举措。
今年4月28日,首期“天籁银发关爱基金”试点落地广东韶关。在韶关民政部门的支持下,腾讯会议天籁实验室在当地开展老人听力障碍预防、康复知识科普、听力筛查等相关工作,为500位家庭困难的听障老人免费提供带有天籁AI技术加持的助听器设备,进一步推动“天籁行动”探索技术公益的长效模式。
商世东透露,腾讯会议天籁实验室正在紧锣密鼓地推进技术公益,让更多、更大范围的公益行动落地,“2023年,天籁AI技术会更多地开放给厂商,一起合作,改善、提升体验,让助听器的价格保持在一个更加亲民的水平,让更多人受益。”
未来,腾讯会议天籁实验室还将继续携手合作伙伴,共同探索数字技术推动听力健康、改善用户体验的模式和实践,为更多听障人群提供更好的听力产品和体验,帮助他们更好地融入数字社会。
责任编辑:
标签: