北晚新视觉 > 新闻 > 科技

手语迎来AI翻译机 助力听障人士无障碍沟通

2019-05-16 13:53 编辑:TF011 来源:北京晚报

“科技向善,助力无障碍沟通。”一名听障人士面对普通摄像头做出以上手语表达,无需特意停顿,翻译机屏幕界面便迅速将一连串手语动作转化为文字,让普通公众也能“看”得懂手语,与听障人士正常交流……

5月16日,在全球无障碍宣传日上,腾讯优图实验室宣布攻克AI手语识别技术挑战,联合深圳市信息无障碍研究会推出了“优图AI手语翻译机”,致力于用人工智能基础为听障人群搭建无障碍沟通平台。 自动将手语翻译成文字 “手语翻译技术的核心是手语识别(SLR),通过计算机算法,可以自动区分手语表达中的各类手势、动作,并支持手势和动作之间的切换,最终将手语实时翻译成文字。”腾讯优图研究员阳赵阳告诉记者,以往也有一些团队探索过用人工智能技术环节听障人士沟通障碍,但往往需要借助一些额外的设备或传感器,不仅增加了用户使用门槛,也无法保证对复杂手语的识别率。

记者了解到,由于手语特有的地域性、复杂性和多样性,手语识别技术即使在深度学习的帮助下也仍存很大挑战,难以实际应用。“为此我们在自研算法上下了很大功夫,除了手势识别、动作识别外,还加入了序列翻译等技术,力求包含来自不同地域的听障人士在手语表达上的不同习惯与速度,同时让用户表达时候可以连贯将整个句子表达完,无需特意停顿或设定特定起始或结束动作。” 解决听障服务短缺需求 世界卫生组织最新数据显示,目前全球约有4.66亿人患有残疾性听力损失,超过全世界人口的5%。据北京听力协会2017年的预估数据,国内残疾性听力障碍人士也已达到7200万。“虽然我国在信息无障碍领域的投入不断增加,但听障人群的一切需求仍得不到满足,尤其是公共环境设施、服务体验等方面。”深圳市信息无障碍研究会秘书长杨骅表示,据有关数据统计,我国目前致力于听障者专业服务的人士仅约有1万名,大部门公共服务并未配备专门的便利设施。

“我们希望将计算机视觉人工智能技术应用到手语识别场景,利用手语翻译机能实现整句识别和翻译的特性,将听障人士的手语快速识别翻译成文字,帮助解决公共服务中听障专业人士短缺的社会痛点。” 阳赵阳介绍称,目前优图实验室手语识别数据覆盖了近千句日常表达、900个常用词汇,是最大的中文手语识别数据集。 有望落地公共服务领域 “实验室将继续进行语料库的扩展和算法优化,进一步探索在机场、高铁、民政窗口等公共服务领域的部署场景,提供更加具体的无障碍沟通解决方案,为听障人士与普通人的日常交流提供便利。” 香港中文大学终身教授、腾讯杰出科学家贾佳亚教授表示,为进一步深入接触听障群体,了解手语和优化数据识别算法,腾讯优图实验室已和深圳市信息无障碍研究会成立AI手语识别联合项目组。

不过,贾佳亚也坦言,AI手语翻译机在落地中也面临不少挑战。“就目前来说,优图AI手语翻译机仍处于实际应用探索阶段。主要受三个问题限制,一是需要高性能计算机,二是复杂环境背景的适应性,三是语料库进一步拓展。这几方面的问题将在未来的升级和优化中重点解决。”

 

 

来源:北京晚报 记者袁璐 值班冯瑞

相关阅读

北晚新视觉网版权与免责声明:

一、凡本站中注明“来源:北晚新视觉网或北京晚报”的所有文字、图片和音视频,版权均属北晚新视觉网所有,转载时必须注明“来源:北晚新视觉网”,并附上原文链接。

二、凡来源非北晚新视觉网或北京晚报的新闻(作品)只代表本网传播该消息,并不代表赞同其观点。

如因作品内容、版权和其它问题需要同本网联系的,请在见网后30日内进行,联系邮箱:takefoto@vip.sina.com。