北晚新视觉 > 热点 > 网摘

自主开发编程语言被指Python套壳?中科院回应了

2020-01-19 17:17 编辑:TF019 来源:北晚新视觉综合

近日,网上出现质疑“木兰”语言的信息。我所获知这一情况后高度重视。经所科研道德委员会初步调查,“木兰”语言系我所员工刘雷创办的中科智芯公司研发的面向青少年编程教育的集成化产品,该产品的开发包中包含了Python开源编译器,对外却声称“完全自主”。该行为存在欺瞒与虚假陈述的科研不端问题。我所已对当事人刘雷做出停职检查的决定,并就管理责任责令编译实验室负责人作深刻检讨。

我所正抓紧对该问题开展进一步深入调查,将尽快公布处理结果,并以此为戒加强管理。我所对由此造成的不良影响深表歉意,衷心感谢并诚恳接受社会各界的监督和批评。

此前消息:

自主开发编程语言被指Python套壳,中科院开发者道歉

中科院计算所团队“完全自主设计、开发和实现”的“木兰”编程语言是Python语言的套壳产品?针对近日这一网络质疑,1月17日,项目负责人、中科院计算所编译实验室员工刘雷在科学网上发表回应称,木兰语言在8位单片机上的编译器是本团队开发的,在32位单片机上的编译器是基于Python开源编译器进行的二次开发,但在接受采访中将木兰编程语言和编译器夸大为完全自主开发。

刘雷关于“木兰”编程语言的情况说明全文如下:

本人系中科院计算所编译实验室员工。基于我在编译技术上的科研积累创办了中科智芯(北京)科技有限公司,该公司围绕青少年编程教育,设计开发编程语言、编译器和集成开发环境等产品。

为了更好地在中小学中普及计算思维,本人带领团队开发了一种称为“木兰”的编程语言。它包含三个组成部分:一、在语言规范上借鉴了Lua语言的特性并进行了扩展,增加数据表达方法等新的特性;二、开发了支持少儿编程教育的可视化编程环境;三、针对8位AVR单片机,实现了相应的编译器和运行时系统,开发了能模拟多任务执行的虚拟机。以上产品已经在数百所中小学中,开展了10万人次的编程科普活动。

针对STM32单片机,我们是基于Python开源编译器进行的二次开发,也就是先将木兰语言的源程序转换为Python的中间表示(AST),再在Python虚拟机上运行。这就是在开发和运行环境中会包含Python系统的原因。

在1月15日接受媒体采访时,本人在对木兰编程语言的介绍中,犯了以下错误:

1. 木兰编程语言主要是用于中小学教育,在介绍中将它扩大到智能物联领域。

2. 木兰语言在8位单片机上的编译器是本团队开发的,在32位单片机上的编译器是基于Python开源编译器进行的二次开发,但在接受采访中将木兰编程语言和编译器夸大为完全自主开发。

对于此次在网络上造成的不良影响,本人郑重道歉,对给中科院、中科院计算所带来的不良后果表示诚挚的歉意。本人感谢大家的监督与批评,并深刻反省,保证不再出现类似问题。

此前,据中国新闻网等多家媒体报道,中国科学院计算技术研究所(以下简称中科院计算所)1月15日正式对外发布该所计算机体系结构国家重点实验室编译技术团队自主研发、面向新一代人工智能和物联网应用的“木兰”编程语言体系,并推出“木兰”开源软件包,供全球用户免费下载获取。

但随后网络上争议四起,知乎网友@沉迷单车就指出,从网络下载的“木兰”语言编辑器程序图标来看,与用著名编程语言Python生成的应用程序图标完全一致。“都不换个图标吗?”他问道。

澎湃新闻记者并未在中科院计算所或计算机体系结构国家重点实验室官方网站上找到“木兰”的发布信息,亦无下载链接。

“木兰”的下载渠道在一家名为“中科智芯”的公司网站上。据企业主页介绍,中科智芯(北京)科技有限公司是中国科学院计算技术研究所孵化企业,源中科院计算所计算机体系结构国家重点实验室而成立。

“木兰”编程语言是该公司的重点产品,企业介绍称,“木兰”是“专为人工智能教育而生的中国自主知识产权编程语言,由中科智芯自主研发。语言设计上屏蔽了其他任何一种针对成人设计的编程语言特性,如编程环境调试复杂等,让学生在编程语言学习之初不为细节所牵绊,具有更易理解、易于学习、易于阅读、易于维护等特性;且支持跨平台,对Android、UNIX、Windows都可以很好的兼容。”

有计算机业内人士对澎湃新闻记者表示,从目前能掌握的情况来看,“木兰”语言更像是Python语言的“套壳”产物。“这个软件就是在Python语言外边套了一层壳,还是比较简单的那种,相当于一个接口,连图标都没有改。”

“对这个exe文件进行反向编译后可以发现,整个结构就是Python环境,比如其中有一个‘lib2to3’文件夹,就是只有python才会有的,是转换python2到python3的lib。”上述业内人士对记者表示。

不过,上述业内人士也对记者表示,“还是要看‘木兰’的源代码,才能确定这个语言到底有多少自主研发成分,以及多少是来自Python语言。现在从公司网页上无法看到源代码,也就是说还没做到完全开源。”

据此前报道,刘雷介绍称,“木兰”是中科院计算所团队完全自主设计、开发和实现的编程语言,与之配套的编译器与集成开发工具也完全由团队自主实现,“是我们真正掌握核心技术的编程语言”。

其介绍称,“木兰”定位为下一代重要应用——物联网应用开发语言,打造物联网智能执行平台,其采用最新的编程语言设计理念和编译技术,在考虑性能的设备处理层,它提供面向轻量级物联网设备和领域特定专用加速器的编程特性;在应用层面,它提供面向通用计算设备的编程语言并支持多种领域的定制化元编程。

据了解,以“木兰”为基础延伸的自主研发编程软件、人工智能教材、教学装备现已投入中小学、幼儿园使用,截至目前,“木兰”应用范围已涵盖中国18个省市共700所中小学。

工商信息显示,中科智芯(北京)科技有限公司持股70%的大股东是中科编易(北京)科技有限公司,而后者的大股东正是刘雷。

中科院计算所计算机体系结构国家重点实验室网站显示,刘雷,博士,工程师一级,在编程语言和并行编译技术方向上具有丰富的科研和工程经验,先后承担过国家863项目、核高基重大专项项目的子课题,所研发的技术成果达到世界先进水平,在多个顶尖的国际会议和权威期刊上都发表论文10余篇。其开发的自动并行化编译器的加速效果要明显好于世界上最好商用编译器Intel编译器。

Python在1991年由荷兰人Guido van Rossum发明,是一种跨平台的计算机程序设计语言,近几年因机器学习大热而受到关注。

光明日报评论:

光明网评论员:夏娃能成华夏娃,大蟒焉不成木兰

1月19日,有媒体报道说,针对近日有人质疑中国科学院计算技术研究所所谓“完全自主设计、开发和实现”的“木兰”编程语言不过是Python(一种编程语言,词有“大蟒”之意)的套壳产品这一说法,中科院计算所团队项目负责人回应称,“木兰语言在8位单片机上的编译器是本团队开发的,在32位单片机上的编译器是基于Python开源编译器进行的二次开发,但在接受采访中将木兰编程语言和编译器夸大为完全自主开发”,“对于此次在网络上造成的不良影响,本人郑重道歉,对给中科院、中科院计算所带来的不良后果表示诚挚的歉意。本人感谢大家的监督与批评,并深刻反省,保证不再出现类似问题”。

这个道歉声明,可能是最近一段时间内出现的类似现象中的当事人所发出的相对诚恳的道歉。编程语言,虽为小众范围的语言,但恰因如此,鉴别、判别其原创性,证实或证伪其独创性也相对简单。中科院计算所于15日刚刚对外发布其“计算机体系结构国家重点实验室编译技术团队自主研发、面向新一代人工智能和物联网应用的‘木兰’编程语言体系”,并推出“木兰”开源软件包,立刻就有人在社交媒体上指出“木兰”的语言编辑器程序图标与用著名编程语言Python生成的应用程序图标完全一致。

好在有了上述道歉,否则,这款号称“专为人工智能教育而生的中国自主知识产权编程语言”最终会引出什么样的官司也实难预料。现实中,不是有“创造”了和著名商标一模一样的商标,反而要求后者赔偿并得手的例子吗!因此,也好在道歉者吸取了汉芯事件中的造假者买来芯片用砂纸打磨掉原商标图案、印上汉芯标识以充创新的教训,并没有改动Python生成的应用程序图标,而“就是在Python语言外边套了一层壳,还是比较简单的那种,相当于一个接口,连图标都没有改”,这样才遂使事情变得简单。

“木兰”也好,“大蟒”也罢,在现实中所能起到的作用并没有什么太大的差别。“大蟒”不会因为换了个马甲而有了那些天花乱坠的新功能,“木兰”也不会因为套了层壳就能反吞“大蟒”隐其于腹。为Python加了层壳也是一种工作,但是将“语言设计上屏蔽了其他任何一种针对成人设计的编程语言特性,如编程环境调试复杂等,让学生在编程语言学习之初不为细节所牵绊,具有更易理解、易于学习、易于阅读、易于维护等特性”,说成是“完全自主设计、开发和实现的编程语言,与之配套的编译器与集成开发工具也完全由团队自主实现,‘是我们真正掌握核心技术的编程语言’”,作为专业科研工作者,就不是顺嘴胡说那么简单。

Python语言的使用,其开发者并没有对此做出什么特定限制,看得懂、用得着的人大可拿来大大方方、踏踏实实地使用。非要将其加上层壳,而后将其名字从“夏娃”改成“木兰”,再加持上什么“自主研发”“核心技术”概念,由此就好像带上了自豪感的光环,由此便可实现加壳者真正的目的了。这也正如报道所说,“木兰”的下载源设于一家名为“中科智芯”的公司网站上,中科智芯(北京)科技有限公司则是中科院计算所的孵化企业。既为企业,就要做生意、讲业绩:Python变身木兰后,“以‘木兰’为基础延伸的自主研发编程软件、人工智能教材、教学装备现已投入中小学、幼儿园使用,截至目前,‘木兰’应用范围已涵盖中国18个省市共700所中小学”。

来源:综合中国科学院计算技术研究所、澎湃新闻、光明日报

流程编辑:tf019

相关阅读

北晚新视觉网版权与免责声明:

一、凡本站中注明“来源:北晚新视觉网或北京晚报”的所有文字、图片和音视频,版权均属北晚新视觉网所有,转载时必须注明“来源:北晚新视觉网”,并附上原文链接。

二、凡来源非北晚新视觉网或北京晚报的新闻(作品)只代表本网传播该消息,并不代表赞同其观点。

如因作品内容、版权和其它问题需要同本网联系的,请在见网后30日内进行,联系邮箱:takefoto@vip.sina.com。