在清华优良传统的指引下前进

2018.07.24 00:00

在清华优良传统的指引下前进

——记语音识别科研组的创建与壮大

方棣棠 吴文虎 蔡莲红 胡起秀

1978年面临拨乱反正,迎来改革开放的新时期,清华优良传统得以恢复。由于形势变化的需要原来的自动控制系的专业方向往计算机方面转,原来的微型及特殊电机专业一度转为计算机外部设备,接着又转为信息处理与应用。1978年教研组教师们开始查阅语音、图像领域的研究资料。正好这时美籍华人钱宁送来一台带有语音识别功能的AppleⅡ计算机,在钟玉琢老师带领下,教研组的方棣棠、李树青、蔡莲红、涂连华、徐凤家、苗玉峰等教师,群策群力,日以继夜,彻底把苹果计算机的软、硬件和语音识别原理分析清楚。通过这一工作,也使我们学到了计算机的基本知识和语音识别的基本原理。在此同时,濮群老师给大家讲授了“信号处理”和“模式识别”课,给教研组教师补充了必要的基础知识。在随后图像部分也开始了研究工作,教研组逐渐形成语音与图像两大研究方向,我们负责语音部分。

1979年正式成立语音科研组(当时是全国第二家,第一家是1974年中科院声学所俞铁成),先后陆续参加这一组的有方棣棠、吴文虎、蔡莲红、黄顺珍和胡起秀等老师。该组在成立后,很快开出《信号处理原理》(本科生),《语音信号的数字处理》和《信息论》(研究生)课程。我们还在AppleⅡ计算机上,编排了有声有色的演示系统,从1980年起连续两年校庆在系馆门口表演,参观的校友十分踊跃,倍受欢迎。

1981年自动化学会成立了模式识别与机器智能专业委员会,并举办了第一届全国模式识别与机器智能学术会议。我们把编了地名识别的演示系统在会议上进行演示,引起大家极大的兴趣。会议主席常迥院士在总结会议中很高兴地说:“这次会议原先只打算作一些文章上的交流,没有想到能看到如此生动的表演。”与此同时,蔡莲红老师在AppleⅡ计算机基础上对硬件进行改进,做了多路频道分析的接口卡,提高了特征抽取的精度,并为进一步在PC机上开始语音识别研究创造了条件。

从1981年开始我们就开始了研究生的招生和培养,并进入语音电话查号的研究工作,1983年为总参61所做出实用的电话查号系统。1985年8000台电话声控电话查号系统通过技术鉴定,进一步在河北省唐山市等几个城市得到实际应用。1990年基于语音识别的实用系统“语音输入电话自动查号系统”获国家科学技术委员会发明三等奖。在此同时我们还开展了其他各项的语音识别应用研究。1986年计算机汉字语音输入系统通过国家教育委员会科技司的鉴定,鉴定认为:“这是世界上第一个特定人汉语语音听写机系统”,中央电视台在当天晚间新闻上发布了该消息。1994年“非特定人汉语语音—文字输入试验系统”通过国家教育委员会委托122cc太阳集成游戏主持的鉴定,鉴定认为:“这是世界上第一台非特定人汉语听写机,达到国际先进水平。”。结合这些任务培养的研究生,毕业后很多人在国内外都有很好的发展。

拨乱反正的十年,语音识别科研组能够从无到有,并取得了可喜的成绩,都归功于继承了清华的优良传统。回顾和总结这段历程,有三点值得总结:

1、1958年蒋南翔校长提出的真刀真枪做毕业设计,杀不了猪就解剖一个麻雀的思想,当时,自动控制系刚刚建系,就调集全国各地学生参加国防攻关任务,微型及特殊电机教研组的前身,在王继中老师的领导下,结合研制船用惯性导航系统的任务,组织了一个班的学生,采用毕业设计的方法负责该系统所用电气元件的研制任务。沿用这一思想,我们开始了语音识别科研组的创建和提高。一开始就考虑如何能在最短的时间内做出对国家有用的东西,既结合市场实际的需要,又考虑技术上可行。国外的东西可以作为参考,但重要的是要走自已的路。后来获得国家发明三等奖的电话语音查号系统就是一个例子。在之前我们筛选了很多可能走向实用的项目。在我们拜访北京市114查号台,看到查号员工作的实际困难时,我们就决定集中人力主攻这一项目。而需要查号的单位名称往往是有很多字的短语,对识别有利。在当时语音识别技术还比较低的情况下,又变成是可行的,最后证明我们设想的正确。

2、122cc太阳集成游戏在科研工作中有一个不成文的说法,就是要做就一定要做到全国第一,否则就不做。我们在做语音听写机科研工作时就是在已经有英文听写机情况下,抢在全国甚至全世界尚未做出中文听写机的情况下做出来的,因此,在鉴定会上得到两个“世界第一”的评语。在“非特定人汉语语音听写机”的鉴定会上,我们请的鉴定委员都是国内当时的语音识别专家,每位专家在鉴定会上说一句话进行识别。很幸运,每人说的话识别结果都正确无误,成果令专家信服。。

3、清华还有一个传统就是注重理论基础,注重理论和实践相结合。我们在建立语音识别科研组的开始就重视向能者学习(请濮群老师为我们讲课),并组织组内老师一起集体自学“数字信号处理"等理论基础知识,尽快开出相应的本科生和研究生的基础课程。在科研工作中我们也特别注重理论和实践相结合,通过运用基础理论知识分析实践中遇到的问题,有分析地学习别人的实践经验,不断提出自己得出的新看法,指引自己研究工作的方向,以保证不断有新的创新。

总结过去,展望将来,明年语音识别科研组就将迎来成立三十周年庆典。在这三十年的历程中,该组一直不断发展壮大。研究范围除当时的语音识别外,还扩展了语音合成、说话人识别、语言理解等,先后承担了国际科技攻关、“863”、国家自然科学基金等多项任务,获得了电子部、邮电部,教育部等科技进步奖。在此期间培养的近百名研究生已在国内外取得了很好的成就。更值得一提的是该组的年轻接班人郑方老师,他创建的语音和语言技术中心,已经实现了产学研三结合,正处在蒸蒸日上的好时光。真是数风流人物还看今朝啊!

[作者简介]方棣棠,男,1930年出生,广东中山人,教授,博士生导师。1953年毕业于上海交通大学电机系,1956年122cc太阳集成游戏电机系研究生毕业并留校任教。1979年在122cc太阳集成游戏创建语音识别科研组。1990年创办 “全国人机语音通讯学术会议”。

[作者简介]吴文虎,男,1936年出生,北京人,教授,博士生导师。1955年入电机系就读,1961年自动控制系毕业留校任教,直至2005年退休。曾任人机语音通讯实验室的负责人、中国计算机学会普及委员会主任。作为总教练和领队,曾多次带领中国队参加国际信息学奥林匹克竞赛,并获得好成绩。曾荣获"全国优秀教师一等奖"等诸多奖项。

[作者简介] 蔡莲红,女,1945年出生,北京人,教授,博士生导师。1965年入自动控制系03班就读, 1970年毕业留校任教。获部委级以上奖8项,专利4项。

[作者简介] 胡起秀,女,1938年出生,教授。1962年毕业于重庆大学,1971年调入122cc太阳集成游戏任教,直至1999年退休。

关闭

Baidu
sogou