积跬步而致千里-记微软拼音输入法15周年
2018-06-11 来源:
积跬步而致千里
——记微软拼音输入法15周年
1984年8月5日,法新社发出报道:新华社派了22名记者,4名摄影记者和4名技术人员在洛杉矶奥运会采访和工作。在全世界报道奥运会的7000名记者中,只有中国人用手写他们的报道。
1995年,美国微软公司与中国国家语言文字工作委员会9月20日在北京签署合作备忘录,微软将支持国家语言文字工作委员会(国家语委),研究和开发中国语言文字相关项目, 以促进中文在电脑领域的普及和推广。同年微软发布的具有划时代意义的Windows 95,宣布正式支持中文输入法。古老的中国文字开始与最先进的信息系统结缘。
2008年,奥运会112年来首次来到了中国,一条条实时中文奥运报道直达全球华人。当中国的记者们用指尖而非笔尖传递着光荣与梦想时, 微软中文输入法的研发团队的工程师们已经开始为新版本的拼音输入法而冲刺。
十五年的承诺
1995年,李东加入微软在中国成立的第一支研发团队。她接手的第一个项目,就是微软中文输入法。“可能谁也想不到,并不引人注目的中文输入法,成为了微软在中国投资的第一个研发项目。”已经成为输入法项目负责人的李东笑说,“当时我们团队有6个人,今天已经发展到57人的规模”。这个团队正在为亚太地区的多个市场开发各语种的输入法。
1996年, 比尔·盖茨来到中国,在钓鱼台国宾馆,他向各部委的领导演示了第一个版本的微软中文拼音输入法, 展示了微软在中国第一个研发项目投资的成功,也带来了未来在中国长久发展的默默承诺。
要让古老的中国文字与基于二进制代码开发的现代软件结合,殊非易事。语料的采集、语句语义的分析、用户习惯的调研等等,都是一项项的空白。与学术界的合作,成为研发的突破口。1995年,微软与哈尔滨工业大学开始合作,双方成立联合语言语音实验室,主要从事中文语言处理研究。 2006年7月,微软与哈工大又合作成立了哈工大教育部微软语言语音重点实验室深圳分室,与本部的实验室在统一的运作模式下南北呼应,互相支持和协作。
“我们当时找到了国内在自然语言处理领域权威地位的哈工大, 与李生和王晓龙等著名教授合作,开发了微软拼音输入法。微软拼音输入法的特点,是语句级智能,这与当时的词语级智能相比,是个极大的科技进步。”李东介绍说,“换句话说,就是进行整句输入,系统会自动分析自动校正相应的汉字,整句的拼音输入完了,相应的汉字整句也生成了,正确率相当高。” 经过若干版本的演进,微软拼音输入法风靡一时。
“从1995年开始,微软就不断投资,长期和国家语委合作开发语料库,并且参与到国家语委的标准化研究中。”李东说,“此外,为了提高微软拼音输入法的词库质量,我们还长期与国家名词审定委员会权威专家合作目前形成了58个高质量的专业词库。比如很难的医学语句,一次性输入成功率非常高,在许多专业领域, 微软拼音输入法都成为学者们工作中的必需工具。”
还让李东引以为豪的是,1997年香港回归前后,她主持开发了繁体汉字的拼音输入功能,并且获得了专利。从此,微软Office的用户,就能毫不费力的进行繁体或简体的汉字输入和相互转换,推动了大陆与香港地区的文化融合。而微软拼音输入法台湾版本的成功开发,同样支持简体或繁体的汉字输入转换,也促进了两岸的文化交流与合作。
宁静致远
中文信息处理技术进步的程度如何,决定着中华文化(包括传统的和现代的)继承、发展和弘扬的速度、范围和质量。对文化的传承,绝非一朝一夕之功。
相比于当时市场中的各类中文输入法来说, 微软拼音输入法的市场宣传推广几乎可以忽略不计。然而,微软的投入却一直未减。其中投资方向之一,就是投入到了对中国少数民族文字的支持上。微软认为,少数民族文字也是中华民族文化的重要组成部分,而其数字化也将推动少数民族文化在新时代的保留与发展。微软的Office办公软件,还进一步考虑到了少数民族文字(蒙文、藏文、傣文等)的排版需求——竖排且从右到左书写的方式。
“从2006年互联网的兴起以后,可能大家感觉到微软拼音输入法的进步有些滞后了。”李东坦言。“其中原因之一,是我们的开发周期长,因为要配合每一代的Windows和Office系统,必须得经过全球36种语言的严格测试,不同应用系统的兼容性测试、安全性可靠性的全面测试、国家标准认证测试, 才会上市。”此外,微软还花了大量时间,与高校、国家语委、行业语言专家等开展基础性研究工作。”我们现在已经基于互联网平台,加大了产品的更新力度。”
除了与国家标准规范部门合作外,微软还非常重视用户体验。每年,微软拼音输入法的消费者调研都要进行几轮,调研方式包括邀请用户到微软实验室进行实际测试,以及对重点城市的消费都进行问卷调查。除此之外,微软还邀请用户把错误报告发送给微软,以便在下一个版本的开发中改进。十五年来的默默耕耘和积累,让微软拼音输入法在Office 2010版本中再放光彩。
积跬步而致千里
经过2年多夜以继日的开发,微软拼音输入法2010版有了许多新的提升,比如更加准确的智能,而且整句输入准确率更高。输入法的词汇库也大量扩充,特别补充了当下流行网络词汇库并且支持词库自动更新, 使用户可以保持与网络文化的与时俱进。除了网络词汇外,微软拼音输入法一直在行业专业词汇领域保持领先,通过与各行业专家的长期合作,收录了最为全面的行业专业词汇库。最新的开放词典平台,使各行业用户可以创建并分享不同的专业词库。 此外,微软拼音输入法2010的性能有了大幅提升,启动更迅速、反映更灵敏。
为了及时吸纳用户的需求和反馈,微软拼音输入法提供了完整的价值创新链条:对于新词、错词,用户可随时反馈给微软,输入法能够定期自动更新。为了更准确把握用户需求、了解用户习惯,微软亚太研发集团的同事们努力钻研网友的聊天习惯,甚至跑到网吧去了解网吧用户使用输入法的习惯等等。
在这个信息科技时代,中文输入法的意义已远远不仅限于文字输入。随着中国国力的增强和国际交流的增加,越来越多的外国人开始学习汉语。在此情况下,中文信息处理将促进对外汉语教学。而对内也有助于巩固和提高基础中文教育,曾几何时,国人开始提笔忘字,需要靠拼音输入法找回模糊的记忆?
“十五年来,正因为有微软对中国市场的长远承诺, 我们才推动了拼音输入法的不断升级。也正因为这种努力,带动了国内这个领域软件的蓬勃发展。回头来看,这对中文信息处理的演进做出了历史性的贡献,有幸能成为这个团队中的一员,我很自豪。“ 李东说,”“未来,我们会继续做出更大的努力,奉献给大家更精彩的输入法, 提供给用户更完美的计算机交互体验”。
标签: 安全 标准 代码 互联网 互联网平台 美国 推广 网络 行业 用户
版权申明:本站文章部分自网络,如有侵权,请联系:west999com@outlook.com
特别注意:本站所有转载文章言论不代表本站观点!
本站所提供的图片等素材,版权归原作者所有,如需使用,请与原作者联系。