发表日期:2006-12-02
更新日期:2006-12-02
作者文章阅读次数:466
源自:如水随风 (个人网站) 标签:.net
您认为本文应该得 打印|收藏|讨论|投诉
在多位好友的鼓励和支持下,终于利用断断续续的业余时间完成了多维拼音输入法的界面库,加之曾经完成的拼音语言模型库,估计年底前可以出来beta版本。我在此输入法中加入一些有趣的特性,希望能打破传统输入法的套路,毕竟我是从事语言处理工作的,让模型贴近人类使用语言的思维方式是我最终的目标。
多维的含义
谓之多维,是希望拼音输入法可以从更多的角度来处理用户输入,就像人在面对一个问题的时候,总是要从诸多方面进行考虑,这也就是所谓的智能。当然,智能一 词过于复杂,也过于宽泛,对于输入法而言,其智能应该在于其具有敏捷的学习功能,在于语言模型的鲁棒性,并能让用户感觉面对的是一个活物,不要那么机械, 这大概也就是多维拼音输入法的目标。值得一提的是“多维”一词,也是我昵称dave的谐音:)。
新特性
根据计划,多维拼音输入法应该会具有一些有趣的特性,之所说是有趣,并不代表它一定会受用户欢迎,只是我个人的一些关于语言处理的ideas(当然它肯定也具有现有输入法所应该有的特性):
1. 支持整句输入,提示前面n个近似结果句,n不会超过3,否则就难看了。
2. 同时支持输入拼音,以及转化汉字结果的智能预测,并进行提示。
3. 支持字音以及字型结构的混合输入,此项属于我个人发明范畴,但所有权不一定归我,未知是否可行。
4. 一些很有意思的智能特性,因仍未申请专利,暂时保密,以防剽窃。
linux版本将设计为网络词库同步训练,多人协同工作模式,并以网络服务方式提供。
源代码
多维拼音输入法系统界面库采用 win32 c++编写,基本上以面向对象的方式封装(讨厌win32 c程序那种凌乱的处理方式,全局变量满天飞),main程序以及ime接口部分遵循win32消息处理机制代码编写风格,详细技巧可以参考blog上我撰写的 关于输入法编程心得的文章。作为开源的坚定支持者,多维拼音输入法的界面库将在我souceforge目录下进行公布,同时语言模型引擎接口也将公开(因 为专利以及词库版权的问题,引擎库代码库暂不会公开),以方便输入法爱好者可以选择编写自己的界面库,或者自然语言处理研究者可以避开书写界面库的烦琐, 直接用自己的语言模型库替换掉现有的来进行自己的研究或者玩乐。