也说Google拼音输入法

2007-04-05 10:57:28 来源: cnbeta 网友评论 0 进入论坛

Google输入法终于发布了,在我预测的Google中国新产品又一项变为了现实.而今天对于搜狗输入法也必将是重要的一天,一个强大的有些可怕的对手出现了,因此出现Google输入法盗用搜狗输入法词库的传闻也就不足为奇了,我这里说说自己的看法.

关于盗用的证据主要体现在两个方面,一是据说为了搜狗的词库防止盗用,在搜狗词库建立之初就加入了词库指纹,即十几个很偏僻、但不影响输入的词汇,里面还包括有数位搜狗员工的名字.而Google输入法中能准确的打出这些词汇.二是一些词语的注音错误,在搜狗中发现并已经更正的错误又出现在了Google输入法中.

个人认为仅靠这两点是不足以说明Google盗用了搜狗的词库.因为Google输入法与搜狗输入法都是充分的利用网络词汇作为词库,而取词都是来自于网络以及用户进行搜索的关键词,因此在词库上具有相似性是很正常的一件事.而是否存在搜狗所谓的词库指纹我也是持怀疑态度的.

让我们举词库指纹的一个例子来说明,比如这个茹立云.在搜狗与Google中均是ruliyun这个拼音的首选词,通过搜索可以发现,茹立云是搜狗的一名员工,据此搜狗便说这是他们此前的词库指纹,认定Google抄袭.在Google中搜索茹立云,可以得到44个结果,而且结果中都是关于茹立云的一些介绍,匹配度达到了100%,也就是说的确存在茹立云这么一个人.而如果是输入如立云的话,只有18项结果,而这些结果都没有100%的匹配,都是些回廊殿宇如立云中,景色奇伟之类十分生硬的分词结果,也就是说网络上根本就没有如立云这样的词存在,因此Google输入法当然不会将其作为首选词,这也充分说明了Google输入法的准确性,而搜狗输入法还需要加入所谓的词库指纹,也就是人工的加入这个词才能将茹立云这个真实的人名作为首选词,孰好孰坏已经十分清楚.

再说词汇的注音错误的问题,其实这个更容易反驳.搜狗输入法也曾经有过这些错误的注音错误,只是现在人工改正了过来.这说明这些错误是因为通过网络词库,网络取词而造成的,而同样的,Google输入法也是网络取词,因此出现同样的错误也是很正常的.错就错在Google对竞争对手的关注太少,没有汲取对手的教训,而被对手抓住把柄.

基于以上几点,关于Google输入法盗用搜狗输入法词库的问题无非是搜狗在面临强大对手时的无赖之举,而Google输入法不要被这些东西纠缠不清,踏踏实实地加紧开发进度,解决目前已发现的bug,因为你离我想象中的还差很多.

学习更多知识与技巧 请点击 网易学院 陈刚

本文来源:cnbeta
我来评两句
我的灌水记录
匿名发表
tech
精彩推荐

今日网易科技看点


39健康网_中国第一健康门户网站
商业推荐

排行榜

今日网易财经看点


主编信箱 热线:020-85105316 给网易提意见 
About NetEase - 公司简介 - 联系方法 - 招聘信息 - 客户服务 - 相关法律 - 网络营销
网易公司版权所有
©1997-2008