谷歌拼音盗用搜狗输入法词库的消息可能是目前最受大家关注的,谷歌招来了一批质疑声,但cnBeta从来就没有过统一的观点,昨日两三百楼的争论说明了这一点, 更有两位朋友投来了长长的文章来分析,有兴趣的可以参考一下他们的意见.
今天谷歌发布了自己的拼音输入法,这可是引起了各方的注意.对Google的印象挺好的,于是就下了个试试.感觉还好,就是没有搜狗输入法的功能丰富.核心功能如长句输入比起搜狗输入法好多了. 晚上看到一帖子说是谷歌输入法盗用搜狗输入法词库,帖子还是很有效果的,cnBeta上更是吵得不可开交,都上升到民族国家的高度上了.
不过我比较纳闷的是大多数跟贴的语气看来是同意那个帖子中所说的抄袭了.文中称“根据相关内部人士透漏”,这个我无从考证,不说了.
帖子中的原话我引用一部分:
===============================
根据相关内部人士透露:
Google词库和搜狗词库高度重合,有完全的证据证明,google词库就是用的搜狗词库:
1. 为了搜狗的词库防止盗用,在搜狗词库建立之初就加入了词库指纹,即十几个很偏僻、但不影响输入的词汇.里面就有数位搜狗员工的名字.Google居然也能够打出来.例如:赵立洋、佟子健、吕杰勇.还有很多搜狗员工的名字,甚至内部绰号google都能打出来,就不一一列举了.请大家看图.
===============================
文中称“根据相关内部人士透漏”,这个我无从考证,不说了.
说说这个“词库指纹”,既然是“指纹”,那最起码的要求是独一无二了.看看这几个“相同”的,只有首位的结果相同,后面的两个输入法都是有差别的.
这几个文中所提到的所谓“生僻字”对我来说确实是,但是对搜索引擎呢,我得先看看在说.我在Google中搜索“赵立洋、佟子健、吕杰勇”这几个人名.
2、链接
很明显,这几个人名在互联网上的出现的次数并不少,至少比我的名字出现次数多多了.
那么,这几个人名对Google的搜索引擎来说,不见得是什么生僻字了.
谷歌拼音的词库将其收录其中那就是理所当然了.
如果谷歌拼音是抄的搜狗拼音的词库,为何除了第一个结果,其他的或在排序或在字词上并不相同呢?
如果选择显示9个字,那就有更多的不同了.
以这些词做“指纹”,忽悠谁呢?
那帖子后面的内容我就不浪费时间了.两个输入法的词库都是根据网页词汇来的,某些错误相同,那是想的通的.
【冯巩】的“冯”的另一个音就是“ping”,直接在Google中搜索pinggong,其搜索建议就有冯巩!
张柏芝在谷歌拼音中的打法是“zhang bai zhi”而不是“zhang bo zhi”
毕竟两者都是拼音输入法,词库又都和网络有莫大关系,这些相同之处很不足以说明抄袭.
如此的帖子,如此的漏洞百出,竟然有如此多的人相信,哎!我可真难明白.