谷歌正在解决敏感词的烦恼
两年前的一个深夜,我独在网络上徘徊,遇见S君,前来问我道,“先生可曾知晓您的名字已经成为Google的敏感词?”我说“没有”。他就正告我,“先生去试一下吧,Google搜索引擎已经把您的名字屏蔽了。同时,L君和O君的名字也被屏蔽了。” http://www.sjzhunjia.com.cn/hunsha/
看到这个消息,我暂时性地短路了。S君的头像又在一闪一闪的,点开来看:“先生干什么出格的事儿了吗?有啥需要帮忙的吗?”
于是我大脑里立马闪现出《非诚勿扰》电影里葛优在教堂里忏悔的那个镜头,从小时候偷鸡烤来吃开始算起,到借看手相摸女同学小手,再到…………没有什么能上纲上线的大事啊,总体还算良民一枚啊。
怎么回事呢?于是想到了万能的微博:http://www.sjzhunjia.com.cn/
微博果然万能,答案很快知晓。比如李开复的回复:“不是你,是你的姓。我也一样。”原来,是因为我姓“刘”了,而且有个官员也姓刘。好吧,姓刘的所有人名都不能在谷歌里被搜索了。
这个时候,谷歌的敏感词词库在不断的壮大,对于用户来说,于是经常碰到“无法显示此网页”的错误提示。这还不算啥,更为糟糕的是,当出现这样的错误提示之后,在之后的几分钟内,你,就别想再使用Google搜索了。
对于用户来说,一切都是未知的。于是,不知情的用户们把所有的愤怒都尽情的洒向了谷歌,痛斥着谷歌的不稳定,传播着谷歌的不可靠。
消息源源不断的被反馈到了谷歌,他们坐不住了。
据谷歌知识高级副总裁艾伦·尤斯塔斯(AlanEustace)昨天的文章透露,“经过长期严格的自我系统检视,我们未能找到任何问题。”这说明,全世界技术最NB的这家公司,发现这个问题不是他们造成的。“然而,在认真研究用户使用报告后,我们注意到这些连接中断与搜索某些特定字词有着密切关联。”
于是,谷歌开始着手解决这些敏感词带来的烦恼。昨天,这个新玩意上线了,他们是这么解决的,比如搜索我的名字:
用户搜索时,谷歌会给出一个提示:“请注意在中国大陆搜索[刘]很可能导致用户与谷歌的连接暂时被阻断。此阻断并不受谷歌控制。”
如果我是外交部的官员,这个时候应该会特别愤怒,因为谷歌的提示明显山寨了他们的口气。不管如何,谷歌想通过这个提示撇清自己的责任。
同时,谷歌会醒目的用黄色字体标出到底是哪个字词出现了问题,成为了敏感词。比如,图片中的“刘”字。
用户如果要一意孤行,点击“仍然搜索”,那后果跟从前一样惨。如果想要结果,那就修改查询字词,比如换成汉语拼音“liuxingliang”。
通过这个方法,谷歌想尽量减少由于敏感词而带来的搜索中断,从而给中国大陆的用户带来更好的搜索体验,同时,也尽量少的挨骂。
作为一个中国大陆的用户,对谷歌的这种“不抛弃不放弃”的精神深深感动。但是,谷歌的这个新玩意也会带来另一个直接的后果,这个后果会让一个群体很难堪。是哪个群体呢,有些事不能说太细,试举一例:
作为一个正常的用户,这个时候肯定会破口大骂:草泥马,因为一个人就连“江苏”都不让搜索了?
唉,谷歌啊谷歌,你这样做,把一切都大白于天下,让那个群体,情何以堪啊!