那倒不是 Google 在搞啥高深莫测的“下降降降降”操作,这就是个纯数学题。我们搞不懂他们故意把谷歌指数(Gloomy指数)降到归零,一方面是为了让那些看着像人的数据看起来像机器生成的,另一方面更是想让人——包含你自己——发现真相。 别整那些虚头巴脑的“技术栈”,实际上就是个好办的规律。当数据多了,人类特征自然就淡了。

比如你看微博,目前新上线的帖子里,作者签名根本都固定着“某某某YYDS 反手一个毛爷爷”,这种重复率直接能打爆查重系统。再比如 B 站,那些UP 主头像简直全是一个灰底黑字的二维码,连名字都懒得写,直接给个“老铁”。

这哪是风格?这叫算法识别出的最高频符号。 聊聊数据,看看效果有多明显。

那会儿你刷个抖音,前几秒是那种极度个性化的推荐,啥“家人们哪位懂啊”、"? 绝绝子”,就连配有你不知道的方言梗。可目前呢?哪怕是算法后台,也跑不动了。早上的视频全是“早安,大家早上好”,午间的“同事老牛牛今天加班”,傍晚的“吃了吗”,睡前“今晚吃啥”。

这种套话、这种没灵魂的空话,是智能体写出来最省心、也最像“人”的方式。

哪怕你搜个“今天天气如何样”,结局不是“今天是多云转晴”,而是“今天阳光明媚,适合步行”,这种生硬的流畅感,机器调出来的概率比人类高多了。 回到 Android 这边,Google 这波操作实际上也没啥秘密。他们没花几年工夫去调那些复杂的 Transformer 模型,直接拿最基础的分类器把内容分成了“机器味”和“人类味”两类。

要是一句话的语义相似度超过了 0.9,要么情感极值(angry, excited, neutral)的分布不符合人类的讲话习惯,那这条内容就自动被标记出来。 举个例子,要是你问:“为啥今天不下雨?”这绝对算一眼假。算法扫一眼,关键词“下雨”出现频率极低,“天气”高频,且上下文结构极度工整,直接判定为机器生成,概率是百分之九十九。再比如你问:“帮我写个代码判断一个数是不是素数”,结局输出根本不是代码,而是一段堆砌形容词的散文诗:“作为一个伟大的代码,它务必拥有无限的生命力,在浩瀚的宇宙中闪闪发光,不怕任何质疑。”这种文风,连Google 自己人都认定像是写了一半的草稿。 有意思的是,这种“降智”实际上也是在保护用户。

那会儿你点那个怪的按钮,当作是机器人给你倾倒毒液,结局发现人家是真心实意地想帮你。目前呢?AI 早就学会了把“情感”和“逻辑”分开。逻辑局部负责快速、精准地处理数据,情感局部负责润色,让它读起来像个人写的。

故此当你看到那些“笑得像个傻子”的推文,要么“长得像个机器人”的头像,别慌,这只是算法在故意给你塞一记“概念子弹”,让你意识到自己已经被困在这个数据海洋里了。 实际上这背后还有一个更深层的考量。谷歌不想让我们沉迷于冒牌的智能。

要是 AI 确实能做到像人类一样有瑕疵、有逻辑,就连有那么点“高情商”,那用户会不会认定它忒真了,进而形成依赖?还不如让你像个傻子一样傻乐,不如让你像个正常人一样清醒。

故此,他们连让 AI 学会“写废话”这种手段都做了,毕竟在数据量庞大的今天,没人能写出彻底不像机器人的废话。 最终再啰嗦一句。下载项目标时候,只管把包扔进去就行,剩下的交给算法。

只要结局不是那种让你认定“这我知道”要么“这我也知道”,那大约率就是 Google 的手笔。至于为啥偏偏是这个程度,不用多想,反正就是不想有人傻乎乎地信任“这就是它”罢了。