先是收到了一条下发通知。通知内容写的略随意,少了一个空行。但现在可能已经改进了。
好事多磨,又稍微等了等,重启动了好几次微信,主界面左上角终于出现了「小微」的标记。
其实,微信团队有自研大模型并不是个保密消息,几年前就有对外的披露,但是业界对此完全选择性地忽略了,闭源大模型就不被关注吗?相当令人惊讶地被忽略,甚至主动保密都不一定能有这个效果。
主模型用的 WeLM,部分回答用 DeepSeek 做兜底。目前看,小微的能力可以支持多个模型。
微信自己做独立的模型这件事,其实非常非常重要。对于这么大体量的产品而言,使用第三方开源大模型的定制维护成本甚至会比自己开发还高,而且也会影响产品的迭代速度。
腾讯现在至少有两个团队做模型,外部看起来像是又在「赛马」,但结果会是多了拿到「船票」的机会。其实也没必要忌讳「赛马」这种说法,通过这种方式,先把各个团队的战斗力激发出来再说。况且,混元是通用大模型,而 WeLM 是微信的专用大模型。
目前至少有两处可以唤起唤起小微,一处就是主界面左上角,另外,会话或是群聊的 + 展开,功能项里多了一个「问小微」。
然后我想了解的是能力范围和能力边界,内测阶段,还是放出来不少能力。
当然,这个只是问答的摘要,实际功能边界还有待探索,于是我就探索了一下。
小微已经悄然出现在各个使用场景,却以一种不打扰的方式存在。
小微并不挑战用户已有的使用习惯,而是用户习惯的延伸和拓展。
单聊和群聊的场景,都可以在展开菜单里「问小微」。群聊内容的总结对微信重度用户来说,是刚需。也可以在小微里分析并拟好消息,直接发给某个人或发送到某个群聊,用下来很顺滑。这个环节的完成度相当高。
公众号文章和视频号内容,也可以直接通过功能菜单里的「问小微」进行分析。这个场景看起来也和其他场景一样,已经考虑到了无障碍人群的使用需求。
朋友圈的内容能总结分析,朋友圈好友多有来不及看的人有救了。暂时还不支持直接发内容到朋友圈,等等看。
在小微里直接进行小程序的调用暂时还不支持,如果要操作小程序,需要用户自行打开,但显而易见这只是策略上的选择问题,早晚会放开。
在涉及到交易记录这样的敏感信息,需要用户进行显式授权。目前至少可以分析微信支付的记录。
暂时还没放开直接进行支付的能力,没接入购物订单系统,比如在「小微」对话里完成手机话费的支付,直接在小店下单等……值得说明的是,从技术上看这毫无问题,提供这样的能力也会是早晚的事。
现在也不支持读取自己关注的公众号列表的信息。不过,读取分析单篇公众号文章是标配的能力。
对于这几个隐私的红线,微信团队是相当慎重的。因为如果允许大模型读取分析,容易出现数据安全隐患。对广大用户来说,慎重一点当然好。
虽然这些边界不能逾越,但可以设想的是,有了小微之后,用户希望微信做的但微信不可能都去做的「小众需求」「长尾需求」,没准儿可以通过小微实现。
然后我想让小微给我生成一张公众号封面图,调试了几次,还没能让我满意。或许图像生成是 WeLM 的短板?文本处理已经没什么问题了。
上面几张截图里,大家应该也能看出小微是语音优先的,对话框默认使用语音,其次才是文字输入,右上角默认支持语音播报。
语音优先的前提是,微信的语音识别的能力早就相当强,微信输入法团队最近也在快速迭代。这方面也是微信团队长期被外界所忽视的。
文本和语音,可以说 WeLM 的确没短板。小微还直接提供了代码生成的能力。
现在,每个人都可以自己捣鼓小工具了。我当然是要先做个「提肛」主题的小工具试试看啦。
整个流程过于简单,分分钟一个小程序就做好了。居然真的能用,但是我对这个小程序名字不太满意,于是又改了一下,又是分分钟部署上线:
以后还写什么代码?人人都是「想法开发者」,有什么想法,喝杯咖啡的功夫,捣鼓出来个小程序看看再说。
当然,要是非找点不足的话,那就是这个小程序暂时只能自己用。但将来……哎,真不敢想将来会怎样,一切皆有可能。
小微的右上角有设置选项,关于记忆和隐私,可以选择是否长期记忆设定,也可以开启个性化内容。顺便,当然要选择「帮助模型改进效果」啦。
最后,对于那些还没用上但习惯性地要喷微信的人来说,我给你们提供一个刁钻的角度:暂时还不支持 Markdown。
这还了得?全世界最好的文件格式 Markdown 都敢不支持……