关注、星标下方公众号,和你一起成长
作者 | 梁唐
出品 | 公众号:Coder梁(ID:Coder_LT)
(相关资料图)
大家好,我是老梁。
昨天百度发布了文心一言,引来了广泛的关注。因为发布会上只播放了视频没有进行实机演示,因此引起了大量关注者的失望和群嘲。老梁也表达了作为国内的先行玩家,希望百度支棱起来的言论。
但让人没有料到的是,仅仅间隔了一天,百度它就支棱起来了……
在知乎里有大佬段小草拿到了文心一言的内侧邀请码,进行了详细的评测。我转载一部分给大家尝尝鲜,想要看完整评测可以访问大佬的知乎回答:https://www.zhihu.com/question/589955024
老梁粉丝群里也有大佬拿到了评测资格进行了测试,表示在一些实时性问题上,文心一言的表现还不太尽如人意。经常会一本正经地胡说八道:
但也有大佬表示文心一言迭代速度很快,同样的问题早上问还在胡说八道,但到了中午就已经回答得有模有样了。
综合老梁搜集到的评测结果来看,文心一言已经具备了一定的上下文理解以及内容生成能力,至少还是有一定完成度的。虽然总体不如ChatGPT如此惊艳,但也已经有了一定的效果,在一些特定的场景下,结果甚至要比ChatGPT更好。根据百度内部员工的说法是达到了ChatGPT3.5 70%的能力,我个人也比较认可这种说法。
老梁也联系了我在百度的朋友,打听了一下详细的情况。
根据朋友的说法,模型在回答问题的时候胡说八道的行为目前是业界普遍存在的问题。对于和ChatGPT的对比,朋友也坦诚给出了看法:
今天晚点的时候,文心一言开放了个人用户申请体验,老梁知道消息之后第一时间就提交了申请。希望能早点获批,详细体验一番。
不知道是否是市场从昨天失望的情绪中走了出来,感受到了其中的不容易,以及百度在国内率先突破的勇气。百度的股价又迎来了一波大涨。截止到停盘时涨了接近14个点,不仅弥补了昨天的跌幅,还有得多。
其实在我看来,文心一言能有这样的表现能力,就已经足够在发布会上展示了。可能由于谷歌翻车的“珠玉”在前,加上ChatGPT 4.0的效果太过惊艳,导致百度最终底气不足。
所以我个人觉得挺可惜的,作为国内第一个吃螃蟹的人,即使模型在一些问题上回答不尽如人意,相信大家对此都能理解的。ChatGPT刚刚发布时各种错误的问题也不少,也没少引来诟病。加上百度AiGC的团队组建时间不久,去年下半年才开始全力搞大模型。这么短的时间内,能有这样的结果,已经很令人欣喜了。
最后,就火速发展的人工智能对于未来的影响,老梁也与朋友真诚地交换了意见:
喜欢本文的话不要忘记三连~