Uploads%2farticles%2f15982%2f%e6%96%87%e5%bf%83%e4%b8%80%e8%a8%80
|
2023-03-17

文心一言的炸场 Demo 还不够炸,主要是对手太强大

国产版 ChatGPT 文心一言,赢了第一

被称为国产版 ChatGPT 的文心一言,终于在 3 月 16 日在百度北京总部大楼正式发布。

为什么是今天,你们真的 ready 了吗?

李彦宏表达了自信:

百度 2019 年就推出了文心大语言模型,今天的文心一言是过去多年努力的延续。

李彦宏又同时表达了不自信:

但也不能说我们完全 ready 了,文心一言对标 ChatGPT、甚至是对标 CGT-4,门槛是很高的,全球大厂还没有一个做出来的,百度是第一个。我自己测试感觉还是有很多不完美的地方。

但因为市场有需求,百度有点赶鸭子上架一样,还是把东西拿出来来。

百度的很多产品,从搜索到智能云,再到自动驾驶,到小度,大家都有需要,更重要的是我们的客户需要,合作伙伴需要。
从我们承认文心一言的存在到现在,短短一个月的时间,就有超过 650 家合作伙伴宣布加入文心一言生态,大家都希望能早一点用上最新最先进的大语言模型。

于是,百度拿出了五个场景的 Demo 来炸场,包括文学创作、商业文案创作、数理推算、中文理解、多模态生成。

文学创作

在回答事实性问题的时候,文心一言延续了百度知识增强的大模型理念,大幅度提升了准确率。

在总结《三体》的核心内容、续写《三体》、比较《三体》中人物的过程中,文心一言展现了很强的总结和分析能力、内容创作生成能力、推理能力。

商业文案创作

以常见的公司起名字、写 slogan、写新闻稿为例,文心一言可以做到连续三次内容创作生成。

AI 要写好一篇稿子,除了需要准确理解我们的意图,还要有清晰的表达能力,这背后需要的事庞大的数据规模。

文心一言大模型的训练数据包括:万亿级网页数据,数十亿的搜索数据和图片数据,百亿级的语音日均调用数据,以及 5500 亿事实的知识图谱等。

有研究表明,数据规模足够大,参数达到千亿级,大模型就可能发生「智能涌现」,即使在没有专门训练过的领域,也能涌现出知识理解和逻辑推理能力。

数理逻辑推算

文心一言具备了一定的思维能力,能够学会数学推演及逻辑推理这类相对复杂任务。

鸡兔同笼是锻炼人类逻辑思维的经典题,面对这样的题目,文心一言能够理解题意,有正确的解题思路,能做演算,不但给出了正确结果,还详细给出解题步骤。

中文理解能力

毕竟扎根于中国市场,文心一言具备中文领域最先进的自然语言处理能力。通过「洛阳纸贵」的例子,展示了文心一言在中文上的优势。

相对应的,一言目前对英文语种、代码场景的训练还不够多,表现还不够好,相信通过训练,能够完善这些能力。

多模态生成

文心一言在覆盖多种模态方面做得很全面。目前的版本,已经能够生成文字、图片和语音。生成视频因为成本比较高,还没有对所有用户开放,未来我们会逐步接入。

多模态是生成式 AI 一个明确的发展趋势。未来,随着百度多模态统一大模型的能力增强,文心一言的多模态生成能力,也会不断提升。

总而言之,

从文心一言的表现看,某种程度上它具有了对人类意图的理解能力,回答的准确性、逻辑性、流畅性,都逐渐接近人类水平。

百度已经连续多日进行持续到凌晨的压力测试,为了支持文心一言,亚洲目前最大的单体智算中心山西阳泉百度智算中心已经将算力提升到每秒可以完成 400 亿亿次浮点运算,将与百度在江苏盐城等地的其他几座智算中心一起,为文心一言提供算力支持。

据百度消息,文心一言新闻发布会后三小时,文心一言企业版 API 调用服务测试的企业用户达 6.5 万,与百度智能云基于文心一言展开合作咨询已达 5590 条。

尽管百度试图传递着看好的消息,同时也在努力拉升着下跌的股价,但整体而言,这类大语言模型还远未到发展完善的阶段,它们有时候会有很惊艳的表现,但不少场景下,细究起来还有明显的 bug,进步空间很大。

但我们期待着未来它能飞速发展,日新月异。


主笔:周森 / 深圳湾

编辑:陈述 / 深圳湾

>>
Back to top btn