Uploads%2farticles%2f16148%2fxinghuo 2.0 cover.001
|
2023-08-16

科大讯飞年中「模拟考」交卷,星火大模型 2.0 你给打多少分?

代码能力、多模态能力升级,大模型时代,人人都是开发者。

8 月 15 日,科大讯飞召开星火认知大模型 2.0 发布会。

两个半小时的发布会里,有技术、产品发布,有现场实操演练,更有董事长刘庆峰一如既往的激情感染力。

在刘庆峰一众金句当中,如约而至,印象最为深刻。

100 天前,也就是 5 月 6 日,星火大模型发布会上,讯飞曾公布过年内的三大里程碑。

其中之一,即为:8 月 15 日,代码能力升级以及多模态交互能力提升,希望能帮助到更多的合作伙伴及开发者团队。

xinghuo 2

讯飞是守约的。

新技术、新产品全线亮相,当中几乎所有功能都做到了现场实操演示,并非录制及 PPT 阶段。

作为 1024 开发者节大考前的一次「模拟考」,星火大模型 2.0 算是年中的最重要节点。

准时赴约,那考的怎么样,又交出了怎样的答卷?

代码能力 5 大升级,部分能力超越 ChatGPT

代码能力通常被认为是认知大模型「聪明」程度的重要标志,而代码数据亦能提升认知大模型的「智慧」。

如何能让更广阔的人群、企业尝鲜使用大模型,除了平台代码能力提升之外,降低代码门槛无疑是最优解之一。

此次,讯飞星火认知大模型 2.0 对代码能力进行了 5 个维度升级,分别为:代码生成、代码补齐、代码纠错、代码解释、单元测试生成

xinghuo 2

带来的最直观体验是,少写代码,或不写代码

对此,刘庆峰着重提到:

只要有想象力、对场景有见地,不需要人人都是代码高手。

为了实际证明这一点,科大讯飞研究院院长刘聪,通过画红色的心形线、画马鞍面方程三维立体图、视频转 GIF 图,以及创作贪吃蛇小游戏进行了多重演示。

xinghuo 2

除搭建 Python 语言环境之外,所演示的案例,均未敲一行代码。

而根据 OpenAI 构建的代码能力公开测试集 HumanEval,当前星火 2.0 版本 Python、Java、JS、C++ 能力均较之于 1.5 版本大幅提升。其中 Python 代码能力最为突出,达到了 61 分,与 ChatGPT 仅 1 分之差

xinghuo 2

5 项升级能力中,代码纠错、代码解释也已非常接近 ChatGPT,代码生成、代码补齐能力甚至高于 ChatGPT。

智能编程助手 iFlyCode 1.0 发布,编码效率提升 30%

iFlyCode 是此次讯飞专为用户开发的智能编程助手,它集成了大模型的 5 项代码能力,并融合至开发环境中。

为了更进一步降低开发难度,iFlyCode 还能提供专业的代码知识与服务。

xinghuo 2

这部分,我们就借由一段实操演示,对 iFlyCode 的能力做进一步说明。

演示环节,刘聪还是以去年 1024 开发者节上的「凌空手写」做案例。

在 iFlyCode 后台界面,以 Prompt 文字写出想要实现的效果:如两指捏合,进行画图。

这时,通过求助 iFlyCode,就能获取实现这一效果的关键步骤与准备事项。

xinghuo 2

基于给出的建议,还能进一步发起求助,获得更细化的步骤。

xinghuo 2

而用户需要做的,就是按照操作建议,一步步执行。

当然,如果最终效果不甚满意,也能调用 iFlyCode 的改代码能力。修改 Prompt 文字,简单的复制粘贴即可。

就「凌空手写」这类稍复杂的应用,整个过程下来,刘聪同样没有敲一行代码,并且用了不到十分钟的时间就完成操作。

xinghuo 2

此外,iFlyCode 还非常适合于如学校、医院等行业应用。即使「零编程能力」的老师或医生,也能通过 iFlyCode 行业底座,快速创建管理应用。

xinghuo 2

根据讯飞内部研发效能平台,对 2000 余名员工在 1 个月内测试使用 iFlyCode 1.0 的成效数据统计。在一些典型场景中,代码采纳率达 30%,编码效率可提升 30%,综合效率可提升 15%。

xinghuo 2

写文案、文生图、虚拟人合成视频,多模态能力再升级

多模态能力,是星火认知大模型 2.0 升级的另一重点。

刘庆峰谈到:

多模态能力是科大讯飞既定的人工智能技术长期战略,通用人工智能发展多模态能力是必由之路,也是持续迭代,形成自我造血,数据循环的非常关键的内容。

在 2022 年初,讯飞曾发布了包括多模感知、深度理解、多维表达、运动智能等核心能力的「讯飞超脑 2030 计划」。

如今,星火认知大模型 2.0 将多模态能力进一步产品化,划分为图像描述、理解推理、识图创作、文图生成以及虚拟人合成。

xinghuo 2

星火认知大模型 2.0 的多模态能力如何?我们还是看实操演示。

1、图像理解

丢给星火认知大模型任意一张照片,它都能自主识别,并给出对照片的理解释义。

xinghuo 2

2、识图创作

这个功能比较有趣,举出了给小朋友讲故事的场景,通过大模型,给出图片就能生成一则小故事。

xinghuo 2

3、文生图

随着 AIGC 的火热,文生图应用早已被大众接受。演示环节,星火认知大模型也展示出了较强的出图速度和准确度能力。

xinghuo 2

4、虚拟人合成

只需一段简短需求定义,虚拟人合成功能就能快速生成一段包含虚拟人独白的视频。

xinghuo 2

新应用:1 个新发布、2 个新迭代,学习机迎新功能

1、讯飞智作 2.0

发布会上多模态能力升级后的产品:讯飞智作 2.0 也正式发布。

升级后的讯飞智作 2.0,在视频创作方面更进一步,视频后期处理、创意视频生产均可完成。

现场,刘聪演示了一段由讯飞智作进行了虚拟人短视频生成、视频创作的视频内容。

从操作上可见,讯飞智作 2.0 的创作过程,已足够智能。只需要提出想要需求,而后按后台选项执行,就能逐步实现。

如提出:

帮我写一段黄山毛峰宣传文案,包括茶叶的产地、包装、色泽等特点。
xinghuo 2

基于讯飞智作创作的创意文案,添加「徽州风格女主播」人设,插入背景图片或由 AI 自动生成更多图片后,即能生成一段由身着徽州传统服饰的女生,娓娓道来讲述黄山毛峰茶叶的视频内容。

xinghuo 2

值得一提的是,视频语言还能切换为英文,同样可由主播播报。

xinghuo 2

2、星火语伴 2.0

6 月 9 日,科大讯飞上线发布了面向各学段学生、商务人士等广大英语学习爱好者的口语陪练老师「讯飞语伴」 App。

本次结合多模态能力,讯飞语伴升级至 2.0 版本。除了能够进行主题对话、虚拟人对话,重点推出两大核心能力——口语模考和情景交流,并且可用 AI 实现真人式陪练。

xinghuo 2

刘聪现场和讯飞星火语伴 2.0 进行了一场代入感极强的口语模拟考试,他进入星火语伴的雅思考试入口,一位 AI 英语老师便跟他展开对话。

xinghuo 2

对话结束后,系统还给出了对准确度、流畅度、语法、词汇等维度的系统性评价,并推荐相关课程,通过及时反馈来强化学习结果。

xinghuo 2

目前口语模考功能已支持 CET、雅思、托福等大型权威考试。

3、星火教师助手

全新发布的星火教师助手,支持创新规划单元教学设计、启发创设情境教学活动、一键生成互动教学课件,可帮助老师提升备课效率。

xinghuo 2

刘聪现场演示了老师如何快速生成并修改教学设计。

当他给出提示词「围绕时代品质、工匠精神」主题,生成高中语文必修(上)第二单元的教学设计。

一份逻辑清晰、细分成 4 个任务 8 个课时的教学设计随即生成,通过提示词可以直接修改细节,以及一键生成参考课件 PPT。

xinghuo 2

利用 AI,根据课本内容可生成和插入适合学生理解的图片与视频。甚至连布置实践作业,也都能通过教师助手完成。

xinghuo 2

目前,搭载了讯飞星火认知大模型的教师助手,已服务全国超过 2.5 万所学校、超过 1200 万名师生。

4、智能学习机功能上新

基于星火大模型 2.0,讯飞 AI 学习机升级了两项新功能:AI 编程空间、AI 创意画板。

xinghuo 2

新功能主要用于贴近新课标要求,拓展学科学习。

其中 AI 编程空间是学习机行业首款 AI 一对一智能编程助手,支持 Python 语言的学习、练习以及代码自动生成、修改、运行调试等功能。

通过知识问答、练习题和代码诊断等步骤,在 AI 一对一互动的过程中,让孩子逐步爱上编程。

AI 创意画板则在看懂孩子画了什么的基础上,去理解孩子想要表达的情感和意义。通过鼓励式探讨,不断提升孩子们的观察力、想象力、创造力和表达能力。

新产品,星火一体机

发布会尾声,讯飞星火和华为昇腾联合发布了星火一体机。

xinghuo 2

星火一体机基于华为鲲鹏 CPU + 昇腾 GPU,可提供对话开发、任务编排、插件执行、知识接入、提示工程等 5 种定制优化模式。以及办公、代码、客服、运维、营销、采购等 10 种以上即开即用的丰富场景包,并支持 3 种模型尺寸供用户选择。

刘庆峰表示,有了这些能力,就可以使得每一家企业、每一个行业、每一个学校、每个医院都有机会构建自己的专属大模型。

湾里小结

拥抱 AI,讯飞是笃定的。

而正是讯飞的这份笃定,持续的技术、产品迭代,也让千行百业拾取信心、找到方向。

发布会后,走在回程的路上,我听到了讯飞的合作伙伴围坐一团在探讨,如何用星火认知大模型解决适老化改造问题。

身边经过的学生代表们,正在为通过几张图片、无代码生成虚拟人视频而激动的讨论。

再过两个多月,讯飞年度 1024 开发者节将要召开,星火大模型能否比肩 ChatGPT,又将交出怎样的答卷,我们共同期待。


主笔:达达 / 深圳湾

编辑:陈述 / 深圳湾

>>
Back to top btn