Uploads%2farticles%2f16148%2fxinghuo 2.0 cover.001

2023-08-16

科大讯飞年中「模拟考」交卷，星火大模型 2.0 你给打多少分？

代码能力、多模态能力升级，大模型时代，人人都是开发者。

8 月 15 日，科大讯飞召开星火认知大模型 2.0 发布会。

两个半小时的发布会里，有技术、产品发布，有现场实操演练，更有董事长刘庆峰一如既往的激情感染力。

在刘庆峰一众金句当中，如约而至，印象最为深刻。

100 天前，也就是 5 月 6 日，星火大模型发布会上，讯飞曾公布过年内的三大里程碑。

其中之一，即为：8 月 15 日，代码能力升级以及多模态交互能力提升，希望能帮助到更多的合作伙伴及开发者团队。

xinghuo 2

讯飞是守约的。

新技术、新产品全线亮相，当中几乎所有功能都做到了现场实操演示，并非录制及 PPT 阶段。

作为 1024 开发者节大考前的一次「模拟考」，星火大模型 2.0 算是年中的最重要节点。

准时赴约，那考的怎么样，又交出了怎样的答卷？

代码能力 5 大升级，部分能力超越 ChatGPT

代码能力通常被认为是认知大模型「聪明」程度的重要标志，而代码数据亦能提升认知大模型的「智慧」。

如何能让更广阔的人群、企业尝鲜使用大模型，除了平台代码能力提升之外，降低代码门槛无疑是最优解之一。

此次，讯飞星火认知大模型 2.0 对代码能力进行了 5 个维度升级，分别为：代码生成、代码补齐、代码纠错、代码解释、单元测试生成。

xinghuo 2

带来的最直观体验是，少写代码，或不写代码。

对此，刘庆峰着重提到：

只要有想象力、对场景有见地，不需要人人都是代码高手。

为了实际证明这一点，科大讯飞研究院院长刘聪，通过画红色的心形线、画马鞍面方程三维立体图、视频转 GIF 图，以及创作贪吃蛇小游戏进行了多重演示。

xinghuo 2

除搭建 Python 语言环境之外，所演示的案例，均未敲一行代码。

而根据 OpenAI 构建的代码能力公开测试集 HumanEval，当前星火 2.0 版本 Python、Java、JS、C++ 能力均较之于 1.5 版本大幅提升。其中 Python 代码能力最为突出，达到了 61 分，与 ChatGPT 仅 1 分之差。

xinghuo 2

5 项升级能力中，代码纠错、代码解释也已非常接近 ChatGPT，代码生成、代码补齐能力甚至高于 ChatGPT。

智能编程助手 iFlyCode 1.0 发布，编码效率提升 30%

iFlyCode 是此次讯飞专为用户开发的智能编程助手，它集成了大模型的 5 项代码能力，并融合至开发环境中。

为了更进一步降低开发难度，iFlyCode 还能提供专业的代码知识与服务。

xinghuo 2

这部分，我们就借由一段实操演示，对 iFlyCode 的能力做进一步说明。

演示环节，刘聪还是以去年 1024 开发者节上的「凌空手写」做案例。

在 iFlyCode 后台界面，以 Prompt 文字写出想要实现的效果：如两指捏合，进行画图。

这时，通过求助 iFlyCode，就能获取实现这一效果的关键步骤与准备事项。

xinghuo 2

基于给出的建议，还能进一步发起求助，获得更细化的步骤。

xinghuo 2

而用户需要做的，就是按照操作建议，一步步执行。

当然，如果最终效果不甚满意，也能调用 iFlyCode 的改代码能力。修改 Prompt 文字，简单的复制粘贴即可。

就「凌空手写」这类稍复杂的应用，整个过程下来，刘聪同样没有敲一行代码，并且用了不到十分钟的时间就完成操作。

xinghuo 2

此外，iFlyCode 还非常适合于如学校、医院等行业应用。即使「零编程能力」的老师或医生，也能通过 iFlyCode 行业底座，快速创建管理应用。

xinghuo 2

根据讯飞内部研发效能平台，对 2000 余名员工在 1 个月内测试使用 iFlyCode 1.0 的成效数据统计。在一些典型场景中，代码采纳率达 30%，编码效率可提升 30%，综合效率可提升 15%。

xinghuo 2

写文案、文生图、虚拟人合成视频，多模态能力再升级

多模态能力，是星火认知大模型 2.0 升级的另一重点。

刘庆峰谈到：

多模态能力是科大讯飞既定的人工智能技术长期战略，通用人工智能发展多模态能力是必由之路，也是持续迭代，形成自我造血，数据循环的非常关键的内容。

在 2022 年初，讯飞曾发布了包括多模感知、深度理解、多维表达、运动智能等核心能力的「讯飞超脑 2030 计划」。

如今，星火认知大模型 2.0 将多模态能力进一步产品化，划分为图像描述、理解推理、识图创作、文图生成以及虚拟人合成。

xinghuo 2

星火认知大模型 2.0 的多模态能力如何？我们还是看实操演示。

1、图像理解

丢给星火认知大模型任意一张照片，它都能自主识别，并给出对照片的理解释义。

xinghuo 2

2、识图创作

这个功能比较有趣，举出了给小朋友讲故事的场景，通过大模型，给出图片就能生成一则小故事。

xinghuo 2

3、文生图

随着 AIGC 的火热，文生图应用早已被大众接受。演示环节，星火认知大模型也展示出了较强的出图速度和准确度能力。

xinghuo 2

4、虚拟人合成

只需一段简短需求定义，虚拟人合成功能就能快速生成一段包含虚拟人独白的视频。

xinghuo 2

新应用：1 个新发布、2 个新迭代，学习机迎新功能

1、讯飞智作 2.0

发布会上多模态能力升级后的产品：讯飞智作 2.0 也正式发布。

升级后的讯飞智作 2.0，在视频创作方面更进一步，视频后期处理、创意视频生产均可完成。

现场，刘聪演示了一段由讯飞智作进行了虚拟人短视频生成、视频创作的视频内容。

从操作上可见，讯飞智作 2.0 的创作过程，已足够智能。只需要提出想要需求，而后按后台选项执行，就能逐步实现。

如提出：

帮我写一段黄山毛峰宣传文案，包括茶叶的产地、包装、色泽等特点。

xinghuo 2

基于讯飞智作创作的创意文案，添加「徽州风格女主播」人设，插入背景图片或由 AI 自动生成更多图片后，即能生成一段由身着徽州传统服饰的女生，娓娓道来讲述黄山毛峰茶叶的视频内容。

xinghuo 2

值得一提的是，视频语言还能切换为英文，同样可由主播播报。

xinghuo 2

2、星火语伴 2.0

6 月 9 日，科大讯飞上线发布了面向各学段学生、商务人士等广大英语学习爱好者的口语陪练老师「讯飞语伴」 App。

本次结合多模态能力，讯飞语伴升级至 2.0 版本。除了能够进行主题对话、虚拟人对话，重点推出两大核心能力——口语模考和情景交流，并且可用 AI 实现真人式陪练。

xinghuo 2

刘聪现场和讯飞星火语伴 2.0 进行了一场代入感极强的口语模拟考试，他进入星火语伴的雅思考试入口，一位 AI 英语老师便跟他展开对话。

xinghuo 2

对话结束后，系统还给出了对准确度、流畅度、语法、词汇等维度的系统性评价，并推荐相关课程，通过及时反馈来强化学习结果。

xinghuo 2

目前口语模考功能已支持 CET、雅思、托福等大型权威考试。

3、星火教师助手

全新发布的星火教师助手，支持创新规划单元教学设计、启发创设情境教学活动、一键生成互动教学课件，可帮助老师提升备课效率。

xinghuo 2

刘聪现场演示了老师如何快速生成并修改教学设计。

当他给出提示词「围绕时代品质、工匠精神」主题，生成高中语文必修（上）第二单元的教学设计。

一份逻辑清晰、细分成 4 个任务 8 个课时的教学设计随即生成，通过提示词可以直接修改细节，以及一键生成参考课件 PPT。

xinghuo 2

利用 AI，根据课本内容可生成和插入适合学生理解的图片与视频。甚至连布置实践作业，也都能通过教师助手完成。

xinghuo 2

目前，搭载了讯飞星火认知大模型的教师助手，已服务全国超过 2.5 万所学校、超过 1200 万名师生。

4、智能学习机功能上新

基于星火大模型 2.0，讯飞 AI 学习机升级了两项新功能：AI 编程空间、AI 创意画板。

xinghuo 2

新功能主要用于贴近新课标要求，拓展学科学习。

其中 AI 编程空间是学习机行业首款 AI 一对一智能编程助手，支持 Python 语言的学习、练习以及代码自动生成、修改、运行调试等功能。

通过知识问答、练习题和代码诊断等步骤，在 AI 一对一互动的过程中，让孩子逐步爱上编程。

AI 创意画板则在看懂孩子画了什么的基础上，去理解孩子想要表达的情感和意义。通过鼓励式探讨，不断提升孩子们的观察力、想象力、创造力和表达能力。

新产品，星火一体机

发布会尾声，讯飞星火和华为昇腾联合发布了星火一体机。

xinghuo 2

星火一体机基于华为鲲鹏 CPU + 昇腾 GPU，可提供对话开发、任务编排、插件执行、知识接入、提示工程等 5 种定制优化模式。以及办公、代码、客服、运维、营销、采购等 10 种以上即开即用的丰富场景包，并支持 3 种模型尺寸供用户选择。

刘庆峰表示，有了这些能力，就可以使得每一家企业、每一个行业、每一个学校、每个医院都有机会构建自己的专属大模型。

湾里小结

拥抱 AI，讯飞是笃定的。

而正是讯飞的这份笃定，持续的技术、产品迭代，也让千行百业拾取信心、找到方向。

发布会后，走在回程的路上，我听到了讯飞的合作伙伴围坐一团在探讨，如何用星火认知大模型解决适老化改造问题。

身边经过的学生代表们，正在为通过几张图片、无代码生成虚拟人视频而激动的讨论。

再过两个多月，讯飞年度 1024 开发者节将要召开，星火大模型能否比肩 ChatGPT，又将交出怎样的答卷，我们共同期待。

主笔：达达 / 深圳湾

编辑：陈述 / 深圳湾

星火大模型

AI

深圳湾（微信公众号 ID：shenzhenware）是最早也是最活跃的硬件创新社区和媒体，关注「软件+硬件」带来的场景和交互创新，以及与平台和应用相连的产业链升级。

版权声明：本文系深圳湾原创，转载或摘录请先获得授权。
深圳湾微信公众号：shenzhenware。深圳湾同时在头条号、企鹅号、知乎等主流媒体站开设专栏板块，欢迎关注。转载、约稿、投稿、团队报道请在公众号对话框回复关键字并留下联系方式。

上一篇：急红了眼的 Google，想用这些重磅更新后来居上

下一篇：8K 画质塞进 55.9 克机身，光子跃迁用 Cube 和 AI 戒指搭了一个影像创作网络

>>

Back to top btn