谁在生产“放心大模型”？

科技新知

2023-08-18 22:54:03

大模型是一场赛跑，不但要跑得快，还要跑得稳。

(资料图)

上月，微软、谷歌、Meta等七家美国AI巨头在白宫签署了一份文件，承诺自家的AI技术保证安全、透明。

中国的监管政策也快速跟进。7月13日，国家网信办联合多部门发布了《生成式人工智能服务管理暂行办法》。“安全”成为此次新政的超级高频词，《办法》中反复强调，中国的大模型，无论是芯片、软件、工具、算力和数据资源，都应该做到安全可信。

如果自去年ChatGPT发布以来飞速增长，引出“百模大战”的生成式人工智能产业是一匹跑马，那么配套的监管政策、安全措施就是跑马身后的缰绳。只有安全可控的大模型技术，才能在未来的大规模应用作战中平稳落地。

而来自中国的大模型头部玩家科大讯飞，已为自家的大模型备好了“缰绳”。

讯飞星火打响“安全战”

作为大模型领域的后起之秀们，中国企业正在快速缩短与国际顶尖水平的差距。

8月15日，科大讯飞在合肥举办了讯飞星火认知大模型V2.0升级发布会。科大讯飞董事长刘庆峰在现场展示了新版本讯飞星火的一些简单功能——从撰写一段详实有物的现场欢迎词，到解答一道兼具三角函数、等差数列的高中数学题，再到现场编写一段复杂的代码，升级后的讯飞星火都能在极短的时间内处理完毕。

背后是此次讯飞星火升级的两个主力方向:代码能力和多模态交互能力。刘庆峰表示，到今年10月24日，讯飞星火的多项代码能力会超越ChatGPT，到明年上半年将对标GPT-4。

一批基于星火2.0的代码功能将正式上线，比如智能编程助手，这一功能将令更多专业程序员提升工作效率，也让零基础的其它行业人士拥有代码开发能力。

以教育行业为例，学校原本需要17天加15万元开发的轻应用，比如学生管理、请假审批等，借助讯飞星火的教育数字基座的话，可以在一天内，仅需1.5万元开发完毕。

多模态能力则让讯飞星火大模型在文字、图片、音频、视频等多种模态中，能实现更流畅的识别和生成。比如，大模型能对医疗领域的手写材料、影像资料，进行快速识别并积累数据。再如专业的内容创作工具讯飞智作2.0，视频创作者可以借助这款产品实现创作效率的极大提升。

而在大模型的技术性能以外，科大讯飞正在思考更多有关AI安全的问题，在这次大会上，一款与大模型相关的硬件正式发布——由科大讯飞联合华为共同打造的大模型算力底座，讯飞星火一体机。

这是一款定制化的企业大模型硬件，集合了训练和推理功能，同时内置办公、代码、知识库、客服等场景包，同时支持对话开发、任务编排、插件执行、知识接入、提示工程等5种定制优化模式，可以从多个角度辅助客户加速数字化转型。

讯飞星火一体机主要解决的痛点，是大模型应用落地的安全问题。

所有人都知道，大模型在各行各业都有效率优势，但所有的企事业单位在面对大模型时，都必须思考几个问题：

1、大模型如何保障我的使用安全？在训练时，我的内部数据是否会对外泄露？训练算力是否充足？输入什么数据，生成什么内容，这些是否可控？

2、如何训练一个“更懂我”、“只懂我”的大模型？我所在的行业垂直度高，专业需求强，大模型能否满足我这里的细分需求，同时做到成本可控？

而这些棘手问题，恰恰是讯飞星火一体机的优势所在。

简单来说，星火一体机能让企事业单位为自己架设一个专属的大模型技术服务器，实现自主训练、推理和生成模型，而且能做到开箱即用。这不仅是把大模型的载体从软件替换为硬件，同时也把大模型的应用场景从公域空间，引向了更安全可靠的私域专属空间。

大模型护航员：1+1如何大于2

讯飞星火一体机是如何让企业的大模型应用，变得更安全的？

人工智能大模型的安全，主要分为内容安全和算力安全两个方面。内容安全意味着，大模型输出的内容始终可信、可控；算力安全意味着，大模型背后用于训练的数据保密性强，同时也有充足的算力用于大模型的不断升级、迭代。

背后，离不开科大讯飞和华为昇腾贡献各自技术优势，为这款产品注入的性能优势。

科大讯飞拥有内容安全方面的积累。刘庆峰介绍，大模型的内容安全主要分为两个方面，污语料和大模型幻觉。简单来说，要保障大模型生成的内容真实且质量高，一要保障背后的数据库足够干净，没有被污染过的“脏数据”；二要保证AI不会“胡说八道”，在联想问题时在一个精确的范围内给出答案。

“我们要向全世界学习最新知识，但也要保障数据安全，怎么办？”

科大讯飞选择对症下药，此前，科大讯飞曾承建语音及语言国家工程技术中心，这让科大讯飞拥有收集全世界各行业知识内容的能力，再通过语种判别器、质量判别器、隐私判别器和安全判别器对文本进行筛选，最终得到安全的高质量文本，形成大模型的数据基础。

面对大模型的幻觉问题，科大讯飞让大模型从经过整合的精确知识库中读取内容，经过理解后向客户呈现。如果大模型容易不受限制地“胡思乱想”，那就让它的想象力，停留在精准确认过的数据库之内。

而算力方面的安全，则需要华为昇腾的硬件能力。

大模型的竞争主体是企业，同样也是国家。早在去年10月，为了封锁中国的AI产业，美国商务部曾对出口芯片的算力和带宽设置上限，如果芯片企业想要出口超出限制的芯片，就必须申请执照。此前英伟达销往中国的AI训练芯片A100被叫停，前者不得不推出“阉割”版的A800芯片用于替代。

科大讯飞对此的感受更为深刻，2019年，科大讯飞就被美国列入出口管制“实体清单”，禁止与美国企业产生合作。

国际竞争环境激烈变化，中国的算力必须建立在自己的平台上，用独立自主的办法打破封锁。这包括算法和模型的自主，也包括芯片和数据存储平台的自主。只有这样，中国企业才能保证自己的数据、算力都能得到保障。《生成式人工智能服务管理暂行办法》中强调中国大模型的软硬件都要做到安全，深意正在于此。

幸运的是，华为解了讯飞星火的难题。大模型的研发，需要海量算力。而华为坐拥昇腾AI芯片的底层算力优势，其智算中心占据了国内主要市场份额。

讯飞星火一体机则是双方合作的成果。这款基于华为昇腾芯片的产品可以做到高算力、低损耗，为每一个行业的企事业单位提供专属大模型基座。更重要的是，这款算力底座产品完全由中国企业自主研发，实现了对进口方案的替代，对数据安全和算力安全给出了充分保障。越是到国际竞争前沿的关键行业中，星火一体机的安全优势就越明显。

AI如何驱动百业兴旺？

中国大模型想要与ChatGPT竞争，就必须围绕AI的三大要素即算力、算法和数据展开。

以算力为例，回溯人类文明的发展史，从农业时代到工业时代、人工智能时代，人力、电力、算力分别是所处时代最重要的发展力。2022年AIGC技术的全面爆发证实了这一点，当ChatGPT吸引世界目光时，所有相关从业者都认识到，算力将成为决定AIGC命运的关键底牌。

“谁先拿出最好的算力和算法，谁就能构建源源不断的数据汇聚，形成全球最强大脑。”刘庆峰表示。ChatGPT之所以能拿出一鸣惊人的效果，正是因为基于英语写作的论文、资料数量庞大，这让立足于英语数据的ChatGPT进步神速。而中国的大模型想要高速发展，就必须重视高质量数据库的整理。

这不仅需要研发企业的努力，同样需要大模型深入到各个产业的应用场景当中去，从具体的行业运转中积累数据。

科大讯飞正在全力扩展大模型的应用范畴，刘庆峰介绍，科大讯飞拥有130亿、650亿和1750亿的模型参数供客户选择，且可以在此基础上针对客户的场景进行快速优化，一周左右就可以增加20%的技术指标。这不仅能极大提升大模型生成内容的精确度和专业度，也能让每一家企业、学校或者医院，都能拥有属于自己的定制化大模型。

讯飞星火一体机则是这场数字化革命最重要的安全保障和算力保障。

回到不同企业面对大模型时最关心的问题，如何保障使用安全？如何控制成本？如何让大模型更懂我的需求？科大讯飞的答案是，通过讯飞星火一体机的算力底座，为企业布置一个专属的大模型平台，通过不断的数据输入及训练，最终实现所有客户的“私域大模型”梦想。

讯飞星火小助手则是一个很好的案例。这个功能能够让用户设定大模型生成内容的模式，也就是把内容定制权交给用户，无论你想要辩论文稿、模拟面试、论文写作甚至是生成周报，讯飞星火都能生成相关精确内容。截至发布会召开，由用户创造的讯飞星火小助手已经达到7800个，这极大降低了普通人使用大模型的门槛。

对企业用户来说也是同理，当企业拥有自己的专属大模型后，你对它的训练越多，它提供的反馈也越精确。

对讯飞星火来说，深入到产业场景中同样是必经之路。目前，科大讯飞正通过私有化部署的方式，向重点行业客户提供专属大模型构建服务。今年6月，科大讯飞就与金融行业的人保科技达成合作，不久前的8月12日，科大讯飞在2023半年度业绩说明会上表示，公司内部已经成立专门的团队，面向重点行业客户构建基于行业专用数据的自主可控私有化专用大模型，目前已经与多家行业头部客户达成试点意向。在未来，讯飞星火将延续大模型的1+N的研发计划，将大模型应用到N个行业的赛道中去，向教育、医疗、工业等重要领域进军，为各行业加速数字化转型。

这不仅意味着专业的AI大模型将为各行各业赋能，也代表在通用人工智能这个全球竞争的重要领域，国产大模型正在向产业大踏步迈进，把数字化转型的命运牢牢握在自己手上，这才是国产大模型在AI时代，最有战略意义的安全护航。