文 丨 新浪财经 周文猛
截至目前,国内已有超40个大模型正筹备研制或已经推出,越来越“卷”的大模型竞赛,似乎也正在演变为新一轮算力、数据以及算法竞争的“烧钱”大战,各家都在宣扬着自己的大模型能力出众、性能卓越,但最终真实情况如何,外界难以评判。
越来越卷的国内大模型竞赛,究竟是好事还是坏事?企业该如何理性地参与这场竞赛?近日,科大讯飞星火大模型发布,在接受新浪财经《大道直行》采访时,科大讯飞董事长刘庆峰给出了自己的答案,在他看来,“百花齐放是好事,但也需要建立一套客观科学的大模型评价体系,让大家知道谁好谁坏,避免一窝蜂而上导致的鱼龙混杂,对外界形成误导。”
“大模型进步中,会有许多毛病”
ChatGPT发布后短短半年内,国内已经涌现出超40余支大模型团队,从阿里、百度、360等底蕴雄厚的互联网大厂,到科大讯飞、云从科技等AI科技企业,再到王慧文、王小川等明星高管带队的初创团队,以及中科院自动化所、智源研究院等“学院派”大模型队伍,越来越多的大模型团队正不断涌现。
然而,繁荣之下,愈演愈烈的大模型竞赛,也正在不断催生出新的数据孤岛、算力浪费以及人才内耗等问题。与此同时,一些企业团体不断通过舆论手段混淆视听,干扰大众认知以及行业判断的行为,也正滋生着新的混乱。
在刘庆峰看来,“当前国内大模型百花齐放的状态是一件好事,毕竟,我们需要拥抱这一次通用人工智能的机会。”但在拥抱的同时,我们也应该尊重一些基本的伦理价值和法律底线,涉及数据安全、个人隐私以及国家安全等相关问题的,需要有一定的“警戒线”。
与此同时,刘庆峰还指出,“随着越来越多的企业参与到大模型研究当中,行业需要有一个相对客观的系统性评价方法,在对企业自己的大模型研究发展进行指导的同时,也让外界看到不同模型之间的差异与特色,进而帮助开发者、客户、行业监管乃至于媒体公众,进行自发的遴选评测。”
“认知大模型推出的时间并不长,即便是ChatGPT和GPT4,也在快速进步中,它们也有许多毛病和问题,如果随便找一个例子来评测并说自己的大模型做得好,这其实是片面的,可能只是为了营销或者其他目的的误导。”
据刘庆峰介绍,在成立了讯飞星火大模型专项工作组初期,科大讯飞所做的第一件事情,就是根据ChatGPT的48个主要任务指令进行系统性的评价,并据此提出大模型研发需求。在新近公布的通用人工智能评价方式中,科大讯飞提出了包括文本生成、语言理解、知识问答、逻辑推理、数学能力、代码能力、多模态能力在内的7大维度481项大模型评测体系。
在他看来,我们一定是要把通用人工智能的评价标准拿出来,这既能够对我们自己的大模型研究做到什么程度起到指导,让我们知道自己的进步和缺点。同时这也是拿来给开发者、客户、行业监管以及公众看的,让他们能够知道从哪些维度进行评测,并做出自己的选择判断。
“做认知大模型的企业,大部分都是龙头企业,都可能有一批跟随者或者资本关注者,还是要有科学的精神,脚踏实地的态度,来给大家把大模型究竟是怎么回事把它解析出来。否则就会一窝蜂上,也不知道谁好谁坏、进步方向在哪。”刘庆峰表示。
据他介绍,基于自主提出的7维度481项大模型评测体系,科大讯飞对最新发布的星火大模型进行了每维度10个左右的案例测试,讯飞星火在语言理解和知识问答方面已接近ChatGPT处于国内领先水平,“5分制ChatGPT能到4.48分,而讯飞星火大模型已经达到4.29分”。
“有两件事情值得注意”
刘庆峰认为,这一次认知大模型的发展,能够在工业互联网领域会形成巨大的突破和机会,有力地推动万物互联时代的到来。几年前,外界一致认为IT产业将从以手机为代表的移动互联网,发展到以穿戴设备等为代表的万物互联阶段,但由于人机交互模式以及机器人语言理解能力的不足,这一天迟迟没能快速到来。
“但今天已经不一样了,基于大模型的人工智能技术已经具备通用领域的智慧涌现、触类旁通能力,这将带来万物互联这个产业的巨大的机会。”刘庆峰表示。
在他看来,人类智慧的产生可能有两种模式。第一,类似于牛顿范式,所有事情都能讲得清清楚楚,写出万有引力公式并据此计算出九大行星如何绕地运行、宇宙飞船如何飞上天。另一种则是生物神经网络,基于海量模型参数形成记忆后带来的学习认知触类旁通能力。刘庆峰实测发现,“这一次基于大模型技术的通用人工智能技术,确实已经具备智慧涌现的能力,原来我们还不敢轻易提的通用人工智能确实已经到来,星星之火开始显现。”
“虽然目前我们仍不清楚大模型为什么会具备‘智慧涌现’的能力,但我们可以通过在大模型训练学习阶段加入人为的选择和价值判断,保证它学得更对,最终更加符合我们的要求。”刘庆峰表示。
在刘庆峰看来,做大模型应用的企业,有两件事情值得注意。第一,特别敏感、关键的应用,应该建立在自主可控的硬件平台之上,这才是长期之道。第二,做大模型应用时,需要看准目标市场,遵循国家法律,同时自己心中带着人工智能不是代替人类,是帮助人类的这样一个基本伦理和价值观,这样才能越做越好。
随着越来越多的大模型产品技术不断涌现,未来真正有价值的认知大模型,将是以解决社会刚需问题为导向的,拥有正确价值观,并且能够在具备社会刚需的应用场景落地大模型的企业,也将最先能形成良性的自我造血能力。