当前位置：首页 > 科技 > 正文

越来越卷的国内大模型竞赛,究竟是好事还是坏事企业该如何理性

问答百科
科技
2023-05-17
104

　　文丨新浪财经周文猛

　　截至目前，国内已有超40个大模型正筹备研制或已经推出，越来越“卷”的大模型竞赛，似乎也正在演变为新一轮算力、数据以及算法竞争的“烧钱”大战，各家都在宣扬着自己的大模型能力出众、性能卓越，但最终真实情况如何，外界难以评判。

　　越来越卷的国内大模型竞赛，究竟是好事还是坏事？企业该如何理性地参与这场竞赛？近日，科大讯飞星火大模型发布，在接受新浪财经《大道直行》采访时，科大讯飞董事长刘庆峰给出了自己的答案，在他看来，“百花齐放是好事，但也需要建立一套客观科学的大模型评价体系，让大家知道谁好谁坏，避免一窝蜂而上导致的鱼龙混杂，对外界形成误导。”

　　“大模型进步中，会有许多毛病”

　　ChatGPT发布后短短半年内，国内已经涌现出超40余支大模型团队，从阿里、百度、360等底蕴雄厚的互联网大厂，到科大讯飞、云从科技等AI科技企业，再到王慧文、王小川等明星高管带队的初创团队，以及中科院自动化所、智源研究院等“学院派”大模型队伍，越来越多的大模型团队正不断涌现。

　　然而，繁荣之下，愈演愈烈的大模型竞赛，也正在不断催生出新的数据孤岛、算力浪费以及人才内耗等问题。与此同时，一些企业团体不断通过舆论手段混淆视听，干扰大众认知以及行业判断的行为，也正滋生着新的混乱。

　　在刘庆峰看来，“当前国内大模型百花齐放的状态是一件好事，毕竟，我们需要拥抱这一次通用人工智能的机会。”但在拥抱的同时，我们也应该尊重一些基本的伦理价值和法律底线，涉及数据安全、个人隐私以及国家安全等相关问题的，需要有一定的“警戒线”。

　　与此同时，刘庆峰还指出，“随着越来越多的企业参与到大模型研究当中，行业需要有一个相对客观的系统性评价方法，在对企业自己的大模型研究发展进行指导的同时，也让外界看到不同模型之间的差异与特色，进而帮助开发者、客户、行业监管乃至于媒体公众，进行自发的遴选评测。”

　　“认知大模型推出的时间并不长，即便是ChatGPT和GPT4，也在快速进步中，它们也有许多毛病和问题，如果随便找一个例子来评测并说自己的大模型做得好，这其实是片面的，可能只是为了营销或者其他目的的误导。”

　　据刘庆峰介绍，在成立了讯飞星火大模型专项工作组初期，科大讯飞所做的第一件事情，就是根据ChatGPT的48个主要任务指令进行系统性的评价，并据此提出大模型研发需求。在新近公布的通用人工智能评价方式中，科大讯飞提出了包括文本生成、语言理解、知识问答、逻辑推理、数学能力、代码能力、多模态能力在内的7大维度481项大模型评测体系。

　　在他看来，我们一定是要把通用人工智能的评价标准拿出来，这既能够对我们自己的大模型研究做到什么程度起到指导，让我们知道自己的进步和缺点。同时这也是拿来给开发者、客户、行业监管以及公众看的，让他们能够知道从哪些维度进行评测，并做出自己的选择判断。

　　“做认知大模型的企业，大部分都是龙头企业，都可能有一批跟随者或者资本关注者，还是要有科学的精神，脚踏实地的态度，来给大家把大模型究竟是怎么回事把它解析出来。否则就会一窝蜂上，也不知道谁好谁坏、进步方向在哪。”刘庆峰表示。

　　据他介绍，基于自主提出的7维度481项大模型评测体系，科大讯飞对最新发布的星火大模型进行了每维度10个左右的案例测试，讯飞星火在语言理解和知识问答方面已接近ChatGPT处于国内领先水平，“5分制ChatGPT能到4.48分，而讯飞星火大模型已经达到4.29分”。

　　“有两件事情值得注意”

　　刘庆峰认为，这一次认知大模型的发展，能够在工业互联网领域会形成巨大的突破和机会，有力地推动万物互联时代的到来。几年前，外界一致认为IT产业将从以手机为代表的移动互联网，发展到以穿戴设备等为代表的万物互联阶段，但由于人机交互模式以及机器人语言理解能力的不足，这一天迟迟没能快速到来。

　　“但今天已经不一样了，基于大模型的人工智能技术已经具备通用领域的智慧涌现、触类旁通能力，这将带来万物互联这个产业的巨大的机会。”刘庆峰表示。

　　在他看来，人类智慧的产生可能有两种模式。第一，类似于牛顿范式，所有事情都能讲得清清楚楚，写出万有引力公式并据此计算出九大行星如何绕地运行、宇宙飞船如何飞上天。另一种则是生物神经网络，基于海量模型参数形成记忆后带来的学习认知触类旁通能力。刘庆峰实测发现，“这一次基于大模型技术的通用人工智能技术，确实已经具备智慧涌现的能力，原来我们还不敢轻易提的通用人工智能确实已经到来，星星之火开始显现。”

　　“虽然目前我们仍不清楚大模型为什么会具备‘智慧涌现’的能力，但我们可以通过在大模型训练学习阶段加入人为的选择和价值判断，保证它学得更对，最终更加符合我们的要求。”刘庆峰表示。

　　在刘庆峰看来，做大模型应用的企业，有两件事情值得注意。第一，特别敏感、关键的应用，应该建立在自主可控的硬件平台之上，这才是长期之道。第二，做大模型应用时，需要看准目标市场，遵循国家法律，同时自己心中带着人工智能不是代替人类，是帮助人类的这样一个基本伦理和价值观，这样才能越做越好。

　　随着越来越多的大模型产品技术不断涌现，未来真正有价值的认知大模型，将是以解决社会刚需问题为导向的，拥有正确价值观，并且能够在具备社会刚需的应用场景落地大模型的企业，也将最先能形成良性的自我造血能力。

上一篇
意大利乡村咖啡厅:省下一张回国吃家乡美味的机票

下一篇
西藏航空有限公司实现航材类减免税申请海关系统“秒批”