“百模大战”下半场:野蛮生长后,如何避免重复“造轮子”?

发布时间:2024-12-19 08:11:09 来源: sp20241219

   中新网 北京12月2日电 (记者 夏宾)今年以来,全球科技领域最重要的风向,就是新一轮人工智能大模型竞赛。随着美国OpenAI公司发布ChatGPT一鸣惊人,中国科技界不遑多让、纷纷接招,国内大模型总数一度逼近100个,“百模大战”盛况吸引全球关注,大模型的发展速度日新月异。

  生成式人工智能技术正在逐步改造重塑人类社会、经济、文化等各个领域的能力。伴随着国内开启“百模大战”,大模型在写文章、对话、企划、写代码等很多领域表现出了让人惊艳的创作能力,并且每天都在快速进化。

  业内专家认为,这一技术带来的产业红利才刚刚初露峥嵘,AIGC与数字经济、实体经济的深度融合,还将创造出更多颠覆性的社会价值、经济价值,有望开启一场关系到未来数十年的新一轮技术和产业变革。

  有分析观点认为,上述进化和变革,都需要夯实大模型技术底座的广域和跨度,需要通过大量智能计算,耦合人工智能底层技术与基础软件,营造安全可信的人工智能生态,加快推动应用落地,深入垂直领域,构建建立在高质量通用大模型底座上的技能模型、行业模型等的增长飞轮。

  近日在京举行的人工智能计算大会(AICC2023)吸引了来自智谱AI、IDEA研究院、百川智能、循环智能、网易伏羲、中国科学院自动化研究所等机构的大模型专家,分享多模态、超长上下文、开源数据集等大模型技术话题,并将就大模型的技术路线、训练的工程化挑战与开源生态建设展开对话碰撞。

图说:人工智能计算大会(AICC 2023)近日在京举行。摄影:主办方供图

  同时,大会在1500m2的实景AI创新科技展中设置“助百模”专区,集结业内顶尖的基础大模型和行业大模型,通过实时交互系统展示大模型技术魅力。

  浪潮信息也于近日正式发布千亿级开源大模型源2.0,同时宣布源大模型共训计划,呼吁开发者一起训练大模型,构建繁荣的开源生态。作为千亿级别的开源大模型,源2.0在编程、推理、逻辑等方面再进化,为大模型创业者和开发者提供更加丰富、全面的助力,以及更开放的技术创新空间。

  应看到,面对“AI时代”的来临,“单打独斗”已不适应大科学时代的科技创新。“百模大战”进入下半场,野蛮生长后,“群模时代”来临,行业格局经历洗牌重组,优胜劣汰,正在逐渐成形。

  有观点称,经过众多科技探索和市场试错,业界共识也已经逐渐明晰:繁荣的开源模型生态体系是吸纳、培养用户的重要途经,也是避免当下AI大模型企业重复造轮子的商业新范式。

  一方面,大模型需要巨量资金的持续投入,B端市场同样面临这个问题,从这一点说,大公司做大模型更有优势和可持续性,能够保持长期的重型投入,不断迭代,这个能力对于B端市场十分重要。

  另一方面,“众人拾柴火焰高”,以优秀的开源模型性能汇聚技术创新力量,以技术创新反哺大模型数据、工具、应用的迭代升级,才能为全球开发者、研究机构、科技企业提供坚实的底座和成长的土壤,激发无穷创新力。

  浪潮信息高级副总裁刘军认为,应对生成式AI的发展和挑战,应该从算力系统、AI Infra、算法模型、产业生态四个层面创新,通过大模型算力效率、模型算法等创新有效提升基础大模型能力,以健康产业生态助推“百模千行”应用落地。

  浪潮信息人工智能软件研发总监吴韶华则对 中新网 记者表示,开源的通用大模型是未来最先进生产力的“地基”,地基的稳固度和厚度决定了建筑的高度。筑基“高智商的”通用大模型基座,算力是核心驱动力,如何用同样多的算力,更高质量的数据,换取更低的损失率,把算力更有效地匹配智能涌现,这是促进产业良性发展的核心关键。(完)

【编辑:姜雨薇】
选择用户
全部人员 全选 撤消
谢志刚
李岩
李海涛
谢志强
李亚琴
潘潇潇
杨亚男
高荣新
郑文静
金琳
张银波
张欣
陈曦
刘涛
王长青
高广柱
孙圆
行政专员
付雪枫
张雪莲
张璐
刘相群
张明璇
李静
孙静
王晨
赵夏
马洪亮
张兰
黄莉
李潍伊
常恩宁
侯昭宇
韩岩峰
冯亚红
林洋
陈静
刘婧
魏保国
唐彦秀
张楠
刘瑞萍
付严明
荣伶
马建国
邓爱青
系统管理员