OpenAI o1 拉开与国产大模型差距?360集结16家国产大模型可以匹敌

发布时间:2024-11-14 06:53:15 来源: sp20241114

  日前,OpenAI 发布 o1-preview,问鼎最强大语言模型,引发业内轰动。也正因如此,国内也产生了质疑的声音:为何大模型领域国内追赶了一两年,差距好像没见缩小,甚至是扩大了。

  差距真的是在扩大吗?事实可能并非如此。

  根据行业专家张俊林的观点,o1-preview 之所以能够更强,其方法本质上是思维链(Chain-of-Thought, CoT)的自动化。通过 CoT 把一个复杂问题拆解成若干简单步骤,这有利于大模型解决复杂逻辑问题,但之前这个过程主要靠人工来达成。o1 采用的这种方法,将使得 Prompt 工程逐渐消亡,也就是说所有复杂人工环节的自动化成为了大势所趋。

  但其实,这种思想和方法并非 OpenAI 的首创,更非独创。早在 7 月底的 ISC.AI2024 大会上,360集团创始人周鸿祎就宣布,“用基于智能体的框架打造慢思考系统,从而增强大模型的慢思考能力”,并且此后多次强调类似观点。这种方法的技术和产品应用上,国内也已经走在前面:还是在 ISC.AI 上 360 发布的CoE(Collaboration-of-Experts,专家协同)技术架构及混合大模型,就是该方法的产物;并且,该技术架构已经落地到了多个产品中,比如360AI搜索、360AI浏览器。

  值得一提的是,在大模型技术前沿,国内比 OpenAI 在开放协作的道路上走的更远,更加“open”。比如 CoE 架构并非只接入了一家企业的模型,而是由 360 牵头,百度、腾讯、阿里巴巴、智谱AI、Minimax、月之暗面等 16 家国内主流大模型厂商合作打造的,目前已经接入了这些企业的 54 款大模型产品,未来预计会全量接入 100 多款大模型产品。

  更进一步的是,CoE 技术架构不仅接入了“大模型”,还接入了很多十亿甚至更小参数的专家模型,这使得整个系统更加智能。CoE 架构在实现“让最强的模型回答最难的问题”的同时,还能在回答简单问题时调用更精准的“小模型”,在获得高质量回答的同时,节约推理资源、提升响应速度。

  有了上述的多种底层技术创新,基于CoE 架构的混合大模型在翻译、写作等 12 项指标的测试中取得了80.49分的综合成绩,超越了GPT-4o的69.22分;特别是在“弱智吧”和“诗词赏析”这类比较具有中文特色的问题上,该架构的领先优势更加明显。即使是对于最新发布的 o1-preview,CoE 架构在未经专门优化的情况下也展现出了优势。

  拥有了底层技术创新的情况下,国内在做应用和产品层面的优势更大。CoE 架构和混合大模型没有止步于技术创新,而是比OpenAI更快一步地进入了实际应用领域。

  一方面,360 通过 CoE 技术架构,构建了大模型竞技平台——模型竞技场(bot.360.com),目前已经入驻360AI浏览器,成为国内大模型领域的基础设施。在多模型协作模式下,用户可以从 16 家国内主流大模型厂商的 54 款大模型中任意选择 3 款大模型,进行多模型协作,以此达成比单个大模型回答问题好得多的效果。

  另一方面,CoE 还成为了支撑360AI搜索的底层技术架构。正是由于全球领先的技术架构的支撑,和国内多家主流大模型厂商的通力协作,让360AI搜索能够让360AI搜索能够在2024年1月诞生后八九个月的时间里,就超越 Perplexity AI。

  我国基于高素质的工程师人才优势和时代创新精神,完全有可能让AI大模型赛道,成为继新能源汽车之后的又一个领跑国际前沿的重要科技创新领域。 【编辑:邵婉云】

选择用户
全部人员 全选 撤消
谢志刚
李岩
李海涛
谢志强
李亚琴
潘潇潇
杨亚男
高荣新
郑文静
金琳
张银波
张欣
陈曦
刘涛
王长青
高广柱
孙圆
行政专员
付雪枫
张雪莲
张璐
刘相群
张明璇
李静
孙静
王晨
赵夏
马洪亮
张兰
黄莉
李潍伊
常恩宁
侯昭宇
韩岩峰
冯亚红
林洋
陈静
刘婧
魏保国
唐彦秀
张楠
刘瑞萍
付严明
荣伶
马建国
邓爱青
系统管理员