技术手段助大模型成本“瘦身”

发布时间:2024-09-24 01:25:47 来源: sp20240924

原标题:技术手段助大模型成本“瘦身”

“降价的基本逻辑是,我们有信心用技术手段降低成本,市场也需要更低价的大模型。”5月15日,字节跳动豆包大模型在火山引擎原动力大会上发布,火山引擎总裁谭待在公布豆包大模型定价时如是说。

豆包大模型的超低价格引起业内关注。据悉,豆包主力模型的推理输入价格只有0.0008元/千Tokens(数据中的基本单元),比行业价格便宜99.3%。对此,谭待坦言:“降价是用技术优化成本来实现的。如果只是补贴,用亏损换收入是不可持续的,我们不会走这条路。”

对大模型推理成本的优化,可通过很多技术手段实现。首先是模型本身,模型结构、训练方法都可以持续改进,包括业界很关注的MoE(混合专家模型),就是优化推理成本很好的解决方案。其次是工程上的优化。大模型的调用量越大,优化推理成本的空间也越大。以前的模型都是单机推理,大模型用的是分布式推理。所以如果能把各种各样的底层算力用得更好,推理成本就会大大降低。

谭待表示,豆包大模型平均每天处理1200亿Tokens文本、生成3000万张图片,不同任务有不同的负载,可以把它们混合在一起,通过智能调度提高它们的利用率,就能极大地提升资源利用率,实现整体成本的优化。

“大的使用量,才能打磨出好模型,大幅降低模型推理的单位成本。”谭待拿字节跳动内部业务举例,飞书的主要流量高峰在工作时间,抖音在下班后休闲时间的流量更高,这些不同业务的大模型推理,也能根据业务特点错峰使用,降低成本。

豆包大模型原名“云雀”,是国内首批通过算法备案的大模型之一。字节跳动基于豆包大模型打造了AI对话助手“豆包”、AI应用开发平台“扣子”、互动娱乐应用“猫箱”,以及星绘、即梦等AI创作工具,并把大模型接入抖音、番茄小说、飞书、巨量引擎等50余个业务,用以提升效率和优化产品体验。

大模型从以分计价到以厘计价,将助力企业以更低成本加速业务创新。“比如一个人现在要创业,如果要花1万元钱调用大模型,可能会觉得有点贵。我们把价格降到1%都不到,相当于花100元钱,就能把大模型用起来,相关想法也就更容易得到尝试。”谭待表示,企业的AI转型充满不确定性,试错成本要尽量低,才能更快更多地实现大模型的应用落地,从而让整个行业受益。

(责编:杨曦、陈键)
选择用户
全部人员 全选 撤消
谢志刚
李岩
李海涛
谢志强
李亚琴
潘潇潇
杨亚男
高荣新
郑文静
金琳
张银波
张欣
陈曦
刘涛
王长青
高广柱
孙圆
行政专员
付雪枫
张雪莲
张璐
刘相群
张明璇
李静
孙静
王晨
赵夏
马洪亮
张兰
黄莉
李潍伊
常恩宁
侯昭宇
韩岩峰
冯亚红
林洋
陈静
刘婧
魏保国
唐彦秀
张楠
刘瑞萍
付严明
荣伶
马建国
邓爱青
系统管理员