谷歌发布最新人工智能模型Gemini 声称性能超越GPT-4和人类专家

发布时间:2025-01-11 11:36:05 来源: sp20250111

  科技日报北京12月7日电 (记者张梦然)谷歌公司6日宣布推出一种名为Gemini的新人工智能模型,声称该模型在一系列智力测试中的表现优于OpenAI的GPT-4模型和“专家级”人类。

  Gemini已针对不同的应用创建了3个版本,分别是Nano、Pro和Ultra。谷歌拒绝回答有关Pro和Ultra的规模、它们包含的参数数量、训练数据的规模或来源等问题。

  其最小版本Nano旨在在智能手机上运行,实际上有两种模型:一种用于速度较慢的手机,拥有18亿个参数;另一种用于功能更强大的手机,拥有32.5亿个参数。

  谷歌声称,Gemini的中档Pro版本击败了其他一些模型,但更强大的Ultra超过了所有现有AI模型的能力。它在行业标准MMLU基准上的得分为90%,而“专家级”的人类预计能达到89.8%。

  这是人工智能首次在测试中击败人类,也是现有模型中得分最高的。该测试涉及一系列棘手的问题,包括逻辑谬误、日常道德问题、医疗问题、经济和地理。

  在同一测试中,GPT-4的得分为87%,LLAMA-2的得分为68%,Anthropic Claude 2的得分为78.5%。Gemini在其他9项常见基准测试中的8项中击败了所有这些模型。

  去年,谷歌“深度思维”发布的AlphaCode可击败50%的人类开发人员,而新发布的Gemini声称可击败85%的人类编程师。

  谷歌“深度思维”的艾力·柯林斯表示,Gemini“几乎在每个领域都是最先进的”。

  【总编辑圈点】

  Gemini目前没有可供测试的版本,但谷歌却演示了它两种很“实际”的功能——解决家庭作业问题、处理实时视频能力。这不禁让“特定人群”惊呼:我现在就需要它!而对业内人士来说,这个AI更值得注意之处,是它不仅能力最强,还最通用,这意味着其可以适应各种任务。与当前许多专注于文本的模型不同,Gemini接受过文本、图像和声音方面的综合训练,能接受所有这些格式的输入然后再输出,甚至,它还比所有“前辈”模型们更擅长搞开发。 【编辑:付子豪】

选择用户
全部人员 全选 撤消
谢志刚
李岩
李海涛
谢志强
李亚琴
潘潇潇
杨亚男
高荣新
郑文静
金琳
张银波
张欣
陈曦
刘涛
王长青
高广柱
孙圆
行政专员
付雪枫
张雪莲
张璐
刘相群
张明璇
李静
孙静
王晨
赵夏
马洪亮
张兰
黄莉
李潍伊
常恩宁
侯昭宇
韩岩峰
冯亚红
林洋
陈静
刘婧
魏保国
唐彦秀
张楠
刘瑞萍
付严明
荣伶
马建国
邓爱青
系统管理员