这是谷歌首次在 Chatbot Arena 排行榜上占据榜首。
作者:Tristan Greene,CoinTelegraph;编译:陶朱,
生成式人工智能基准测试领域又出现了一位新霸主,它的名字是 Gemini 1.5 Pro。
之前的冠军 OpenAI 的 ChatGPT-4o 终于在 8 月 1 日被超越,当时谷歌悄然发布了其最新模型的实验版本。
Gemini 的最新更新没有大张旗鼓地发布,目前被标记为实验性的。但它很快引起了社交媒体上人工智能社区的关注,因为有报道称它在基准测试分数上超越了竞争对手。
自 GPT-3 发布以来,OpenAI 的 ChatGPT 一直是生成式 AI 的标杆。过去一年左右,其最新模型 GPT-4o 和最接近的竞争对手 Anthropic 的 Claude-3 在大多数常见基准测试中都遥遥领先于大多数其他模型,几乎没有遇到任何竞争对手。
来源:大型模型系统组织。
最受欢迎的基准测试之一是 LMSYS Chatbot Arena。它测试各种任务的模型并分配总体能力分数。GPT-4o 的得分为 1,286,而 Claude-3 获得了可观的 1,271 分。
Gemini 1.5 Pro 的先前版本得分为 1,261。但 8 月 1 日发布的实验版本 (Gemini 1.5 Pro 0801) 得分高达 1,300。
这表明它总体上比竞争对手更强大,但基准测试并不一定能准确反映 AI 模型能做什么和不能做什么。
在没有更深入的比较的情况下,我们正进入一个 AI 聊天机器人市场已经足够成熟,可以提供多种选择的时代。最终由用户来决定哪种 AI 模型最适合他们。
据传,Gemini 的最新版本引起了一波兴奋,社交媒体上的用户称它“非常好”。一位 Redditor 甚至写道,它“完全胜过 4o”。
目前尚不清楚 Gemini 1.5 Pro 的实验版本是否会成为未来的默认版本。虽然截至本文发表时,它仍然普遍可用,但它处于早期发布或测试阶段这一事实表明,出于安全或协调原因,该模型可能会被撤销或更改。
相关推荐
加密市场24小时内爆仓3.10亿美元,多单损失惨重
2024-08-03 11:30
0美国证券交易委员会指控联合创始人欺诈后,Chamath Palihapitiya支持的Altcoin崩溃
2024-08-02 02:10
0比特币急坠5.8万、以太坊力守2500美元 支撑位在哪 本周有哪些经济大事要注意
2024-08-12 14:10
0Ripple CEO:美国应领跑加密货币行业,呼吁政府支持
2024-06-22 17:03
603拜登退出竞选后,Polymarket 用户 AnonBidenBull 损失 200 万美元
2024-07-22 09:34
02024 年 7 月区块链游戏研报:市场波动与数据分化的挑战与机遇
2024-08-07 18:10
0最新资讯
弗拉基米尔·普京在俄罗斯将比特币挖矿合法化:这对加密货币世界意味着什么
2024-08-12 13:47
SUI强势复苏,或成挑战Solana的“区块链杀手”
2024-08-12 11:46
预计比特币 ETF 期权将于 2025 年之前推出
2024-08-12 11:27
比特币矿工储备量创三年新低:这对 BTC 的未来意味着什么
2024-08-12 10:57
Ripple 与 SEC:法律之争真的结束了还是才刚刚开始
2024-08-12 10:30
比特币(BTC)会进一步下跌吗? Solana(SOL)超越以太坊,Shiba Inu(SHIB)面临障碍
2024-08-12 10:25
以太坊Gas费用暴跌至数年最低,Layer2交易激增或与Dencun升级有关
2024-08-12 09:53
Circle USDC 流通量激增,7天内净增加16亿美元
2024-08-10 15:36
最热资讯
新星Memecoin蓄势待发挑战狗狗币霸主地位
2024-08-12 14:17