新闻中心

开源11天,马斯克再发Grok-1.5!128K代码击败GPT-4

2024-03-30
浏览次数:
返回列表

Grok-1官宣开源不过半月,新升级的Grok-1.5出炉了。

刚刚,马斯克xAI官宣,128K上下文Grok-1.5,推理能力大幅提升。

并且,很快就会上线。

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

开源11天,马斯克再发Grok-1.5!128K代码击败GPT-4

11天前,Grok-1模型的权重和架构开源,展示了Xai在去年11月之前取得的进展。

Grok-1有3140亿参数,是Llama 2的4倍大,而且采用的是MoE架构,8个专家中2个是活跃专家。

开源11天,马斯克再发Grok-1.5!128K代码击败GPT-4

Xai介绍,也就是从那时起,团队改进了最新模型Grok-1.5的推理和解决问题的能力。

开源11天,马斯克再发Grok-1.5!128K代码击败GPT-4

OpenAI前开发者关系负责人表示,从xAI重大发布的时间可以看出他们前进的步伐和紧迫感。令人振奋!

开源11天,马斯克再发Grok-1.5!128K代码击败GPT-4

128K上下文,Grok-1.5数学推理能力暴涨

根据官方介绍,Grok-1.5改进了推理能力,上下文长度为128K。

开源11天,马斯克再发Grok-1.5!128K代码击败GPT-4

Grok-1.5最显著的改进之一是,它在编码和数学相关任务中的表现。

在测试中,Grok-1.5在数学基准上取得50.6%的得分,在GSM8K基准上获得了90%,这两个数学基准涵盖了从小学到高中的各种竞赛问题。

此外,在评估代码生成和解决问题能力的HumanEval基准测试中,Grok-1.5获得了74.1%的高分。

从下图中,与Grok-1相比,可以看出Grok-1.5在数学方面的能力得到大幅提升,GSM8K上从62.9%改进到90,MATH上从23.9%提升到50.6%。

开源11天,马斯克再发Grok-1.5!128K代码击败GPT-4

128K长语境理解,扩增16倍

Grok-1.5另一全新特点是,能够在其上下文窗口内处理高达128K token的文本。

这使Grok的内存容量,增加到以前上下文长度的16倍,从而使它能够利用更长的文档中的信息。

开源11天,马斯克再发Grok-1.5!128K代码击败GPT-4

此外,新模型还可以处理更长和更复杂的提示,同时在其上下文窗口扩展时仍保持其指令跟随能力。

在Needle In A Haystack(NIAH)评估中,Grok-1.5 展示了强大的检索能力,可检索长度达 128K 字节的上下文中的嵌入文本,并取得了完美的检索结果。

Grok-1.5基础设施

Grok-1.5构建在基于JAX、Rust和Kubernetes的定制分布式训练框架之上。

这个训练堆栈可以让xAI团队能够以最少的投入,大规模构建创意,以及训练新的架构。

在大型计算群集上进行训练LLM的一个主要挑战是,最大限度地提高训练任务的可靠性和正常运行时间。

xAI定制的训练编排器,可确保自动检测有问题的节点,并将其从训练任务剔除。

与此同时,他们还优化了检查点、数据加载和训练任务的重启,以最大限度地减少发生故障时的停机时间。

xAI表示,Grok-1.5将很快提供给早期测试者,以帮助改进模型。

博客还预告了Grok-1.5将在未来几天里推出几个新功能。

最后,xAI还是一如既往地po出了招募信息。

开源11天,马斯克再发Grok-1.5!128K代码击败GPT-4

以上就是开源11天,马斯克再发Grok-1.5!128K代码击败GPT-4的详细内容,更多请关注其它相关文章!


# 训练  # 数据  # 其上  # 可以看出  # 解决问题  # 新能源  # 马斯克  # 再发  # 开源  # llama  # grok  # SEO任舒瑛  # 南山区网站建设  # 抖音推广营销链路方案  # seo人群基础知识  # 浙江抖音推广营销知识  # 无为seo网络营销推广  # 全国网站优化公司  # 影响网站推广的因素  # 数字媒体网站建设哪个好  # 南京关键词排名优化公司  # 参数设置  # 结构化  # 实拍 


相关栏目: 【 行业资讯67740 】 【 技术百科0 】 【 网络运营39195


相关推荐: typescript适合什么用  typescript学多久可以学会  春运抢票可以抢几张  r中如何逐行执行命令  performance是什么意思  阿里云盘的会员怎么用  j*a里数组怎么赋值  折叠屏手机哪个有性价比  vs怎么编写typescript  镜像ao3链接入口  虚拟机服务器如何关机命令  春运抢票最多能抢几趟车  爱奇艺fun会员可以几个人用?  固态硬盘4k如何看  对象数组怎么用j*a  春运抢票在哪儿抢票  怎么在typescript定义集合  夸克的答案为什么不对  为什么选择typescript  哪些编程软件需用typescript  typescript能开发什么  单片机程序负数怎么表示  win10如何打开dos命令窗口大小  单片机怎么定义字符长度  wps中datediff函数怎么用 WPS中DATEDIFF函数的语法和用法分享  苹果16新增哪些功能  折叠屏手机共有哪些  固态硬盘如何4k对其  play的三人称单数和过去式  夸克网盘为什么解析错误  如何修改cad命令  手机nfc功能功能是什么意思  什么网址不能域名解析  市盈率估值1stdv是什么意思  爱奇艺中下载的视频怎么在PPT中播放操作方法  选哪个折叠屏手机好  一分钟等于多少秒  干股是什么意思  固态硬盘如何测试  ssd固态硬盘如何选择  typescript用在哪里  舆论是什么意思  md5解密是什么意思  为什么学typescript  华为5g手机掉了怎么定位找回  driver是什么意思  power在充电器上是什么意思  跑分是什么意思  typescript怎么拼接  夸克是什么用途 

搜索