新闻中心
-
04-07超越GPT-4,斯坦福团队手机可跑的大模型火了,一夜下载量超2k在大模型落地应用的过程中,端侧AI是非常重要的一个方向。近日,斯坦福大学研究人员推出的Octopusv2火了,受到了开发者社区的极大关注,模型一夜下载量超2k。...
-
04-0710万美元训出Llama-2级大模型!全华人打造新型MoE,贾扬清SD前CEO围观想了解更多AIGC的内容,请访问:51CTOAI.x社区https://www.51cto.com/aigc/“只需”10万美元,训练Llama-2级别的大模型...
-
04-02元象首个MoE大模型开源:4.2B激活参数,效果堪比13B模型元象发布XVERSE-MoE-A4.2B大模型,采用业界最前沿的混合专家模型架构(MixtureofExperts),激活参数4.2B,效果即可媲美13B模型。...
-
04-01大语言模型中常用的旋转位置编码RoPE详解:为什么它比绝对或相对位置编码更好?自2017年发表的“AttentionIsAllYouNeed”论文以来,Transformer架构一直是自然语言处理(NLP)领域的基石。它的设计多年来基本没...
-
04-010门槛免费商用!孟子3-13B大模型正式开源,万亿token数据训练澜舟科技官宣:孟子3-13B大模型正式开源!这一主打高性价比的轻量化大模型,面向学术研究完全开放,并支持免费商用。在MMLU、GSM8K、HUMAN-EVAL等...
-
04-01GPT-4单项仅得7.1分,揭露大模型代码能力三大短板,最新基准测试来了首个AI软件工程师Devin正式亮相,立即引爆了整个技术界。Devin虽然不能够轻松解决编码任务,但可以自主完成软件开发的整个周期——从项目规划到部署。他尽力挖...

