llama_第62页_陕西然坤悦科技有限公司

400-5689-0921
客服咨询
- 在线咨询

新闻中心 NEWS CENTER

您当前位置：首页

04-07

超越GPT-4，斯坦福团队手机可跑的大模型火了，一夜下载量超2k

在大模型落地应用的过程中，端侧AI是非常重要的一个方向。近日，斯坦福大学研究人员推出的Octopusv2火了，受到了开发者社区的极大关注，模型一夜下载量超2k。...
04-07

10万美元训出Llama-2级大模型！全华人打造新型MoE，贾扬清SD前CEO围观

想了解更多AIGC的内容，请访问：51CTOAI.x社区https://www.51cto.com/aigc/“只需”10万美元，训练Llama-2级别的大模型...
04-02

元象首个MoE大模型开源：4.2B激活参数，效果堪比13B模型

元象发布XVERSE-MoE-A4.2B大模型，采用业界最前沿的混合专家模型架构（MixtureofExperts），激活参数4.2B，效果即可媲美13B模型。...
04-01

大语言模型中常用的旋转位置编码RoPE详解：为什么它比绝对或相对位置编码更好?

自2017年发表的“AttentionIsAllYouNeed”论文以来，Transformer架构一直是自然语言处理（NLP）领域的基石。它的设计多年来基本没...
04-01

0门槛免费商用！孟子3-13B大模型正式开源，万亿token数据训练

澜舟科技官宣：孟子3-13B大模型正式开源！这一主打高性价比的轻量化大模型，面向学术研究完全开放，并支持免费商用。在MMLU、GSM8K、HUMAN-EVAL等...
04-01

GPT-4单项仅得7.1分，揭露大模型代码能力三大短板，最新基准测试来了

首个AI软件工程师Devin正式亮相，立即引爆了整个技术界。Devin虽然不能够轻松解决编码任务，但可以自主完成软件开发的整个周期——从项目规划到部署。他尽力挖...

: 电话

: 客服

: 地图

: 搜索