llama_第48页_陕西然坤悦科技有限公司

400-5689-0921
客服咨询
- 在线咨询

新闻中心 NEWS CENTER

您当前位置：首页

06-11

用神经架构搜索给LLM瘦身，模型变小，准确度有时反而更高

用神经架构搜索给LLM瘦身，同等准确度可让LLaMA2-7B模型大小降2倍。LLM（大型语言模型）的一个主要特点是“大”，也因此其训练和部署成本相当高，如何在保...
06-06

LLM | Yuan 2.0-M32：带注意力路由的专家混合模型

图片一、结论写在前面Yuan+2.0-M32是一种基础架构，与Yuan-2.0+2B相似，采用了一个包含32位专家的专家混合架构。其中2位专家处于活跃状态。提出...
06-06

清华大学与智谱AI重磅开源 GLM-4：掀起自然语言处理新革命

自2023年3月14日开始，ChatGLM-6B以来，GLM系列模型受到了广泛的关注和认可。特别是在ChatGLM3-6B开源之后，开发者对智谱AI推出的第四代...
06-06

GLM-4开源版本终于来了：超越Llama3，多模态比肩GPT4V，MaaS平台也大升级

最新版本大模型，6分钱100万Token。今天上午，在AI开放日上，备受关注的大模型公司智谱AI公布了一系列行业落地数字：根据最新的统计数据，智谱AI大模型开放...
06-06

智谱AI Open Day：升级清言App、发布GLM-4开源模型、新一代MaaS平台，大模型商业化迎来“下一站”

“描绘宏大未来愿景的同时让更多人切身体会到大模型的强大能力，让大模型技术从炫酷的天空当中真正落到地面上、落到实处，是每一个大模型公司必须思考的问题。”——智谱A...
06-06

2025北京智源大会开启注册！

北京智源大会是人工智能领域综合性内行盛会，自2019年10月首度亮相，已成功举办五届。大会以鲜明的特色，邀请海内外研究者开展精彩演讲与深入对话，共11位图灵奖得...

: 电话

: 客服

: 地图

: 搜索