新闻中心
-
06-11用神经架构搜索给LLM瘦身,模型变小,准确度有时反而更高用神经架构搜索给LLM瘦身,同等准确度可让LLaMA2-7B模型大小降2倍。LLM(大型语言模型)的一个主要特点是“大”,也因此其训练和部署成本相当高,如何在保...
-
06-06LLM | Yuan 2.0-M32:带注意力路由的专家混合模型图片一、结论写在前面Yuan+2.0-M32是一种基础架构,与Yuan-2.0+2B相似,采用了一个包含32位专家的专家混合架构。其中2位专家处于活跃状态。提出...
-
06-06清华大学与智谱AI重磅开源 GLM-4:掀起自然语言处理新革命自2023年3月14日开始,ChatGLM-6B以来,GLM系列模型受到了广泛的关注和认可。特别是在ChatGLM3-6B开源之后,开发者对智谱AI推出的第四代...
-
06-06GLM-4开源版本终于来了:超越Llama3,多模态比肩GPT4V,MaaS平台也大升级最新版本大模型,6分钱100万Token。今天上午,在AI开放日上,备受关注的大模型公司智谱AI公布了一系列行业落地数字:根据最新的统计数据,智谱AI大模型开放...
-
06-06智谱AI Open Day:升级清言App、发布GLM-4开源模型、新一代MaaS平台,大模型商业化迎来“下一站”“描绘宏大未来愿景的同时让更多人切身体会到大模型的强大能力,让大模型技术从炫酷的天空当中真正落到地面上、落到实处,是每一个大模型公司必须思考的问题。”——智谱A...
-
06-062025北京智源大会开启注册!北京智源大会是人工智能领域综合性内行盛会,自2019年10月首度亮相,已成功举办五届。大会以鲜明的特色,邀请海内外研究者开展精彩演讲与深入对话,共11位图灵奖得...

