新闻中心
-
04-29单卡跑Llama 70B快过双卡,微软硬生生把FP6搞到了A100里 | 开源FP8和更低的浮点数量化精度,不再是H100的“专利”了!老黄想让大家用INT8/INT4,微软DeepSpeed团队在没有英伟达官方支持的条件下,硬生生在A1...
-
04-28让大模型不再「巨无霸」,这是一份最新的大模型参数高效微调综述AIxiv专栏是本站发布学术、技术内容的栏目。过去数年,本站AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传...
-
04-28阿里智能体“组装工厂”开源!0经验搞定上万Agent并发让多智能体开发就像搭积木,阿里巴巴通义实验室开源多智能体编程框架与开发平台AgentScope。该平台专门为多智能体应用开发者打造,旨在提供高易用的编程体验、稳...
-
04-28Llama 3低比特量化性能下降显著!全面评估结果来了 | 港大&北航Ð大模型力大砖飞,让LLaMA3演绎出了新高度:经过超大规模预训练的15T+Token数据上,已实现了令人印象深刻的性能提升,也因远超Chinchilla推荐量再...
-
04-26颜水成挂帅,昆仑万维2050全球研究院联合NUS、NTU发布Vitron,奠定通用视觉多模态大模型终极形态近日,由颜水成教授带队,昆仑万维2050全球研究院、新加坡国立大学、新加坡南洋理工大学团队联合发布并开源了Vitron通用像素级视觉多模态大语言模型。这是一款重...
-
04-26Docker三分钟搞定LLama3开源大模型本地部署概述LLaMA-3(LargeLanguageModelMetaAI3)是由Meta公司开发的大型开源生成式人工智能模型。它在模型结构上与前一代LLaMA-2相...

