新闻中心
-
04-19Llama3突然来袭!开源社区再次沸腾:GPT4级模型自由访问时代到来Llama3来了!就在刚刚,Meta官网上新,官宣了Llama380亿和700亿参数版本。并且推出即为开源SOTA:Meta官方数据显示,Llama38B和70...
-
04-19六年种方式快速体验最新发布的 Llama 3!昨晚Meta发布了Llama38B和70B模型,Llama3指令调整模型针对对话/聊天用例进行了微调和优化,在常见基准测试中优于许多现有的开源聊天模型。比如,G...
-
04-18Meta无限长文本大模型来了:参数仅7B,已开源谷歌之后,Meta也来卷无限长上下文。Transformers的二次复杂度和弱长度外推限制了它们扩展到长序列的能力,虽然存在线性注意力力和状态空间模型等次二次解...
-
04-15ReFT(表征微调):比PeFT效果更好的新的大语言模型微调技术ReFT(RepresentationFinetuning)是一种突破性的方法,有望重新定义我们对大型语言模型进行微调的方式。斯坦福大学的研究人员最近(4月)在...
-
04-15将AI集成到DevOps,以增强工作流自动化译者|陈峻审校|重楼如果有人跟你说,软件开发和运营团队可以毫不费力地协同工作、简化流程,并能提高工作效率,你一定会想到那是DevOps。现如今,人们则期望它能够...
-
04-13改变LoRA的初始化方式,北大新方法PiSSA显著提升微调效果随着大模型的参数量日益增长,微调整个模型的开销逐渐变得难以接受。因此,北京大学的研究团队提出了一种名为PiSSA的参數高效微调方法,在主流数据集上都超过了目前广...

