新闻中心
-
04-15一阶优化算法启发,北大林宙辰团队提出具有万有逼近性质的神经网络架构的设计方法神经网络作为深度学习技术的基础已经在诸多应用领域取得了有效成果。在实践中,网络架构可以显著影响学习效率,一个好的神经网络架构能够融入问题的先验知识,确立网络训练...
-
04-15谁说大象不能起舞! 重编程大语言模型实现跨模态交互的时序预测 | ICLR 2025近期,来自澳大利亚蒙纳士大学、蚂蚁集团、IBM研究院等机构的研究人员探索了模型重编程(modelreprogramming)在大语言模型(LLMs)上应用,并提...
-
04-15培育发展金融领域新质生产力,“AI+金融”论坛在浦东新区成功举办4月12日,上海市浦东新区科技和经济委员会指导下,由上海市浦东新区产业发展促进中心、上海市浦东新区投资促进二中心、上海陆家嘴(集团)有限公司主办,上海浦东科技创...
-
04-13直接扩展到无限长,谷歌Infini-Transformer终结上下文长度之争不知Gemini1.5Pro是否用到了这项技术。谷歌又放大招了,发布下一代Transformer模型Infini-Transformer。Infini-Tran...
-
04-11大模型做时序预测也很强!华人团队激活LLM新能力,超越一众传统模型实现SOTA大语言模型潜力被激发——无需训练大语言模型就能实现高精度时序预测,超越一切传统时序模型。蒙纳士大学、蚂蚁和IBM研究院联合开发了一种通用框架,成功推动了大语言模...
-
04-10开源模型首胜GPT-4!竞技场最新战报引热议,Karpathy:这是我唯二信任的榜单能打得过GPT-4的开源模型出现了!大模型竞技场最新战报:1040亿参数开源模型CommandR+攀升至第6位,与GPT-4-0314打成平手,超过了GPT-4...

