新闻中心
-
02-02大模型也有小偷?为保护你的参数,上交大给大模型制作「人类可读指纹」将不同的基模型象征为不同品种的狗,其中相同的「狗形指纹」表明它们源自同一个基模型。大模型的预训练需要耗费大量的计算资源和数据,因此预训练模型的参数成为各大机构重...
-
02-02匿名论文提出奇招!增强大模型长文本能力居然还能这么做一提到提高大模型长文本能力,就想到长度外推或者上下文窗口扩展?不行,这些都太费硬件资源了。来看一个奇妙新解:和长度外推等方法使用KV缓存的本质不同,它用模型的参...
-
02-01编程新范式,当Spring Boot遇上OpenAI2023年,AI技术已经成为热点话题,对各行业产生了巨大影响,编程领域尤其如此。人们越来越认识到AI技术的重要性,Spring社区也不例外。随着GenAI(Ge...
-
02-01媲美GPT-4的开源模型泄露!Mistral老板刚刚证实:正式版本还会更强Mistral-Medium竟然意外泄露?此前仅能通过API获得,性能直逼GPT-4。CEO最新发声:确有其事,系早期客户员工泄露。但仍表示敬请期待。图片换句话...
-
02-01准确率不足20%,GPT-4V/Gemini竟看不懂漫画!首个图像序列基准测试开源OpenAI的GPT-4V和谷歌的Gemini多模态大语言模型引起了业界和学界的广泛关注。这些模型在多个领域展示了对视频的深入理解能力,从不同角度呈现出了其潜力...
-
02-01揭秘NVIDIA大模型推理框架:TensorRT-LLM一、TensorRT-LLM的产品定位TensorRT-LLM是NVIDIA为大型语言模型(LLM)开发的可扩展推理方案。它基于TensorRT深度学习编译框架...

