新闻中心
-
03-04只需少量计算和内存资源即可运行的小型 Llama 大模型背景介绍在当前信息量爆炸的时代,语言模型的训练日益变得复杂和困难。为了培训一个高效的语言模型,我们需要大量的计算资源和时间,这对很多人来说是不切实际的。同时,我...
-
03-04模型偏好只与大小有关?上交大全面解析人类与32种大模型偏好的定量组分在目前的模型训练范式中,偏好数据的的获取与使用已经成为了不可或缺的一环。在训练中,偏好数据通常被用作对齐(alignment)时的训练优化目标,如基于人类或AI...
-
03-01吞吐量提升5倍,联合设计后端系统和前端语言的LLM接口来了大型语言模型(LLM)被广泛应用于需要多个链式生成调用、高级提示技术、控制流以及与外部环境交互的复杂任务。尽管如此,目前用于编程和执行这些应用程序的高效系统却存...
-
03-01可视化FAISS矢量空间并调整RAG参数提高结果精度随着开源大型语言模型的性能不断提高,编写和分析代码、推荐、文本摘要和问答(QA)对的性能都有了很大的提高。但是当涉及到QA时,LLM通常会在未训练数据的相关的问...
-
03-01让GenAI提供更好答案的诀窍GenAI作为一种界面具有巨大的潜力,可以让用户以独特的方式查询数据,获取满足他们需求的答案。例如,作为一个查询助手,GenAI工具可以帮助客户通过简单的问答格...
-
03-01陈丹琦团队新作:Llama-2上下文扩展至128k,10倍吞吐量仅需1/6内存陈丹琦团队刚刚发布了一种新的LLM上下文窗口扩展方法:它仅用8k大小的token文档进行训练,就能将Llama-2窗口扩展至128k。最重要的是,在这个过程中,...

