新闻中心
-
07-06细数RAG的12个痛点,英伟达高级架构师亲授解决方案检索增强式生成(RAG)是一种使用检索提升语言模型的技术。具体来说,就是在语言模型生成答案之前,先从广泛的文档数据库中检索相关信息,然后利用这些信息来引导生成过...
-
06-17英伟达开源最强通用模型Nemotron-4 340B性能超越Llama-3,主要用于合成数据。英伟达的通用大模型Nemotron,开源了最新的3400亿参数版本。本周五,英伟达宣布推出Nemotron-4340B...
-
06-05利用 NVIDIA Riva 快速部署企业级中文语音 AI 服务并进行优化加速一、Riva概览1.OverviewRiva是NVIDIA推出的一款SDK,用于实时的SpeechAI服务。它是一个高度可定制的工具,并且使用GPU进行加速。N...
-
05-25从80个模型中构建Scaling Law:华人博士生新作,思维链提出者力荐在AI领域,扩展定律(Scalinglaws)是理解LM扩展趋势的强大工具,其为广大研究者提供了一个准则,该定律在理解语言模型的性能如何随规模变化提供了一个重要...
-
05-25提高光学数据集利用率,天大团队提出增强光谱预测效果 AI 模型编辑|枯叶蝶最近,天津大学激光与光电子研究所吴亮副教授、姚建铨院士团队联合自然语言处理实验室熊德意教授团队报道了一种使用多频率补充输入的深度学习模型来增强光谱预...
-
05-24首个GPU高级语言,大规模并行就像写Python,已获8500 Star经过近10年的不懈努力,对计算机科学核心的深入研究,人们终于实现了一个梦想:在GPU上运行高级语言。上周末,一种名为Bend的编程语言在开源社区引发了热烈的讨论...

