新闻中心
-
01-14蚂蚁开源分布式训练扩展库ATorch实现大模型训练算力有效利用率达到60%蚂蚁集团最近宣布推出了名为ATorch的大模型分布式训练加速扩展库,这是一个开源工具。ATorch的目标是通过自动资源动态优化和分布式训练稳定性提升,帮助提高深...
-
01-14深入探讨模型、数据和框架:一份详尽的54页高效大语言模型综述大规模语言模型(LLMs)在许多重要任务中展现出了引人注目的能力,包括自然语言理解、语言生成和复杂推理,并对社会产生了深远的影响。然而,这些出色的能力却需要大量...
-
01-14利用知识图谱增强RAG模型的能力和减轻大模型虚假印象在使用大型语言模型(LLM)时,幻觉是一个常见问题。尽管LLM可以生成流畅连贯的文本,但其生成的信息往往不准确或不一致。为了防止LLM产生幻觉,可以利用外部的知...
-
01-14云天励飞五年连续巨亏20亿元!AI芯片投资冒险狂赌在大模型兴起之前,人工智能的1.0时代出现了文本识别、语音识别和图像识别这三大杀手级应用。2015年,总部位于深圳的云天励飞推出了名为“云天深目”的系统,成为全...
-
01-14小而强大的模型盛火兴起:TinyLlama和LiteLlama成为热门选择当前,研究者开始关注小巧且高性能的小模型,尽管大家都在研究参数规模达到百亿甚至千亿级别的大模型。小模型在边缘设备上有广泛应用,如智能手机、物联网设备和嵌入式系统...
-
01-13减少Transformer秩数以提高性能,同时保持移除特定层90%以上组件LLM不减少麻省理工学院和微软进行了联合研究,发现不需要额外的训练即可提升大型语言模型的任务性能,并减小其大小在大型模型时代,Transformer以其独特的能力支撑起整个...

