llama_第78页_陕西然坤悦科技有限公司

400-5689-0921
客服咨询
- 在线咨询

新闻中心 NEWS CENTER

您当前位置：首页

01-14

蚂蚁开源分布式训练扩展库ATorch实现大模型训练算力有效利用率达到60%

蚂蚁集团最近宣布推出了名为ATorch的大模型分布式训练加速扩展库，这是一个开源工具。ATorch的目标是通过自动资源动态优化和分布式训练稳定性提升，帮助提高深...
01-14

深入探讨模型、数据和框架：一份详尽的54页高效大语言模型综述

大规模语言模型（LLMs）在许多重要任务中展现出了引人注目的能力，包括自然语言理解、语言生成和复杂推理，并对社会产生了深远的影响。然而，这些出色的能力却需要大量...
01-14

利用知识图谱增强RAG模型的能力和减轻大模型虚假印象

在使用大型语言模型(LLM)时，幻觉是一个常见问题。尽管LLM可以生成流畅连贯的文本，但其生成的信息往往不准确或不一致。为了防止LLM产生幻觉，可以利用外部的知...
01-14

云天励飞五年连续巨亏20亿元！AI芯片投资冒险狂赌

在大模型兴起之前，人工智能的1.0时代出现了文本识别、语音识别和图像识别这三大杀手级应用。2015年，总部位于深圳的云天励飞推出了名为“云天深目”的系统，成为全...
01-14

小而强大的模型盛火兴起：TinyLlama和LiteLlama成为热门选择

当前，研究者开始关注小巧且高性能的小模型，尽管大家都在研究参数规模达到百亿甚至千亿级别的大模型。小模型在边缘设备上有广泛应用，如智能手机、物联网设备和嵌入式系统...
01-13

减少Transformer秩数以提高性能，同时保持移除特定层90%以上组件LLM不减少

麻省理工学院和微软进行了联合研究，发现不需要额外的训练即可提升大型语言模型的任务性能，并减小其大小在大型模型时代，Transformer以其独特的能力支撑起整个...

: 电话

: 客服

: 地图

: 搜索