新闻中心
-
01-17Stability AI发布了支持本地运行且无需GPU的稳定代码3B模型StabilityAI近日发布了其2024年的首款AI模型,名为StableCode3B。这个模型拥有30亿参数,专注于辅助代码任务。无需专用GPU即可在笔记本...
-
01-17小红书搜索团队揭示:验证负样本在大规模模型蒸馏中的重要性大语言模型(LLMs)在推理任务上表现出色,但其黑盒属性和庞大参数量限制了其在实践中的应用。特别是在处理复杂的数学问题时,LLMs有时会出现错误的推理链。传统的...
-
01-17浅析 LLM 可观测性大家好,我是Luga。今天我们继续探讨人工智能生态领域中与技术相关的主题——LLM(大型语言模型)的可观测性。本文将继续深入分析LLM的可观测性,以帮助大家了解...
-
01-16上交大发布推理引擎PowerInfer,其token生成速率仅比A100低18%,或将取代4090成为A100的替代品为了不改变原意而重写内容,需要将语言重写为中文,不需要出现原句本网站的编辑部PowerInfer的出现使得在消费级硬件上运行AI变得更加高效上海交大团队,刚刚推...
-
01-16位置编码在Transformer中的应用:探究长度外推的无限可能性在自然语言处理领域,Transformer模型因其卓越的序列建模性能而备受关注。然而,由于其训练时限制了上下文长度,使得它及其基于此的大语言模型都无法有效地处理...
-
01-16释放绝佳的编程资源,巨型模型和智能体将引发更强劲的力量正如瑞斯福兹魔杖缔造了诸如邓布利多在内的历代非凡魔法师的传奇,具有巨大潜能的传统大型语言模型,在经过代码语料的预训练/精调后,掌握了更超出本源的执行力。具体来说...

