新闻中心
-
08-06算法、系统和应用,三个视角全面读懂混合专家(MoE)LLM很强,而为了实现LLM的可持续扩展,有必要找到并实现能提升其效率的方法,混合专家(MoE)就是这类方法的一大重要成员。最近,各家科技公司提出的新一代大模型...
-
08-0570倍极致压缩!大模型的检查点再多也不怕AIxiv专栏是本站发布学术、技术内容的栏目。过去数年,本站AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传...
-
08-05苹果让大模型学会偷懒:更快吐出第一个token,准确度还保住了偷懒才能更好地工作。Llama3.1刚刚发布,你是否已经尝试了呢?就算你的个人计算机是最近的顶尖配置,运行其中最小的8B版本可能也依然会有明显延迟。为了提升模型...
-
08-05离开OpenAI待业的Karpathy做了个大模型新项目,Star量一日破千没工作也要「卷」。闲不下来的AndrejKarpathy又有了新项目!过去几天,OpenAI非常热闹,先有AI大牛AndrejKarpathy官宣离职,后有视频...
-
08-05Llama成大模型顶流,扎克伯格掀论战:玩开源,时代变了开源与闭源的纷争已久,现在或许已经达到了一个新的高潮。说到开源大模型,Llama系列自诞生以来就是典型代表,其优秀的性能与开源特点让人工智能技术的应用性和可访问...
-
07-31揭秘!47页文档拆解苹果智能,从架构、数据到训练和优化在2024年全球开发者大会上,苹果重磅推出了AppleIntelligence,这是一个全新的个性化智能系统,可以提供实用的智能服务,覆盖iPhone、iPad...

