新闻中心
-
05-27全面超越DPO:陈丹琦团队提出简单偏好优化SimPO,还炼出最强8B开源模型为了将大型语言模型(LLM)与人类的价值和意图对齐,学习人类反馈至关重要,这能确保它们是有用的、诚实的和无害的。在对齐LLM方面,一种有效的方法是根据人类反馈的...
-
05-25从80个模型中构建Scaling Law:华人博士生新作,思维链提出者力荐在AI领域,扩展定律(Scalinglaws)是理解LM扩展趋势的强大工具,其为广大研究者提供了一个准则,该定律在理解语言模型的性能如何随规模变化提供了一个重要...
-
05-25Meta首发「变色龙」挑战GPT-4o,34B参数引领多模态革命!10万亿token训练刷新SOTAGPT-4o的横空出世,再次创立了一个多模态模型发展的新范式!为什么这么说?OpenAI将其称为「首个『原生』多模态」模型,意味着GPT-4o与以往所有的模型,...
-
05-24HuggingFace教你怎样做出SOTA视觉模型前有OpenAI的GPT-4o,后有谷歌的系列王炸,先进的多模态大模型接连炸场。其他从业者在震撼之余,也再次开始思考怎么追赶这些超级模型了。在这篇Hugging...
-
05-24Karpathy称赞,从零实现LLaMa3项目爆火,半天1.5k star一个月前,Meta+发布了开源大模型llama3系列,在多个关键基准测试中优于业界SOTA模型,并在代码生成任务上全面领先。此后,开发者们便开始了本地部署和实现...
-
05-2370B模型秒出1000token,代码重写超越GPT-4o,来自OpenAI投资的代码神器Cursor团队70B模型,秒出1000token,换算成字符接近4000!研究人员将Llama3进行了微调并引入加速算法,和原生版本相比,速度足足快出了快了13倍!不仅是快,...

