llama_第51页_陕西然坤悦科技有限公司

400-5689-0921
客服咨询
- 在线咨询

新闻中心 NEWS CENTER

您当前位置：首页

05-27

全面超越DPO：陈丹琦团队提出简单偏好优化SimPO，还炼出最强8B开源模型

为了将大型语言模型（LLM）与人类的价值和意图对齐，学习人类反馈至关重要，这能确保它们是有用的、诚实的和无害的。在对齐LLM方面，一种有效的方法是根据人类反馈的...
05-25

从80个模型中构建Scaling Law：华人博士生新作，思维链提出者力荐

在AI领域，扩展定律（Scalinglaws）是理解LM扩展趋势的强大工具，其为广大研究者提供了一个准则，该定律在理解语言模型的性能如何随规模变化提供了一个重要...
05-25

Meta首发「变色龙」挑战GPT-4o，34B参数引领多模态革命！10万亿token训练刷新SOTA

GPT-4o的横空出世，再次创立了一个多模态模型发展的新范式！为什么这么说？OpenAI将其称为「首个『原生』多模态」模型，意味着GPT-4o与以往所有的模型，...
05-24

HuggingFace教你怎样做出SOTA视觉模型

前有OpenAI的GPT-4o，后有谷歌的系列王炸，先进的多模态大模型接连炸场。其他从业者在震撼之余，也再次开始思考怎么追赶这些超级模型了。在这篇Hugging...
05-24

Karpathy称赞，从零实现LLaMa3项目爆火，半天1.5k star

一个月前，Meta+发布了开源大模型llama3系列，在多个关键基准测试中优于业界SOTA模型，并在代码生成任务上全面领先。此后，开发者们便开始了本地部署和实现...
05-23

70B模型秒出1000token，代码重写超越GPT-4o，来自OpenAI投资的代码神器Cursor团队

70B模型，秒出1000token，换算成字符接近4000！研究人员将Llama3进行了微调并引入加速算法，和原生版本相比，速度足足快出了快了13倍！不仅是快，...

: 电话

: 客服

: 地图

: 搜索