llama_第73页_陕西然坤悦科技有限公司

400-5689-0921
客服咨询
- 在线咨询

新闻中心 NEWS CENTER

您当前位置：首页

02-01

无注意力大模型Eagle7B：基于RWKV，推理成本降低10-100 倍

无注意力大模型Eagle7B：基于RWKV，推理成本降低10-100倍在AI赛道中，小模型近来备受瞩目，相较于拥有上千亿参数的模型。例如，法国AI初创公司发布的...
02-01

Mistral-Medium意外泄露？冲上榜单的这个神秘模型让AI社区讨论爆了

「我现在100%确信Miqu与PerplexityLabs上的Mistral-Medium是同一个模型。」近日，一则关于「Mistral-Medium模型泄露」...
01-31

小扎官宣Code Llama重量级更新，新增70B版本，但还有能力限制

功能更强大的CodeLlama70B模型来了。今天，Meta正式发布CodeLlama70B，这是CodeLlama系列有史以来最大、性能最好的型号。我们正在开...
01-31

大模型也能切片，微软SliceGPT让LLAMA-2计算效率大增

大型语言模型（LLM）通常拥有数十亿参数，经过数万亿token的数据训练。然而，这样的模型训练和部署成本都非常昂贵。为了降低计算需求，人们常常采用各种模型压缩技...
01-30

Meta官方的Prompt工程指南：Llama 2这样用更高效

随着大型语言模型（LLM）技术日渐成熟，提示工程（PromptEngineering）变得越来越重要。一些研究机构发布了LLM提示工程指南，包括微软、OpenA...
01-30

无需人工标注！LLM加持文本嵌入学习：轻松支持100种语言，适配数十万下游任务

文本嵌入（wordembedding）是自然语言处理（NLP）领域的基础技术，它能够将文本映射到语义空间，并转化为稠密的矢量表示。这种方法已经被广泛应用于各种N...

: 电话

: 客服

: 地图

: 搜索