新闻中心
-
02-01无注意力大模型Eagle7B:基于RWKV,推理成本降低10-100 倍无注意力大模型Eagle7B:基于RWKV,推理成本降低10-100倍在AI赛道中,小模型近来备受瞩目,相较于拥有上千亿参数的模型。例如,法国AI初创公司发布的...
-
02-01Mistral-Medium意外泄露?冲上榜单的这个神秘模型让AI社区讨论爆了「我现在100%确信Miqu与PerplexityLabs上的Mistral-Medium是同一个模型。」近日,一则关于「Mistral-Medium模型泄露」...
-
01-31小扎官宣Code Llama重量级更新,新增70B版本,但还有能力限制功能更强大的CodeLlama70B模型来了。今天,Meta正式发布CodeLlama70B,这是CodeLlama系列有史以来最大、性能最好的型号。我们正在开...
-
01-31大模型也能切片,微软SliceGPT让LLAMA-2计算效率大增大型语言模型(LLM)通常拥有数十亿参数,经过数万亿token的数据训练。然而,这样的模型训练和部署成本都非常昂贵。为了降低计算需求,人们常常采用各种模型压缩技...
-
01-30Meta官方的Prompt工程指南:Llama 2这样用更高效随着大型语言模型(LLM)技术日渐成熟,提示工程(PromptEngineering)变得越来越重要。一些研究机构发布了LLM提示工程指南,包括微软、OpenA...
-
01-30无需人工标注!LLM加持文本嵌入学习:轻松支持100种语言,适配数十万下游任务文本嵌入(wordembedding)是自然语言处理(NLP)领域的基础技术,它能够将文本映射到语义空间,并转化为稠密的矢量表示。这种方法已经被广泛应用于各种N...

