新闻中心
-
03-26模型合并就进化,直接拿下SOTA!Transformer作者创业新成果火了把Huggingface上的现成模型拿来“攒一攒”——直接就能组合出新的强大模型?!日本大模型公司sakana.ai脑洞大开(正是“Transformer八子”...
-
03-26使用GaLore在本地GPU进行高效的LLM调优训练大型语言模型(llm)是一项计算密集型的任务,即使是那些“只有”70亿个参数的模型也是如此。这种级别的训练需要的资源超出了大多数个人爱好者的能力范围。为了弥...
-
03-253140参数Grok-1推理加速3.8倍,PyTorch+HuggingFace版来了马斯克说到做到开源Grok-1,开源社区一片狂喜。但基于Grok-1做改动or商用,都还有点难题:Grok-1使用Rust+JAX构建,对于习惯Python+P...
-
03-22WorldGPT来了:打造类Sora视频AI智能体,「复活」图文OpenAI的Sora在今年2月惊艳亮相,为文本生成视频带来了全新的突破。它可以根据文字输入创作出仿佛来自好莱坞的逼真且充满想象力的影片,让人叹为观止。许多人都...
-
03-20一文读懂大型语言模型微调技术挑战与优化策略大家好,我是Luga。今天我们将继续探讨人工智能生态领域中的技术,特别是LLMFine-Tuning。本文将继续深入剖析LLMFine-Tuning技术,帮助大...
-
03-18为了保护客户隐私,使用Ruby在本地运行开源AI模型译者|陈峻审校|重楼最近,我们实施了一个定制化的人工智能(AI)项目。鉴于甲方持有着非常敏感的客户信息,为了安全起见,我们不能将它们传递给OpenAI或其他专有...

