新闻中心
-
06-12SmolVLA— Hugging Face开源的轻量级机器人模型SmolVLA是HuggingFace推出的一款轻量级视觉-语言-行动(VLA)模型,专为资源受限的机器人平台设计。该模型参数规模约为4.5亿,具备较高的计算效...
-
06-05PlayDiffusion— Play AI开源的音频编辑模型PlayDiffusion是什么PlayDiffusion是PlayAI推出的新型音频编辑模型,基于扩散模型技术,专门用在音频的精细编辑和修复。模型将音频编码为...
-
06-04Google AI Edge Gallery— 谷歌推出的AI应用,支持手机端离线运行AI模型GoogleAIEdgeGallery是什么GoogleAIEdgeGallery是谷歌推出的一款试验性应用程序,允许用户在本地设备上尝试和运用机器学习(ML)...
-
05-3020款核心AI API 开发人员必备,涵盖文本生成、语音处理、图像识别、视频编辑四大领域AIAPI正以前所未有的速度重塑技术开发格局。从生成式文本到多模态内容生成,从智能客服到工业级视觉识别,开发者仅需几行代码便能轻松获取顶级AI能力。随着技术不断...
-
05-30Ming-lite-omni— 蚂蚁集团开源的统一多模态大模型Ming-Lite-Omni是蚂蚁集团推出的一款开源的统一多模态大模型。该模型采用了MoE(MixtureofExperts)架构,整合了文本、图像、音频及视频...
-
05-29Jodi— 中国科学院推出的视觉理解与生成统一模型Jodi是由中国科学院计算技术研究所与中国科学院大学共同研发的一种扩散模型框架,其核心在于通过联合建模图像域与多个标签域,将视觉生成与理解功能整合在一起。该框架...

