新闻中心

群核科技发布两款空间开源模型,为空间智能技术带来新突破

2025-09-18
浏览次数:
返回列表

近日,群核科技在首届技术开放日(techday)上正式推出其空间大模型领域的最新研究成果:新一代空间语言模型 spatiallm 1.5 与空间生成模型 spatialgen。这两款核心模型将陆续在 huggingface、github、魔搭社区等全球开发者平台开源,全面赋能行业创新。

同时,群核科技AI团队透露,正在研发一款深度融合3D技术的AI视频生成产品——AI视频生成Agent,并计划于今年内正式发布,进一步拓展AIGC在空间内容创作中的边界。

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

群核科技联合创始人兼董事长表示,开源是公司长期坚持的战略方向之一。相较于已趋成熟的通用大语言模型,当前的空间大模型仍处于发展初期。通过开源共享,群核希望加速全球范围内空间智能技术的迭代进程,致力于成为世界领先的空间智能服务提供者。

目前,室内空间数据的获取面临三大核心难题:数据采集困难、空间结构复杂、人机交互需求高。依托旗下酷家乐这一领先的三维空间设计平台,群核构建了“空间编辑工具 → 空间合成数据 → 空间大模型”三位一体的飞轮生态体系:工具沉淀真实场景数据,数据反哺模型训练,模型优化工具能力,进而推动更广泛的应用和更多元的数据积累。

截至2025年6月30日,群核科技已拥有超 4.41亿个3D模型 和超过 5亿个结构化3D空间场景,形成了业内领先的高质量空间数据库。

在此基础上发布的 SpatialLM 1.5 是基于大语言模型深度训练而成的新一代空间语言理解与生成系统。用户可通过对话式交互界面 SpatialLM - Chat 实现端到端的可交互空间场景生成。相比传统大语言模型对物理空间几何关系理解的局限性,SpatialLM 1.5不仅能解析自然语言指令,更能输出包含空间布局、物体相对位置、材质参数及物理约束的“空间语言”。

其所生成的场景具备准确的物理结构信息,支持批量生成多样化、合规化的三维环境,广泛适用于机器人路径规划、避障训练、任务执行等AI训练场景,有效缓解当前机器人领域因真实数据稀缺而导致的“缺数据”困境。其前代版本 SpatialLM 1.0 自今年3月开源以来,迅速登上 Hugging Face 趋势榜前三,获得全球开发者高度关注。

另一重磅成果 SpatialGen 则聚焦于“视觉呈现与内容生成”。作为一款基于扩散模型架构的多视角图像生成模型,SpatialGen 能够确保同一物体在不同视角下保持一致的空间属性与物理逻辑,避免传统生成模型中常见的错位、畸变或遮挡错误问题。

GoEnhance GoEnhance

全能AI视频制作平台:通过GoEnhance AI让视频创作变得比以往任何时候都更简单。

GoEnhance 347 查看详情 GoEnhance

基于 SpatialGen 技术生成的 3D高斯溅射场景 以及 真实感全息漫游视频,让用户如同置身真实空间,自由穿梭于虚拟环境中,享受沉浸式的视觉体验。

群核科技AI产品总监指出,尽管当前AIGC在文生视频、图生视频方面已掀起创作热潮,但在商业化落地层面仍存在明显短板。许多现有视频生成模型依赖2D图像或视频片段进行训练,缺乏对三维空间结构和物理规律的理解与推理能力,导致在视角切换时频繁出现物体漂移、空间错乱、遮挡异常等问题。

为此,群核AI团队正全力攻关一款具备强3D理解能力的AI视频生成Agent。该产品将深度融合空间建模与动态时序生成能力,有望显著提升AI生成视频的时空一致性,为*、家装、虚拟现实等领域带来更具实用价值的内容生产工具。

此前,群核科技更新了赴港上市招股书,持续推进在港交所的IPO进程。根据披露数据,公司在2025年上半年实现业绩大幅增长,成功扭亏为盈,经调整净利润达 1783万元,展现出强劲的发展势头。

此次发布的两款空间智能模型,标志着群核科技在AI+空间领域的关键突破:SpatialLM 1.5 从“语言”与“结构”维度为AI理解物理世界奠定基础,SpatialGen 则从“视觉”与“生成”层面提供高质量解决方案

它们并非仅为展示技术实力的“炫技之作”,而是立足底层逻辑,直面AI在真实场景中“见光死”的根本挑战。在全球科技巨头竞相追逐“世界模型”的背景下,主流路径多以“视觉优先”为主导,而群核则另辟蹊径,提出“结构优先”的技术路线,强调先理解空间内在逻辑,再实现感知与生成。

随着技术持续演进,群核科技有望在空间智能领域取得更多突破性进展,引领行业迈向更高阶的智能化未来。

以上就是群核科技发布两款空间开源模型,为空间智能技术带来新突破的详细内容,更多请关注其它相关文章!


# github  # 如何推广健身网站赚钱呢  # 自然语言  # 万元  # 这一  # 安装包  # 一键  # 前代  # 高质量  # 新突破  # 两款  # hugging face  # git  # 工具  # ai  # 虚拟现实  # 大模型  # ai视频  # 2025年  # 2025  # 开源  # 番禺品牌网站推广推荐  # 阜宁关键词排名  # 旅游营销推广哪家好  # 营销平台推广计划升级  # 大石桥国内seo优化  # seo喜刷怎么用  # 网站站群建设  # 个人网站建设总结报告  # 民宿的营销推广策略分析 


相关栏目: 【 行业资讯67740 】 【 技术百科0 】 【 网络运营39195


相关推荐: 三星相机里power是什么意思  如何安装台式机固态硬盘  春运抢票用不用取票码  苹果16改掉了哪些  折叠屏手机哪个牌子性价比高  数组和J*A怎么打  typescript和node学哪个  混合固态硬盘如何分区  faq是什么意思  望远镜上power是什么意思  记录仪power灯亮是什么意思  docs命令如何进入d  ensp命令如何提示  linux如何合并分区命令  学typescript需要什么基础么  焊机上power指示灯亮是什么意思  春运抢票如何快速抢到票  单身交友必备软件  shell如何注释所有命令  苹果16有哪些款式的  光刻机的分类及特点  如何使用ping命令  ospf中交换机命令如何设置  商誉是什么意思  eraser是什么意思  1tb等于多少mb  市盈率市净率是什么意思  固态硬盘如何备份  typescript有什么作用  苹果16主打颜色有哪些  电瓶车的power是什么意思  为什么夸克书架书单没了  什么网址不能域名解析  51单片机贴片怎么*  跨境电商gmv是什么意思?跨境电商GMV:理解其含义、计算方法和影响因素  typescript掌握哪些可以做项目  光刻机是干什么用的  如何用adb命令停用系统软件  本科一批和本科二批是什么意思  typescript接口怎么选  win10电脑如何使用命令提示符  typescript能干什么  主板如何禁用固态硬盘  ip dhcp是什么意思  为什么进行域名解析  65寸电视长宽多少厘米  阿里云盘的会员怎么用  苹果怎么没出5g手机  16苹果有哪些机型  如何设置sql命令 

搜索