新闻中心
-
01-07高情商的NPC来了,刚伸出手,它就做好了要配合下一步动作的准备在虚拟现实、增强现实、游戏和人机交互等领域,经常需要让虚拟人物和屏幕外的玩家互动。这种互动是即时的,要求虚拟人物根据操作者的动作进行动态调整。有些互动还涉及物体...
-
01-06免费*工具:一键将动漫化影片转换为流畅的武打招式万物皆可动漫化,无论是文字、图片还是视频!看,兩位老兄上一秒還在武館激烈打鬥:下一秒就转到了二次元世界,出拳、格挡各种招式丝滑转换:小帅和小美正在拼凑“爱的华尔...
-
01-05旷视开源多模态大模型,支持文档级OCR,覆盖中英文,是否标志着OCR的终结?想将一份文档图片转换成Markdown格式?以往这一任务需要文本识别、布局检测和排序、公式表格处理、文本清洗等多个步骤——这一次,只需一句话命令,多模态大模型V...
-
01-05MobileSAM:为移动设备提供高性能的轻量级图像分割模型一、引言随着移动设备的普及和计算能力的提升,图像分割技术成为了研究的热点。MobileSAM(MobileSegmentAnythingModel)是一种针对移...
-
01-05大规模模型已经可以为图像做标注,只需简单对话!清华&NUS的研究成果多模态大模型集成了检测分割模块后,抠图变得更简单了!我们的模型可以通过自然语言描述来快速标注要寻找的物体,并提供文字解释,让您轻松完成任务。新加坡国立大学NEx...
-
01-05全力迈向闭环!DriveMLM:将LLM与自动驾驶行为规划完美结合!写在前面&笔者的个人理解大型语言模型为智能驾驶开辟了新的格局,赋予了他们类似人类的思维和认知能力。本文深入研究了大型语言模型(LLM)在自动驾驶(AD)...

