新闻中心
-
01-05旷视开源多模态大模型,支持文档级OCR,覆盖中英文,是否标志着OCR的终结?想将一份文档图片转换成Markdown格式?以往这一任务需要文本识别、布局检测和排序、公式表格处理、文本清洗等多个步骤——这一次,只需一句话命令,多模态大模型V...
-
01-04AI重生:夺回网文界的霸权重生了,这辈子我重生成了MidReal。一个可以帮别人写「网文」的AI机器人。这段时间里,我看到很多选题,偶尔也会吐槽一下。竟然有人让我写写HarryPotte...
-
01-04A800显著超越Llama2推理RTX3090与4090,表现优异的延迟和吞吐量大型语言模型(LLM)在学界和业界都取得了巨大的进展。但训练和部署LLM非常昂贵,需要大量的计算资源和内存,因此研究人员开发了许多用于加速LLM预训练、微调和推...
-
01-04清华浙大主导开源视觉模型爆炸, GPT-4V与LLaVA、CogAgent等平台带来革命性变革目前,GPT-4Vision在语言理解和视觉处理方面显示出了令人惊叹的能力。然而,对于那些希望在不影响性能的情况下寻求成本效益替代方案的人来说,开源方案是一个具...
-
12-28Transformer模型降维减少,移除90%以上特定层的组件时,LLM性能保持不变在大型模型时代,Transformer独自支撑起了整个科研领域。自从发布以来,基于Transformer的语言模型在各种任务上展现出了出色的性能,在自然语言建模...
-
12-214090生成器:与A100平台相比,token生成速度仅低于18%,上交推理引擎赢得热议PowerInfer提高了在消费级硬件上运行AI的效率上海交大团队最新推出了超强CPU/GPULLM高速推理引擎PowerInfer。PowerInfer和ll...

