新闻中心

国内首款AI助盲眼镜发布,通义千问驱动解决视障出行难题

2025-12-13
浏览次数:
返回列表

近日,杭州瞳行科技正式推出国内首台ai助盲眼镜,致力于以人工智能技术切实缓解视障人士在日常出行与生活场景中面临的现实困境。该产品已完*套化设计并上架销售,包含ai眼镜本体、专属配套手机、可穿戴遥控指环及一根智能适配盲杖,用户可一站式购齐、即开即用。

这款眼镜功能全面,覆盖出行避障、物品查找与文本识别、语音交互助手、一键紧急求助亲友等核心需求。在出行模式下,系统端到端延迟控制在约300毫秒以内,响应极为迅捷,能精准匹配人体自然步频——每迈出一步,即可同步获取实时路况语音提示。

硬件层面,设备搭载121度超广角双摄像头模组,协同手机端强大算力与指环式交互操作,构建起“感知—决策—反馈”的闭环式人机协作体系。技术实现上,并未采用单一模型架构。瞳行融合自研视觉理解模型与通义千问Qwen-VL多模态大模型、OCR识别系列模型,并针对不同使用情境进行精细化参数调优与任务分流。

例如,在避障类场景中,系统需在毫秒级内判断前方是否存在大型障碍物及其可通行性(如能否迈过台阶),此时模型输出高度精简、指令明确,如“正前方有三级台阶,左侧2米处有慢行行人”,信息被压缩为可立即执行的动作指引;而在找店点餐类场景中,系统需准确识别招牌文字、菜单段落排版、窗口价目表等多源异构信息,会对图像内容进行深度结构化解析与语义整合,再通过语音清晰复述关键要素,处理耗时略长但信息维度更完整、上下文更连贯。

研发团队在模型选型与硬件配置之间进行了大量权衡取舍。为保障避障响应的极致低延时,他们将大模型能力按场景解耦:对强时效性任务(如动态避让)优先启用轻量化本地推理逻辑,大模型仅作辅助校验;而对依赖深层语义解析与长文本理解的任务(如菜单解读、公告阅读),才激活高复杂度模型参与运算。

硬件选型亦围绕实用性展开:超宽视角双摄显著缩小视觉盲区;指环支持无感切换功能模式与触发SOS求助;手机承担主要计算负载与网络连接任务;传统盲杖则予以保留并做智能化适配,延续用户既有使用习惯。

出行难,长期是视障群体最突出的生活痛点。我国视力障碍人口逾1700万,日常通勤高度依赖电子导航与他人协助,却频繁遭遇“最后十米”导航失效问题——门牌模糊不清、出入口被临时占用、楼道标识缺失或位置隐蔽等情形屡见不鲜;加之公共服务响应存在不确定性,不少视障者被迫大幅减少外出频次,甚至长期居家。

本款AI助盲眼镜正是直击上述高频难点,重点强化复杂城市环境下的毫秒级环境感知能力与自然语言交互体验。从行业方法论看,瞳行采取“通用基座模型+垂直场景微调”的技术路径,提升模型复用效率与落地适配性。

市场与技术总监曾指出:“在大模型尚未普及的阶段,独立部署高性能AI算力的成本极高,中小创业公司往往难以承受。如今随着通义千问等高质量开源基础模型的成熟与算力基础设施成本持续下降,企业得以将资源重心转向场景工程打磨与用户体验优化,真正让这类软硬一体的助残硬件具备规模化落地与可持续运营的商业基础。”

拾贝 拾贝

一键同步微信读书所有笔记和划线,并在新标签页回顾

拾贝 186 查看详情 拾贝

该产品在多样化真实场景中展现出差异化性能表现:

  • 在人流密集街区,系统侧重对移动目标的轨迹预测与简洁化语音提示;
  • 行至公交站或地铁口时,自动识别线路指示牌与到站车次信息,优先播报与用户目的地强相关的关键字段;
  • 进入餐厅或需阅读纸质材料时,OCR模块将图像实时转为可读文本,大模型进一步提炼要点并逐句语音播报;
  • 若识别置信度不足或结果存疑,系统主动提示用户确认,或一键发起远程求助,即时向预设联系人发送当前位置与现场语音片段。

操作流程同样贴合用户实际:开机佩戴后,可通过语音或指环快捷选择“出行”或“阅读”主模式;指环支持多档位切换子功能;遇突发状况仅需单击指环,即可自动上传定位坐标与最近10秒音频至紧急联系人终端。

从企业发展策略来看,瞳行坚持“自研模型打底 + 大模型赋能”的双轨协同路线:自研模型专注高速响应与边缘端稳定执行,大模型负责高阶语义理解与复杂上下文推理,二者经由场景驱动的任务调度机制与联合微调,在速度与精度间取得动态平衡。

面向市场,整套“眼镜+手机+指环+盲杖”组合设计,既降低初次使用门槛,又尊重传统辅具使用惯性,是一种务实且具包容性的产品哲学。关于成本控制与长期可持续性,算力成本的实质性下降成为关键支点——过去同类项目常因算力投入过高导致资金链承压,如今依托成熟的基础模型生态,企业可聚焦于真实场景的问题定义、交互设计与服务闭环建设。

目前,该AI助盲眼镜已全面开放购买,用户可直接选购含眼镜主机、定制手机、遥控指环及智能盲杖在内的完整套装。

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜



以上就是国内首款AI助盲眼镜发布,通义千问驱动解决视障出行难题的详细内容,更多请关注其它相关文章!


# 首款  # 老域名seo优化  # 新网站如何做网站推广赚钱  # 优化一个网站推荐的软件  # 鄂州网站建设维护  # 德令哈网站推广优化  # 聊城网站建设优化公司  # 南宁seo付费推广  # 崂山网站建设运营  # 南岸靠谱的seo电话  # 关键词排名看哪个  # 逐句  # 两月  # 通义千问  # 国内  # 好用  # 下载地址  # 闭环  # 景中  # 一键  # 拾贝  # qwen  # 大模型  # ai  # 人工智能 


相关栏目: 【 行业资讯67740 】 【 技术百科0 】 【 网络运营39195


相关推荐: 域名批量查询工具有哪些  学typescript需要什么基础么  折叠手机内屏为什么会坏  折叠手机屏易坏吗为什么  学typescript需要多久  苹果16日发售哪些机型  虽千万人吾往矣什么意思  a股等权平均市盈率是什么意思  ao3镜像网站哪个好  固态硬盘4k如何看  如何安装台式机固态硬盘  12306退票手续费最新规定  j*a数组怎么存满  ka是什么意思  安卓手机怎么打开5g  华为交换机如何复制命令行  计数器上power是什么意思  typescript是什么时候出来的  如何打开管理员命令提示符  vivo手机爱奇艺怎么投屏到电视操作步骤  苹果16系统有哪些系列  三星固态硬盘如何保修  苹果16系统有哪些问题  为什么夸克书架书单没了  a股等权市盈率中位数是什么意思  win7如何打开命令行窗口  如何编写一个linux命令  夸克文字口令是什么意思  linux如何合并分区命令  performance是什么意思  typescript如何遍历map  openwrt有什么用  数组和J*A怎么打  负市盈率是什么意思  如何使用net命令  adb 命令如何后台运行  typescript能干什么  市盈率当中17A 18E是什么意思  如何激活固态硬盘  typescript接口怎么选  爱奇艺vip会员可以同时几个人用?  a03怎么根据编号找文链接入口  市盈率静是什么意思  kingston是什么_kingston是什么意思  NoSQL数据库有哪些特点  j*a数组怎么取元素  虚拟机服务器如何关机命令  固态硬盘质量如何  datediff快捷函数怎么用  put linux命令如何书写 

搜索