Google发布机器人专用AI模型提升仪表读取精度至93%

发布时间：2026-04-16 03:21 点击:1次

Google DeepMind于2026年4月14日（当地时间）正式发布了面向工业场景的机器人专用视觉语言模型「Gemini Robotics-ER 1.6」。该模型专为解决工厂、设施等复杂环境下的实际作业难题而设计，显著提升了机器人在空间认知、测量仪器读取等关键任务上的表现。作为的AI研究机构，Google此次发布的模型标志着人工智能从通用对话向物理世界深度交互迈出了重要一步。

该模型与波士顿动力公司（Boston Dynamics）展开了深度合作，被搭载于其标志性的四足机器人「Spot」之上。在实际应用中，搭载ER 1.6的Spot机器人已能够自主完成设施巡检任务，包括精准读取各类仪表盘数据、拍摄现场照片等，大幅减少了人工巡检的频率与风险。这一合作不仅验证了AI模型在真实工业场景中的落地能力，也为未来机器人自主作业提供了可复制的范例。

ER 1.6模型具备三大核心功能，使其在工业应用中表现卓越。是「Pointing」（指差确认）功能，该功能使机器人能够像人类一样通过指认方式识别多个物体，并检测物体位置、比较物体差异以及追踪物体运动轨迹。这一能力在复杂任务推理的前置阶段发挥了关键作用，显著提升了任务执行的准确性。是「Success Detection」（成功检测）功能，机器人可自主判断任务是否完成，并在失败时自动重试或进入下一工序，实现了真正的闭环作业。该功能通过强化多摄像头影像分析能力，使机器人能够从多角度综合评估任务状态。

第三项创新功能是「Instrument Reading」（仪表读取），这是前代模型ER 1.5所不具备的新特性。ER 1.6能够识别工厂中常见的温度计、压力表等模拟仪表的数值，面对复杂的刻度与指针位置，也能通过图像放大、指差确认及代码执行等步骤组合，实现高精度解读。这一功能对于需要24小时不间断监控的工业设施尤为重要，有效降低了人工读取误差与安全隐患。

性能测试ER 1.6在多项任务中的成功率均优于前代模型及通用大模型。特别是在仪表读取任务中，ER 1.6的成功率达到93%，远超ER 1.5的23%和Gemini 3.0 Flash的72%。在安全性方面，基于实际工伤案例构建的「ASIMOV」测试场景中，ER 1.6在文本与物体识别能力上也超越了Gemini 3.0 Flash，展现出更强的工业适应性。

目前，ER 1.6已通过「Gemini API」和「Google AI Studio」向开发者开放，并提供「Google Colaborate」开发环境，方便企业快速集成与测试。这一开放策略有助于加速AI机器人在全球范围内的应用落地，推动工业自动化的智能化升级。

日本作为全球机器人技术领先国家，其制造业正面临劳动力短缺与老龄化挑战，对具备自主感知与决策能力的智能机器人需求迫切。Google此次发布的模型不仅契合日本工业现场的实际痛点，也为全球制造业提供了可借鉴的技术路径。中国企业可关注此类垂直领域AI模型的演进趋势，结合本土工业场景进行技术适配与创新，推动智能制造向更高阶的自主化方向发展。

Google发布机器人专用AI模型提升仪表读取精度至93%

郑州昌晖自动化仪表有限公司