本文的作者来自清华大学、北京大学、武汉大学和上海交通大学,主要作者为清华大学硕士生袁承博、武汉大学本科生周睿和北京大学博士生刘梦真,通讯作者为清华大学交叉信息研究院的高阳助理教授。 近期,GoogleDeepMind发布新一代具身大模型GeminiRobotics1.5,其核心亮点之一便是被称为MotionTransferMechanism(MT)的端到端动作迁移算法——无需重新训练,即可把不同形态机器人的技能「搬」到自己身上。不过,官方技术报告对此仅一笔带过,细节成谜。 正当业内还在揣摩MT的...
丁琰团队与地平线前总裁张玉峰的变化 近日,一则具身智能领域的人事变动,引发了行业内的强烈关注。前上海人工智能实验室青年研究员丁琰,2025年6月以联合创始人身份加入一星机器人任技术副总裁,其主导的IJRR系列研究引用量超400次,在CVPR、NeurIPS等顶会成果丰硕,更深度参与智元AgibotWorld等超大规模机器人项目。然而仅4个月后,一星机器人因吉利战略调整解散,即便其数采设备与数据治理平台已实现自负盈亏并能发放研发奖金,仍未能逃脱终止命运。 图片来源:甲子苏州 解散消息传出后,丁琰迅...
●ICLR2026爆火领域VLA(Vision-Language-Action,视觉-语言-动作)全面综述来了!如果你还不了解VLA是什么,以及这个让机器人学者集体兴奋的领域进展如何,看这一篇就够了。 文章作者MoritzReuss是2025年AppleAI/ML学者奖得主,曾在RSS、ICLR、NeurIPS等顶级会议多次发表研究成果。这篇综述既是一线研究者的实战总结,也是洞察趋势的前沿观察。文章一出,评论区好评不断,甚至顶级猎头MarkWallace直接抛出了橄榄枝。 这个VLA,究竟有多火...
11月27日,未来机域举办了"等待具身智能数据的ChatGPT时刻"第二场主题直播。 本次研讨会采用“嘉宾分享+圆桌讨论”的形式,上海刻行时空科技有限公司CEO黄阳明与北京具身智能科技有限公司CEO吴清华作为主讲嘉宾,就“高质量的具身智能数据生产”这一行业关键议题展开深度对话,共同探讨了当前行业面临的数据采集、标注与处理等核心挑战,并对具身智能发展的未来路径作出展望。 数据质量:成本与质量的平衡之路 具身智能行业正在经历从单一机型数据采集向异构多机器人数采的转变。黄阳明在分享中指出:“从谷歌的R...
论文信息 标题:AFractional-OrderSSIM-BasedGaussianLosswithLong-RangeMemoryforDenseVSLAM 作者:JunyangZhao,HuixinZhu,ZhiliZhang,MingtaoFeng,,HanYu,YuxuanLi 机构:中国人民解放军火箭军工程大学 原文链接:https://doi.org/10.3390/fractalfract9110744. 导读 在现有密集视觉同步定位与建图(VSLAM)研究中,一个核心挑战在于现...
近日,未来机域编辑部又听到了一位合作伙伴企业——灵心巧手的好消息,它作为国内“机器人灵巧手”的知名创新企业,宣布完成数亿元人民币A+轮融资。短短一年之内,灵心巧手接连完成了多轮亿元级融资(今年的4月、8月、10月,灵心巧手都宣布了融资的好消息)。 除了灵心巧手之外,因时机器人、傲意科技、灵巧智能、钧舵机器人的控股子公司淳栋触控、强脑科技BrainCo等创业公司都得到不少资本的青睐。然而,在这狂热的资本背后,有几个特别值得思考的问题。一、为什么资本那么热衷于投资灵巧手?为什么会有那么多创业公司专攻...
11月20号直播精彩回顾 具身智能是否真的会迎来属于它的‘ChatGPT时刻’? 这是许多具身智能从业者心头的问题。我们看到不少双足行走、灵活抓取的人形机器人demo,却也清楚地看到:它们的“小脑”发达,“大脑”却仍显稚嫩。而这一切的背后,是数据效率的困境——端到端模仿学习对高质量、大规模数据的渴求,已成为行业发展的瓶颈。 在11月20日由未来机域主办的"等待具身智能数据的ChatGPT时刻"主题直播中,来自产学研各界的专家围绕具身智能数据领域面临的挑战与突破路径展开深入探讨。北京人形机器人创新...
今天(11月20日),本账号“未来机域”正式开始第一场具身智能产业系列直播活动。本次直播是《等待具身智能数据的ChatGPT时刻》系列直播的第一场,主题为“具身智能数据‘垃圾之谜’”。来自产学研的嘉宾,对这一个话题,进行了一个多小时的对话和探讨。本文将直播中嘉宾的金句进行了简要整理,供馈读者。 备注:后续未来机域会根据本次直播进行内容深度整理,记得持续关注我们哟~ 北京人形机器人创新中心数据智能&灵巧操作负责人李广宇 这些年VLA大模型驱动了机器人发展,而发展的瓶颈并不是VLA模型本身,是数据闭...
近日,北京具身智能机器人创新中心正式发布Pelican-VL1.0具身视觉语言模型(VLM),宣称Pelican-VL1.0是"全球最大规模开源具身多模态大模型",展示出强大的技术实力。 而近期本平台也在策划“等待具身智能数据的ChatGPT时刻”的系列直播节目(欢迎大家扫描下方海报二维码加入直播群),借此机会,正好和大家梳理一下,目前全球具身智能机器人行业几个公认的高质量数据集。 01 OpenX-Embodiment ●发布方:GoogleDeepMind等全球21家机构 ●发布时间:202...
2025年11月7日,在伦敦伊丽莎白女王工程奖颁奖典礼后,英伟达CEO黄仁勋、斯坦福大学教授李飞飞、“AI教父”杰弗里・辛顿(GeoffreyHinton)、图灵奖得主杨立昆(YannLeCun)、约书亚・本吉奥(YoshuaBengio)以及英伟达首席科学家比尔・戴利(BillDally)六位AI领域顶尖人物进行了圆桌对话。 他们围绕通用人工智能(AGI)是否已经到来这一核心议题展开了讨论,还就技术泡沫、AGI时间表、发展路径等关键问题进行了激辩。接下来的一个星期,我会用一系列的文章,来分享这...