Episode 20240433
从会跳舞到有感知,触觉是机器人通往智能的门票吗?| S10E19
July 1st, 2026
52 mins 35 secs
About this Episode
2025 年,Tesla Optimus Gen 2 能拿鸡蛋,宇树机器人能翻跟头,波士顿动力 Atlas 能 360 度旋转——机器人的运动能力已逼近 90 分。但如果你让机器人扣一颗扣子、给手机充个电,它可能连插头都找不准。具身智能的最后一块拼图——触觉,至今还没装上。触觉到底是通往 AGI 的必经之路,还是一个可有可无的锦上添花?一边是头部公司纷纷自研视触觉传感器,另一边是触觉传感器至今没有大规模量产落地,连像样的开源数据集都几乎不存在。2026 年被称为「触觉元年」——但这一年,真的来了吗?
本期嘉宾是一目科技创始人兼 CEO 李智强(Eric),他用十年时间把触觉传感器从实验室带到了量产线。我们在一起聊了聊机器人触觉有哪些解决方案;触觉作为一种全新模态,如何整合进机器人的大脑;以及触觉传感器商业化落地的场景在哪里。
本期人物
李智强 Eric,一目科技创始人兼 CEO
丁教 Diane,「声动活泼」联合创始人、「科技早知道」主播
Yaxian,「科技早知道」主播

时间轴
[02:15] 视觉三大死穴:精度、遮挡、缺乏力觉
视觉测距只能到毫米级,灵巧操作需要亚毫米精度
物体的背面完全被遮挡,手到底碰到了没有、力有多大,视觉完全不知道
[05:05] 三张成绩单:运动 90 分、灵巧手 59 分、大脑只有 30 分
运动控制已非常接近完成,硬件本身的自由度甚至超过人类
灵巧手的技术方案有了但还没过质量门槛,高自由度路线还未收敛
大脑最差:没有物理世界的触觉信息,大语言模型「读万卷书」但还没「行万里路」
[09:30] 触觉的技术路线:「视触觉」不是视觉,光触觉才是更好的名字
视触觉本质是触觉:弹性皮肤接触物体后产生形变和光影变化,用光学方式读取并转化为力和纹理
行业里曾有纯视觉路线,但视觉的精度、遮挡、力控缺陷无法绕开,两者是互补而非替代
从第一性原理出发,类人五感的核心是「类人」——人类的指尖有 3000 个点位、12000 个受体神经
[16:51] 触觉元年到了吗?价值共识、技术收敛、成本可行性的三重拐点
做 VLA 和世界模型的公司已撞到模态天花板——视觉和语言都有了,一上手还是落不了地
技术路线从电磁、压阻、电容多条路线收敛到视触觉这一条
成本端:触觉传感器是投资回报率极高的模态——性能提升十万倍但成本只增加百分之几十
[23:41] 触觉模型怎么构建?
触觉数据有三个特点:离物理真相最近(准)、数据量相对小、高频连续信号
前端用小模型 Encoder 做语义理解,再跟视觉等其他模态对齐
行业正在从 VLA 向 VTLA(加入 Tactile)演进
[30:20] 数据难题:触觉数据的独特困境
真机数据最好但太贵太难获得,仿真数据占大头
一个全新思路:预训练用大量纯视觉数据先「学个样」,再叠加触觉进行 fine-tuning
[36:27] 触觉在哪先落地?
人类工人 30 秒一道工序,机器人起初要 100 秒;四个月后做到 15 秒,比人快一倍
一旦 learning-based 的模型收敛,就像 AlphaGo 一样,人就再也赢不了了
[43:01] 一张芯片、自研材料、十年磨一剑:一目的三重护城河
最底层是自研超表面硅光感光芯片,把传感器厚度压缩到 10 毫米
材料学悖论:既要捕捉微米级纹理,又要百万次按压不变形——从单体分子开始自研自产
十年积累带来量产工程化能力:全行业成本最低,性能最好
点击链接,了解一目科技更多信息!

幕后制作
监制:Yaxian
后期:迪卡
运营:George
设计:饭团
商业合作
声动活泼商业化小队,点击链接直达声动商务会客厅,也可发送邮件至 [email protected] 联系我们。
加入声动活泼
声动活泼正在招聘全职商务运营经理、早咖啡内容实习生和社群实习生,如果你也对播客行业的内容制作感兴趣,欢迎点击招聘入口
关于声动活泼
「用声音碰撞世界」,声动活泼致力于为人们提供源源不断的思考养料。
我们还有这些播客:声动早咖啡、声东击西、吃喝玩乐了不起、反潮流俱乐部、泡腾 VC、商业WHY酱、跳进兔子洞 、不止金钱
欢迎在即刻、微博等社交媒体上与我们互动,搜索 声动活泼 即可找到我们。
期待你给我们写邮件,邮箱地址是:[email protected]

欢迎扫码添加声小音,在节目之外和我们保持联系。