envy944
2025-06-04T14:36:24+00:00
2.89 复制打开抖音,看看[桶哥偶尔说的作品]上交大教授爆锤视觉智驾吹 [url]https://v.douyin.com/uZqhXopqa98/[/url] Okc:/ q@e.oD 05/23
前面价格那些不清楚,现在真降到3K以内了呀,真NB。
但是后面那个数据比算力更重要非常认同,模型再NB,算力再强大,也要供训练的数据优质才行。
打个比方,如果某公司开发出了一个文本问答模型,这个模型非常NB,这家公司也有财力把算力堆到飞起,但是由于种种原因,给模型供训练的数据全是垃圾,比如这个训练数据当中,公然说“地球是方的,且太阳围绕地球转”,垃圾到这种程度的数据,模型和算力再NB又有什么用呢?
Reply to [pid=827392481,44355743,1]Reply[/pid] Post by [uid=26544015]刻_铭[/uid] (2025-06-12 22:48) 人脑对于空间认知也是纯视觉运算。现在纯视觉的问题只是因为算力不足。比如说达到专业赛车手人脑级的驾驶如果需要10万T的推理算力与1亿T计算算力,那现在的车载算力是700t。 我也看好激光雷达,是因为激光雷达比算力便宜太多了。
本身吹纯视觉的。。。就很迷。。。大概率只是马粉而已。。。
说白了,现在给M3的FSD硬塞一个激光雷达进去,我TM连电都不通了,就纯装饰,你FSD的整体能力会变弱吗?不会啊,那如果我这个雷达在6万多种场景中的其中之一产生了积极作用,这是不是一个提升?
你可以说FSD用纯视觉做到一个不错的高度,但是以此为依据去硬要说纯视觉是毕业路线就很迷了。
Reply to [pid=827395218,44355743,1]Reply[/pid] Post by [uid=64963538]qdmakka[/uid] (2025-06-12 23:14)
如果是为了竞技,那局限在人眼或者视觉方案无可厚非。
但是为了安全,为了更好的智驾,多模态测量给出的多维度感知提升是最明显的,而且数据冗余也对算法有促进作用。
类似的比如之前华为的拍月亮,很多人质疑相机没有真的拍到,而是算法画出来的月亮,咋在智驾上面态度就反过来了呢。。。。。
整个计算机视觉算法是基于ML的,整个大模型也是基于ML的,而ML这玩意的最大特点就是不靠谱,而且一定不靠谱(底层数学原理决定的)[s:ac:哭笑]
所有人整各种算法,清洗各种数据拿去training,本质就是在想方设法降低错误率,但在可见的未来完全降不到一个可以接近靠谱的水平[s:ac:哭笑]
也就是因此,不管是视觉方案还是把大模型拿来用到智驾的决策,本质就只能起一个辅助作用,你一定要有额外的外部力量来做最终的保底决定来防止这些个玩意抽风酿成大祸[s:ac:哭笑]
当然,市场是另一回事,反正一般人也不懂底层原理,所以市场上多的是各种乱七八糟胡吹一通的,比如最近还有个大火的VLA,拿这玩意用来当智驾不做保底那是真的不把别人命当命[s:ac:哭笑]
关于纯视觉加上激光雷达能不能更好,举个很简单的例子。镜子迷宫,纯靠眼睛确实能走出来,但是有时候不太确定的时候,伸手去摸只会更快更稳。
成本降到3000,但是卖你2万,你看看问界pro到max的差价,就算成本是几十几百,资本家还是卖你2-3w呀
[quote][pid=827396141,44355743,1]Reply[/pid] Post by [uid=1725822]飞仔[/uid] (2025-06-12 23:23):
本身吹纯视觉的。。。就很迷。。。大概率只是马粉而已。。。
说白了,现在给M3的FSD硬塞一个激光雷达进去,我TM连电都不通了,就纯装饰,你FSD的整体能力会变弱吗?不会啊,那如果我这个雷达在......[/quote]所以特斯拉要加激光雷达很容易 反正特斯拉自己打自己脸都是家常便饭了 但是特斯拉视觉算法 遥遥 领先也是实打实的事实
[quote][pid=827395218,44355743,1]Reply[/pid] Post by [uid=64963538]qdmakka[/uid] (2025-06-12 23:14):
人脑对于空间认知也是纯视觉运算。现在纯视觉的问题只是因为算力不足。比如说达到专业赛车手人脑级的驾驶如果需要10万T的推理算力与1亿T计算算力,那现在的车载算力是700t。 我也看好激光雷达,是因为激光雷达比算力便宜太多了。[/quote]不是只算力不足的问题,你基础数据采集都不如视觉+激光融合准确,你算力再足有啥用。
[quote][pid=827398014,44355743,1]Reply[/pid] Post by [uid=66741603]lruekr3[/uid] (2025-06-12 23:40):
整个计算机视觉算法是基于ML的,整个大模型也是基于ML的,而ML这玩意的最大特点就是不靠谱,而且一定不靠谱(底层数学原理决定的)[s:ac:哭笑]
所有人整各种算法,清洗各种数据拿去training,本质就是在想方设法降低错误率,但在可见的未来完全降不到一个可以接近靠谱的水平[s:ac:哭笑]
也就是因此,不管是视觉方案还是把大模型拿来用到智驾的决策,本质就只能起一个辅助作用,你一定要有额外的外部力量来做最终的保底决定来防止这些个玩意抽风酿成大祸[s:ac:哭笑]
当然,市场是另一回事,反正一般[/quote]很简单的道理,给模型的输入越多,模型越准确,激光雷达一定比视觉能给出更多的输入。
个人觉得哪天真落地民用普及L3,那一定是视距能达到司机人眼的距离才行
专业的就是专业的,最佩服的就是那个我虽然不懂,但是我就要抬杠的,服气[s:ac:晕]
从激光雷达到纯视觉的其实有个牌子可以用自己的同一车型做对比的
就是小鹏
小鹏的G6激光版和P7+视觉版我都试过
我觉得视觉被激光雷达吊打
[quote][pid=827398960,44355743,1]Reply[/pid] Post by [uid=37613411]wgtt12345[/uid] (2025-06-12 23:49):
成本降到3000,但是卖你2万,你看看问界pro到max的差价,就算成本是几十几百,资本家还是卖你2-3w呀[/quote]这个不能只算硬件的钱,还得算软件的,就像同一系列的手机,标准版和pro版的相机硬件不一样,那么同时也伴随着成像算法的升级。
Reply to [pid=827395218,44355743,1]Reply[/pid] Post by [uid=64963538]qdmakka[/uid] (2025-06-12 23:14)人脑对于空间的处理能力
到底是视觉牛逼,还是思维和想象力牛逼。你先搞清楚再说
现在激光雷达已经很便宜了,不用根本不是贵,单纯的提升不大。激光雷达比视觉最大的优势就是无可见光的时候,可汽车有大灯。目前的辅助驾驶,有没有激光雷达并没什么差距,索性就都在堆算力。
Reply to [pid=827402212,44355743,1]Reply[/pid] Post by [uid=60293936]执子之手下棋[/uid] (2025-06-13 00:22)
不是说人看见的东西有一部分是人脑脑补出来的吗?人的视野里有两个空洞,是靠人脑算法补上的。
激光雷达的点云覆盖情况。100米以及更远,激光雷达的性能就这点?
[img]https://img.nga.178.com/attachments/mon_202506/13/-7da9Q1ac-1a5tKzT3cSj6-9t.jpg[/img]
我理解,纯视觉能做到处理90%工况,加个雷达做到91%不好吗