榴榴杂谈

你只管“遥遥领先”,别人早已经一骑绝尘!

榴榴杂谈 2024-02-29 07:24 出处:网络 作者:一湾清泉编辑:@榴榴


你只管“遥遥领先”,别人早已经一骑绝尘! 


最近在国外火出圈的一件大事要算苹果vision pro面世。虽然此前已经有过很多议论和猜测。但当人们第一次拿到这台vision pro的时候,依然感叹是自己的想象力不够。关于vision pro,还没有了解过的朋友建议先看一下苹果官方的宣传片。

不能不说,作为一枚硬核理工男,我还没有真正入手一台vision pro就已经陶醉在自己的想象中了。vision pro到底是什么?这可能要取决于你想用它干什么。它可以是贴身秘书、私家影院、游戏大师、旅行助理,甚至是军事指挥设备。总之,苹果再次把人类社会向未来推进了一步。当然,这些都是很容易就可以看懂的。而我下面要说的,可能会超过大部分人对于vision pro的理解:因为vision pro的诞生,苹果公司将不会再止步于一家以智能手机、电脑以及操作系统等为主要产品的跨国科技公司。苹果将会成为这颗星球上最伟大的人工智能公司。或者可以换一个说法,vision pro打通了拟人态AI的最关键一道障碍。或许你会问,苹果又不是世界上唯一做头戴式设备的,是不是有点危言耸听了。之所以这样断言,是因为在苹果的vision pro中隐藏着一个关键的秘密。

众所周知,人类的主要感觉系统包括:视觉、听觉、味觉、嗅觉,以及触觉。俗称“五感”。在这五种感觉中,最敏感也是最容易形成记忆的首先是视觉,其次是听觉。最弱的是嗅觉和味觉。这两种感觉最缺乏的是对空间和距离的觉察。虽然有人坚称自己的嗅觉灵敏,但不能不说现代人类的嗅觉比起我们的祖先已经退化太多。人们在开发AI的时候,一直都是在不知不觉使用人类特征作为蓝本。例如用压力传感器来模拟人的触感,用声音传感器模拟人的听觉,用气味传感器模拟人的嗅觉。最近横空出世的ChatGPT引领的生成式人工智能模拟人的学习和思考。但始终有一个方面还没有实现质的突破。那就是对于人类视觉的模拟。

有朋友肯定会说,你这就有点不着边际了。那么多摄像头,还有图像分析系统。怎么可能做不到视觉模拟。更何况,还有雷达系统作为补充。应该说人工智能的视觉早已经超过人类才对。但无论是摄像头还是雷达,都只是视觉信息的采集设备而已。并没有从根本上解决从“看到什么”到“为什么看”的问题。这就意味着,人工智能可以比人类看到更多东西,但它无法在一个复杂的环境中准确判断哪些才是最主要的。假如有些东西是AI数据库中完全不曾出现过的东西,可能就成为AI无法理解的存在。因此无法作出人们理想中的判断结论。

你只管“遥遥领先”,别人早已经一骑绝尘! 


举个最直接的例子,全世界都在研究汽车的无人驾驶技术。各家厂商虽然有各种各样的解决方案,但始终无法超越特斯拉。这是因为特斯拉采用的是一种计算机视觉技术,并且一直都在宣称要走纯视觉路线。想想看,我们人类在驾驶汽车的时候,并不会在身上安装什么毫米波雷达。我们的大部分反应都来自于视觉。特斯拉的视觉技术能够精准感知深度、速度、加速度信息等。然后把这些讯息通过计算反馈实现对车辆的操控。虽然听起来并不复杂,但真实的情况是,无论算法、算力、路测、数据标注,还是仿真训练和芯片开发等等,哪方面都不能有短板。就拿AI训练必须的数据来说,特斯拉的自动驾驶系统每天可以接收到车辆回传的 1600 亿帧视频数据,支持神经网络训练。截至目前,特斯拉 FSD 累积行驶里程已超 5 亿英里,Autopilot 使用里程已经超过 90 亿英里。某些宗教品牌的造车新势力,动辄宣称超越特斯拉。但除了在车里装上了彩电冰箱大沙发以外,并没有什么真正拿得出手的。我知道这话说出来又会点燃宗教品牌车粉的怒火。但事实就是事实。在特斯拉自建的大数据中心中,使用了 14,000 片 GPU 芯片,其中 10000 片是用于 AI 训练的 H100;4000 片用于数据标注。这些可不是摆设,更不是拿来骗补贴的!有人做过测算,要想建立起一个特斯拉式纯视觉路线的高阶智能驾驶系统,总投入大约在200亿元。

那么,仅仅是有钱就可以做到吗?肯定不是。如前所述,海量的数据是构成这套系统的基础。这也就是为什么很多地方并不欢迎特斯拉的到访。特斯拉确实无时无刻不是在“睁着眼”开车。每一辆特斯拉都在为特斯拉的自动驾驶贡献数据。只不过,这些数据并不意味着必须要有什么“不良”企图。毕竟现在卫星技术已经非常发达。哪里都有什么是根本藏不住的,还用得着汽车么?况且特斯拉也不可能开到屋里录像。受迫害妄想症还是少一点好。归根结底,没有海量的视觉数据作为基础,什么样的摄像头也无法真正实现对人类视觉的模拟,更无法取代。

你只管“遥遥领先”,别人早已经一骑绝尘! 


但即便是特斯拉,获取的信息也是有局限性的。因为汽车的应用场景就是在道路上。神经网络训练的重点也是道路驾驶。而苹果vision pro则完全不同。它几乎可以出现在生活的方方面面。尤其是精确的眼球跟踪技术,可以让AI学习和理解人看到了什么和为什么去看。所以说,当越来越多的人开始使用苹果vision pro的时候,就会有无数人成为苹果人工智能的免费训练员。最终完成的将是一个无法想象的庞大的神经网络。基于一个真实的视觉,配合以生成式人工智能,机器人时代将加速到来。届时,大量以前无法由机器人独立完成的工作都将被机器人取代。例如机器人保姆、机器人厨师、机器人医生,甚至是机器人士兵。机器人比人类更聪明、更精确、更不知疲倦。或许,人类会为了缩小这种差距而把自己身体的一部分改装成机器。事实上,这一天并不会太久。想想看,现在的苹果vision pro还是一个笨拙的头戴式设备。谁能说在不久的将来,它不会演变成一个小小的“植入体”,成为你身上的一个“新器官”呢?

战争永远是人类科技进步的最大推动力。在此次俄乌战争中,大量投入使用的无人机和智能网络武器都让人看到了未来战争的雏形。未来当越来越多“长眼睛”的武器出现在战场上,像大鹅这种还在使用传统的火炮坦克的,仗还有的打么?这是一种不同文明层次的碾压!一场俄乌战争已经让大鹅彻底被逐出了参与下一轮竞争的圈子。大鹅失去了历史赋予的机遇。这才是一个民族最大的悲剧。

马上就是除夕了,这个时候写一点轻松的内容。我想说的是,这个时代的变化可能会超过大部分人的想象。当有些人还在“遥遥领先”的时候,别人其实早已经一骑绝尘!“硅基生命”和“硅胶生命”虽然一字之差,却有天壤之别!人类并不会同时进入一个新的文明时代。就像今天的地球,有人坐着喷气式飞机全球旅行,也有人类依然生活在非洲草原上和野牛赛跑。要想不被时代抛弃,不成为AI时代里“骑着骆驼的野蛮人”,唯一的方式就是与世界握手。除此以外,没有其他路可以走!

0

精彩评论