|
婚后试爱txt新浪本月在香港大学陆佑堂做了一次演讲。这是港大经管学院陈坤耀杰出学人讲座的系列活动。据说,17年前,马云曾站在同一个舞台上。主办方称,这次演讲的报名速度创下纪录:邮件发出两小时内,超过1200人报名。
美国人怎么算谁赢?看谁的大语言模型(Large Language Model)更强。今天是OpenAI领先,明天是Anthropic,后天可能是别人。但蔡崇信说,这个计分方式本身就有问题。
这个判断的底层逻辑是:AI的价值在于渗透率(penetration rate)。中国国务院的AI规划就很务实——到2030年,AI代理和设备的渗透率要达到90%。不讲玄学,只讲普及。
训练大模型、跑推理(inference),本质上都是在烧电。中国的电力成本比美国低40%。
为什么?因为15年前中国就开始大规模投资电力传输基础设施。北方发的电要送到南方,新能源产地和用电需求地往往不重合,必须靠输电网络打通。中国国家电网每年资本支出900亿美元,美国只有300亿——三倍的差距。
结果是什么?中国的电力装机容量是美国的2.6倍,而且新增装机容量是美国的9倍。这个差距还在拉大。
蔡崇信提到一个有趣的数据:全球几乎一半的AI科学家和研究人员,都有中国大学的学位——无论他们现在在美国公司、中国公司,还是世界任何地方工作。
他还讲了个段子。最近社交媒体上有人吐槽,说自己在Meta(Facebook)的AI团队里,同事们都在用中文交流想法,他完全听不懂。
以前中国公司出海,语言是劣势——在意大利开办公室,当地人不会说中文,中国员工得用第二语言沟通。但在AI领域,全球的华人工程师用中文分享想法、交换思路,这反而成了信息优势。
训练一个万亿参数的模型,如果系统效率不高,GPU消耗会非常恐怖。中国团队因为硬件受限,必须把系统优化做到极致。DeepSeek就是这么逼出来的——阿里的通义千问(Qwen)模型刚刚赢得了一场为期两周的加密货币和股票交易AI竞赛,DeepSeek排名第二。
蔡崇信对DeepSeek毫不吝惜赞美:我们在杭州的邻居,他们做的事情令人难以置信。
蔡崇信的观点很直接:开源模型会击败闭源模型,不是因为开源更先进,而是因为开源更符合全球大多数用户的利益。
他举了个例子。假设你是沙特阿拉伯,想发展AI,又想保持“AI主权”(sovereign AI)——意思是AI不受外国控制。但你没有人才自己开发模型。
这时候你有两个选择:选择一:通过API使用OpenAI。付很多钱,而且数据要喂进去——你不知道数据去了哪里,那是个黑箱(black box)。选择二:直接下载阿里的开源模型,部署在自己的私有云上。免费,而且数据完全可控。
成本和隐私,两边都赢。所以无论是政府还是企业,只要认真做成本效益分析,都会倾向于开源。
阿里靠的是云计算。你用开源模型没问题,但你要跑模型,需要云基础设施——存储、数据管理、安全、网络、容器(containers,他说这个词他自己也不太懂)。这些阿里都能提供。开源模型是流量入口,云服务才是利润来源。
这个模式其实很像早年的互联网公司:免费产品获客,增值服务变现。只不过规模和技术门槛完全不同。
港大教授邓希炜问了一个好问题:阿里从B2B电商变成AI云计算公司,秘诀是什么?
阿里1999年成立时,中国还没加入WTO,国际贸易必须通过国有贸易公司。2001年入世之后,小企业可以直接和全球做生意了。阿里的B2B平台就是帮这些小厂找买家——第一版网站是英文的,面向海外。
后来消费者电商起来了,就有了淘宝。买家和卖家互不信任,就发明了支付宝(最初是个担保交易系统)。物流跟不上,就投资物流。
云计算也是一样的逻辑。16年前,没人讨论云。但阿里的消费平台要处理海量数据,如果继续用Dell的服务器、EMC的存储、Oracle的数据库,所有利润都会交给这些供应商。
所以阿里云的起点是自己吃自己的狗粮(eat our own dog food)——先内部用,用好了再开放给外部客户。
蔡崇信对年轻创业者的建议也很明确:优先选择有机增长(organic development),而不是并购。因为自己团队培养出来的能力,DNA纯正,文化匹配。阿里也做过并购,有些成功,有些失败得很惨。
第一,学会获取知识。听起来是废话,但在AI时代,知识获取的效率差异会被放大。
第三,学会提问。蔡崇信特别强调这一点——提出正确的问题(ask the right questions),比找到答案更重要。
很多人说AI时代不用学编程了,用自然语言(natural language)就能指挥机器。蔡崇信不同意。
他甚至建议学电子表格——能把一个复杂公式写对,让数字自动计算出来,这本身就是逻辑训练。
数据科学(data science):其实就是统计学的新名字,但未来数据会爆炸式增长,懂得管理和分析数据的人永远稀缺。
心理学和生物学:理解人脑怎么运作。人脑仍然是最高能效的机器,AI的很多设计思路都来自对大脑的模拟。
材料科学(material science):世界现在被比特(bits)主导,但让比特跑得更快的,是原子(atoms)。半导体领域会有大量创新,而半导体的核心就是材料。
1999年,蔡崇信放弃香港的律师高薪,跑去杭州加入一个18人的小公司。为什么?
这就像一个看涨期权(call option)——最多亏掉权利金,但收益没有上限。
但他补充了一句更重要的话:机会是来找你的,不是你去找它的。你要做的是准备好(preparedness),这样机会来的时候才能抓住。
金融市场泡沫(financial market bubble):股票估值是不是太高?50倍市盈率合不合理?这是一门艺术,我不知道。
他的判断是:AI可能存在金融泡沫,但技术本身是线月互联网泡沫破裂,但互联网并没有消失——今天互联网比那时候强大得多。
蔡崇信拥有NBA布鲁克林篮网队(Brooklyn Nets)、WNBA纽约自由人队(New York Liberty)、NLL圣地亚哥队(San Diego Seals)和拉斯維加斯沙漠之犬队(Las Vegas Desert Dogs)等多家美国职业运动队。今年篮网时隔六年重返中国(澳门),这是他主动推动的。
但他做体育投资最有意思的部分,是一个教育项目:每年选6-8个中国初中生,送去美国读高中、打篮球。
他说这是在复制自己的经历——13岁离开台湾去美国读书。人与人的交流(people-to-people exchange),比任何官方渠道都重要。
不是模型本身,而是让AI被广泛使用的整个生态系统。电力成本低40%、数据中心建设成本低60%、全球一半AI人才有中国学历、资源匮乏逼出系统级创新——这些加在一起,让中国更有可能实现AI的大规模普及。而普及率才是线:为什么开源模式会赢?
因为对全球大多数用户来说,开源同时解决了成本、数据主权和隐私三个问题。闭源模型要付费,数据要喂进黑箱;开源模型免费,数据可以留在本地。这不是技术优劣之争,是利益格局使然。
学编程不是为了写代码,而是训练逻辑思维;学统计(数据科学)是因为数据会爆炸;学心理学是因为要理解人脑这个最高效的机器;学材料科学是因为让比特跑得更快的是原子。更重要的是,学会提出正确的问题——这比找到答案更有价值。*
|