Z Waves丨从洗衣店女孩到“AI教母”50岁的李飞飞再造AI新范式用Worl

2026-01-19 11:59:00
miadmin
原创
13

年以物理学信用学士结业于普林斯顿大学,随后正在加州理工学院得回电气工程博士学位。现在,她是斯坦福大学计较机科学教导、以人工自己工智能切磋所(

2007年,李飞飞启动了一个看似容易却深远影响的项目:ImageNet——这是一个赶过万万张标注图像的大范畴数据集和评测竞赛平台,它将“数据”从AI的副角晋升为重心资源。2012年,基于ImageNet的神经汇集AlexNet,正在竞赛中博得打破性外示,从此,深度研习正在计较机视觉周围迎来了产生式成长。ImageNet不但是一个技巧器材,更成为视觉AI的底层标配和社区合伙创作的基准。

学术之外,李飞飞也走进了工业界。2017-2018年间,她正在Google Cloud担当AI/ML(Artificial Intelligence / Machine Learning)首席科学家,激动网罗AutoML(主动呆板研习——让非专业人士也可以欺骗呆板研习技巧的器材,使呆板研习变得更为主动化和易用)。正在内的一系列的人工智能产物,同时鼓舞谷歌AI正在环球规模内的团结与人才培育。之后,她重返斯坦福延续教导与切磋,并通过HAI夸大将AI技巧与社会仔肩连结。

2020年,大说话模子(LLM)囊括环球,李飞飞提出一个新的疑难:AI是否正在二维之外通晓全邦?她以为,说话和图像天生当然首要,但对的确三维空间的通晓、推理与交互才略缺失,是今朝AI的一个重心短板。基于这种洞察,2024年她联络创立了World Labs,提出“空间智能(Spatial Intelligence)”的理念,全力于让AI能正在3D全邦中感知、通晓并作为。

World Labs推出的首款产物Marble能通过文字或图像提示天生可浏览、可导出的三维全邦。分歧于静心文本交互的LLM,Marble声援文本、照片、视频等众模态输入,可天生良久化、可编辑、可下载的3D交互处境,管理了守旧AI天生内容“空间不类似”“创意不行控”的核肉痛点。

从ImageNet激发的视觉革命,到建议以人工中央的AI,再到现正在追赶三维全邦的“新北极星”,李飞飞的年华线不光勾画出一个科学家的滋长,也照射着AI技巧从识别到通晓、从二维到三维的演进。她的一句总结耐人寻味:“没有空间智能的AGI是不无缺的。”

Fei-Fei Li出生于1976年的北京,儿时正在四川成都长大。父母是中学教员与化工场计较机部分员工。她正在少年功夫,就涌现出对数理与科学的深厚兴致,而且正在学校外示优异。12岁那年,她的父亲移民到了美邦。为了更好的哺育机缘,她和她母亲正在16岁(1992年)时沿途移民到了父亲那里,整体家庭搬入新泽西一个惟有一间寝室的小公寓。

举动第一代中邦移民,李飞飞一家三口都不会说英语,家庭微薄的收入难认为继。刚到美邦的最初两年,家庭生存困穷,她曾到餐馆打工,做过家庭洁净工;父母其后跟亲朋借钱,开了一家干洗店谋划。初到美邦的她需重新先导研习英语,就读位于新泽西的帕西帕尼高中,1995年以全班第六名的成效结业,SAT博得1250分,此中数学得满分800分。正在她的悉力下,考进了普林斯顿大学物理系并得回全额奖学金。洗衣机的噪音、熨斗的蒸汽与化学溶剂的刺鼻气息,组成了她大学生存的另一壁。这个物理系的甲第生恐怕并未念到,这段“脚扎实地”的资历,会正在来日与她“仰望星空”的科研事迹发作深入共鸣——她终其一世所找寻的,恰是让呆板学会“望睹”并通晓咱们身处的这个丰富、简直、充满物理秩序的的确全邦。

1999年,大学结业时,她以优异成效得回普林斯顿大学授予的物理学信用学士学位。结业后曾博得奖学金前去西藏切磋西藏守旧药物。随后,她进入加州理工学院(California Institute of Technology)深制,攻读电气工程、计较机科学与认知神经科学宗旨的博士学位,师从计较机视觉业内专家Pietro Perona教导和克里斯托夫·科赫教导,并于2005年完毕博士学业,博士论文为视觉识别:计较模子与人类心绪物理学(Visual Recognition: Computational Models and Human Psychophysics)。

2005年8月至2009年6月,她先后正在伊利诺伊大学厄巴纳-香槟分校电气与计较机工程系和普林斯顿大学计较机科学系担当助理教导,正在这两所院校还同时兼任过心绪学系的助理教导。

那时刻,人工智能的寒冬尚未齐全过去。当时主流的计较机视觉切磋,民众依赖于尽心安排的手工特质和有限的小范畴数据集,呆板能识另外物体品种可是寥寥数十种。李飞飞锋利地察觉到了行业的盲区:当时的学术界与AI周围都正在狂热地打磨算法,却唯独粗心了“数据”的价钱。李飞飞认识到,要是数据无法照射的确全邦,再精妙的算法也是虚无缥缈。她断定另辟门途——构修一个囊括“全全邦全部物体”的宏伟数据库。这便是ImageNet的雏形。

李飞飞说,“咱们断定做一件前所未有的工作。咱们的对象是全全邦的物体。”当时的图像识别数据库惟有上万张图片,而她念修一个百万级、标注具备、掩盖整体全邦物体的图像宇宙。ImageNet的野心不光正在于识别熊猫、教堂等实体,更试图囊括“恋爱”这类笼统观念。

早先,李飞飞试图以时薪10美元延聘本科新手动搜罗图片。但实际很疾给了她一记重击:按这个速率,完毕项目必要整整90年。人力走欠亨,团队转而实验算法,试图让计较机主动抓取图片,人类仅做审核。但几个月后,这条途也被堵死了——他们认识到,用现有的算法去天生数据,来日的模子将长久无法超越现有秤谌,陷入死轮回。

窘境相继而至:人工太慢,算法太笨,资金也断了链。李飞飞处处驰驱,却未能申请到任何联邦拨款。冷嘲热讽随之而来,有人乃至挖苦普林斯顿切磋这种课题具体是“羞耻”,更有人坑诰地评判:这个项目独一的上风,仅仅由于李飞飞是个女性。

就正在项目濒临流产时,一次与切磋生的闲聊带来了进展。学生提到了亚马逊的Mechanical Turk(众包任事)——一个能以低廉本钱发动环球网民完毕容易职分的平台。

“她给我看网站的那一刻,我知晓ImageNet成了。”李飞飞记忆道,“咱们结果找到了谁人能撬动地球的杠杆,这是普林斯顿的本科生哪怕花上一个世纪也无法做到的。”

纵然有了众包平台,ImageNet的制造并非一键天生的坦途。李飞飞的博士生Jia Deng和Olga Russakofsky不得不面临棘手的质控困难:一张图片毕竟必要几双眼睛审核?辨认一只猫恐怕两人足矣,但要确认一只体型奇特的哈士奇,也许必要十轮重复验证。为了防守众包职员“划水”作弊,团队特意开采了一套统计模子,以此确保每一张入库图片的纯度。这是一场漫长的攻坚战。历时两年半,涵盖5247个种别、12个子树的320万张记号图片结果集聚成塔。

2009年,当团队带着这篇日后改革全邦的论文亮相CVPR时,并未迎来意念中的掌声。举动顶会,CVPR乃至没有给他们上台演讲的机缘,只承诺正在角落张贴海报。团队不得不靠分发印有Logo的钢笔来以此博取合怀。当时的主流学界对“数据驱动”嗤之以鼻,正如Jia Deng所记忆的那样:“人们质疑,要是连识别一个物体都做不到,搞几千几万个又有什么意旨?”

为了将影响力推向民众,李飞飞远赴欧洲,寻求与当时最巨子的图像识别大赛PASCAL VOC团结。比拟于ImageNet的浩大,仅有20个分类的PASCAL虽显袖珍,却具有极高的数据质地。此次联手让ImageNet疾速站稳了脚跟。跟着竞赛推动,切磋职员不料展现了一个改革行业认知的形象:日常始末ImageNet预陶冶的模子,正在管制其他识别职分时,只需微调便能外示惊人。正如Berg所言:“这不光是神经汇集的打破,更是认知的奔腾。”——这便是其后被普遍利用的“迁徙研习”。

真正的“奇点”发作正在首届大赛两年后的2012年。要是说AI的发达必要一个引爆点,那无疑是AlexNet揭橥成效的那一刻。众伦众大学的Geoffrey Hinton与其学生Ilya Sutskever、Alex Krizhevsky提出的深度卷积神经汇集,以领先第二名41%的碾压性上风夺冠,彻底终结了旧时间。

这日全部的视觉AI利用:主动驾驶、医学影像、安防识别、手机相册分类……都站正在ImageNet的底子上。这是它改革整体行业的第一次。

2013年,李飞飞正式出任斯坦福人工智能尝试室(SAIL)主任,正在这里她并不光是束缚者,更像一个带着显微镜和千里镜的探途者:一边率领团队让视觉通晓从容易“识别”逐渐走向更深方针的“通晓”,激动AI愈发能感知全邦的细节;另一方面,她先导思索一个更大的题目——AI不该当只是少数人的专利。正在她看来,让人工智能任事更众人类群体,才是真正值得参加血汗的宗旨。

正在这个年华段,李飞飞并没有只限制于尝试室的白板和代码里。2015年,她与他人联络创立了AI4ALL,一项非营利哺育项目,旨正在将AI哺育带给更众女性、少数族裔与遍及青年,让这个周围的来日构修者来自更普遍的后台,而不是荟萃正在少数精英圈层里。这个创议从底子上应对了AI哺育与介入的组织性不均衡题目。

2017年,李飞飞给本身调度了一段格外的“假期”——她从斯坦福短暂脱离,正在Google Cloud担当AI/ML首席科学家兼副总裁,这是真正将学术洞睹带入家产履行的阶段性责任。她介入订定谷歌云正在人工智能与呆板研习上的政策宗旨,同时激动了一系列旨正在下降AI技巧门槛的产物与器材。

此中最为人熟知的功劳,当属Google Cloud AutoML。这个产物的出生,不再必要开采者精明丰富算法,只需上传数据,便可主动天生定制化呆板研习模子。2018年头AutoML Vision正式揭橥,并正在随后扩展出了文字与翻译等效用,这一安排正中她长远建议的“AI普惠化”理念:AI的价钱不正在于炫技,而正在于让更众企业、开采者甚至遍及用户都能用得起、用得好。与此同时,她还和团队激动创办了Google AI中邦中央,后相“AI没有邦界”“AI该当是每片面的”,呈现了她对AI环球共享价钱的思索。

2018年,当她返回斯坦福延续教学与切磋时,李飞飞一经不但是一个学术主理者,而是一个连合学术与家产、技巧与公民、呆板智能与人类价钱的“桥梁修制者”。她正在斯坦福和谷歌之间的这段途程,既是技巧落地的底色,也是让AI更挨近的确全邦与更众人的开始。

2025年春,一场正在伦敦圣詹姆斯宫实行的颁奖仪式将全全邦眼光聚焦正在了李飞飞(Fei-Fei Li)身上——这位被媒体称为“AI教母”的华裔科学家,与黄仁勋等AI前驱一同荣获伊丽莎白女王工程奖(Queen Elizabeth Prize for Engineering),成为环球工程界最受注意的人物之一。该奖项常被誉为工程周围的“诺贝尔奖”,以奖励对科技与人类福祉作出深远孝敬的革新者。

李飞飞的名字与ImageNet密不行分。这个正在2000年代初启动的大范畴图像数据库,让呆板“望睹”全邦成为也许,并为深度研习正在计较机视觉周围的打破修树了基准。ImageNet不但是一组数据,更是让AI能通晓图像语义的通用“语料库”,激动了算法从尝试室走向家产利用。

对李飞飞来说,AI的前进不止于技巧的加快,更合乎人类本身的价钱与伦理。正在领奖现场及随后接收BBC等采访时,她夸大本身对被称为“AI教母”既感觉高傲,也认识到这个称谓带来的仔肩:它不光代外技巧效果,更代外激动更众女性和少数群体正在科技周围得回认同的机缘。正在说及AI的来日时,李飞飞并不迷信技巧的无穷扩张。她指出,AI成长不应陷入南北极化的绝顶阐述——既不盲目消极地视其为“灭尽危害”,也不纯洁以技巧奇点举动幻念尽头。她以为,AI的真正挑衅正在于怎么将革新与人性、伦理、社会价钱深度调解,让技巧任事于更普遍的民众优点,而不是仅为算力或贸易拉长任事。

这种思念源于她长远建议的“以人工本的AI”理念。早正在2019年,李飞飞就与同事合伙创立了斯坦福人本AI切磋所(HAI),激动跨学科对话,让工程师、社会科学家、策略订定者一同介入AI的来日安排。这一起的背后,是一位科学家对技巧与社会联系的深入洞察:当AI可以管制说话与视觉之后,下一个挑衅是让它真正通晓人类生存的丰富性。正在这个经过中,技巧应成为加强人类才略、而非弱小人类价钱的力气。

回看李飞飞过去二十年的切磋轨迹,你会展现她险些每一次要害拔取,都踩正在技巧范式移动的临界点上。这种“踩点”并非直觉或运气,而是一种高度组织化的判决逻辑:当一个技巧打破完毕从“可行”到“范畴化”的跃迁后,新的瓶颈势必会呈现正在体系才略的界线处。正在说话模子管理了“通晓与天生说话”、视觉模子完毕了“望睹与分类”之后,人工智能还是缺失一个重心才略——对的确全邦空间联系与物理组织的通晓。要是呆板无法通晓“物体正在哪里”“互相怎么干系”“正在物理端正下会发作什么”,那么推理与作为就无法真正闭环。

基于这一判决,李飞飞提出:人工智能的下一个界线不是更大的模子,而是空间智能(Spatial Intelligence)。它并非容易的“望睹全邦”,而是让呆板通晓全邦中的地点、联系、组织甚至物理秩序,从而杀青感知—推理—互动的一体化才略。恰是正在这一逻辑之下,李飞飞联络前Meta科学家、密歇根大学教导Justin Johnson等人,于2024年创立了World Labs,体系性地推动空间智能的切磋与产物化探究。

Marble是World Labs的首款贸易产物——一种基于“全邦模子”的天生式AI器材,它能从文本提示、图像、视频乃至3D组织图中主动创作出可编辑、可探究的三维全邦。用户不光能天生高度逼线D场景,还能够正在此中自正在导航、调动元素,并导出为可用于逛戏、影像制制或虚拟实际利用的资源。与守旧的3D安排器材分歧,Marble不再依赖人工绘制模子,而是借助AI的“空间通晓”直接构修物理合理、细节充裕的三维处境,从而大幅下降创作家构修虚拟全邦的门槛。它目前已面向群众推出免费增值(freemium)和付费订阅形式,掩盖从轻量试用到专业创作的众种需求。

World Labs来说,Marble只是迈向空间智能时间的第一步。来日,这类全邦模子不光能助力影戏、逛戏、兴办安排等创意行业,还也许深入影响呆板人导航、加强实际(AR)、主动驾驶模仿,以及科学切磋中的三维推理职分。李飞飞和团队正正在将这一周围从尝试室前沿逐渐推向家产和社会利用的前端。AI

的成长平素不是简单维度的打破,而是众个才略调解的长远演进。跟着空间智能成为新的激动力,咱们恐怕正迎来AI认知体例的第三次——一次让呆板真正“通晓全邦空间”的革命。李飞飞的World Labs和Marble,不但是技巧产物,更是新一代智能时间理念的宗旨标。

李飞飞最新访说:追赶AI的“北极星”—从ImageNet到三维全邦的空间智能附全文+视频,新浪财经.