近期全网热议的GPT Image 2性能显著优于同类图像生成AI,其底层架构已彻底重构,文字渲染精准、复杂指令执行无误,从1.5版本迭代至2.0仅耗时4个月。打造这一突破的核心团队仅13人,其中华人成员占比超一半。这支标杆性研发团队由无锡青年学者牵头,汇聚中科大、浙大等高校博士人才,平均年龄约30岁,重新定义了图像生成技术上限。

AI领域普遍认为,顶尖模型研发需上百人团队、半年以上周期及海量算力,而GPT Image 2的成功打破了这一惯例。2024年12月GPT Image 1.5发布,2025年4月2.0版本推出,13人团队仅用4个月完成颠覆性升级。研究负责人陈博远表示,模型已彻底重构,致力于打造“图像领域的GPT”。13名成员涵盖研究、工程、产品等领域,均为顶尖人才,团队高效协同,契合OpenAI“小型核心团队突破+资源倾斜”的理念。

团队最突出的特点是华人占半壁,13人中含6位华人,他们作为核心骨干,主导了关键技术的突破与落地。

1、无锡才俊陈博远

华人研究负责人陈博远是OpenAI最年轻的核心研究员之一,负责GPT图像生成模型全流程训练,同时参与Sora视频生成项目。

陈博远高中时未掌握Python基础,经谷歌DeepMind研究员夏斐引导步入AI领域,两次实习积累了大规模模型训练经验。

他本科毕业后考入MIT攻读博士,代表作入选AI顶级会议NeurIPS 2024,提出的全新训练范式为GPT Image 2架构提供核心灵感。

谷歌实习期间,他以共同一作发表SpatialVLM研究,研发的指令微调技术后续被Gemini 2.0采用。

2025年6月陈博远加入OpenAI,迅速晋升为研究负责人,主导架构重构,演示中为家乡及队友制作的多语言海报,精准验证了模型文字生成能力。

2、中科大博士Jianfeng Wang

Jianfeng Wang负责模型指令遵循与世界知识理解,解决了传统模型“只模仿、不思考”的缺陷,此前传统模型生成的时钟始终指向10:10,仅能机械模仿广告图。

他优化训练逻辑后,模型可精准生成不同时间的时钟,复杂空间布局指令也能完美执行,真正实现“所想即所得”。

曾在微软任职近9年,与OpenAI合作过DALL-E 3,在计算机视觉领域成果丰硕,精准定位传统模型痛点并实现突破。

3、浙大才子Yuguang Yang

Yuguang Yang主导高精度信息图生成功能,可将75页GPT-3论文一键转化为规范幻灯片,大幅提升科研效率。

他履历跨界,从浙大工程本科、约翰斯霍普金斯大学博士,到量化分析师、清华访问研究员,再到亚马逊、微软任职,积累了多领域经验。

2025年初加入OpenAI,融合多领域能力研发出信息图功能,提醒用户生成时需选择“思考模式”确保逻辑准确。

4、斯坦福博士Weixin Liang

Weixin Liang负责模型架构优化与计算效率提升,为模型普及奠定基础。

他本科毕业于浙大,斯坦福博士期间在Meta实习发表的研究,引入模态解耦技术,有效降低多模态模型计算成本,该思路被应用于GPT Image 2。

2025年博士毕业后加入OpenAI,迅速成为核心成员,避免模型过度依赖高算力。

5、其他华人

上海交大校友Mengchao Zhong负责多模态产品工程实现,将科研成果转化为落地功能,保障模型稳定运行。

Bing Liang在Google干了5年多,参与Imagen3、Veo、Gemini Multimodal,2025年跳到OpenAI做图像生成研究。

其余7位成员来自耶鲁、MIT、谷歌、微软等顶尖机构,与华人成员协同发力,完成技术突破。负责人Gabriel Goh是OpenAI资深员工,见证多模态模型发展,秉持开放科研理念,给予成员充分自由。

13人团队、4个月攻坚、半壁华人,GPT Image 2的成功,是华人科研力量崛起的生动证明。它打破了“AI核心领域被欧美垄断”的偏见,陈博远、Jianfeng Wang等华人学者,在核心岗位展现了扎实功底与实力。GPT Image 2仅是AI视觉革命的开端,未来华人科研人员将持续在AI领域发力,创造更多颠覆性成果。