据多位知情人士向雷锋网爆料,微软亚洲研究院计算机视觉大牛王井东已离职,或将加入百度。
视觉计算组作为微软亚研的灵魂团队,陆续培养出了沈向洋、汤晓鸥、马毅、孙剑、何恺明等老中青三代计算机视觉引领者,只可惜这些人都已远去。
王井东原为微软亚洲研究院视觉计算组的首席研究员,研究领域包括神经架构设计、人体姿态估计、语义分割、图像分类、目标检测、大规模索引和显著目标检测。
他是 ACM 杰出会员和 IAPR Fellow,曾任 IEEE TPAMI、IEEE TMM、IEEE TCSVT 副主编,以及 CVPR、ICCV、ECCV、ACM MM、IJCAI、AAAI 等视觉、多媒体、AI 领域顶级会议的区域主席。谷歌学术显示,他目前论文总引用量为 23950,h 指数为 69。
王井东本科就读于清华大学自动化系,是个学霸,成绩全年级第一。他 2001 年和 2004 年在清华大学自动化系先后获得学士学位和硕士学位,硕士期间也曾获得优秀硕士学位论文奖。2007 年,他在香港科技大学计算科学与工程系获得博士学位,同年进入微软亚洲研究院。
他的硕士导师是清华大学教授张长水,在硕士期间他曾去微软亚研实习,接受沈向洋的指导,那是他与微软亚研的初次结缘。攻读博士学位阶段,他成为了香港科技大学教授权龙的学生。
▲ 权龙(左)和王井东(右)
除此之外,在整个学术生涯中,王井东亦合作过多位知名 AI 学者,包括华先胜、田奇、梅涛、李世鹏等。
加入微软亚研后,王井东从研究员一步步上升为高级首席研究经理,并秉承微软亚研一贯的高产传统,发表了两百多篇论文。
王井东加入百度后,具体去向如何?
因其过硬的实力,王井东或许可以成为百度研究院在视觉研究的“一把手”。
AI 工业界有句老话:得视觉者得天下。
百度研究院历来的掌舵人,从余凯、林元庆到王海峰,以及副院长张潼、集团首席科学家吴恩达等人,除了林元庆外,其他均为机器学习和 NLP 领域的学者,视觉领头人属实稀缺。
更是从未有过 Fellow 级的计算机视觉专家。
反观这些年的腾讯(张正友、贾佳亚)、阿里(华先胜、张磊)、华为(田奇)、京东(梅涛),长期都有 Fellow 级知名计算机视觉学者坐镇。
这也难怪,百度的业务支柱是搜索和广告,主要涉及文本信息检索和推荐,自然和 NLP、机器学习等技术更加契合,而在图像领域,除了自动驾驶外,百度天然缺少线下物理世界的视图场景,而线上图像的数据识别和处理,本身并不具备太大难度,且实用价值不足,这对知名的计算机视觉专家来说,吸引力着实有限。
业内人告诉雷锋网,王井东加入百度自动驾驶部门也不无可能。
其一,百度前机器人、自动驾驶实验室主任及首席 3D 视觉科学家杨睿刚教授已在去年初加入嬴彻科技担任 CTO,这一职位一直空缺。
其次,他的同门师弟 AutoX 创始人肖健雄,在自动驾驶方向颇为成功,这为王井东破圈进入自动驾驶领域有不少借鉴意义。
王井东在计算机视觉领域特别是视觉感知方面的研究非常广泛,比如人体姿态估计、语义分割、图像分类、目标检测等技术,对于自动驾驶来说都是很重要的感知功能。
他还曾开发出 HRNet 模型,其通用性很强,不但可胜任人体姿态、分割、人脸关键点检测、目标检测等任务,体现了高分辨率表征的优点,并且从参数量、计算量以及最终结果看,都很有优势。在 CCF-GAIR 2020 上,王井东详细介绍了这一模型。在报告中,王井东表示:
这个方法自从在 CVPR 发表以来,已经成为在人体姿态构建里一个标准的网络,一些文章或者比赛都会采用 HRNet 架构。
详见:https://www.leiphone.com/category/smartsecurity/Qu1qbNlNCWdiaaf7.html
而另外一声音则预判,王井东深厚的三维视觉背景,有可能会去百度研究院,成为元宇宙、AR/VR 等创新项目的支撑力量。
可以预见,三维重建在未来必定会成为元宇宙最重要的基础技术之一,玩家长期在虚拟空间中进行交互,离不开大量的重建和识别。
王井东的导师权龙教授也曾告诉雷锋网,三维重建包含三大问题:一、定位置。假如我给出一张照片,计算机视觉要知道这张照片是在什么位置拍的。二、多目。通过多目的视差获取三维信息,识别每一个像素并进行匹配,进行三维重建。三、语义识别。完成几何三维重建后,要对这个三维信息进行语义识别,这是重建的最终目的。三维重建不是最终的目的,最终的应用肯定要把三维重建和识别融为一体。