-
汤晓鸥 编辑
汤晓鸥(1968年1月24日-2023年12月15日),出生于辽宁省鞍山市,计算机科学家,香港中文大学信息工程学系教授、工程学院杰出学人,香港中文大学多媒体实验室创始人、浦江实验室主任、上海人工智能实验室主任,商汤科技创始人。汤晓鸥1990年毕业于中国科学技术大学,获得学士学位;1991年获得美国罗切斯特大学硕士学位;1996年获得麻省理工学院博士学位;1998年加入香港中文大学信息工程学系任教;2001年创立香港中文大学多媒体实验室;2005年至2007年在微软亚洲研究院工作,担任视觉计算组主任;2008年在中国科学院深圳先进技术研究院多媒体集成技术研究室工作,担任主任和研究员;2009年1月起担任中国科学院深圳先进技术研究院副院长;2014年创立商汤科技;2020年任上海人工智能实验室主任;2021年任浦江实验室主任;2023年12月15日23时45分,因病救治无效去世,享年55岁。汤晓鸥主要从事计算机视觉相关领域的研究,包括多媒体、计算机视觉、模式识别及视频处理,被誉为将香港中文大学建成“中国计算机视觉界的黄埔军校”的学者。
中文名:汤晓鸥
外文名:TANG Xiaoou, SeanXiaoou Tang
国籍:中国
民族:汉族
出生地:辽宁省鞍山市
出生日期:1968年1月24日
逝世日期:2023年12月15日
毕业院校:中国科学技术大学、罗切斯特大学、麻省理工学院
职业:教育科研工作者
主要成就:全球人脸识别技术的“开拓者”和“探路者”
性别:男
早期经历
1968年,汤晓鸥出生于辽宁省鞍山市。
汤晓鸥人物素描
1985年,从鞍山市第一中学毕业。
1990年7月,本科毕业于中国科学技术大学精密机械与精密仪器系,获得学士学位。
1991年8月,从美国罗切斯特大学(University of Rochester)毕业,获得硕士学位。
1996年9月,从麻省理工学院(Massachusetts Institute of Technology)毕业,获得博士学位。
1996年至1997年,在麻省理工学院伍兹霍尔海洋研究所从事研究工作。
工作经历
1998年1月-2003年1月,任香港中文大学助理教授。
2001年7月,创立香港中文大学多媒体实验室。
2003年1月-2005年1月,任香港中文大学副教授。
2005年3月,任香港中文大学教授。
2005年3月-2008年1月,任微软亚洲研究院视觉计算组主任。
2008年12月,在中国科学院深圳先进技术研究院多媒体集成技术研究室工作,担任主任和研究员。
2009年1月,任中国科学院深圳先进技术研究院副院长 。
2020年7月,上海人工智能实验室揭牌,汤晓鸥担任该实验室主任。该实验室积极汇聚国际国内重要科技力量,以上海为中心,依托三个核心基地——北京、杭州和粤港澳大湾区推进建设。由于是一个全新的体系和形态,既要进行战略性、原创性、前瞻性的科学研究与技术攻关,也要进行生态建设,汤晓鸥为此做了大量工作。
2020年8月,任上海人工智能创新中心负责人 。
参加2023世界人工智能大会(waic)开幕式
学术经历
1992年,汤晓鸥在美国麻省理工学院攻读博士学位,所在实验室通过海底机器人,在水下用声纳(呐)和视觉相机来探索海底世界,发现沉没的泰坦尼克号,从此时起汤晓鸥就开始学习人脸识别的算法 。
博士毕业后,汤晓鸥在香港中文大学建立实验室继续从事计算机视觉相关领域的研究。汤晓鸥将这一时期的积累称作“深挖洞、广积粮”。
在微软亚洲研究院工作时,“总感觉和铭铭(汤晓鸥儿子的小名)在一起的时间太少,想把每一分钟都记录下来。” 汤晓鸥在一篇自述中写道。每次见到儿子,都会拍下大量照片。
汤晓鸥的解决办法是,“号召大家做照片管理方面的研究”,接着又做了多图分割、实时图像检索技术等课题,铭铭的照片经常用在视觉计算组的各种实验数据里。三年中,汤晓鸥团队在一流的计算机视觉会议(ICCV , CVPR , ECCV)发表了60多篇论文 。现时的相册管理系统,还有各种美颜美图应用,其核心技术大多来自于汤晓鸥团队人脸识别技术的延伸和拓展 。汤晓鸥同微软亚洲研究院合作研发的图像识别技术被用于微软图像搜索引擎,成为世界上第一项图像识别技术被用于大规模商业应用。
2014年3月,汤晓鸥团队发布GaussianFace人脸识别算法,在LFW数据库上准确率达98.52%,在全球首次突破人眼识别能力。
2014年6月,汤晓鸥实验室开始发表的DeepID系列算法,逐步将人脸识别准确率提升至99.55%。
2015年,汤晓鸥团队在中国移动的招标中胜出,成为实名制认证技术合作方。因为人脸识别技术的介入,处理用户实名认证所需的时间,由原来的五分钟,提高至五秒。
2023年,汤晓鸥带领团队发布“风乌”大模型、书生通用大模型体系、与央视合作的“央视听媒体大模型”。
逝世
2023年12月15日23时45分,因病救治无效在上海去世,享年55岁。
汤晓鸥教授
科研成就
科研综述
汤晓鸥发明的人脸识别技术,是世界上第一个超过人眼识别能力的计算机算法,其在香港中文大学创办的多媒体实验室,2016年与麻省理工学院、斯坦福大学等一道入选世界十大人工智能先锋实验室。为促进深港两地的研究人员交流互通和协同创新,汤晓鸥牵头组建了香港中文大学和中国科学院深圳先进技术研究院的联合实验室 。
汤晓鸥同微软亚洲研究院合作研发的图像识别技术已被用于微软图像搜索引擎,成为世界上第一项图像识别技术被用于大规模商业应用。汤晓鸥的团队在全球范围内做出了大量深度学习原创技术突破:2012年国际计算视觉与模式识别会议(CVPR)上仅有的两篇深度学习文章均出自其实验室;2013年国际计算机视觉大会(ICCV)上全球学者共发表8篇有关深度学习的文章,其中6篇出自汤教授实验室;2011—2013年间在计算机视觉领域两大顶级会议ICCV和CVPR上发表了14篇深度学习论文,占据全世界在这两个会议上深度学习论文总数(29篇)的近一半。2014年3月,其团队发布GaussianFace人脸识别算法,在LFW数据库上准确率达98.52%,在全球首次突破人眼识别能力。2014年6月起,汤晓鸥实验室开始发表的DeepID系列算法,逐步将人脸识别准确率提升至99.55%,开启了整个人脸识别行业技术落地的时代 。
2014年3月,汤晓鸥团队发布研究成果,基于原创的人脸识别算法,准确率达到98.52%,首次超越人眼识别能力(97.53%) 。2016年,汤晓鸥领军的中国人工智能团队,入选世界十大人工智能先锋实验室,成为亚洲区唯一入选的实验室。2020年,汤晓鸥入选“人工智能全球2000位最具影响力学者榜” 。
学术论文
根据2023年11月香港中文大学多媒体实验室网站数据,汤晓鸥团队已发表论文400余篇 。据统计,汤晓鸥的论文累计被引用近14万次,位居全球华人计算机科学家前列。
2009年,《基于暗原色的单一图像去雾技术》(Single image haze removal using darkchannel prior)获得IEEE计算机视觉与模式识别会议(CVPR)最佳论文奖(与何恺明、孙剑)。
作者 | 文章名 | 期刊/会议 | 年份 | 备注 |
---|---|---|---|---|
Ke Yu, Xintao Wang, Chao Dong, Xiaoou Tang, Chen Change Loy | Path-Restore: Learning Network Path Selection for Image Restoration | TPAMI | 2021 | |
Tak-Wai Hui;Xiaoou Tang;Chen Change Loy | A Lightweight Optical Flow CNN —Revisiting Data Fidelity and Regularization | IEEE Transactions on Pattern Analysis and Machine Intelligence | 2021 | |
Yujun Shen, Ceyuan Yang, Xiaoou Tang, Bolei Zhou | Interfacegan: Interpreting the disentangled face representation learned by gans | IEEE Transactions on Pattern Analysis and Machine Intelligence | 2020 | 第 3 作者 |
Yujun Shen, Jinjin Gu, Xiaoou Tang, Bolei Zhou | Interpreting the latent space of gans for semantic face editing | Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition | 2020 | 第 3 作者 |
Yue Zhao, Yuanjun Xiong, Zhirong Wu, Dahua Lin | Temporal Action Detection with Structured Segment Networks | International Journal of Computer Vision | 2020 | 第 5 作者 |
L Wang,Y Xiong,Z Wang,Y Qiao,D Lin,X Tang,LV Gool | Temporal Segment Networks for Action Recognition in Videos | IEEE Trans. Pattern Anal. Mach. Intell | 2019 | 第 6 作者 |
Xintao Wang, Ke Yu, Chao Dong, Xiaoou Tang, Chen Change Loy | Deep Network Interpolation for Continuous Imagery Effect Transition | CVPR 2019 | 2019 | 第 4 作者 |
Yuying Ge, Ruimao Zhang, Xiaoou Tang, Xiaogang Wang, Ping Luo | DeepFashion2: A Versatile Benchmark for Detection,Pose Estimation,Segmentation and Re-Identification of Clothing Images | CVPR 2019 | 2019 | 第 4 作者 |
Xingang Pan, Xiaohang Zhan, Jianping Shi, Xiaoou Tang, Ping Luo | Switchable Whitening for Deep Representation Learning | ICCV 2019 | 2019 | 第 4 作者 |
Z Zhang,P Luo,CL Chen,X Tang | From Facial Expression Recognition to Interpersonal Relation Prediction | International Journal of Computer Vision | 2018 | 第 4 作者 |
Ziwei Liu, Xiaoxiao Li, Ping Luo, Chen Change Loy, Xiaoou Tang | Deep Learning Markov Random Field for Semantic Segmentation | IEEE Trans. Pattern Anal. Mach. Intell | 2018 | 第 5 作者 |
Shuo Yang, Ping Luo, Chen Change Loy, Xiaoou Tang | Faceness-Net: Face Detection through Deep Facial Part Responses | IEEE Trans. Pattern Anal. Mach. Intell | 2018 | 第 4 作者 |
Chen Huang, Chen Change Loy, Xiaoou Tang | Discriminative Sparse Neighbor Approximation for Imbalanced Learning | IEEE Trans. Neural Netw. Learning Syst | 2018 | 第 3 作者 |
Xingang Pan, Jianping Shi, Ping Luo, Xiaogang Wang, Xiaoou Tang | Spatial as Deep: Spatial CNN for Traffic Scene Understanding | AAAI 2018 | 2018 | 第 5 作者 |
Xiaohang Zhan, Ziwei Liu, Ping Luo, Xiaoou Tang, Chen Change Loy | Mix-and-Match Tuning for Self-Supervised Semantic Segmentation | AAAI 2018 | 2018 | 第 4 作者 |
Yujun Shen, Ping Luo, Junjie Yan, Xiaogang Wang, Xiaoou Tang | FaceID-GAN: Learning a Symmetry Three-Player GAN for Identity-Preserving Face Synthesis | CVPR 2018 | 2018 | 第 5 作者 |
Xingang Pan, Ping Luo, Jianping Shi, Xiaoou Tang | Two at Once: Enhancing Learning and Generalization Capacities via IBN-Net | ECCV 2018 | 2018 | 第 4 作者 |
Yujun Shen, Ping Luo, Junjie Yan, Xiaogang Wang, Xiaoou Tang | FaceID-GAN: Learning a Symmetry Three-Player GAN for Identity-Preserving Face Synthesis | The IEEE Conference on Computer Vision and Pattern Recognition (CVPR) | 2018 | 第 5 作者 |
Kaidi Cao, Yu Rong, Cheng Li, Xiaoou Tang, Chen Change Loy | Pose-Robust Face Recognition via Deep Residual Equivariant Mapping | Computer Vision and Pattern Recognition 2018 | 2018 | 第 4 作者 |
DeepID-Net: Object Detection with Deformable Part Based Convolutional Neural Networks | IEEE Trans. Pattern Anal. Mach. Intell | 2017 | 其他(合作组作者) | |
Yubin Deng, Chen Change Loy, Xiaoou Tang | Image Aesthetic Assessment: An experimental survey | IEEE Signal Process. Mag | 2017 | 第 3 作者 |
Xiaoxiao Li, Ziwei Liu, Ping Luo, Chen Change Loy, Xiaoou Tang | Not All Pixels Are Equal:Difficulty-Aware Semantic Segmentation via Deep Layer Cascade | CVPR 2017 | 2017 | 第 5 作者 |
Yikang Li, Wanli Ouyang, Xiaogang Wang, Xiaoou Tang | ViP-CNN: Visual Phrase Guided Convolutional Neural Network | CVPR 2017 | 2017 | 第 4 作者 |
Yining Li, Chen Huang, Xiaoou Tang, Chen Change Loy | Learning to Disambiguate by Asking Discriminative Questions | ICCV 2017 | 2017 | 第 3 作者 |
Ziwei Liu, Raymond A. Yeh, Xiaoou Tang, Yiming Liu, Aseem Agarwala | Video Frame Synthesis Using Deep Voxel Flow | ICCV 2017 | 2017 | 第 3 作者 |
Yue Zhao, Yuanjun Xiong, Zhirong Wu, Dahua Lin | Temporal Action Detection with Structured Segment Networks | ICCV 2017 | 2017 | 第 5 作者 |
Xixuan,Wu,Yu,Qiao,Xiaogang,Wang,Xiaoou,Tang | Bridging Music and Image via Cross-Modal Ranking Analysis | IEEE Trans. Multimedia | 2016 | 第 4 作者 |
L Wang,Y Qiao,X Tang | MoFAP: A Multi-level Representation for Action Recognition | International Journal of Computer Vision | 2016 | 第 3 作者 |
Limin Wang, Yu Qiao, Xiaoou Tang, Luc Van Gool | Actionness Estimation Using Hybrid Fully Convolutional Networks | Proc. Int. Conf. Computer Vision and Pattern Recognition (CVPR) | 2016 | 第 3 作者 |
Shuo Yang, Ping Luo, Chen Change Loy, Xiaoou Tang | WIDER FACE: A Face Detection Benchmark | Proc. Int. Conf. Computer Vision and Pattern Recognition (CVPR) | 2016 | 第 4 作者 |
Shizhan Zhu, Cheng Li, Chen Change Loy, Xiaoou Tang | Unconstrained Face Alignment via Cascaded Compositional Learning | Proc. Int. Conf. Computer Vision and Pattern Recognition (CVPR) | 2016 | 第 4 作者 |
Chen Huang, Chen Change Loy, Xiaoou Tang | Unsupervised Learning of Discriminative Attributes and Visual Representations | Proc. Int. Conf. Computer Vision and Pattern Recognition (CVPR) | 2016 | 第 3 作者 |
Ziwei Liu, Sijie Yan, Ping Luo, Xiaogang Wang, Xiaoou Tang | Fashion Landmark Detection in the Wild | The 14th European Conference on Computer Vision(ECCV2016) | 2016 | 第 5 作者 |
ZhanpengZhang,PingLuo,ChenChangeLoy,XiaoouTang | Joint Face Representation Adaptation and Clustering in Videos | The 14th European Conference on Computer Vision | 2016 | 第 4 作者 |
Tak Wai Hui, Chen Change Loy, Xiaoou Tang | Depth Map Super-Resolution by Deep Multi-Scale Guidance | The 14th European Conference on Computer Vision | 2016 | 第 3 作者 |
Shizhan Zhu, Sifei Liu, Chen Change Loy, Xiaoou Tang | Deep Cascaded Bi-Network for Face Hallucination | The 14th European Conference on Computer Vision | 2016 | 第 4 作者 |
Wu Shi, Chen Change Loy, Xiaoou Tang | Deep Specialized Network for Illuminant Estimation | The 14th European Conference on Computer Vision | 2016 | 第 3 作者 |
Linjie Yang;Jianzhuang Liu;Xiaoou Tang | Depth From Water Reflection | IEEE Transactions on Image Processing | 2015 | 第 3 作者 |
Y. Xiong, K. Zhu, D. Lin, X. Tang | Recognize Complex Events From Static Images by Fusing Deep Channels | Proc. Int. Conf. Computer Vision and Pattern Recognition (CVPR) | 2015 | 第 4 作者 |
Yi Sun, Xiaogang Wang, Xiaoou Tang | Deeply Learned Face Representations Are Sparse, Selective, and Robust,Proc. Int. Conf. | Computer Vision and Pattern Recognition (CVPR) | 2015 | 第 3 作者 |
Linjie Yang, Ping Luo, Chen Change Loy, Xiaoou Tang | A Large-Scale Car Dataset for Fine-Grained Categorization and Verification | Proc. Int. Conf. Computer Vision and Pattern Recognition (CVPR) | 2015 | 第 4 作者 |
Shizhan Zhu, Cheng Li, Chen Change Loy, Xiaoou Tang | Face Alignment by Coarse-to-Fine Shape Searching | Proc. Int. Conf. Computer Vision and Pattern Recognition (CVPR) | 2015 | 第 4 作者 |
Yonglong Tian, Ping Luo, Xiaogang Wang, Xiaoou Tang | Pedestrian Detection Aided by Deep Learning Semantic Tasks | Proc. Int. Conf. Computer Vision and Pattern Recognition (CVPR) | 2015 | 第 4 作者 |
Yonglong Tian, Ping Luo, Xiaogang Wang, Xiaoou Tang | Deep Learning Strong Parts for Pedestrian Detection | IEEE International Conference on Computer Vision (ICCV) | 2015 | 第 4 作者 |
Shuo Yang, Ping Luo, Chen Change Loy, Xiaoou Tang | From Facial Parts Responses to Face Detection: A Deep Learning Approach | IEEE International Conference on Computer Vision (ICCV) | 2015 | 第 4 作者 |
Z. Zhang, W. Zhang, H. Ding, J. Liu, and X. Tang | Hierarchical facial landmark localization via cascaded random binary patterns | Pattern Recognition | 2015 | 第 5 作者 |
Z. Zhu, P. Luo, X. Wang, and X. Tang | Multi-view Facial Landmark Localization in RGB-D Images via Hierarchical Regression with Binary Patterns | IEEE TRANSACTIONS ON CIRCUITS AND SYSTEMS FOR VIDEO TECHNOLOGY | 2014 | 第 4 作者 |
X. Wang, S. Qiu, K. Liu, and X. Tang | Web Image Re-ranking Using Query-Specific Semantic Signatures | IEEE Trans on Pattern Analysis and Machine(PAMI) | 2014 | 第 4 作者 |
L. Wang, Y. Qiao, and X. Tang | Video Action Detection with Relational Dynamic-Poselets | Proc. European Conference Computer Vision ( ECCV),2014 | 2014 | 第 3 作者 |
W. Huang, Y. Qiao, and X. Tang and X. Tang | Robust Scene Text Detection with Convolution Neural Network Induced MSER Trees | Proc. European Conference Computer Vision ( ECCV),2014 | 2014 | 第 3 作者 |
P. Luo, Y. Tian, X. Wang, and X. Tang | Switchable Deep Network for Pedestrian Detection | IEEE Conference on Computer Vision and Pattern Recognition | 2014 | 第 4 作者 |
Y. Sun, X. Wang, and X. Tang | Deep Learning Face Representation from Predicting 10,000 Classes | IEEE Conference on Computer Vision and Pattern Recognition | 2014 | 第 3 作者 |
Z. Zhu, P. Luo, X. Wang, and X. Tang | Multi-View Perceptron: a Deep Model for Learning Face Identity and View Representations | The 28 Annual Conference on Neural Information Processing Systems (NIPS) | 2014 | 第 4 作者 |
Y. Sun, Y. Chen, X. Wang, and X. Tang | Deep Learning Face Representation by Joint Identification-Verification | The 28 Annual Conference on Neural Information Processing Systems (NIPS) | 2014 | 第 3 作者 |
Y. Sun, X. Wang and X. Tang | “Deep Convolutional Network Cascade for Facial Point Detection | ” in Proceedings of IEEE Computer Society Conference on Computer Vision and Patter Recognition (CVPR) 2013 | 2013 | |
X. Wang, S. Qiu, K. Liu, and X. Tang | “Web Image Re-ranking Using Query-Specific Semantic Signatures” | accepted to IEEE Transactions on Pattern Analysis and Machine Intelligence (PAMI) | ||
K. Jia, X. Wang, and X. Tang | “Image Transformation based on Learning Dictionaries across Image Spaces” | IEEE Transactions on Pattern Analysis and Machine Intelligence (PAMI) | 2013 | 2013Vol. 35 pp. 367-380 |
X. Tang, K. Liu, J. Cui, F. Wen, and X. Wang | “IntentSearch: Capturing User Intention for One-Click Internet Image Search | ” IEEE Trans. Pattern Analysis and Machine Intelligence (PAMI) | 2012 | July 2012. Vol. 34 No. 7 |
T. Xue, J. Liu and X. Tang | “Example-Based 3D Object Reconstruction from Line Drawings | ” Proc. of IEEE Conf. on Computer Vision and Pattern Recognition(CVPR) | 2012 | |
B. Zhou, X. Wang and X. Tang | “Understanding Collective Crowd Behaviors:Learning a Mixture Model of Dynamic Pedestrian-Agents | ” Prof. of IEEE Conf. on Computer Vision and Pattern Recognition(CVPR) | 2012 | |
P. Luo, X. Wang, and X. Tang | “Hierarchical Face Parsing via Deep Learning” | Prof. of IEEE Conf. on Computer Vision and Pattern Recognition(CVPR) | 2012 | |
K. Jia, X. Tang, X. Wang | “Image Transformation based on Learning Dictionaries across Image Spaces” | IEEE Trans. Pattern Anal. Mach. Intell. (PAMI) | 2012 | |
T. Xue, J. Liu, X. Tang | “3D Modeling from a Single View of a Symmetric Object” | IEEE Trans. on Image Processing. (TIP) | 2012 | |
K. He, J. Sun, X. Tang | “Single Image Haze Removal Using Dark Channel Prior | ” IEEE Trans. Pattern Analysis and Machine Intelligence (PAMI) | 2011 | Vol. 33 No. 12 Dec. 2011. |
W. LUO, X. Wang and X. Tang | “Content-based Photo Quality Assessment” | Proc. International Conference on Computer Vision (ICCV) | 2011 | |
K. Jia, X. Wang, X. Tang | “Optical flow estimation using learned sparse model” | Proc. International Conference on Computer Vision (ICCV) | 2011 | |
W. Zhang, X. Wang, and X. Tang | “Coupled Information-Theoretic Encoding for Face Photo-Sketch Recognition | ” Prof. IEEE Conf. Computer Vision and Pattern Recognition(CVPR) | 2011 | |
B. Zhou, X. Wang, X. Tang | “Random Field Topic Model for Semanic Region Analysis in Crowded Scenes from Tracklets | ” IEEE Conf. Computer Vision and Pattern Recognition (CVPR) | 2011. | June |
T. Xue, J. Liu, X. Tang | “Symmetric Piecewise Planar Object Reconstruction from a Single Image | ” IEEE Conf. Computer Vision and Pattern Recognition (CVPR) | 2011. | June |
X. Wang, K. Liu, X. Tang | “Query-Specific Visual Semantic Spaces forWeb Image Re-ranking | ” IEEE Conf. Computer Vision and Pattern Recognition (CVPR) | 2011. | June |
K. He, C. Rhemann, C. Rother, X. Tang, and J. Sun | “A Global Sampling Method for Alpha Matting” | IEEE Conference on Computer Vision and Pattern Recognition (CVPR) | 2011 | |
Q. Yin, X. Tang, J. Sun | “An associate-predict model for face recognition” | IEEE Conference on Computer Vision and Pattern Recognition (CVPR) | 2011 | |
J. Liu, Y. Chen, X. Tang | “Decomposition of complex line drawings with hidden lines for 3D planar-faced manifold object reconstruction | ” IEEE Trans. Pattern Anal. Mach. Intell. (PAMI) | 2011 | vol. 33 no. 1 pp. 3 |
T. Liu, Z. Yuan, J. Sun, J. Wang, N. Zheng, X. Tang, H. Shum | “Learning to Detect a Salient Object” | IEEE Trans. Pattern Anal. Mach. Intell. (PAMI) | 2011 | vol. 33 no. 2 pp. 353-367 |
W. Zhang, J. Sun, X. Tang | “From Tiger to Panda: Animal Head Detection | ” IEEE Transactions on Image Processing (TIP) | 2011 | vol. 20 no. 6 pp.1696-1708 |
W. Zhang, Z. Lin, X. Tang | “Learning Semi-Riemannian Metrics for Semisupervised Feature Extraction | ” IEEE Trans. Knowl. Data Eng | 2011 | vol 23 no. 4 pp. 600-611 |
C. Zhao, X. Wang, and W. Cham | “Background Subtraction via Robust Dictionary Learning | ” EURASIP journal on Image and Video Processing | 2011 | |
Z. Lin, X. Tang | “Learning Semi-Riemannian Metrics for Semisupervised Feature Extraction” | IEEE Trans. on Knowledge and Data Engineering (TKDE) | 2011 | vol. 23 no. 4 pp. 600-611 |
Z. Yu, C. Xu, J. Liu, O. C. Au, X. Tang | “Automatic object segmentation from large scale 3D urban point clouds through manifold embedded mode seeking” | Proceedings of the 19th ACM international conference on Multimedia (MM) | 2011 | |
C. Cao, S. Chen, W. Zhang, X. Tang | “Automatic motion-guided video stylization and personalization” | Proceedings of the 19th ACM international conference on Multimedia (MM) | 2011 | |
B. Gong, J. Liu, X. Wang, X. Tang | “3D object retrieval with semantic attributes” | Proceedings of the 19th ACM international conference on Multimedia (MM) | 2011 | |
Q. Zhou, S. Chen, J. Liu, X. Tang | “Edge-preserving single image super-resolution” | Proceedings of the 19th ACM international conference on Multimedia (MM) | 2011 | |
参考资料: |
承担项目
时间 | 项目名称 | 备注 |
---|---|---|
2011年1月—2015年12月 | 广东省引进创新科研团队-机器人与智能信息技术创新科研团队 | 负责人 |
2011年1月—2015年12月 | 机器人与智能信息技术创新科研团队(深圳市配套) | 负责人 |
2012年7月—2014年7月 | 深圳市机器视觉与模式识别重点实验室 | 负责人 |
2014年12月—2019年12月 | 视频监控和人脸识别技术研究 | 参与 |
2015年1月—2018年12月 | 面向互联网图像视频的鲁棒人脸分析与识别技术研究 | 负责人 |
2016年1月—2018年12月 | 基20150084非结构场景下机器人视觉感知关键技术的研究 | 负责人 |
2019年1月—2023年12月 | SIAT-CHUK多媒体技术联合实验室 | 参与 |
参考资料来源: |
人才培养
指导学生
汤晓鸥在香港中文大学任教25年间共培养超过100名学生,其中著名的有王晓刚、何恺明、林达华等。
王晓刚,本科中科大少年班,硕士期间在汤晓鸥的MMLab,博士就读于麻省理工,2009年从麻省理工回到MMLab做教授。2015年,由王晓刚带队,打败对手谷歌,取得了中国学者在ImageNet评测中的第一个世界冠军。
何恺明,系2003年广东高考状元,本科毕业后,进入香港中文大学攻读研究生,师从汤晓鸥。2009年在MMLab读硕期间发表的第一篇文章,就取得了国际顶尖会议CVPR(IEEE国际计算机视觉与模式识别会议)的最佳论文。这也是CVPR历史上产自亚洲的第一篇最佳论文 。此后何恺明去了微软研究院和Facebook工作。2016年,何恺明凭借深度残差网络(ResNet)论文再次获得CVPR最佳论文奖 。在微软研究院,何恺明把深度学习训练的层级从2015年时的最多三层,拓深到了20多层。他在网络的每一层引入了直联通道,从而解决了深度网络梯度传递的问题。而今,以Transformer为核心的大模型,也普遍采用何恺明当年所创设的结构。
汤晓鸥与何恺明
林达华,本科在中科大,硕士在香港中文大学,博士在麻省理工。2010年在麻省理工读博期间,获得NIPS(神经信息处理系统大会)最佳学生论文。林达华2014年回到汤晓鸥的MMLab做教授,第一项工作就是将实验室开源,在没有推广投入的情况下,OpenMMLab纯以口口相传的形式,成为国际上最具影响力的视觉算法开源体系之一。林达华的第二项工作,是推出书生·浦语,这是中国首个千亿参数多语种大语言模型;他第三项工作是推出全球首个城市级实景三维大模型LandMark,有2000亿参数,覆盖100平方公里。
汤晓鸥、王晓刚与学生在香港中文大学合照(2011年)
编写教材
汤晓鸥十分注重在基础教育领域的AI教育。商汤科技曾联合华东师范大学、商务印书馆发布全球首本人工智能高中教材《人工智能基础(高中版)》。
创立商汤
2014年10月,汤晓鸥和徐立共同成立了商汤集团股份有限公司(商汤科技、SenseTime) 。“商汤”之名,源自中国历史上第一个有文字记载的朝代商,及其开国之君汤 。随后王晓刚、徐冰、杨帆等联合创始人相继加入 。技术和创始团队皆来自香港中文大学多媒体实验室——汤晓鸥所领导的计算机视觉研究组,及其核心成员。
商汤科技
2016年,商汤持续保持在计算机视觉三大会议CVPR、ICCV和ECCV上发表的论文数量排名领先。
2016年用6000万人脸训练达到了百万分之一的误识率,2017年用20亿人脸训练达到一亿分之一的误识率。
在2018年世界人工智能大会主论坛上,汤晓鸥介绍,在商汤科技他们推崇的是“羊”文化,“我们提倡的是,吃的是草,挤出来的是AI 。”
根据沙利文发布的报告,按2020年收入算,商汤科技位列AI行业亚洲第一;同年中国计算机视觉软件提供商市场份额排名中,商汤科技以11%的市场份额排名第一。
截止2021年6月底,商汤科技服务客户超2400家,包括250余家《财富》500强企业及上市公司,以及超过30家汽车企业。
在正式IPO之前,商汤科技先后获得了12轮融资,融资金额总计超过52亿美元。汤晓鸥被认为是将计算机视觉技术从象牙塔带到了商业世界,并且取得了成功。
2021年12月30日,在经历了被美列入实体清单和禁止投资名单的风波后,商汤科技在香港正式上市,上市首日市值达到约1375亿港元。
在汤晓鸥的带领下,商汤科技取得了丰硕的成果。数据显示,自2014年成立至2022年1月,商汤科技已经拿下70多个全球冠军,800多项AI发明专利。
财富排名
时间 | 榜单排名 | 财富值 |
---|---|---|
2020年5月 | 2020新财富500富人榜第402位 | 78.5亿 |
2022年3月 | 2022家大业大酒·胡润全球富豪榜第505位 | 390亿 |
2022年 | 2022年福布斯全球亿万富豪榜第460位 | 57亿美元 |
2022年 | 2022年衡昌烧坊·胡润百富榜第473位 | 130亿元人民币 |
2023年2月 | 2023年《福布斯》杂志香港富豪榜第33位 | 25亿美元 |
2023年3月 | 2023年胡润全球富豪榜第1782位 | 130亿元 |
2023年10月 | 2023年胡润百富榜第585名 | 100亿人民币 |
荣誉表彰
时间 | 荣誉奖励 | 授予单位 |
---|---|---|
2009年 | 电气与电子工程师协会会士(IEEE Fellow) | 电气与电子工程师协会(IEEE) |
2020年 | 入选“人工智能全球2000位最具影响力学者榜” | |
2020年 | 亚洲五大计算机科学家 | Guide2Research |
时间 | 担任职务 |
---|---|
1999年 | 中国科学技术大学海外校友基金会(USTCAF)理事会主席 |
2014年5月至2018年1月 | 中国科学技术大学新创校友基金会第三届理事 |
2017年9月 | 北京市工商业联合会第十四届执行委员会副主席 |
2018年5月 | 香港人工智能及数据实验室董事 |
2018年7月至2021年3月 | 香港科学园公司董事 |
2019年6月至2020年4月 | 马来西亚国库控股董事 |
2023年 | 中国人民政治协商会议第十四届全国委员会委员 |
2023年 | 中国人民政治协商会议北京市第十四届委员会委员 |
2023年3月 | 香港特别行政区政府特首顾问团成员 |
《IEEE Transactions on Pattern Analysis and Machine Intelligence》编委(Associate Editor) | |
《International Journal of Computer Vision》编委(Associate Editor) | |
中国科学院深圳先进技术研究院副院长 | |
上海人工智能实验室主任 | |
计算机视觉国际会议(ICCV)主席 | |
计算机视觉与模式识别会议(CVPR)主席 | |
参考资料来源: |
家庭
儿子:汤之铭,2003年3月9日出生
妹夫:王晓刚
科研之外
在微软亚洲研究院期间,汤晓鸥被一致推选为研究院文工团团长,兼团委书记,连续三年出任研究院年度文艺晚会主持人,为此,他为自己起了个艺名叫“小o”(发音为Xiao Ou)。
“我们不能走以前的老路,不能永远在下游干活。必须有人去做核心的、底层的平台级技术,人工智能是新的机会。”
“我们在成长过程中享受了国家优质的教育资源,应该为源头创新做些有意义的事,在基础研究方面为中国人争一口气,这是中国当代知识分子应有的情怀。”
“学术的东西,如果不能落地也没有什么用,好在我们不是烧钱的公司,是能赚钱的公司,可以自负盈亏,我们的融资不是用来烧的,而是做伟大的事。”
“很多互联网公司喜欢拿狼性作为企业文化,但我们不同,我们公司的文化是羊,商汤是很有同情心,很有同理心的公司。但羊也有缺点,比如说羊群效应,因此我们想做不一样的羊——黑羊(Black sheep),去做别人没有做过的事情,甚至是别人想不到的事情。”
“我想对所有我曾经合作过的学生、老师讲一句,我不是在最好的时光遇见了你们,而是遇见了你们,才有这段最好的时光。”
汤晓鸥教授是中国人工智能领域的杰出代表。他学识渊博、治学严谨、求真务实、开拓创新,富有家国情怀和战略眼光;他甘为人梯、奖掖后学、矢志创新、勇担重任,把全部精力奉献于计算机科学研究,积极推动原创技术发展,为中国人工智能领域科技事业发展做出了卓越的贡献;他二十多年来悉心培养学生,桃李满天下。(商汤科技 评)
汤晓鸥教授是商业领域的杰出领导者,也是香港特首顾问委员会成员,在创新和创业领域给了我宝贵的建议。他是最早一批推动香港研发成果商业化的人,并在香港和内地培养了众多杰出的人工智能人才,他的远见、决心和领导力将继续激励所有人。(香港特别行政区行政长官李家超 评)
汤晓鸥是全球人脸识别技术的“开拓者”和“探路者” 。(中青在线 评)
汤晓鸥被认为是最有影响力的人工智能科学家之一(He is considered one of the most influential AI scientists) 。(香港大学同心基金数据科学研究院 评)
在过去的二十年中,您(汤晓鸥)培育了众多杰出的学子。正是这些学子们,正在将中国计算机视觉从平原提升至珠穆朗玛峰之巅。(昆仑万维2050全球研究院院长 颜水城 评)
汤晓鸥是人工智能领域的翘楚,一生致力投身创科事业,多年来也在大学传授知识,把创意思维传承予莘莘学子。汤教授乐于服务社会,为香港的创科事业发展作出重要贡献。(香港特区政府创新科技及工业局局长 孙东评)
汤晓鸥是(香港中文大学)工程学院杰出学人,他专门从事计算机视觉相关领域研究,才华出众。 (香港立法会议员 黄锦辉 评)
汤晓鸥离世是国家及科技界的损失。(香港立法会议员 刘国勋 评)
汤教授是一位出色的学者、创业家、也是我的紧密工作伙伴及挚友,他的离世对于大学是极大损失,我深感悲痛。汤教授不但在人工智能领域成绩骄人,更将科研成果成功转化为全国领先的独角兽企业,启发无数大学成员和企业家,为推动科研及创业文化作出重大贡献。(香港中文大学校长 段崇智 评)
汤晓鸥先生逝世后,中央领导同志、其他有关方面领导同志以各种方式表示关心、慰问和深切哀悼。
2023年12月19日上午,龙华殡仪馆大厅内气氛庄重肃穆,汤晓鸥先生的遗体安卧在鲜花丛中。10时30分许,陈吉宁、龚正、胡文容、陈家昌、张为、李政等向汤晓鸥先生遗体三鞠躬,作最后送别。上海市人大常委会、市政府相关负责同志,有关部门和单位负责同志,汤晓鸥先生亲属、同事、学生、生前友好及各界人士前往送别。
汤晓鸥先生逝世后,送花圈或发唁电的有国务院港澳办、中央政府驻港联络办、科技部、人力资源社会保障部、国家卫生健康委、全国政协办公厅、中国科学院、中国工程院、中央广播电视总台、中国科协、中国地震局、中国气象局等。
1、本站所有文本、信息、视频文件等,仅代表本站观点或作者本人观点,请网友谨慎参考使用。
2、本站信息均为作者提供和网友推荐收集整理而来,仅供学习和研究使用。
3、对任何由于使用本站内容而引起的诉讼、纠纷,本站不承担任何责任。
4、如有侵犯你版权的,请来信(邮箱:baike52199@gmail.com)指出,核实后,本站将立即删除。