头像

孙铭杰 副教授

计算机科学与技术学院(软件学院)

个人资料

  • 直属机构:计算机科学与技术学院(软件学院)
  • 联系电话:
  • 性别:
  • 电子邮箱:mjsun@suda.edu.cn
  • 专业技术职务:
  • 办公地址:苏州大学北校区工科楼
  • 毕业院校:利物浦大学
  • 通讯地址:
  • 学位:哲学博士学位
  • 邮编:
  • 学历:博士研究生毕业
  • 传真:

教育经历

教育经历:
  • 博士,2019年1月-2022年7月,人工智能,利物浦大学
  • 硕士,2017年9月-2018年6月,计算机科学,诺丁汉大学
  • 硕士,2016年9月-2019年6月,软件工程,西安电子科技大学
  • 本科,2012年9月-2016年6月,电子信息科学与技术,南京航空航天大学

工作经历

工作经历:
  • 2022年8月-2022年12月,上海人工智能研究院,助理研究员
  • 2023年1月-至今,苏州大学,计算机科学与技术学院,副教授

研究领域

研究领域:

1. AIGC,图像生成方向:针对样本稀少且难以标注的分割任务,如工业图像缺陷样本(缺陷发生概率低)、医疗样本(标注需要专业医师)等等,基于Stable Diffusion模型,同时自动生成多样的样本图片和对应的精准像素级标注,为下游分割任务提供无限量的训练样本;


2. 多模态大模型+小模型方向:针对视频异常检测任务中传统重建方法往往缺失语义信息的问题,基于多模态大模型为检测模型赋予更好的语义信息提取能力以及推理能力,增强检测模型的通用能力;


3. 少像素目标检测方向:针对异常检测场景的高分辨率、小目标特性:如无人机场景下高空拍摄的物体往往较小、工业产品检测的缺陷往往较小,设计更高效的视觉基座模型,能高效处理高分辨率图片,并能精准检测其中的少像素目标;


4. 多模态信息处理方向:针对图片模态、语言等模态,目标定位、跟踪、分割,强化学习在上述问题中的应用等等。


招收研究生,欢迎对课题组方向感兴趣的同学发邮件联系。

开授课程

开授课程:
  • 1、计算机组成与结构,未来校区21级本科,2023年9月-2023年12月
  • 2、计算机组成与结构,未来校区22级本科,2024年2月-2024年6月
  • 3、模拟与数字电路设计课程实践,本部计科22级本科,2024年9月-2024年12月
  • 4、计算机组成与结构,本部23级本科软工,2025年2月-2025年6月
  • 5、模拟与数字电路设计课程实践,本部计科23级本科,2025年9月-2025年12月
课程教学:

科研项目

科研项目:
  • 1、国家自然科学基金-青年基金,2024/01-2026/12,主持,在研,30万
  • 2、江苏省自然科学基金-青年基金,2023/07-2026/06,主持,在研,20万
  • 3、苏州大学优秀青年学者学术启动经费,2023/03-2029/12,主持,在研,40万
  • 4、科技部国家重点研发项目 ,2022/06-2024/05,参与,结题,220万
  • 5、国家自然科学基金-面上项目,2020/01-2023/12,参与,结题,59万
  • 6、江苏省重点产业技术创新项目,2024/09-2025/12,主持,在研
  • 7、苏州市软课题项目,2024/06-2024/12,主持,结题,1万
  • 8、企业横向-阿丘科技,2024/09-2027/08,主持,在研,11万
  • 9、苏州市重点实验室开放课题,2025/02-2026/02,主持,在研,5万
  • 10、企业横向-追觅科技,2025/04-2027/04,参与,在研,120万
  • 11、江苏省公派访问学者项目,2025/07-2026/12,主持,在研,5万
  • 12、国家级本科生大创项目,2025/06-2027/06,主持,在研,2万
  • 13、江苏省科技副总项目,2025/04-2027/04,主持,在研,12万

论文

论文:
  • 1、Discriminative Triad Matching and Reconstruction for Weakly Referring Expression Grounding,IEEE Transactions on Pattern Analysis and Machine Intelligence (TPAMI),CCF A类期刊,中科院一区,2021,(第一作者)
  • 2、Iterative Shrinking for Referring Expression Grounding Using Deep Reinforcement Learning,IEEE/CVF Conference on Computer Vision and Pattern Recognition 2021 (CVPR),CCF A类会议,2021,(第一作者)
  • 3、Fast template matching and update for video object tracking and segmentation,IEEE/CVF Conference on Computer Vision and Pattern Recognition 2020 (CVPR),CCF A类会议,2020,(第一作者)
  • 4、Starting Point Selection and Multiple-standard Matching for Video Object Segmentation with Language Annotation,IEEE Transactions on Multimedia (TMM),CCF B类期刊,中科院一区,2022,(第一作者)
  • 5、Cycle-free Weakly Referring Expression Grounding with Self-paced Learning,IEEE Transactions on Multimedia (TMM),CCF B类期刊,中科院一区,2022,(第一作者)
  • 6、Adaptive ROI generation for video object segmentation using reinforcement learning,Pattern Recognition (PR),CCF B类期刊,中科院一区,2020,(第一作者)
  • 7、Feature representation matters: End-to-end learning for reference-based image super-resolution,European Conference on Computer Vision (ECCV),CCF B类会议,2020
  • 8、Reliability does matter: An end-to-end weakly supervised semantic segmentation approach,AAAI Conference on Artificial Intelligence 2020 (AAAI),CCF A类会议,2020
  • 9、Transformer-Based Language-Person Search With Multiple Region Slicing,IEEE Transactions on Circuits and Systems for Video Technology (TCSVT),CCF B类期刊,中科院一区,2022
  • 10、Progressive sample mining and representation learning for one-shot person re-identification,Pattern Recognition (PR),CCF B类期刊,中科院一区,2021
  • 11、Plausible Proxy Mining with Credibility for Unsupervised Person Re-identification,IEEE Transactions on Circuits and Systems for Video Technology (TCSVT),CCF B类期刊,中科院一区,2022
  • 12、Fully and Weakly Supervised Referring Expression Segmentation with End-to-End Learning,IEEE Transactions on Circuits and Systems for Video Technology (TCSVT),CCF B类期刊,中科院一区,2023
  • 13、Unified Multi-Modality Video Object Segmentation Using Reinforcement Learning,IEEE Transactions on Circuits and Systems for Video Technology (TCSVT),CCF B类期刊,中科院一区,2023,(第一作者)
  • 14、Prototype Guided Pseudo Labeling and Perturbation-based Active Learning for domain adaptive semantic segmentation,Pattern Recognition (PR),CCF B类期刊,中科院一区,2023,(共同第一作者)
  • 15、Dance with You: The Diversity Controllable Dancer Generation via Diffusion Models,ACM International Conference on Multimedia (ACM MM),CCF A类会议,2023,(共同第一作者)
  • 16、Context-based local-global fusion network for 3D point cloud classification and segmentation,Expert Systems with Applications,中科院一区,2024,(共同第一作者)
  • 17、ConSense: Continually Sensing Human Activity with WiFi via Growing and Picking,AAAI Conference on Artificial Intelligence (AAAI),CCF A类会议,2025
  • 18、Class agnostic and specific consistency learning for weakly-supervised point cloud semantic segmentation,Pattern Recognition,CCF B类期刊,中科院一区,2025,(共同第一作者)
  • 19、Noise-Consistent Siamese-Diffusion for Medical Image Synthesis and Segmentation,IEEE/CVF Conference on Computer Vision and Pattern Recognition 2025(CVPR),CCF A类会议,2025,(共同通讯作者)
  • 20、Free Lunch of Image-mask Alignment for Anomaly Image Generation and Segmentation,International Joint Conference on Artificial Intelligence 2025 (IJCAI) ,CCF A类会议,2025,(通讯作者)
  • 21、DriftRemover: Hybrid Energy Optimizations for Anomaly Images Synthesis and Segmentation,International Joint Conference on Artificial Intelligence 2025 (IJCAI),CCF A类会议,2025,(通讯作者)
  • 22、NetEventCause: Event-driven Root Cause Analysis for Large Network System without Topology,IEEE Transactions on Neural Networks and Learning Systems (TNNLS),CCF B类期刊,中科院一区,2025
  • 23、SFBM: Shared Feature Bias Mitigating for Long-tailed Image Recognition,IEEE Transactions on Neural Networks and Learning Systems (TNNLS),CCF B类期刊,中科院一区,2025,(共同第一作者)
  • 24、Feature Purification Matters: Suppressing Outlier Propagation for Training-Free Open-Vocabulary Semantic Segmentation,International Conference on Computer Vision (ICCV),CCF A类会议,2025

科技成果

软件著作 软件著作: 专利 专利:
  • 1、一种多模态的情感识别方法及装置,发明
  • 2、一种异常图像生成方法及装置,发明
  • 3、根据图像反向生成人像试衣效果的虚拟试穿方法和系统,发明

荣誉及奖励

荣誉及奖励:
  • 1、苏州市自然科学优秀学术论文 三等奖,2024年
  • 2、苏州市人工智能自然科学奖 一等奖,2024年
  • 3、江苏省计算机学会科学技术奖 三等奖,2025年
  • 4、苏州大学计算机科学与技术学院优秀共产党员,2025年
  • 5、苏州大学计算机科学与技术学院优秀党务工作者,2025年

招生信息

招生信息:

1. AIGC,图像生成方向:针对样本稀少且难以标注的分割任务,如工业图像缺陷样本(缺陷发生概率低)、医疗样本(标注需要专业医师)等等,基于Stable Diffusion模型,同时自动生成多样的样本图片和对应的精准像素级标注,为下游分割任务提供无限量的训练样本;


2. 多模态大模型+小模型方向:针对视频异常检测任务中传统重建方法往往缺失语义信息的问题,基于多模态大模型为检测模型赋予更好的语义信息提取能力以及推理能力,增强检测模型的通用能力;


3. 少像素目标检测方向:针对异常检测场景的高分辨率、小目标特性:如无人机场景下高空拍摄的物体往往较小、工业产品检测的缺陷往往较小,设计更高效的视觉基座模型,能高效处理高分辨率图片,并能精准检测其中的少像素目标;


4. 多模态信息处理方向:针对图片模态、语言等模态,目标定位、跟踪、分割,强化学习在上述问题中的应用等等。


招收研究生,欢迎对课题组方向感兴趣的同学发邮件联系。


招生信息1:

学位:哲学博士学位

毕业院校:利物浦大学

电子邮箱:mjsun@suda.edu.cn

办公地址:苏州大学北校区工科楼

联系电话:

1447 访问

相关教师