章宗长
职称: 副教授
院部/部门: 计算机科学与技术学院

电子邮箱: zzzhang@suda.edu.cn

联系电话:  

办公地点: 十梓街1号苏州大学本部理工楼645室

个人简介

章宗长,男,1985年生,博士,苏州大学特聘副教授、硕士生导师。2007年6月本科毕业于中南大学数学院信息与计算科学专业,2012年6月博士毕业于中国科学技术大学计算机科学与技术学院计算机应用技术专业。2010年10月—2011年10月在美国罗格斯大学计算机科学系联合培养,2012年8-10月在华为诺亚方舟实验室短期工作,2012年11月—2014年6月在新加坡国立大学计算学院从事博士后研究,2014年7月起在苏州大学计算机科学与技术学院工作,2018年9月—2019年9月在斯坦福大学工程学院进行合作研究。目前主要从事强化学习、智能规划和多智能体系统等方面的研究。在国内外重要学术期刊和会议发表论文20多篇,出版译著1部,撰写专著章节2章,申请美国发明专利1项、国家发明专利9项(已授权1项),登记软件著作权3项。部分研究成果以第一作者发表在ICML、AAAI、IJCAI等CCF推荐的A类国际学术会议,UAI、ICAPS、AAMAS等CCF推荐的B类国际学术会议和《Frontiers of Computer Science》、《软件学报》等重要期刊上。

曾/正担任人工智能顶级国际会议AAAI的高级程序委员,IJCAI、NIPS、ICML等人工智能和机器学习顶级国际会议的程序委员、审稿人,《JAIR》、《ACM Trans》、《IEEE Trans》、《MLJ》等国际期刊的审稿人,和ACML、PRICAI等国际会议中强化学习专题研讨会的联合主席。正/将主持国家自然科学基金面上项目、国家自然科学基金青年项目、江苏省自然科学基金面上项目、苏州大学引进高层次人才科研启动项目、苏州大学高等教育教改研究课题青年项目各1项
,曾主持江苏省高校自然科学研究面上项目1项、横向项目2项。曾/正获得国家公派访问学者项目资助,国家建设高水平大学公派研究生项目资助,苏州市高等院校、科研院所紧缺高层次人才资助。曾获得苏州大学瑞翼奖教金、中国科学院朱李月华优秀博士生奖学金等奖励。


英文主页:http://www.escience.cn/people/zzzhang

研究方向

人工智能、机器学习

科学研究

强化学习、智能规划和多智能体系统

科研项目

国家自然科学基金面上项目,基于部分可观察模型的深度强化学习理论及方法,2019.1-2022.12,主持
国家自然科学基金青年项目,基于覆盖数的部分可观察不确定性规划理论及方法,2016.1-2018.12,主持
江苏省自然科学基金面上项目,部分可观察环境中的规划和强化学习理论及方法研究,2018.7-2021.6,主持
江苏省高校自然科学研究面上项目,基于覆盖数的合作多智能体规划方法研究,2016.9-2018.8,主持
横向项目(委托方:南京大学),深度强化学习与规划调研,2018.3-2018.9,主持
苏州大学引进高层次人才科研启动项目,强化学习理论及其在软件工程方面的应用,2014.7-,主持
横向项目(委托方:第三军医大学),抑郁症强化学习缺陷的脑机制研究,2016.1-2017.12,主持

教改项目

苏州大学高等教育教改研究课题青年项目,互联网+背景下的软件工程课程建设与改革研究,2017.9-2019.8,主持

国家留学基金项目
国家公派访问学者项目,留学单位:斯坦福大学,2018.9-2019.9
国家建设高水平大学公派研究生项目,留学单位:罗格斯大学,2010.10-2011.10


学术兼职

顾问:网易(杭州)网络有限公司
会员:国际机器学习协会、美国计算机学会、中国计算机学会、中国自动化学会、苏州市人工智能学会
常务委员:江苏省人工智能学会机器学习专业委员会
会议高级程序委员:AAAI 2019
会议程序委员/审稿人:ICML 2019、IJCAI 2018、AAAI 2018、NIPS 2018、PRICAI 2018、ACML 2018、ADPRL 2018、ICA 2018、ICIST 2018、IJCAI 2017、ICA 2017、ACML 2017、IJCAI 2013
期刊审稿:Journal of Artificial Intelligence Research、ACM Transactions on Intelligent Systems and Technology、IEEE Transactions on Cybernetics, IEEE Computational Intelligence Magazine、Machine Learning、Frontiers of Computer Science、Journal of Shanghai Jiao Tong University、中国科学、计算机学报、软件学报、自动化学报
会议联合主席:PRICAI 2018's Workshop on Methods and Applications of Reinforcement Learning、ACML 2018/2017/2016's Asian Workshop on Reinforcement Learning (AWRL)
会议组织:第五届智能体及多智能体系统研讨会、PRICAI 2018's RL Special Track、ADPRL 2016's POMDP Special Track

科研团队

作为智能计算与认知软件课题组的成员,现指导的研究生如下:
2016硕士:潘致远CCF推荐的会议论文2篇,申请美国发明专利1项、国家发明专利2项,登记软件著作权1项)

2016级硕士:林嘉豪(CCF推荐的会议论1篇,申请国家发明专利2项,登记软件著作权1项)

2017级硕士:陈子璇(CCF推荐的会议论1篇,申请国家发明专利1项)

2017级硕士:王艺深(译著1部,申请国家发明专利1项)

2017级硕士:姜冲(申请国家发明专利2项)

2018级硕士:张琳婧

2018级硕士:蔡佳润

2018级硕士:武震

2018级硕士:朱佳成
2018级硕士:周骁(在职)

以往学生:

2015级硕士:徐进(和刘全教授合作指导)

2014级硕士:翟建伟、钱炜晟(和刘全教授合作指导)

2013级硕士:周谊成、尤树华(和刘全教授合作指导)


论文成果

2018
1. Zongzhang Zhang and Mykel J. Kochenderfer, Decision-Theoretic Planning in Partially Observable Environments, Interactions in Multiagent Systems, World Scientific, 2018, 65--90.

2. Yan Zheng, Zhaopeng Meng, Jianye Hao, Zongzhang Zhang, Tianpei Yang, and Changjie Fan, A Deep Bayesian Policy Reuse Approach Against Non-Stationary Agents, Proceedings of the 32nd Conference on Neural Information Processing Systems (NIPS-2018), Montreal, Canada, 2018.
3. Jiahao Lin and Zongzhang Zhang, ACGAIL: Imitation Learning about Multiple Intentions with Auxiliary Classifier GANs, Proceedings of the 15th Pacific Rim International Conference on Artificial Intelligence (PRICAI-2018), pages 321--334, Nanjing, China, 2018.
4. Yan Zheng, Zhaopeng Meng, Jianye Hao, and Zongzhang Zhang, Weighted Double Deep Multiagent Reinforcement Learning in Stochastic Cooperative Environments, Proceedings of the 15th Pacific Rim International Conference on Artificial Intelligence (PRICAI-2018), pages 421--429, Nanjing, China, 2018.
5.
Shan Zhong, Quan Liu, Zongzhang Zhang, and Qiming Fu, Efficient Reinforcement Learning in Continuous State and Action Spaces with Dyna and Policy Approximation, Frontiers of Computer Science. (2018年2月已在线出版,https://link.springer.com/article/10.1007/s11704-017-6222-6).
6. Zhiyuan Pan, Zongzhang Zhang, and Zixuan Chen, Asynchronous Value Iteration Network, Proceedings of the 25th International Conference on Neural Information Processing (ICONIP-2018), pages 169--180, Siem Reap, Cambodia, 2018.
7. Hongyao Tang, Jianye Hao, Tangjie Lv, Yingfeng Chen, Zongzhang Zhang, Hangtian Jia, Chunxu Ren, Yan Zheng, Changjie Fan, and Li Wang, Hierarchical Deep Multiagent Reinforcement Learning, arXiv preprint arXiv: 1809.09332.
8.
章宗长, 部分可观察环境中的序贯决策理论及方法研究, 多智能体系统及应用(卷二), 清华大学出版社, 2018.1, 94--111.
9. 刘全, 翟建伟, 章宗长, 钟珊, 周倩, 章鹏, 徐进. 深度强化学习综述. 计算机学报, 2018,  41(1): 1--27.
10. 章宗长, 王艺深等译, Python数据科学导论:概念、技术与应用, 机械工业出版社, 2018.8, 1--182.

2017

1. Zongzhang Zhang, Zhiyuan Pan, and Mykel J. Kochenderfer, Weighted Double Q-learning, Proceedings of the 26th International Joint Conference on Artificial Intelligence (IJCAI-2017), pages 3455--3461, Melbourne, Australia, 2017.
2. 刘全, 翟建伟, 钟珊, 章宗长, 周倩, 章鹏. 一种基于视觉注意力机制的深度循环Q网络模型. 计算机学报, 2017,  40(6): 1353--1366.
3. 徐进, 刘全, 章宗长, 梁斌, 周倩. 基于多重门限机制的异步深度强化学习. 计算机学报. (已录用).


2016
1. Zongzhang Zhang and Quan Liu, Covering Number: Analyses for Approximate Continuous-state POMDP Planning, Proceedings of the 15th International Conference on Autonomous Agents and Multiagent Systems (AAMAS-2016), pages 1293--1294, Singapore, Singapore, 2016.
2. Zongzhang Zhang, Qiming Fu, Xiaofang Zhang, and Quan Liu, Reasoning and Predicting POMDP Planning Complexity via Covering Numbers, Frontiers of Computer Science, 2016, 10(4): 726--740.
3. 章晓芳, 章宗长, 谢晓园, 周谊成. 一种基于优先级的迭代划分测试方法. 计算机学报, 2016, 39(11): 2307--2323.
4. Jianwei Zhai, Quan Liu, Zongzhang Zhang, Shan Zhong, Haijun Zhu, Peng Zhang, and Cijia Sun, Deep Q-learning with Prioritized Sampling, Proceedings of the 23rd International Conference on Neural Information Processing (ICONIP-2016), pages 13--22, Kyoto, Japan, 2016.
5. Weisheng Qian, Quan Liu, Zongzhang Zhang, Zhiyuan Pan, and Shan Zhong, Policy Graph Pruning and Optimization in Monte Carlo Value Iteration for Continuous-State POMDPs, Proceedings of the 2016 IEEE Symposium on Adaptive Dynamic Programming and Reinforcement Learning (IEEE ADPRL-2016), Athens, Greece, 2016.

2015
1. Zongzhang Zhang, David Hsu, Wee Sun Lee, Zhan Wei Lim, and Aijun Bai, PLEASE: Palm Leaf Search for POMDPs with Large Observation Spaces, Proceedings of the 25th International Conference on Automated Planning and Scheduling (ICAPS-2015), pages 249--257, Jerusalem, Israel, 2015.
Note: This work also appeared in Proceedings of the 8th Annual Symposium on Combinatiorial Search (SoCS-2015), Ein Gedi, Israel, as a two-page extended abstract.

2. Yicheng Zhou, Quan Liu, Qiming Fu, and Zongzhang Zhang, Trajectory Sampling Value Iteration: Improved Dyna Search for MDPs, Proceedings of the 14th International Conference on Autonomous Agents and Multiagent Systems (AAMAS-2015), pages 1685--1686, Istanbul, Turkey, 2015.

3. Shuhua You, Quan Liu, Zongzhang Zhang, Hui Wang, and Xiaofang Zhang, Intelligent Model Learning Based on Variance for Bayesian Reinforcement Learning, Proceedings of the 27th International IEEE Conference on Tools with Artificial Intelligence (ICTAI-2015), pages 170--177, Salerno, Italy, 2015.
4. 钟珊, 刘全, 傅启明, 章宗长, 朱斐, 龚声蓉. 一种近似模型表示的启发式Dyna优化算法. 计算机研究与发展, 2015, 52(12): 2764--2775.

2014
1.
Zongzhang Zhang, David Hsu, and Wee Sun Lee, Covering Number for Efficient Heuristic-Based POMDP Planning, Proceedings of the 31st International Conference on Machine Learning (ICML-2014), pages 28--36, Beijing, China, 2014. (口头报告视频:http://techtalks.tv/talks/covering-number-for-efficient-heuristic-based-pomdp-planning/60963/
2. Aijun Bai, Feng Wu, Zongzhang Zhang, and Xiaoping Chen, Thompson Sampling based Monte-Carlo Planning in POMDPs, Proceedings of the 24th International Conference on Automated Planning and Scheduling (ICAPS-2014), pages 28--36, Portsmouth, USA, 2014.

2013

1. 章宗长, 陈小平. 杂合启发式在线POMDP规划. 软件学报, 2013, 24(7): 1589--1600.

2012

1. Zongzhang Zhang, Michael L. Littman, and Xiaoping Chen, Covering Number as a Complexity Measure for POMDP Planning and Learning, Proceedings of the 26th Conference on Artificial Intelligence (AAAI-2012), pages 1853--1859, Toronto, Ontario, Canada, 2012.
2. Zongzhang Zhang and Xiaoping Chen, FHHOP: A Factored Hybrid Heuristic Online Planning Algorithm for Large POMDPs, Proceedings of the 28th Conference on Uncertainty in Artificial Intelligence (UAI-2012), pages 934--943, Catalina Island, United States, 2012.
3. 章宗长. 部分可观察马氏决策过程的复杂性理论及规划算法研究. 博士学位论文, 中国科学技术大学, 2012/6/5.

2010

1. Zongzhang Zhang and Xiaoping Chen, Accelerating Point-Based POMDP Algorithms via Greedy Strategies, Proceedings of International Conference on Simulation, Modeling, and Programming for Autonomous Robots (SIMPAR-2010), pages 545--556, Darmstadt, Germany, 2010.

荣誉奖励

2017 苏州大学 瑞翼奖教金
2015 苏州市高等院校、科研院所紧缺高层次人才
2012 中国科学院 朱李月华优秀博士生奖学金
2012
AAAI Student Travel Award
2008
中国科学技术大学 光华奖学金


课程教学

2018.03-2018.06  计算机辅助软件工程(16级:周日08:30-12:30,博远楼409)
2017.02-2017.06  软件工程概论(15级:周三13:30-16:30,博远楼302;周四13:30-14:20,理工楼315(上机)),软件工程实践(15级:周三16:40-17:30,博远楼302;周四14:30-17:30,理工楼315(上机))
2016.09-2017.01  软件工程概论(15级嵌入式软件工程班:周四14:30-17:30,逸夫楼405),计算机辅助软件工程(15级:周二09:00-12:00,文成楼406;周二13:30-16:30,鸿远楼301)
2016.02-2016.06  软件工程概论(15级:周四13:00-15:50,理工楼103)

2015.09-2016.01  计算机辅助软件工程(12级:周三13:00-15:50,博远楼101;14级:周四13:00-15:50,东教楼201)

2015.03-2015.06  软件工程概论(14级周四13:00-16:00,逸夫楼405)
2014.09-2015.01  计算机辅助软件工程(13级:周二9:00-11:50,文成楼306)

招生信息

所需学生要求:掌握基本的概率统计知识,精通一门面向对象的编程语言(如:C++、Python),具备阅读英文文献的能力,痴迷本方向科研,有较强责任心,具有知难而上的品质。