章宗长
职称: 副教授
院部/部门: 计算机科学与技术学院

电子邮箱: zzzhang@suda.edu.cn

联系电话:  

办公地点: 十梓街1号苏州大学本部理工楼645室

个人简介

章宗长,男,1985年4月生,博士,苏州大学特聘副教授,硕士生导师,网易人工智能研究顾问。20076月毕业于中南大学信息与计算科学专业,获理学学士学位;2012年6月毕业于中国科学技术大学计算机应用技术专业,获工学博士学位。2010年10月-201110月在美国罗格斯大学计算机科学系做访问学者,20128-10月在华为诺亚方舟实验室担任研究工程师,201211月-20146月在新加坡国立大学计算学院从事博士后研究20147起在苏州大学工作。目前主要从事部分可观测马氏决策过程POMDPs)、强化学习和多智能体系统理论等方面的研究。曾担任ACM TISTIEEE CIM、MLJ等国际期刊的审稿人,IJCAI、AAAI等国际会议程序委员会委员和2016-2017年亚洲强化学习研讨会(AWRL)的组织委员会委员。正主持国家自然科学基金青年项目、江苏省高校自然科学研究面上项目、苏州大学引进高层次人才科研启动项目各一项,曾参与过美国和新加坡等国家的科研基金项目。近年来,共发表20余篇论文,部分研究成果以第一作者发表在ICMLAAAI、IJCAICCF推荐的A类国际学术会议,UAIICAPS、AAMASCCF推荐的B类国际学术会议和《Frontiers of Computer Science》、《软件学报等重要期刊上。



英文主页:http://www.escience.cn/people/zzzhang

研究方向

人工智能、机器学习

科学研究

部分可观测马氏决策过程、强化学习和多智能体系统理论


科研项目

国家自然科学基金青年项目,基于覆盖数的部分可观察不确定性规划理论及方法,2016.1-2018.12,主持
江苏省高校自然科学研究面上项目,基于覆盖数的合作多智能体规划方法研究,2016.9-2018.8,主持
苏州大学引进高层次人才科研启动项目,强化学习理论及其在软件工程方面的应用,
2014.7-,主持


学术兼职

会员:中国计算机学会、美国计算机学会、国际机器学习协会、苏州市人工智能学会、江苏省人工智能学会机器学习专业委员会(常务委员)
会议程序委员会委员:IJCAI 2018、AAAI 2018、ICIST 2018、IJCAI 2017、ICA 2017、ACML 2017、IJCAI 2013

期刊审稿:ACM Transactions on Intelligent Systems and Technology (ACM TIST)IEEE Computational Intelligence Magazine (IEEE CIM)、Machine Learning、Frontiers of Computer Science、中国科学、计算机学报、软件学报、Journal of Shanghai Jiao Tong University等

会议审稿:AAAIIJCAIAAMAS、ACML、ADPRL、AWRL、ICA、IAS

会议组织:AWRL 2017、ADPRL 2016AWRL 2016



科研团队

作为强化学习课题组的成员,现指导的研究生如下:
2017级硕士:陈子璇、姜冲、王艺深

2016级硕士:潘致远
、林嘉豪
2015级硕士:徐进(和刘全教授合作指导
2014
级硕士:翟建伟、钱炜晟(和刘全教授合作指导
2013级硕士:周谊成、尤树华(和刘全教授合作指导)

注:2018级硕士还有3个招生名额


论文成果

2017

1. Zongzhang Zhang, Zhiyuan Pan and Mykel J. Kochenderfer, Weighted Double Q-learning, Proceedings of the 26th International Joint Conference on Artificial Intelligence (IJCAI-2017), pages 3455--3461, Melbourne, Australia, 2017.
2. Zongzhang Zhang and Mykel J. Kochenderfer, Decision-Theoretic Planning in Partially Observable Environments, Interactions in Multiagent Systems, World Scientific, 2017. (To appear).
3. 章宗长, 部分可观察环境中的序贯决策理论及方法研究, 智能体系统与应用, 清华大学出版社, 2017. (To appear).
4. 刘全, 翟建伟, 章宗长, 钟珊, 周倩, 章鹏, 徐进. 深度强化学习综述. 计算机学报. (已录用,在线版本).
5. 刘全, 翟建伟, 钟珊, 章宗长, 周倩, 章鹏. 一种基于视觉注意力机制的深度循环Q网络模型. 计算机学报, 2017,  40(6): 1353--1366.



2016
1. Zongzhang Zhang and Quan Liu, Covering Number: Analyses for Approximate Continuous-state POMDP Planning, Proceedings of the 15th International Conference on Autonomous Agents and Multiagent Systems (AAMAS-2016), pages 1293--1294, Singapore, Singapore, 2016.
2. Zongzhang Zhang, Qiming Fu, Xiaofang Zhang and Quan Liu, Reasoning and Predicting POMDP Planning Complexity via Covering Numbers, Frontiers of Computer Science, 2016, 10(4): 726--740.
3. 章晓芳, 章宗长, 谢晓园, 周谊成. 一种基于优先级的迭代划分测试方法. 计算机学报, 2016, 39(11): 2307--2323.
4. Jianwei Zhai, Quan Liu, Zongzhang Zhang, et al., Deep Q-learning with Prioritized Sampling, Proceedings of the 23rd International Conference on Neural Information Processing (ICONIP-2016), pages 13--22, Kyoto, Japan, 2016.
5. Weisheng Qian, Quan Liu, Zongzhang Zhang, Zhiyuan Pan and Shan Zhong, Policy Graph Pruning and Optimization in Monte Carlo Value Iteration for Continuous-State POMDPs, Proceedings of the 2016 IEEE Symposium on Adaptive Dynamic Programming and Reinforcement Learning (IEEE ADPRL-2016), Athens, Greece, 2016.
6. Shan Zhong, Quan Liu, Zongzhang Zhang and Qiming Fu, Efficient Reinforcement Learning in Continuous State and Action Spaces with Dyna and Policy Approximation, Frontiers of Computer Science, accepted.


2015
1. Zongzhang Zhang, David Hsu, Wee Sun Lee, Zhan Wei Lim and Aijun Bai, PLEASE: Palm Leaf Search for POMDPs with Large Observation Spaces, Proceedings of the 25th International Conference on Automated Planning and Scheduling (ICAPS-2015), pages 249--257, Jerusalem, Israel, 2015.
This work also appeared in Proceedings of the 8th Annual Symposium on Combinatiorial Search (SoCS-2015), Ein Gedi, Israel, as a two-page extended abstract.

2. Yicheng Zhou, Quan Liu, Qiming Fu and Zongzhang Zhang, Trajectory Sampling Value Iteration: Improved Dyna Search for MDPs, Proceedings of the 14th International Conference on Autonomous Agents and Multiagent Systems (AAMAS-2015), pages 1685--1686, Istanbul, Turkey, 2015.

3. Shuhua You, Quan Liu, Zongzhang Zhang, Hui Wang and Xiaofang Zhang, Intelligent Model Learning Based on Variance for Bayesian Reinforcement Learning, Proceedings of the 27th International IEEE Conference on Tools with Artificial Intelligence (ICTAI-2015), pages 170--177, Salerno, Italy, 2015.
4. 钟珊, 刘全, 傅启明, 章宗长, 朱斐, 龚声蓉. 一种近似模型表示的启发式Dyna优化算法. 计算机研究与发展, 2015, 52(12): 2764--2775.

2014
1.
Zongzhang Zhang, David Hsu and Wee Sun Lee, Covering Number for Efficient Heuristic-Based POMDP Planning, Proceedings of the 31st International Conference on Machine Learning (ICML-2014), pages 28--36, Beijing, China, 2014. (口头报告视频:http://techtalks.tv/talks/covering-number-for-efficient-heuristic-based-pomdp-planning/60963/
2. Aijun Bai, Feng Wu, Zongzhang Zhang and Xiaoping Chen, Thompson Sampling based Monte-Carlo Planning in POMDPs, Proceedings of the 24th International Conference on Automated Planning and Scheduling (ICAPS-2014), pages 28--36, Portsmouth, USA, 2014.

2013

1. 章宗长, 陈小平. 杂合启发式在线POMDP规划. 软件学报, 2013, 24(7): 1589--1600.

2012

1. Zongzhang Zhang, Michael L. Littman and Xiaoping Chen, Covering Number as a Complexity Measure for POMDP Planning and Learning, Proceedings of the 26th Conference on Artificial Intelligence (AAAI-2012), pages 1853--1859, Toronto, Ontario, Canada, 2012.
2. Zongzhang Zhang and Xiaoping Chen, FHHOP: A Factored Hybrid Heuristic Online Planning Algorithm for Large POMDPs, Proceedings of the 28th Conference on Uncertainty in Artificial Intelligence (UAI-2012), pages 934--943, Catalina Island, United States, 2012.
3. 章宗长. 部分可观察马氏决策过程的复杂性理论及规划算法研究. 博士学位论文, 中国科学技术大学, 2012/6/5.

2010

1. Zongzhang Zhang and Xiaoping Chen, Accelerating Point-Based POMDP Algorithms via Greedy Strategies, Proceedings of International Conference on Simulation, Modeling, and Programming for Autonomous Robots (SIMPAR-2010), pages 545--556, Darmstadt, Germany, 2010.

荣誉奖励

2015年  苏州市高等院校、科研院所紧缺高层次人才

2012年 中国科学院 朱李月华优秀博士生奖学金
2012AAAI Student Travel Award

2008年 中国科学技术大学 光华奖学金

课程教学

2017.02-2017.06 软件工程概论(15级:周三13:30-17:30,博远楼302)
2016.09-2017.01
软件工程概论(15级嵌入式软件工程班:周四14:30-17:30,逸夫楼405),计算机辅助软件工程(15级:周二09:00-12:00,文成楼406;周二13:30-16:30,鸿远楼301)
2016.02-2016.06 软件工程概论(15级:周四13:00-15:50,理工楼103)

2015.09-2016.01 计算机辅助软件工程(12级:周三13:00-15:50,博远楼101;14级:周四13:00-15:50,东教楼201)

2015.03-2015.06 软件工程概论(14级周四13:00-16:00,逸夫楼405)
2014.09-2015.01 计算机辅助软件工程(13级:周二9:00-11:50,文成楼306)

招生信息

所需学生要求:掌握基本的概率统计知识,精通一门面向对象的编程语言(如:C++、Python),具备阅读英文文献的能力,痴迷本方向科研,有较强责任心,具有知难而上的品质。