李正华

发布时间:2026-01-07浏览次数:5380

招生说明:HLT网站版本(需白天或vpn访问); github版本

NLP基础编程练习:HLT网站版本(需白天或vpn访问);github版本


我不招录国际研究生(I have no plan to supervise international students pursuing Master/PhD degrees)


请同学们邮件联系我之前,先读招生说明,并在邮件中明确“愿意接受6 天考察(每天 2 小时以上)”如果没有一定程度的科研追求(把技术搞清楚、专注做科研创新),那么不适合跟我读研究生。如果有较强的科研追求,研二可以考虑转博。

如果想要了解我,可以读:1)微信公众号“语析LAGroup”中的一些文章;2)我在研究所主页上写的一些思考(组内同学还可以看内部主页的相关思考)。

邮箱联系方式:zhli13 at suda dot edu dot cn

如果想通过我的学生了解相关情况,可以看一下我们组发表的论文,论文中有邮箱信息。

有时我一天内会收到很多申请读研究生的邮件,如果我24 小时内没有回复邮件,抓紧联系其他老师。

考察期间,如果同学担心最终没有被录取而错过其他老师,建议同时联系其他老师。


我希望在我的带领下,语析LAGroup这条小船可以在知识的海洋中不断前进,在努力做出高质量工作的同时,不断学习、消化、慎思新的知识(joy of understanding),不断追求真理。同时,我希望LAGroup的氛围是宽松的、自由的、尊重个性的、可持续发展的,而不是压榨式的、短视的。因为我相信只有这样,才能做出真正有价值的东西,且不会完全被世俗、潮流所左右。


作为导师,我觉得成就感主要来自两方面:1)和能力强的学生合作出有趣的、好的工作;2)帮助能力弱的学生取得个人成长。长期看,后者的意义可能更大,除非前者能不可替代地为人类知识添砖加瓦。


语析LAGroup“文化”:尊重 (respect)、成长 (growth)、简单 (simplicity)、开放 (openness)创造、交流、传播知识的平台;师生不断取得个人成长的象牙塔。尊重是基础、成长是目标、简单是风格、开放是格局。】


求真、务实、独立、自由 【2024年12月之前的“组训”,有点沉重】



在读学生 (含研究课题)


2020级博士(1):

    刘亚慧(山东农大考研18硕、直博;语义分析)

2021级博士(1):

    周厚全(矿大保研19硕、直博、阿里实习;文本纠错)

2022级博士(2):

    侯    洋(苏大保研20硕、直博;句法分析)

    周仕林(苏大20硕、直博、上海AI Lab实习;语音文本融合处理)

2025级博士(1):

    周月驰(苏大保研23硕、直博)

2026级博士:

    欢迎有志于科研、有扎实基础的同学 发邮件联系。As Early As Possible. 求贤若渴;Yet 精挑细选,希望和我品性相匹配

2027级博士:

    同上

-----

2023级硕士(4):

    陈杰琳(国际关系学院、博世苏州实习;PM2.5预测)

    乔子恒(苏大保研、美团上海实习;文本纠错)

    王学彬(西南交通保研、小米武汉实习;语音文本融合处理)

    张紫岩(苏大、和龚晨老师共同指导、美团上海实习;句法分析)

2024级硕士(1):

    周昊喆(长安大学)

2025级硕士(2):

    吕    喆(天津科技保研)

    梅睿桐(昆明理工)

2026级硕士:

    请尽早联系。保研同学在拿到保研资格之前就可以联系。考研初试结束后,预估可以考上,就可以联系我。



毕业学生 (含学位论文题目)


2018级博士(2):

    龚    晨(苏大保研16硕、直博、苏大任教;汉语多粒度词语结构分析及其应用研究)[2022.6]

    夏庆荣(苏大保研16硕、直博、华为;句法感知的语义角色标注方法研究)[2022.6]

2017级博士(1):

    李    英(昆明理工考博、昆明理工任教;依存句法分析领域移植研究)[2022.6]

-----

2022级硕士(4):【共30名硕士毕业】

    辜仰淦(广东工业保研、港科大广州实习、外校读博;基于图的句法语义联合分析研究)

    蒋浩辰(苏大、微软苏州实习、百度;大模型知识增强的汉语文本纠错方法研究与系统实现)

    刘雨萌(江南大学保研、航天创新院实习、转正;融入多源知识的文本纠错研究

    马    溪(太原理工、小米实习、美团;基于片段建模的多粒度分词和命名实体识别研究)

2021级硕士(6):

    崔秀莲(苏大保研;基于实例的词性数据标注错误检测研究)

    窦晨晖(苏大、和龚晨老师共同指导、公务员;基于一体化建模的汉语词语层次化结构分析及应用技术

    黄赛豪(苏大保研、百度实习、得物;中文text-to-SQL数据集构建及解析方法研究)

    严福康(苏大、小米;基于词典释义的汉语词义消歧研究)

    张    磊(文正、美团实习、科大讯飞;面向汉语分词的语音文本信息融合技术研究

    章    岳(苏大保研、阿里+腾讯实习、字节;中⽂⽂本纠错数据构建及建模⽅法研究)

2020级硕士(4+2):

    李嘉诚(燕山大学、字节实习、中国移动研究院西安;融入混淆集知识的中文语法纠错研究)

    李帅克(苏大保研、百度实习、创业;利用多源数据的零样本跨领域依存句法分析

    李    扬(苏大、华为实习、中国移动研究院苏州;基于条件随机场自编码器的无监督与低资源词性标注)

    刘泽洋(华北电力、百度实习、公务员;面向汉语数据库问答的数据标注平台和语义解析模型构建)

    侯    洋(苏大保研、直博)

    周仕林(苏大、直博)

2019级硕士(2+1):

    杨浩苹(苏大保研、唯品会实习、思必驰;句法驱动的跨领域汉语语义角色标注研究)

    周明月(苏大保研;多领域依存句法树库构建及模型训练方法研究)

    周厚全(矿大保研、直博)

2018级硕士(4+1):

    蒋    炜(苏大、华为实习、转正;句法驱动的基于UCCA表示的句子语义分析

    陆凯华(苏大、华为实习、上海银行;汉语词语上下位关系分类及挖掘研究)

    吴    锟(浙江理工、百度实习、转正、协助周夏冰老师指导;面向汉语知识库问答的语义解析方法研究)

    张    宇(苏大、阿里实习、读博 [导师:付国宏老师];基于树形条件随机场的高阶句法分析[江苏省优秀硕士论文]

    刘亚慧(山东农大、直博)

2017级硕士(3):

    黄德朋(苏科技、华为杭州实习、小红书;基于神经耦合序列标注的异构数据转化和融合

    彭    雪(山东农大、华为杭州实习、移动苏州;半监督汉语依存句法分析领域移植研究)

    章    波(苏大、阿里巴巴杭州达摩院实习、转正;面向依存句法的树库转化与应用研究[江苏省优秀硕士论文]

2016级硕士(3+2):

    郭丽娟(江西财经保研、科沃斯实习、狗尾草公司工作;汉语依存句法分析树库构建与应用研究)

    孙佳伟(北航、搜狗北京实习、微软苏州工作;汉语词语上下位关系分类研究)

    朱    运(山西大学、搜狗北京工作;融合多源特征和数据的汉语分词领域移植研究)

    龚    晨(苏大保研、直博)

    夏庆荣(苏大保研、直博)

2015级硕士(3):

    陈    伟(南阳理工、爱奇艺北京实习、转正、协助陈文亮老师指导;知识图谱的获取相关技术研究与开发)

    凡子威(滁州学院、科大讯飞北京实习、搜狗北京工作;数据驱动的浅层篇章结构分析研究)

    张    月(苏大保研、阿里巴巴杭州实习、转正;基于局部标注的依存句法分析研究)

2014级硕士(1)[2017春毕业]:

    巢佳媛(苏大、微软北京实习、阿里巴巴杭州工作;面向序列标注问题的异构数据融合