1.明代艺术家[明]字咸卓,万安(今江西万安)人。弘治四年(一四九一)进士,官至河南布政。古章句步骤柳州(柳宗元),字画类颜(真卿),甚伟。《刘玉执斋集》
2.哈尔滨工业大学教授基本情况
男,1972年2月出生于哈尔滨,哈尔滨工业大学教授、博导
在学校担任的管理职务
· 2000.10至今, 哈工大计算机研究所副所长
· 2001.3至今,哈工大信息检索研究室主任
· 2004.11至今, 语言语音教育部微软重点实验室(哈尔滨工业大学)副主任
· 2009.3至今,哈工大计算机学院院长助理,主抓学科建设
社会兼职
国家863计划重点项目“中文为核心的多语言处理技术”总体组专家
中国中文信息学会
o 理事
o 信息检索专业委员会,副主任
o 计算语言学专业委员会,委员
中国计算机学会
o 高级会员
o 中文信息技术专业委员会,委员
o YOCSEF,学术委员会委员
研究领域
自然语言处理语言分析依存分析词义消歧语义角色标注语言生成复述技术辅助写作机器翻译文本挖掘实体关系抽取共指消解意见挖掘文本检索问答系统垂直搜索个性化搜索
教学经历
1995 - 1998: “人工智能”, 面向哈工大计算机专业研究生
2001 - 2004: “统计自然语言处理”, 面向哈工大计算机专业研究生
2001 - 2009: “信息检索”, 面向哈工大计算机专业研究生
2006 – 2009: 计算机新进展,面向哈工大计算机专业本科生
职业经历
2004.7 至今: 教授, 哈工大计算机学院
2000.10 - 2004.7: 副教授,哈工大计算机学院
2000.5 - 2000.10: 讲师,哈工大计算机学院
1999.4 - 2000.5: 副研究员,微软中国研究院,自然语言计算组
1998.7 - 1999.4: 讲师,哈工大计算机系
1995.6 - 1998.7: 助教,哈工大计算机系
1995.9 - 1998.7: 博士生,哈工大计算机系
1993.9 - 1995.7: 硕士生,哈工大计算机系
1989.9 - 1993.7: 本科生,哈工大计算机系
主持或参与的科研项目
国家项目:
2008.1-2011.12: 下一代信息检索研究,国家自然科学基金重点项目
2008.1-2010.12: 基于实体关系的文本内容挖掘与集成技术平台,国家863计划探索类课题
2009.1 - 2011.12: 中文依存分析, 国家自然科学基金青年基金
2007.1 - 2009.12: 中文语义角色标注, 国家自然科学基金面上项目
2007.1 - 2008.12: 基于XML的分层互动中文处理开放平台,国家863计划探索类课题
2006.1 - 2008.12: 基于等价伪词的中文词义消歧,国家自然科学基金面上项目
2006.1 - 2008.12: 中文短语及简单句复述技术,国家自然科学基金面上项目
2005.1 - 2008.12: 问题理解与答案抽取,国家自然科学基金重点项目“问答式信息检索”的子课题
2003.1 - 2004.12: 开放域问答式信息检索技术研究, 国家自然科学基金面上项目
2003.2 - 2003.7: 中文信息模糊匹配技术,国家863课题
2001.1 - 2002.12: 基于依存分析的中文自动校对,国家863课题“中文处理平台”的子课题
信息产业部项目:
2007.1 - 2007.12: 短信息理解 242项目
2006.1 - 2006.12: 群发信息检测与过滤 242项目
2005.1 - 2005.12: 群发信息处理
2004.11 – 2005.5: 敏感信息聚类分析与特征抽取
2002.10 - 2003.12: 数据去冗余系统
2002.10 - 2003.12: 群发邮件自动发现与分析系统
2001.12 - 2002.12: 因特网主机攻击报警平台
2001.5 - 2002.12: 大规模网页快速去重系统
2000.10 - 2001.5: 网上有害信息人机互助式过滤系统
国际合作项目:
2008-2009: 特定域个性化交互式问答技术
2007 – 2008: 中文依存句法分析
2007: 中文共指消解
2006: 机构信息抽取
2005-2006: 中文词义消歧
2006: 中文依存句法分析
2005: 英文复述技术
2005: 多文档文摘
2003: 双语例句获取与处理
企业合作项目
2008, 语言技术平台授权
2007 - 2008, 中英双语例句检索
2006, 中文文本分类、聚类和文摘
2005 - 2006, 简繁转换等七项中文处理技术
2005, 在线客服系统
注:以上没有注明负责人的项目,负责人均为刘挺本人
科研团队中的助手
秦兵, 2000.5至今, 教授、博士生导师
张宇, 2002.4至今, 副教授、博士
车万翔, 2000.5至今, 讲师、博士
指导的博士生
作为副导师指导的博士生(导师均为李生教授):
卢志茂, 2003.9 – 2006.7 ,词义消歧
李维刚, 2002.9 - 2008.1 ,复述技术
马金山, 2003.3 - 2008.1 ,依存句法分析
车万翔, 2004.3-2008.12,语义角色标注
洪宇, 2004.9入学,话题检测与跟踪
张志昌, 2005.3入学,阅读理解
陈毅恒, 2005.3 入学,文本聚类
贺瑞芳, 2005.9 入学,自动文摘
赵世奇, 2006.3入学,复述技术
郎君, 2006.3入学,共指消解
宋巍, 2008.9入学,个性化信息检索
郭宇航, 2008.9入学,词义消歧
作为导师指导的博士生:
赵妍妍, 2007.9入学,意见挖掘
伍大勇, 2007.9入学,问答系统
和为, 2008.3入学,复述技术
李正华, 2008.9入学,依存分析
戈马(埃塞俄比亚),2008.9入学,个性化信息检索
薛涵,2009.3入学,文本挖掘
学术活动
程序委员会主席, 第一届全国信息检索与内容安全学术会议, 2004年11月, 上海
程序委员会主席, 第三届全国信息检索与内容安全学术会议,2007年1月,苏州
亚洲信息检索会议AIRS’2006分会场主席,2006年11月,Singapore
第二届自然语言处理青年学者研讨会YSSNLP主席,Chair,2005年6月,哈尔滨
第2届和第4届全国信息检索与内容安全学术会议,程序委员会委员
第6-9届全国计算语言学会议,程序委员会委员
自然语言处理国际联合学术会议IJCNLP’2005, 2005年5月,韩国,
程序委员会委员组织委员会主席,亚洲信检索会议AIRS’2008,2008年1月,哈尔滨
国际青年计算机会议ICYCS’2008, 长沙,程序委员会委员
WWW’2008, 北京,2008年4月,WWW inChina专题会议的程序委员会委员
SIGIR’2009,美国波士顿,程序委员会委员
编委
1. 中文信息学报
审稿人
1. Natural LanguageEngineering
2. 计算机学报
3. 自动化学报
4. 电子学报
5. 软件学报
发表论文
博士论文
基于篇章多级依存结构的自动文摘研究
导师:洪家荣、王开铸,哈工大计算机系, 1998.7
英文论文
2008年
1.Wanxiang Che, MinZhang, Ai Ti Aw, Chew Lim Tan, Ting Liu, and ShengLi.Using a Hybrid Convolution Tree Kernel for Semantic Role Labeling.ACMTransactions on Asian Language Information Processing. To appear.(EI Indexed)
2. Min Zhang, WanxiangChe, Guodong Zhou, Ai Ti Aw, ChewLim Tan, Ting Liu,and ShengLi. Semantic Role Labeling Using aGrammar-Driven Convolution Tree Kernel. IEEETransactions on Audio,Speech, and Language Processing. 2008, 16(7):1315-1329(SCI ImpactFactor: 0.8)
3. Wei Zheng, YuZhang, Yu Hong, Jili Fan, TingLiu,“Topic Tracking Based on KeywordsDependency Profile” AIRSpp129-140,2008.01
4. Wanxiang Che, Min Zhang, Ai Ti Aw, Chew LimTan,Ting Liu, Sheng Li ,“Fast ComputingGrammar-driven Convolution TreeKernel for Semantic Role Labeling” IJCNLP’08
5. Shiqi Zhao,HaifengWang,Ting Liu, Sheng Li “Pivot Approach forExtracting ParaphrasePatterns from Bilingual Corpora” Proceedings ofACL pp780–788,2008
6.Shiqi Zhao, Cheng Niu,Ming Zhou, Ting Liu, Sheng Li “CombiningMultipleResources to Improve SMT-based Paraphrasing Model” Proceedings ofACLpp1021-1029,2008
7. Xiaofeng Yang, Jian Su,Jun Lang, ChewLim Tan,Ting Liu, ShengLi “An Entity-Mention Model for CoreferenceResolutionwith Inductive Logic Programming” Proceedings of ACL pp843-851,2008
2007年
8.Shiqi Zhao, Lin Zhao, Yu Zhang, Ting Liu, Sheng Li “HIT Web basedScoring Method for English LexicalSubstitution “ Proceedings ofSemEvalpp:173-176 2007.06
9. Min Zhang,WanxiangChe,Aiti Aw and ChewLim Tan,TingLiu,Sheng Li “A Grammar-driven Convolution TreeKernel forSemantic Role Classification “ Proceedings of the 45th AnnualMeeting ofthe Association of Computational Linguistics pages200-207,Prague, CzechTepublic,June 2007.
10. Yuhang Guo, Wanxiang Che, YuxuanHu, WeiZhang and Ting Liu “HIT-IR-WSD: A WSD Systemfor English Lexical SampleTask “International Workshop on Semantic EvaluationsAssociation forComputational Linguistics, Prague, Czech Republic 2007,pp. 165--168.
11.Liu Ting, Ma Jinshan, Zhang Huipeng and Li Sheng “SUBDIVIDING VERBS TOIMPROVE SYNTACTIC PARSING“Journal of Electronics (China),2007.03,24(3): 347-352
12. Shiqi Zhao, Ming Zhou, Ting Liu “LearningQuestionParaphrases for QA from Encarta Logs “ Proceedings of IJCAIpp:1795-1800,2007.01
13. Shiqi Zhao, Ting Liu, XinchengYuan, ShengLi, and Yu Zhang “Automatic Acquisitionof Context-Specific LexicalParaphrases “ Proceedings of IJCAIpp:1789-1794 2007.01
14. Jun Lang,Bing Qin, Ting Liu, Sheng Li “Intra-document CoreferenceResolution: Thestate of the art “ Journal of Chinese Language andComputing pp227-253,Vol.17(4) 2007
2006年
15. Liqi Gao, YuZhang,Ting Liu, Guiping Liu “Word Sense Language Model forInformationRetrieval “ In Proceedings of AIRS(Asia Information RetrievalSymposium2006.10,pages 158-171
16. Shiqi Zhao, Ting Liu, XinchengYuan, ShengLi, Yu Zhang “Web Mining forLexical Context-Specific Paraphrasing “ InProceedings of AIRS(Asia InformationRetrieval Symposium) 2006.10,pages673-679
17. Ting Liu, JinshanMa, Sheng Li “Building a DependencyTreebankfor Improving Chinese Parser “ Journal of Chinese Language andComputing.2006.10,16(4):207-224
18. Zhimao Lu, HaifengWang, JianminYao, Ting Liu, ShengLi “An Equivalent Pseudoword Solution toChineseWord Sense Disambiguation” In Proceedings of the 44th AnnualMeeting ofthe Association for Computational Linguistics (ACL-2006.03),pages457-464
19. Wanxiang Che, Min Zhang,Ting Liu, Sheng Li “A HybridConvolution TreeKernel for Semantic Role Labeling” In Proceedings ofthe 44th AnnualMeeting of the Association for Computational Linguisticspp73-80,(ACL-2006.03)
20. Ting Liu, JinshanMa, Huijia Zhu, ShengLi“Dependency Parsing Based on Dynamic Local Optimization” InProceedingsof CoNLL pp211-2152,2006.02
2005年
21.Weigang Li, Ting Liu, Yu Zhang, Sheng Li and Wei He “AutomatedGeneralization ofPhrasal Paraphrases from the Web “ The 3rdInternational Workshop onParaphrasing (IWP2005.10), pp49-57
22.Wanxiang Che, Jianmin Jiang, Zhong Su, Yue Pan and Ting Liu“Improved-Edit-Distance Kernelfor Chinese Relation Extraction “ TheSecond International JointConference on Natural Language Processing(IJCNLP-05), 2005.10, Jeju Korea , pp134-139
23. Zhuoran Wang,TingLiu “ChineseUnknown Word Identification Based on Local Bigram Model “InternationalJournal of Computer Processing of Oriental Languages .2005,.09,18(3): 185-196
24. Huipeng Zhang, Ting Liu, JinshanMa andXiantao Liao “Chinese Word Segmentationwith Multiple Postprocessors inHIT-IR Lab “ SIGHAN 2005.08, pp172-175
25. Ting Liu, WanxiangChe,Sheng Li, Yuxuan Hu, and Huaijun Liu “Semantic role labeling systemusingmaximum entropy classifier “ In Proceedings of CoNLL 2005.06,AnnArbor, Michigan, pp189-192
26. Lu Zhimao, LiuTing, Li Sheng“UnsupervisedChinese Word Sense Disambiguation Based on EquivalentPseudowords“ International Conference on Chinese Computing 2005.3
2004年
27.Weigang Li,Ting Liu,Sheng Li “ CombiningSentence Length with LocationInformation to Align Monolingual Parallel Texts“ Asia InformationRetrieval Symposium 2004, pages 71-77 (LectureNotes in ComputerScience, Volume 3411/2005, Pages118-128)
28. Zhuoran Wang,Ting Liu“hineseUnknown Word Identification Based on Local Bi-gram Model withIntegrallySmoothing Assumption“International Conference onChineseLanguage Computing pp524-528,2004.9
29. Zhimao Lu,Ting Liu,Sheng Li“Combining Neural Networks and Statisticsfor Chinese Word SenseDisambiguation” Third SIGHAN Workshop on ChineseLanguage Processingpp49-56,2004.7
30. Weigang Li,Ting Liu,Zheng Wang,Sheng Li “AligningBilingual Corpora Using Sentences LocationInformation” Third SIGHANWorkshop on Chinese Language Processing pp141-147,2004.7
31.Wanxiang Che,Ting Liu,Sheng Li “A New Chinese NaturalLanguageUnderstanding Architecture Based on Multilayer SearchMechanism” ThirdSIGHAN Workshop on Chinese Language Processingpp134-140,2004.07
32. Jinshan Ma,Yu Zhang,Ting Liu,Sheng Li “AStatistical Dependency Parser of Chineseunder Small Training Data” The1st International Joint Conference ofNatural Language Processing pp1-42004,3
中文论文
2008年
33. 洪宇、郑伟 、张宇、邹博伟、刘挺,“基于子话题分治匹配的新事件检测” 计算机学报 Vol. 31, No. 4, pp. 687-695, 2008
2007年
34. 洪宇、张宇、刘挺、李生 ,“话题检测与跟踪的评测及研究综述” 中文信息学报 Vol. 21, No. 6, pp. 71-87, 2007
35. 洪宇,张宇,刘挺,郑伟,龚诚,李生 “基于层次聚类的自适应信息过滤学习算法”中文信息学报 Vol. 21, No. 3, pp. 47-53, 2007
36. 郎君, 秦兵, 刘挺, 李正华, 李生 “中文人称名词短语单复数自动识别” 自动化学报 2007年9月17日
37. 李维刚、刘挺、李生 “基于双语语料库的短语复述实例获取研究“ 中文信息学报 pp:362-367 ,2007.08 第5期
38. 刘 挺,车万翔,李生“基于最大熵分类器的语义角色标注“软件学报 Vol.18,No.3,3. 2007,pp.565-573
39. 李维刚、刘 挺、李 生 “基于网络挖掘的实体关系元组自动获取” 电子学报 pp2111-2116,2007,35(11)
40. 黄永光,刘挺,车万翔,胡晓光 “面向变异短文本的快速聚类算法” 中文信息学报 2007.21卷,02期, pp:63-68
2006年
41. 刘挺,马金山,李生 “基于词汇支配度的汉语依存分析模型“软件学报 2006.06,17(9):1876-1883
42. 秦兵, 刘挺, 陈尚林,李生 “多文档文摘中句子优化选择方法研究“ 计算机研究与发展 第43卷,第6期,pp1129-1134,2006年6月
43. 卢志茂,刘挺,李生 “基于无指导机器学习的全文词义自动标注方法“ 自动化学报 2006,3, pages 228-236
44. 刘挺,李维刚,张宇,李生 “复述技术研究综述” 中文信息学报 2006.03,40(4),pp25-33
45. 文勖,张宇,刘挺,马金山 “基于句法结构分析的中文问题分类” 中文信息学报 2006.03,20(2),pp33-39
46. 卢志茂,刘挺,李生 “统计词义消歧的研究进展” 电子学报 2006, 2, pages 333-343
2005年
47. 赵世奇, 张宇, 刘挺, 陈毅恒, 黄永光, 李生 “基于类别特征域的文本分类特征选择方法“ 中文信息学报 2005.12, 19(6): 21-27
48. 秦兵, 刘挺, 李生 “多文档自动文摘综述“ 中文信息学报 2005.11, 19(6): 13-20
49. 陈儒, 张宇, 刘挺 “面向中文特定信息变异的过滤技术研究“ 高技术通讯 2005.09, 15(9): 7-12
50. 张宇, 刘挺, 文勖 “基于改进贝叶斯模型的问题分类“ 中文信息学报 2005.02, 19(2):100-105
51. 张宇, 刘挺, 陈毅恒, 赵世奇, 李生 “自然语言文本水印技术“ 中文信息学报 2005.02, 19(6): 13-20
52. 车万翔, 刘挺, 李生 “实体关系自动抽取“ 中文信息学报 2005.02, 19(2):1-6
2004年
53. 卢志茂,刘挺,郎君,李生 “神经网络和贝叶斯网络在汉语词义消歧上的应用对比” 高技术通讯 2004,8,Page:723-728
54. 车万翔,刘挺,秦兵,李生 “基于改进编辑距离的中文相似句子检索” 高技术通讯 2004.07,pp15-20
55. 马金山,张宇,刘挺,李生 “利用三元模型及依存分析查找中文文本错误” 情报学报 2004.06Page:723-728
56. 秦兵,刘挺,李生 “基于局部主题判定与抽取的多文档文摘技术” 自动化学报 2004,5,pp905-910
57. 赵永贞,刘挺,王志伟,陈惠鹏,邵艳秋 “汉语文语转换系统中停顿指数的自动标注” 中文信息学报2004.05,pp48-53
专利
1.Computer-Aided WritingSystem and Method with Cross-language WritingWizard, (1st inventor ), USPatent# 7107204, Sept. 12, 2006
技术评测
国际技术评测
1. CoNLL’2009, 多国语语义角色标注与依存分析国际评测,第1名,20家单位参加
2. CoNLL’2008, 语义角色标注与依存分析国际评测,第2名(在国内参赛单位第1),20家单位参加
3. 美国NIST机器翻译评测, 2008, 英汉翻译第5名(国内第1),9家单位参加
4. CoNLL‘2006, 语义角色标注,第6名,19家单位参加
5. SIGHAN’2005, 中文分词,北大测试集,第3名
国家863组织的技术评测
6. 2003,自动文摘评测第1名
7. 2004,信息检索评测第2名
8. 2005,信息检索评测第1名