所属分类:
多国语言处理
开发工具:Java
文件大小:78KB
下载次数:8
上传日期:2012-12-24 07:01:58
说明: 中文分词和词性分析通用的训练集,含POS。
(Chinese word segmentation and part of speech analysis of generic training set.)
文件列表:
CTB训练集
.........\ctb7_mz_pos_golden.utf8,89663,2012-08-08
.........\ctb7_mz_seg_golden.utf8,62845,2012-08-08
.........\ctb7_nw_pos_golden.utf8,114827,2012-08-08
.........\ctb7_nw_seg_golden.utf8,80680,2012-08-08