此数据集是3755个常用的汉字。第个汉字包含20种不同的样式。
20种同一汉字放在一个文件夹内,文件夹名称以数字命名。
测试集每个汉字包含6种字体。
百分百好用的数据,象征收5积分。
文件有358M不能够一起上传,test放到了百度云上,在说明文件中可以找到下载地址。
如何通过文件夹名称找到相应编码:
1、从chinese_labels读取
p42
sI42
Vu4e4d
其中:
42是train或test对应的文件夹名称
u4e4d是Unicode码,注带有
2、从汉字Unicode互转得到转换的URL地址
把u4e4d复制到转换框中->单击Unicode转中文汉字
代码片段和文件信息
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件举报,一经查实,本站将立刻删除。
评论列表(条)