让全国的文科大学生参与校对数字化古籍,按纠错字数给学分,有没有可能在一年内完成所有古籍的数字化?

2024-11-19 阅读 9
更新于 2024年11月22日
诶,那你算是问对人咯,古籍数字化校对这事我还真干过,带队带着一帮211的历史系大一大二的大学生干的,馆藏的民国老报纸,已经是经过正字的繁体字印刷体了哟。简而言之,不要对大学生,即便是学历史的大学生的水平抱多大期待。
两个星期里,我被问的最多的问题是:“民国XX年是公元哪一年”,问了不下几百回。被问的第二多的问题是“这是个啥字?”
即便是我们学文物学的,当年也有不少人用了快两年时间才能基本无障碍读繁体文言文。换其他的文科专业,换成读手抄本或者老刻本,说不准还能撂倒多少人。
哦对了,这玩意儿的数字化及校对费用是20-300元一页,视难度而定哟,扫描的机器30-500万一台。请问,这个钱谁来出?
(其实也确实是国家在出这个钱,不过拨款有限,所以每年的推进进度很大程度上受此影响)
不要太瞧得起大学生的水平,大学生的平均水平绝对不如AI。
我曾经拜读过一篇硕论,是还不错的某个大学的古代文学专业学生写的,此人居然连礼记月令和孔颖达都不知道。
而且主要问题是现在太多古籍连影像都没有,我现在整理的一个书,要是给我影像,我直接OCR很快就能搞出来,结果现在得跑到古籍馆一个字一个字的敲。