Limited Human Annotation 领域有哪些经典工作?
2023-08-13 阅读 38
在Limited Human Annotation(有限人工标注)领域,有一些经典的工作,如下所示:
1. Active Learning(主动学习):主动学习是一种通过选择最具信息量的样本来减少标注成本的方法。经典的工作包括基于不确定度的样本选择方法(如不确定度采样和不确定度抽样),以及基于模型置信度的方法(如置信度边界采样和置信度边界抽样)。
2. Transfer Learning(迁移学习):迁移学习是一种利用已标注数据进行模型训练,然后将模型迁移到新任务上的方法。在有限人工标注的情况下,迁移学习可以通过利用已标注数据进行预训练,然后在目标任务上进行微调来减少标注成本。
3. Active Querying(主动查询):主动查询是一种通过向标注者提出最有意义的问题来减少标注成本的方法。经典的工作包括基于不确定度的问题选择方法(如最大化不确定度和最小化不确定度),以及基于模型置信度的方法(如最大化置信度和最小化置信度)。
4. Crowdsourcing(众包):众包是一种利用大量非专业标注者进行标注的方法。在有限人工标注的情况下,众包可以通过将任务分解为多个简单子任务,然后将其分配给众包工人来减少标注成本。
这些经典工作提供了一些有效的方法和技术,可以在有限的人工标注资源下进行高效的数据标注。
更新于 2023年08月13日