Multilabel Text Classification for Policy
-
硬件:Nvidia RTX 4090 24G
-
任务类型:多标签文本分类
-
预训练模型:Ernie3 Base
-
训练方法:基于预训练模型进行微调,先基于AdamW优化器使模型快速达到较优的效果,再使用SGD优化器精调
-
优化策略:针对数据类别不平衡情况,采样训练集时刻意尽量提高类别较少样本的比例。
-
评价方法:多标签微平均
-
结果:通过测试,投入生产使用。
硬件:Nvidia RTX 4090 24G
任务类型:多标签文本分类
预训练模型:Ernie3 Base
训练方法:基于预训练模型进行微调,先基于AdamW优化器使模型快速达到较优的效果,再使用SGD优化器精调
优化策略:针对数据类别不平衡情况,采样训练集时刻意尽量提高类别较少样本的比例。
评价方法:多标签微平均
结果:通过测试,投入生产使用。