如何解决从文本中提取自定义实体
多标签文本信息提取/分类的正确方法是什么
具有描述护理人员/患者就诊的文字:(虚构示例)
***先生于2018年2月2日前往诊所,抱怨 下背部几天,X线平片或 在验血中。我建议***先生休息5天。
现在,该文本的段落大小甚至可以使我关心的仅信息下腰痛和休息日 。我有300-400个不同的标签,但带标签的样本数量可以在1000-1500个左右(总计)。当我标记文本时,我还标记了创建“标签”的相关单词,此处将是['pain','lower','back']。
当我只是在其他文本中使用这些单词(或其他300-400个标签)的查询时,我设法为大量文本加标签,但是如果这些单词以不同的方式书写,例如腰痛或“腰痛”,而我从未将这种模式添加到“腰痛”查询表中。
由于我的段落很长,但我只需要3-4个单词,因此DL / ML模型无法通过这么多的数据和大量的标签来学习。在培训阶段是否可以使用查找表作为功能或尝试其他方法
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。