如何解决有没有办法让Tensorflow忽略训练数据语句的某些部分
我正在用Python构建AI,其行为类似于Google Home或Alexa,但是我遇到了一个问题:我将训练模型,通过提供伪造的命令日志来检测用户命令。这是一个示例:
输入:玩德雷克计划
输出:spotify_play_song(query =“神龙计划”)
这里的问题是命令日志中包含这样的数据和实际的输入数据,这让我担心,因为我认为像用户想要在数据中播放的歌曲之类的输入数据可能会与实际的训练数据混淆,所以有我可以训练它忽略输入数据的方式,例如说,如果它预测标签为spotify_play_song(),则训练阶段可能像这样:
输入:玩德雷克计划
预测的输出:spotify_play_song(query =“ play drake”)
输出:spotify_play_song(query =“神龙计划”)
或另一种选择是仅仅训练它来预测命令以及输入的位置,以便代码可以将其剪切掉,这是一个示例:
输入:玩德雷克计划
预测的输出:spotify_play_song(query =“ play drake”)
预计裁员:%play drake%Gods plan
输出:spotify_play_song(query =“神龙计划”)
cut:播放%drake gods plan%
这是我的两个想法,对于Tensorflow来说是一个新事物,我了解这些概念以及时代和培训的工作原理,但是对于创建和组织数据集则是一个新事物,如果有更好的方法,请告诉我。
感谢您的阅读:)
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。