如何解决在带有错别字的句子中从数组中查找一个或多个字符串
我正在尝试在句子中查找街道名称,
问题是该句子可能有错别字(互联网上的人写了错字)
所以我考虑使用difflib.get_close_matches
但是我只能比较单词,而不能拆分这句话中的单词,因为其中有2个甚至3个单词的街道
我给你举个例子:
句子:
我有一间带2门,2扇窗户和1个屋顶的公寓, 该公寓位于曼哈顿(应该是曼哈顿)
我住在超大的公寓里,里面有很多房间 在美洲大道(应该是“美洲大道”),我们在附近有一个Macdonalds,我们很喜欢!
我拥有阵列中的所有城市街道名称(大约3000个)
['Manhattan','Bowery','Broadway','Avenue of the Americas'] But about 3000 of them
在该句子中找到“曼哈顿”的最快,最准确的方法是什么?
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。