如何解决按模式分割文字
我正在尝试编写一个接受字符串并吐出重复模式数量的函数:
string1="abcabc"
string 2="abcdabcdabcd"
solution(string1)=2
solution(string2)=3
我的代码如下。它适用于大多数情况,但是我仍然无法通过隐藏的测试用例(十分之一)
def solution(s):
final_score=[]
for x in range(1,50,1):
pattern=s[0:x]
repeats=[(s[i:i+x]) for i in range(x,len(s),x)]
#print(pattern,repeats)
if all(pattern in x for x in repeats):
#print(len(repeats))
final_score.append(len(repeats)+1)
else:
continue
#print(final_score)
return(max(final_score))
任何建议将不胜感激,谢谢!
编辑:对于“ abababab”,或有多个可用模式(“ ab”和“ abab”)的情况,我正在尝试返回最高频率(在这种情况下,“ ab”重复4次,因此该函数应返回4)
解决方法
实际上可以通过正则表达式执行此操作-至少假设该字符串仅包含一个重复模式的 。
import re
def solution(string):
match = re.match(r'(.+?)\1+',string) # matches an arbitrary-length pattern,# followed by at least one repetition
if match:
pattern = match.group(1) # extract which pattern was repeated
return len(string) // len(pattern) # number of repetitions
else:
return 1 # or whatever your case is for if there
# are no repeated patterns
将正则表达式写为非贪婪的,因此它将使用找到的最小模式。虽然,如果模式重复一次,但随后的动作不是完全重复,这将无法正常工作。如果出现问题,请尝试re.fullmatch()
。
让Python努力工作:
>>> for s in 'abcabc','abcdabcdabcd','abababab','aaazaaa':
print(s,len(s) // (s+s).find(s,1))
abcabc 2
abcdabcdabcd 3
abababab 4
aaazaaa 1
基于this。
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。