如何解决使用Powershell和正则表达式操作String
我有一个html文件,其中包含以下内容:
<li>
<a href="../index.html" name="" title="title1">title1</a>
</li>
<li>
<a href="level1/level1.html" name="" title="title2">title2</a>
</li>
<li>
<a href="levl1/level2/level2.html" name="" title="title3">title3</a>
</li>
我希望他们看起来像这样:
<li>
<a href="../" name="" title="title1">title1</a>
</li>
<li>
<a href="level1/" name="" title="title2">title2</a>
</li>
<li>
<a href="level1/level2/" name="" title="title3">title3</a>
</li>
我在Powershell中编写了一个脚本来操纵这些如下所示的href链接:
(Get-Content $i) -replace '/*.html','/' | Set-Content $i
但是不知何故输出不会达到预期。知道我在做什么错吗?
解决方法
我会用这样的东西:
(Get-Content in.html) -replace '\/[a-zA-Z0-9_-]+\.html','/' | Set-Content out.html
,
我希望从标记的开头开始寻找更广泛的上下文,因为正则表达式可能会发现其他一些意外的模式
( Get-Content $i ) -ireplace '(<a\s+href="[^"]*/).*?(?=")','$1' | Set-Content $i
希望在第8行中有一个错字,否则您也可以在整个文件中从“ levl1 /”中创建“ level1 /”
( Get-Content $i ) -ireplace '(<a\s+href="[^"]*/).*?(?=")','$1' -ireplace 'levl1/','level1/' | Set-Content $i
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。