How to remove extra returns and spaces in a string by regex?(如何通过正则表达式删除字符串中的额外返回和空格?)
问题描述
我将HTML代码转换为纯文本.但是有很多额外的返回和空格.如何删除它们?
I convert a HTML code to plain text.But there are many extra returns and spaces.How to remove them?
推荐答案
我假设你想要
- 找到两个或多个连续的空格并将它们替换为一个空格,然后
- 找到两个或多个连续的换行符并将它们替换为一个换行符.
如果是正确的,那么你可以使用
If that's correct, then you could use
resultString = Regex.Replace(subjectString, @"( |
?
)1+", "$1");
这会保持空白的原始类型"不变,并正确保留 Windows 行尾.如果您还想将多个选项卡压缩"为一个,请使用
This keeps the original "type" of whitespace intact and also preserves Windows line endings correctly. If you also want to "condense" multiple tabs into one, use
resultString = Regex.Replace(subjectString, @"( | |
?
)1+", "$1");
要将一串换行符和空格(任意数量)压缩成一个换行符,请使用
To condense a string of newlines and spaces (any number of each) into a single newline, use
resultString = Regex.Replace(subjectString, @"(?:(?:
?
)+ +){2,}", @"
");
这篇关于如何通过正则表达式删除字符串中的额外返回和空格?的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持编程学习网!
本文标题为:如何通过正则表达式删除字符串中的额外返回和空格?
- 良好实践:如何重用 .csproj 和 .sln 文件来为 CI 创建 2022-01-01
- C# 中多线程网络服务器的模式 2022-01-01
- 输入按键事件处理程序 2022-01-01
- Web Api 中的 Swagger .netcore 3.1,使用 swagger UI 设置日期时间格式 2022-01-01
- 在哪里可以找到使用中的C#/XML文档注释的好例子? 2022-01-01
- MoreLinq maxBy vs LINQ max + where 2022-01-01
- C#MongoDB使用Builders查找派生对象 2022-09-04
- WebMatrix WebSecurity PasswordSalt 2022-01-01
- 带有服务/守护程序应用程序的 Microsoft Graph CSharp SDK 和 OneDrive for Business - 配额方面返回 null 2022-01-01
- 如何用自己压缩一个 IEnumerable 2022-01-01