DOTNET下使用正则使内容字段进行分段处理适合不分段的内容文本处理

DOTNET下使用正则使内容字段进行分段处理适合不分段的内容文本处理, 如果您的内容是一个整段,可以使用如下方法处理
使用条件:内容必须放在p标签内,如
<p>一大段内容,。。。</p>
处理正则函数如下:
/// <summary>
/// 正则替换,忽略大小写,忽略空格,多行替换, 支持 $1
/// </summary>
/// <param name="str"></param>
/// <param name="reg">正则表达式中可以含有 $1, 如 "(<p>.*?</p>)", targetstr中就可以获取这个 $1</param>
/// <returns> Common.RegexHelper.RegexReplace2("afafaf", "([A-Z一二三四五六七八九十\\d]+、)", "</p><p>$1")</returns>
public static string RegexReplace2(string sourcestr, string reg, string targetstr)
{
return Regex.Replace(sourcestr, reg, targetstr, RegexOptions.IgnoreCase | RegexOptions.IgnorePatternWhitespace | RegexOptions.Multiline);
}调用:
//内容分段
content = Common.CommonHelper.RegexReplace2(content, @"([A-Z一二三四五六七八九十\d]+\s*[、\.])", "</p><p>$1");
//因为如果内容中已存在分好的段,再分段就会出现多余的空p标签,p标签内无任务内容的情况,所以最后经过如下方法处理掉空p标签。
content = Common.CommonHelper.RegexReplace2(content, @"<p>\s*<\/p>", "");























