七叶笔记 » java编程 » 如何使用java去除html标签

如何使用java去除html标签

在java中,可以使用replaceAll方法去除html标签,语法格式为“replaceAll(匹配此字符串的正则表达式,"")”。“replaceAll()”方法使用给定的参数替换字符串所有匹配给定的正则表达式的子字符串。

本教程操作环境:windows7系统、java10版、Dell G3电脑。

public static String stripHtml(String content) { // <p>段落替换为换行 content = content.replaceAll("<p .*?>", "\r\n"); // <br><br/>替换为换行 content = content.replaceAll("<br\\s*/?>", "\r\n"); // 去掉其它的<>之间的东西 content = content.replaceAll("\\<.*?>", ""); // 还原HTML // content = HTMLDecoder.decode(content); return content; }

扩展资料:

replaceAll() 方法使用给定的参数 replacement 替换字符串所有匹配给定的正则表达式的子字符串。

语法

public String replaceAll(String regex, String replacement)

参数

  • regex — 匹配此字符串的正则表达式。

  • replacement — 用来替换每个匹配项的字符串。

返回值

成功则返回替换的字符串,失败则返回原始字符串。

相关免费学习推荐:java基础教程

相关文章