是否有更快的方法将html字符解码为字符串而不是Html.fromHtml()?

我正在使用Html.fromHtml(STRING).toString()将可能有或没有html和/或html实体的字符串转换为纯文本字符串。

这很慢,我想我最后的计算是平均花费了大约22毫秒。 对于大批这些,它可以添加超过一分钟。 所以我正在寻找一个更快,性能更高的选项。

无论如何要加快速度还是有其他解码选择?

编辑:由于似乎没有更快或专为性能而构建的内置方法,我将奖励任何可以指向我的方向库的人:

  • 适用于Android
  • 许可免费使用
  • Html.fromHtml(String).toString();更快Html.fromHtml(String).toString();

作为一个注释,我已经用这个方法尝试了Jsoup: Jsoup.parse(String).text() ,它的速度较慢。

Solutions Collecting From Web of "是否有更快的方法将html字符解码为字符串而不是Html.fromHtml()?"

那么org.apache.commons.lang.StringEscapeUtils的unescapeHtml() 。 该库可在Apache站点上获得。

fromHtml()没有高性能的HTML解析器,我不知道SpannedString上的toString()实现有多快。 我怀疑是否是为你的场景设计的。

理想情况下,琴弦在进入低功率手机之前是干净的。 在构建过程中清理它们(对于资源/资产),或者在服务器上清理它们(在下载之前)。

如果出于某种原因,您绝对需要在设备上清理它们,您可以使用NDK创建一个C / C ++库,以便更快地为您进行清理。

这是一个非常快速和简单的选择: Unbescape

它极大地提高了我们的解析性能,这需要每个字符串都通过解码器运行。

您是否从Text JavaScript中查看了Strip HTML

对于大批这些,它可以添加超过一分钟

任何解析都需要一些时间。 22ms对我来说似乎很快。 无论如何,你能在后台做吗? 可以帮助你某种缓存吗?

虽然我还没有尝试过,但我发现了一些可能的解决方案:

  1. HTML Java Parsers
  2. HTML解析
  3. 更多HTML解析

我希望它有所帮助。