有没有更快的方法来解码HTML字符比stringHtml.fromHtml()?

我正在使用Html.fromHtml(STRING).toString()来转换一个string,可能或可能不具有HTML和/或html实体,在一个纯文本string。

这很慢,我想我最后的计算是平均花了22ms。 大量的这些可以增加一分钟以上。 所以我正在寻找一个更快,性能build成的选项。

无论如何加快这一点,还是有其他解码选项可用?

编辑:由于似乎没有一个内置的方法是更快或专为性能打造,我会奖励任何人可以指向我的方向图书馆:

  • 适用于Android
  • 授权免费使用
  • Html.fromHtml(String).toString();更快Html.fromHtml(String).toString();

作为一个说明,我已经试过Jsoup这个方法: Jsoup.parse(String).text() ,它是慢的。

Related of "有没有更快的方法来解码HTML字符比stringHtml.fromHtml()?"

那么org.apache.commons.lang.StringEscapeUtils的unescapeHtml() 。 这个库可以在Apache网站上find。

fromHtml()没有高性能的HTMLparsing器,我不知道SpannedStringtoString()实现有多快。 我怀疑是否为你的情况而devise。

理想情况下,琴弦在达到低功率手机之前是干净的。 要么在构build过程中清理它们(对于资源/资产),要么在服务器上清理它们(在下载它们之前)。

如果出于任何原因,您绝对需要在设备上进行清理,您可以使用NDK创build一个C / C ++库,为您更快地进行清理。

这是一个令人难以置信的快速和简单的select: Unbescape

它极大地提高了我们的parsing性能,这要求每个string都要通过一个解码器来运行。

你有没有看过来自Text JavaScript的Strip HTML?

大量的这些可以增加一分钟以上

任何parsing都需要一些时间。 22ms对我来说似乎很快。 无论如何,你能在背景中做到吗? 可以帮助你某种caching?

虽然我还没有尝试过,但我发现了一些可能的解决scheme:

  1. HTML Javaparsing器
  2. HTMLparsing
  3. 更多的HTMLparsing

我希望它有帮助。