TagSoup vs Jsoup vs HTML Parser vs HotSax vs

La abundancia de analizadores HTML para elegir (y seguir con) es alucinante:

Http://java-source.net/open-source/html-parsers

¿Cómo puedo elegir uno que mejor se adapte a los siguientes requisitos:

  1. Maduro (menos bichos que el resto)
  2. Vivir y respirar (es decir, mantenerse)
  3. Rápido y eficiente en recursos (destinado a ejecutarse en Android)

De acuerdo con su experiencia, ¿qué analizador de HTML recomendaría (para cumplir con los requisitos anteriores) y por qué?

Bueno, encontré la respuesta, que fue dada por @BalusC en un hilo diferente :

  1. Si sólo desea utilizar una herramienta basada en XML para recorrerlo: JTidy .
  2. Si te gusta probar la unidad HTML: HtmlUnit
  3. Si desea extraer datos específicos del HTML: Jsoup

Gracias @BalusC.

  • Unity Android Error de compilación WIN32 Excepción ZipAlign
  • Cómo actualizar fragmento anterior después de cerrar una actividad que se inició dentro de un adaptador?
  • Android Audio - Transmisión de generador de seno-tono comportamiento extraño
  • Faltan credenciales de autenticación de Twitter4j
  • ¿Cómo activar / desactivar los gps y los datos móviles en android mediante programación?
  • GlCreateShader y glCreateProgram fallan en android
  • Obtener el PID de un proceso para matarlo, sin saber su nombre completo
  • Diferencia entre Android and Looper
  • Robotium - personalizar la duración PAUSE en la clase Sleeper
  • OkHttpClient roto después de actualizado Retrofit to Retrofit 2
  • Robolectric: IllegalStateException: Necesita utilizar un tema Theme.AppCompat (o descendente) con esta actividad
  • FlipAndroid es un fan de Google para Android, Todo sobre Android Phones, Android Wear, Android Dev y Aplicaciones para Android Aplicaciones.