TagSoup vs Jsoup vs HTML Parser vs HotSax vs

La abundancia de analizadores HTML para elegir (y seguir con) es alucinante:

Http://java-source.net/open-source/html-parsers

¿Cómo puedo elegir uno que mejor se adapte a los siguientes requisitos:

  1. Maduro (menos bichos que el resto)
  2. Vivir y respirar (es decir, mantenerse)
  3. Rápido y eficiente en recursos (destinado a ejecutarse en Android)

De acuerdo con su experiencia, ¿qué analizador de HTML recomendaría (para cumplir con los requisitos anteriores) y por qué?

Bueno, encontré la respuesta, que fue dada por @BalusC en un hilo diferente :

  1. Si sólo desea utilizar una herramienta basada en XML para recorrerlo: JTidy .
  2. Si te gusta probar la unidad HTML: HtmlUnit
  3. Si desea extraer datos específicos del HTML: Jsoup

Gracias @BalusC.

  • Ejemplos de patrones de diseño de Android MVVM
  • GTA2 como Car Physics, pero extremadamente simplificado
  • Android: Cómo enviar una interfaz de una actividad a otra
  • ¿Cómo escalar sprites en libgdx según las resoluciones de pantalla?
  • Cómo ejecutar dos bucles FOR al mismo tiempo
  • Hacer clic en el elemento giratorio dentro de la ventana emergente causa WindowManager $ BadTokenException
  • No se puede crear un usuario con la última versión de Firebase. Consigo un W / DynamiteModule y W / GooglePlayServicesUtil
  • Barra de progreso personalizada en Android?
  • Android: valor predeterminado en editText
  • EXCEPCIÓN INESPERADA DE SUPERIOR NIVEL: com.android.dex.DexException: Múltiples archivos dex definen
  • SDK de Android: Análisis de JSON de la URL mediante GSON
  • FlipAndroid es un fan de Google para Android, Todo sobre Android Phones, Android Wear, Android Dev y Aplicaciones para Android Aplicaciones.