Analizar HTML en Android

Estoy intentando analizar el HTML para los datos específicos pero estoy teniendo problemas con los caracteres de la vuelta, por lo menos pienso que ése es cuál es el problema. Estoy utilizando un método de subcadena simple para desmontar el HTML como sé de antemano lo que estoy buscando.

Aquí está mi método de análisis:

public static void parse(String response, String[] hashItem, String[][] startEnd) throws Exception { for (i = 0; i < hashItem.length; i++) { part = response.substring(response.indexOf(startEnd[i][0]) + startEnd[i][0].length()); value = part.substring(0, part.indexOf(startEnd[i][1])); DATABASE.setHash(hashItem[i], value); } } 

Aquí hay una muestra del código HTML que me está dando problemas

 <table cellspacing=0 cellpadding=2 class=smallfont> <tr onclick="lu();" onmouseover="style.cursor='hand'"> <td class=bodybox nowrap>&nbsp; 21,773,177,147 $&nbsp;</td><td></td> <td class=bodybox nowrap>&nbsp; 629,991,926 F&nbsp;</td><td></td> <td class=bodybox nowrap>&nbsp; 24,537 P&nbsp;</td><td></td> <td class=bodybox nowrap>&nbsp; 0 T&nbsp;</td> <td></td><td class=bodybox nowrap>&nbsp;RT&nbsp;</td> 

Hay caracteres de retorno ocultos, pero cuando intento agregarlos en la cadena que estoy tratando de usar no funciona bien, si es que lo hago. ¿Hay un método o quizás una mejor manera de quitar los caracteres ocultos del HTML para que sea más fácil de analizar? Cualquier ayuda es muy apreciada como siempre.

Trate de usar un regex para obtener la información que desea: http://java.sun.com/developer/technicalArticles/releases/1.4regex/

Usted podría incluso utilizarlo para quitar los caracteres ocultados. O tal vez utilizar String.Replace para eliminar los caracteres de nueva línea?

Si quieres hacer el análisis muy fácil, prueba Jsoup :

Este ejemplo descargará la página, analizará y obtendrá el texto.

 Document doc = Jsoup.connect("http://jsoup.org").get(); Elements tds = doc.select("td.bodybox"); for (Element td : tds) { String tdText = td.text(); } 

Puedes probar con XMLPullParser disponible en Android. Puede utilizar StringBuffer para añadir caracteres entre las etiquetas.

Puede analizar el archivo HTML utilizando un XMLReader por ejemplo hasta donde yo sé, consulte este artículo http://www.ibm.com/developerworks/xml/library/x-andbene1/

  • ¿Cómo puedo hacer que mi código sea seguro? - Privado vs. Pública
  • Cómo alinear a la derecha PreferencesActivity en android?
  • ¿Son las aplicaciones IOS y Android con Webview sólo consideradas híbridas o aplicaciones Web?
  • Equivalente de Ruby #map o #collect en Java?
  • Error en la ejecución de la tarea: app: compileDebugJavaWithJavac
  • ¿Cómo detectar el número de dedos utilizados?
  • ¿Cómo configurar el nombre del hilo?
  • Botón de Android con Drawable - relleno
  • ¿Cómo puedo leer las pausas en el texto descargado?
  • Android SimpleDateFormat devolver el tiempo incorrecto entre la medianoche y 1 am
  • Elemento aleatorio de la matriz de cadenas
  • FlipAndroid es un fan de Google para Android, Todo sobre Android Phones, Android Wear, Android Dev y Aplicaciones para Android Aplicaciones.