Python Language
Análisis de HTML
Localiza un texto después de un elemento en BeautifulSoup.
Imagina que tienes el siguiente HTML:
John Smith
Y necesitas ubicar el texto "John Smith" después del elemento de label
En este caso, puede ubicar el elemento de label
por texto y luego usar la propiedad .next_sibling
from bs4 import BeautifulSoup
data = """
John Smith
soup = BeautifulSoup(data, "html.parser")
label = soup.find("label", text="Name:")
Imprime John Smith
Usando selectores de CSS en BeautifulSoup
BeautifulSoup tiene un soporte limitado para los selectores de CSS , pero cubre los más utilizados. Use el método select()
para encontrar múltiples elementos y select_one()
para encontrar un solo elemento.
Ejemplo básico:
from bs4 import BeautifulSoup
data = """
<li class="item">item1</li>
<li class="item">item2</li>
<li class="item">item3</li>
soup = BeautifulSoup(data, "html.parser")
for item in"li.item"):
Huellas dactilares:
pyquery es una biblioteca tipo jquery para python. Tiene muy buen soporte para selectores css.
from pyquery import PyQuery
html = """
<table id="table">
doc = PyQuery(html)
title = doc('h1').text()
print title
table_data = []
rows = doc('#table > tr')
for row in rows:
name = PyQuery(row).find('td').eq(0).text()
value = PyQuery(row).find('td').eq(1).text()
print "%s\t %s" % (name, value)
Modified text is an extract of the original Stack Overflow Documentation
Licenciado bajo CC BY-SA 3.0
No afiliado a Stack Overflow