
Trova un testo dopo un elemento in BeautifulSoup

Immagina di avere il seguente codice HTML:

    John Smith

E devi localizzare il testo "John Smith" dopo l'elemento label .

In questo caso, è possibile individuare l'elemento label base al testo e quindi utilizzare la proprietà .next_sibling :

from bs4 import BeautifulSoup

data = """
    John Smith

soup = BeautifulSoup(data, "html.parser")

label = soup.find("label", text="Name:")

Stampa John Smith .

Utilizzo dei selettori CSS in BeautifulSoup

BeautifulSoup ha un supporto limitato per i selettori CSS , ma copre quelli più comunemente usati. Usa il metodo select() per trovare più elementi e select_one() per trovare un singolo elemento.

Esempio di base:

from bs4 import BeautifulSoup

data = """
    <li class="item">item1</li>
    <li class="item">item2</li>
    <li class="item">item3</li>

soup = BeautifulSoup(data, "html.parser")

for item in soup.select("li.item"):




pyquery è una libreria jquery per Python. Ha un ottimo supporto per i selettori di css.

from pyquery import PyQuery

html = """
<table id="table">

doc = PyQuery(html)

title = doc('h1').text()

print title

table_data = []

rows = doc('#table > tr')
for row in rows:
    name = PyQuery(row).find('td').eq(0).text()
    value = PyQuery(row).find('td').eq(1).text()

    print "%s\t  %s" % (name, value) 

Modified text is an extract of the original Stack Overflow Documentation
Autorizzato sotto CC BY-SA 3.0
Non affiliato con Stack Overflow