Web scraping - Python

Question

How can I extract the entire content within "td"?

<td>
    Hand-painted by trained monkeys, these exquisite dolls are priceless! And by "priceless," we mean "extremely expensive"! 
    <span class="excitingNote">8 entire dolls per set! Octuple the presents!</span>
</td>

I tried this:

desc = data.xpath("//td/text()") 
print desc

But, it returns the first sentence only:

Hand-painted by trained monkeys, these exquisite dolls are priceless! And by "priceless," we mean "extremely expensive"!

I would like to have the output in the following format:

Hand-painted by trained monkeys, these exquisite dolls are priceless! And by "priceless," we mean "extremely expensive"! 8 entire dolls per set! Octuple the presents!

I also tried:

desc = data.xpath("//td//text()") 
    print desc

The output looks like this:

Hand-painted by trained monkeys, these exquisite dolls are priceless! And by "priceless," we mean "extremely expensive"! 
8 entire dolls per set! Octuple the presents!

I prefer the following:

Hand-painted by trained monkeys, these exquisite dolls are priceless! And by "priceless," we mean "extremely expensive"! 8 entire dolls per set! Octuple the presents!

shouldn't it be //td//text()?

smac89
– smac89

2015-12-21 00:32:04 +00:00
Commented Dec 21, 2015 at 0:32 — smac89
– smac89, Commented Dec 21, 2015 at 0:32
please see my revised question.

kevin
– kevin

2015-12-21 00:37:32 +00:00
Commented Dec 21, 2015 at 0:37 — kevin
– kevin, Commented Dec 21, 2015 at 0:37
desc.replace("\n"," ") ?

DJanssens
– DJanssens

2015-12-21 00:38:58 +00:00
Commented Dec 21, 2015 at 0:38 — DJanssens
– DJanssens, Commented Dec 21, 2015 at 0:38

kevin · Accepted Answer · 2015-12-21 00:44:02Z

2

This worked.

desc = data.xpath("//td") 
    print desc.text_content()

answered Dec 21, 2015 at 0:44

kevin

2,0145 gold badges27 silver badges30 bronze badges

Sign up to request clarification or add additional context in comments.

Collectives™ on Stack Overflow

Web scraping - Python

1 Answer 1

Comments

Your Answer

Hot Network Questions

Collectives™ on Stack Overflow

1 Answer 1

Comments

Your Answer

Sign up or log in

Post as a guest

Related