PyQuery 中循环获取一段内容

最近在捣腾爬虫，比较习惯用 PyQuery 这个模块来解析 HTML 提取内容。简单看了一下文档，发现国内有些文档的写法是错的，自己试验了一下。

首先，循环一段内容比如循环我博客的文章标题，按照别人的文章来操作了一下发现是错误的。代码如下

import requests from pyquery import PyQuery as pq from lxml import etree try: response = requests.get("http://www.d0cs.org/", timeout=5).text doc = pq(etree.fromstring(response)) print type(doc('div#post-title>h1>a').text()) except Exception, e: print e

打印结果得到 <type 'str'> 类型，说明提取标题的时候实则是 str 类型，并不是 list 类型或者 PyQuery 对象，如果循环输出的话得不到我要的结果。大部分在一些 CSDN 博客之类的文章基本是这样。

而正确的写法是这样的

import requests from pyquery import PyQuery as pq from lxml import etree try: response = requests.get("http://www.d0cs.org/", timeout=5).text doc = pq(etree.fromstring(response)) for title in doc('div#post-title>h1>a').items(): print title.text() + '\n' except Exception, e: print e

这是查阅了官方 API 文档后操作的，不懂英文，还是要去看官方文档，起码有个翻译在。少走很多弯路的！

关于 PyQuery.items() 的文档

PyQuery 中循环获取一段内容

Trending Articles

[XK SPIRITS][假面骑士ZEZTZ / KAMEN RIDER...

[分享]標註x、y、z座標LISP

中國擬禁全隱藏式車門手把撞車後僅 67% 可成功打開

关门一家亲：习远平、张澜澜、徐才厚

「肉包包激战乾爹」5min音檔也外流！女哭求：不要做了

TPS62095上电时大负载下电压输出异常

陈树庆：“颠覆国家政权案”最后陈述

帳務小管家 MyMoneyZero 13.8 免安裝中文版 - 中文記帳軟體

60多年前北斗中學教1年美教授惦記了大半生

西屯國小BabyBoss 一日店長挑戰成功

東林電動割草機獲台灣精品獎

六家佃長壽橋封到明年2月

晋察冀史研究——谈谈肖克挺进军与相邻一分区之间的关系分析

【冰域】【泄底】神的逻辑，人的魔法——一切为**服务 (评论: 神的逻辑，人的魔法)

Fabia 方向盤轉動異音

uniapp开发的鸿蒙应用，拨打电话功能，加上权限配置后Hbuilder运行提示没有签名授权

专业数学公式编辑制作【MathType 7.8.2.441 多语坡姐+便携】..

转让复刻各类藏碟

项目实战-仿bilibili刷新按钮的实现

为亲人维权遭报复　河北刘森被北京门头沟警察劫持