【用Python写爬虫】获取html的方法【一】:使用urllib
个人觉得,Python是一种让编程人员非常自在的语言。脚本性,实时性,开源性..........无不信手拈来。用Python书写爬虫更是如此。
在此处没有语法介绍,没有hello world.....,只有应用,只有代码
# -*- coding: UTF-8 -*-
import urllib
' 获取web页面内容并返回'
def getWebPageContent(url):
f = urllib.urlopen(url)
data = f.read()
f.close()
return data
url = 'http://www.itpub.net'
content = getWebPageContent(url)
print content
[ 本帖最后由 howklp 于 2008-6-13 16:34 编辑 ] |