# -*- coding: utf-8 -*-
import re
import urllib
import urllib2
import cookielib
#获取CSDN博客标题和正文
url = "http://blog.csdn.net/[username]/archive/2010/07/05/5712850.aspx"
sock = urllib.urlopen(url)
html = sock.read()
sock.close()
content = re.findall('(?<=blogstory">).*(?=
上一篇: 用python爬虫抓站的一些技巧总结
下一篇: Python 登录网站
相关文章:
- python程序内存占用分析-meliae
- 介绍几个比较出名的编程acm题库
- 位运算交换变量 不用临时变量(C位运算)
- Javascript 另类写法
- 用python爬虫抓站的一些技巧总结
- Python 模拟登录及表单提交
Categories: 博客记录
0 Responses so far.