接昨天的
采集内容页,要考虑两点,一个是是否需要登录才能浏览,还有一個是有些网站有限制流量的,超过了就看不了
所以需要存着网站的cookie和当前采集的次数
|
|
初始化采集次数和cookie后,内容页就简单了,
|
|
这样子就ok了,再写两个线程,一个用来采集站点,一个用来下载页面信息
|
|
程序运行之后,因为配置文件或其他问题,主界面会出現挂掉的问题,
这个时候就需要在程序运行前,检查下一些配置文件等,
|
|
学会生活
接昨天的
采集内容页,要考虑两点,一个是是否需要登录才能浏览,还有一個是有些网站有限制流量的,超过了就看不了
所以需要存着网站的cookie和当前采集的次数
|
|
初始化采集次数和cookie后,内容页就简单了,
|
|
这样子就ok了,再写两个线程,一个用来采集站点,一个用来下载页面信息
|
|
程序运行之后,因为配置文件或其他问题,主界面会出現挂掉的问题,
这个时候就需要在程序运行前,检查下一些配置文件等,
|
|