11 2020-03 Python python 正则 import re # 程序功能:要将所有<h1>..</h1>中的文本替换掉 key = r"<html><body><h1>hello world</h1><h1>hello wjs</h1>&... 阅读全文 2020年03月11日 13:33:34 周三 2020-03-11 周三 23 0 0
10 2020-03 Python Python 10进制与任意进制之间相互转换(最大为62进制) class tool: baseList = '0123456789ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopqrstuvwxyz' def changeBase(self,n,b): x,y = divmod(n,b) if x... 阅读全文 2020年03月10日 22:02:16 周二 2020-03-10 周二 20 0 0
10 2020-03 Python Scrapy Scrapy 常用函数 import os python os.path.basename()方法 返回path最后的文件名。如果path以/或\结尾,那么就会返回空值。即os.path.split(path)的第二个元素。 import os path = '/Users/beazley/Data/data.csv'... 阅读全文 2020年03月10日 21:59:52 周二 2020-03-10 周二 22 0 0
09 2020-03 Python Scrapy Scrapy注意事项 如果在windows系统下,提示这个错误ModuleNotFoundError: No module named 'win32api',那么使用以下命令可以解决:pip install pypiwin32。 阅读全文 2020年03月09日 12:10:44 周一 2020-03-09 周一 19 0 0
07 2020-03 Python Scrapy Scrapy框架流程图解析 接下来就放一张scrapy的架构图喽~(绿线是数据流向) 简单叙述一下每层图的含义吧: Spiders(爬虫):它负责处理所有Responses,从中分析提取数据,获取Item字段需要的数据,并将需要跟进的URL提交给引擎,... 阅读全文 2020年03月07日 22:28:07 周六 2020-03-07 周六 26 0 1