easy-spider-tool
简介
在实际工作中,沉淀的一些简易、好用的爬虫工具,减少重复代码与文件冗余,希望一样能为使用者带来益处。如果您也想贡献好的代码片段,请将代码以及描述,通过邮箱( xinkonghan@gmail.com
)发送给我。代码格式是遵循自我主观,如存在不足敬请指出!
链接
在线文档:
https://blog.hanxinkong.top/wiki/python-tool-library/easy-spider-tool
PyPi地址:
https://pypi.org/project/easy-spider-tool
GitHub地址:
https://github.com/hanxinkong/easy-spider-tool
安装
1 | pip install easy_spider_tool |
主要功能
时间相关before_day昨天日期(可用于时间递减)after_day明天日期(可用于时间递增)between_day两个日期之间current_date当前时间timestamp当前时间戳(支持精确到毫秒)date_parse任意格式时间解析(支持时区转换,指定保留日期/时间(可设置默认值)部分)
json相关format_json漂亮美观的格式化输出jsonpath任意多个json路径解析(支持设置默认值,选取首个匹配值)
hash摘要相关md5字符经md5编码
正则匹配相关regex_match条件匹配(支持多个不相关条件匹配,支持设置默认值,选取首个匹配值)for_to_regx_match多个不相关条件匹配(兼容老版本保留)
数据清洗/转换相关cookie_to_diccookie转换为字典(Dict)格式clear_value清除列表(List)或字典(Dict)中的指定值(递归清除所有嵌套字典和列表中的指定值)
合法性验证相关verify_ip_addressIP地址合法性验证verify_domain_name域名合法性验证verify_port端口合法性验证verify_urlURL合法性验证
通知相关- 暂无
简单使用
1 | from easy_spider_tool import format_json, jsonpath |
注明
贡献者
许可证
该项目根据 MIT 许可条款获得许可.
免责声明
- 若使用者滥用本项目,本人 无需承担 任何法律责任.
- 本程序仅供娱乐,源码全部开源,禁止滥用 和二次 贩卖盈利. 禁止用于商业用途.