觅风论坛

标题: pyhon通用框架,爬虫,正则,文本读写Python源码 [打印本页]

作者: AllisonBor    时间: 2020-6-19 12:14
标题: pyhon通用框架,爬虫,正则,文本读写Python源码
pyhon通用框架,爬虫,正则,文本读写Python源码

re.正则单个查找框架import re                              #导入re模块
def zz_cz_dg(cz_nr):                  #正则查找视频地址
    re_gz='</a></li><li><a href="/Html/(.*?).html"'      #查找规则
    re_jx_nr=re.search(re_gz,cz_nr)         #正则查找方法
    return re_jx_nr.group(1)            #返回查找内容


re.正则批量查找框架
import re
def zz_cz_lb(cz_nr):                  #正则查找视频地址
    re_gz='</a></li><li><a href="/Html/(.*?).html"'      #查找规则
    re_jx_nr=re.findall(re_gz,cz_nr)            #正则查找方法返回列表
    return re_jx_nr                #返回查找内容,列表方式


requests.get访问框架
import requests
def html_get(wy_dz):                  #网页访问
    r=requests.get(wy_dz)                    #get方法访问网页,获取源码
    r.encoding=r.apparent_encoding           #utf-8编码
    wy_nr=r.text                            #赋值变量保存
    return wy_nr                               #返回保存网页内容


下载图片框架
import requests
def picture(url,name):
html=requests.get(url)    #访问图片地址
    address="D:\\图片\\"+str(name)+".jpg"      #本地图片下载路径
    with open(address,"wb") as f:             #保存图片
        f.write(html.content)
print(address,'下载完成')


读取文件框架
def Read_the_file(Text_address):
with open(Text_address) as f:      
#Full_text=f.read()                 #读取全部文本为文本格式
        Full_text_list =f.readlines()       #读取全部文本为列表格式
        f.close()
return Full_text_list


写入文件框架
def Written_to_the_file(Text_address,Write_content):
with open(Text_address,"a") as f:
f.write(Write_content+"\n")         #尾行写入文件
        f.close()

自己用的爬虫框架,觉的用的还行,分享下。







欢迎光临 觅风论坛 (https://www.eyyba.com/) Powered by Discuz! X3.4