二进制数据为:图片、视频
将图片保存为以下这种形式的步骤:
以下以爬取豆瓣新书快递为例子
第一步:导包requests,python怎么保存代码交作业,re,os。没有requests的需要pip install requests,re和os为内置模块,不需要安装。
第一步:导包requests,re,os。没有requests的需要pip install requests,re和os为内置模块,不需要安装。
1、python保存代码按Ctrl+S快捷键即可,也可以点击左上角文件-保存。2、Python是一种跨平台的计算机程序设计语言。是一种面向对象的动态类型语言,最初被设计用于编写自动化脚本(shell),随着版本的不断更新和语言新功能的添。
第二步:发送请求
第三步:利用正则获取目标数据,这里用到re模块
第四步:保存数据,这里要用到os模块,用来判断文件夹是否存在,不存在则创建该文件夹
1、打开Notepad++ 2、需要新建文本时,点击左上角”文本“,在弹出的菜单栏点击”新建“。3、同时也可以直接点击”文本“下的新建图标即可.4、保存是时候,保存为.py文件,这里保存为hello.py 。
注意:
保存图片数据,因为图片为二进制数据,所以要用wb
保存数据需要写在for循环里,这样才能实现每爬取一张图片就保存一张
for img_url,name in result:39;图片链接:&对图片链接发送请求,获取图片二进制数据39;./豆瓣书籍/&获取的图片数据保存到这个路径下面if not os.path.exists(path): 39;./豆瓣书籍/&39;{}.jpg&39;wb&将每一张图片命名为这张图片的名字f.write(imgs) #将每次获取的图片数据都写入豆瓣书籍的文件夹下,一定要在for循环下,否则就只能保存第一张图片
")。按ctrl+c保存为test.py文件。在test.py文件界面,按F5会在python3.7shell窗口显示执行结果。如已关闭test.py文件,依次点击file--open也可打开test.py文件。将py文件上一级文件夹权限改为完全控制,点击应用选中py。
第五步:打开文件夹里的图片,找到explorer即可打开创建的文件夹