百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 技术资源 > 正文

Python爬虫:静态网址的爬取(爬虫静态页面)

off999 2024-09-20 22:50 25 浏览 0 评论

本文的文字及图片来源于网络,仅供学习、交流使用,不具有任何商业用途,,版权归原作者所有,如有问题请及时联系我们以作处理

作者:il_持之以恒_li 来源:CSDN

本文链接:https://blog.csdn.net/qq_45404396/article/details/111689288

私信小编01即可获取大量Python学习资料

1. 判断网址是静态网址还是动态网址

判断网址是否为静态网址还是动态网址,一般方法是查看网页的源代码或者来到开发者模式下,点击Network,点击All,找到我们想要的那个网址,然后点击Response,如果我们随便搜索一个字段都能在这个网址中找到,那么就应该是静态网址;相反,就是动态网址。如下:我要爬取这个网址下的相应的内容,


我们来到这个界面,点击搜索(Ctrl+F):家常红烧鱼


发现这个网址下有这个字段,说明这是一个静态网址。

2. 需要的Python模块

完成这个项目需要的Python模块有:requests、bs4、urllib.parse、os
其中,第一个模块用于爬取网址上的信息,第二个模块用于解析我们爬取得到的信息,urllib.parse主要是用来进行编码,os模块用于创建文件夹,将菜谱上面的制作方法存储到一个文件中。

3. 具体实现过程

输入自己想了解的菜的名称:用变量keyword接收
得到网址为:url=“https://www.haodou.com/search/recipe/%s”%parse.quote(keyword)
然后再从搜索得到的菜谱中选择一个自己想了解的菜,当然这需要得到这个菜的链接


最后来到这个菜的制作方法的网址

4.实现代码与运行结果

实现代码为:

from urllib import parse
from bs4 import BeautifulSoup
import requests
import os


class HaoDou():
    def __init__(self,keyword):
        self.keyword=keyword
        self.headers={"User-Agent":"Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/70.0.3538.25 Safari/537.36 Core/1.70.3756.400 QQBrowser/10.5.4039.400"}
        # 模拟浏览器
        self.url="https://www.haodou.com/search/recipe/%s"%parse.quote(keyword)

    def getResponse(self):
        response=requests.get(url=self.url,headers=self.headers)
        text=response.text
        html=BeautifulSoup(text,"lxml")
        list=html.select("div.search-result>div.el-row>div>a")
        hrefList=[]
        for i in range(len(list)):
            print("*"*30)
            print("$:【{}】->{}".format(i+1,list[i]['title']))
            hrefList.append(list[i]['href'])   # 将网址添加到列表中
            list2=list[i].select("div.img-cover.slide-mask>div>span") # 得到食材
            infoStr=""
            for html2 in list2:
                infoStr+=html2.text
            print("食材:"+infoStr)

        id=int(input("请输入你想看的序号:"))
        response2=requests.get(url='https://www.haodou.com'+hrefList[id-1],headers=self.headers)

        return response2

    def getInfo(self):
        text=self.getResponse().text
        html=BeautifulSoup(text,'lxml')
        list=html.select('div.practice>div.ingredient>div.paixu>div>a')
        mainStr=""  # 主料
        for i in range(len(list)):
            mainStr+=list[i].text+" "
        list2=html.select('div.practice>div.accessories>div.paixu>div')
        aStr=""  # 辅料
        for i in range(len(list2)):
            aStr+=list2[i].text+" "
        mStr=""
        list3=html.select('div.practice>div.practices>div.pai>div')
        for i in range(len(list3)):
            mStr+=list3[i].text+"\n"
        print("主料:"+mainStr)
        print("辅料:"+aStr)
        print(mStr)  # 制作过程

        # 将上述三个字符串写入到文件中
        path = "./制作方法"
        try:
            os.mkdir(path)
        except Exception as e:
            print(e)
        with open(file="{}/{}.txt".format(path,self.keyword),mode="a",encoding='utf-8')as f:
            f.write(mainStr+"\n")
            f.write(aStr+"\n")
            f.write(mStr)
        print("已写入到文件中,读者到时候记得去看啊!")

if __name__ == '__main__':
   	a=HaoDou(input("请输入你想了解的菜:"))
    a.getInfo()

运行结果:



运行完成之后,可以发现多了一个制作方法的文件夹,菜的制作方法就在这个文件夹下面的一个文件里面,如:


相关推荐

第九章:Python文件操作与输入输出

9.1文件的基本操作9.1.1打开文件理论知识:在Python中,使用open()函数来打开文件。open()函数接受两个主要参数:文件名和打开模式。打开模式决定了文件如何被使用,常见的模式有:&...

Python的文件处理

一、文件处理的流程1.打开文件,得到文件句柄并赋值给一个变量2.通过句柄对文件进行操作3.关闭文件示例:d=open('abc')data1=d.read()pri...

Python处理文本的25个经典操作

Python处理文本的优势主要体现在其简洁性、功能强大和灵活性。具体来说,Python提供了丰富的库和工具,使得对文件的读写、处理变得轻而易举。简洁的文件操作接口Python通过内置的open()函数...

Python学不会来打我(84)python复制文件操作总结

上一篇文章我们分享了python读写文件的操作,主要用到了open()、read()、write()等方法。这一次是在文件读写的基础之上,我们分享文件的复制。#python##python自学##...

python 文件操作

1.检查目录/文件使用exists()方法来检查是否存在特定路径。如果存在,返回True;如果不存在,则返回False。此功能在os和pathlib模块中均可用,各自的用法如下。#os模块中e...

《文件操作(读写文件)》

一、文件操作基础1.open()函数核心语法file=open("filename.txt",mode="r",encoding="utf-8"...

栋察宇宙(二十一):Python 文件操作全解析

分享乐趣,传播快乐,增长见识,留下美好。亲爱的您,这里是LearingYard学苑!今天小编为大家带来“Python文件操作全解析”欢迎您的访问!Sharethefun,spreadthe...

值得学习练手的70个Python项目(附代码),太实用了

Python丰富的开发生态是它的一大优势,各种第三方库、框架和代码,都是前人造好的“轮子”,能够完成很多操作,让你的开发事半功倍。下面就给大家介绍70个通过Python构建的项目,以此来学习Pytho...

python图形化编程:猜数字的游戏

importrandomnum=random.randint(1,500)running=Truetimes=0##总的次数fromtkinterimport*##导入所有tki...

一文讲清Python Flask的Web编程知识

刚入坑Python做Web开发的新手,还在被配置臃肿、启动繁琐折磨?Flask这轻量级框架最近又火出圈,凭5行代码启动Web服务的极致简洁,让90后程序员小张直呼真香——毕竟他刚用这招把部署时间从半小...

用python 编写一个hello,world

第一种:交互式运行一个hello,world程序:这是写python的第一步,也是学习各类语言的第一步,就是用这种语言写一个hello,world程序.第一步,打开命令行窗口,输入python,第二步...

python编程:如何使用python代码绘制出哪些常见的机器学习图像?

专栏推荐绘图的变量单变量查看单变量最方便的无疑是displot()函数,默认绘制一个直方图,并你核密度估计(KDE)sns.set(color_codes=True)np.random.seed(su...

如何编写快速且更惯用的 Python 代码

Python因其可读性而受到称赞。这使它成为一种很好的第一语言,也是脚本和原型设计的流行选择。在这篇文章中,我们将研究一些可以使您的Python代码更具可读性和惯用性的技术。我不仅仅是pyt...

Python函数式编程的详细分析(代码示例)

本篇文章给大家带来的内容是关于Python函数式编程的详细分析(代码示例),有一定的参考价值,有需要的朋友可以参考一下,希望对你有所帮助。FunctionalProgramming,函数式编程。Py...

编程小白学做题:Python 的经典编程题及详解,附代码和注释(七)

适合Python3+的6道编程练习题(附详解)1.检查字符串是否以指定子串开头题目描述:判断字符串是否以给定子串开头(如"helloworld"以"hello&...

取消回复欢迎 发表评论: