BeautifulSoup(bs4)选择器的使用

[复制链接]
作者: Py资源整理 | 时间: 2020-12-7 11:02:51 | python图文教程|
2 299
发表于 2020-12-7 11:02:51| 显示全部楼层 |阅读模式

Beautiful Soup 是一个可以从HTML或XML文件中提取数据的Python库

本篇文章使用 Python3+版本,Beautiful Soup4.4版本

CSS选择器

Beautiful Soup支持大部分的CSS选择器。 使用方法:

soup.select( CSS选择器 )

示例:

这里我们使用: https://bbs.266.la/ 首页进行测试

获取公告的标题信息

  • 实现方法:使用requests库获取网页源码,然后使用Beautiful Soup进行解析,得到用户名。

分析网页,可以使用带有谷歌调试内核的浏览器,获取到选择器。如图:

复制下来选择器。 然后开始编写Python代码:

#coding:utf-8
import requests
from bs4 import BeautifulSoup

req = requests.session().get("https://bbs.266.la/")
Content = req.content.decode("utf-8") #网站UTF-8解码
Soup = BeautifulSoup(Content,"html.parser") # 使用Python自带【html.parser】解析器
resultSet = Soup.select("#ancl > li > span > a > font")
print (resultSet[0].string)

欢迎朋友们来到Python社区~

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
发表于 2021-1-25 20:55:23| 显示全部楼层
xpath不是更香么
回复

使用道具 举报

发表于 2020-12-20 12:49:01| 显示全部楼层
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

!jz_fbzt! 快速回复 !jz_sctz! !jz_fhlb! 按钮
快速回复 返回列表 返回顶部