博客
关于我
爬虫之 xpath的节点关系
阅读量:331 次
发布时间:2019-03-04

本文共 424 字,大约阅读时间需要 1 分钟。

Xpath的节点关系

学习Xpath语法需要先了解Xpath中的节点关系。每个HTML或XML标签都称为节点,其中最顶层的节点被称为根节点。无论是HTML还是XML,这一规则都适用。

1.1 Xpath中的节点是什么

在HTML和XML中,每个标签都可以被视为一个节点。最外层的标签称为根节点。例如,在一个HTML文件中,<html>标签就是根节点。

理解节点关系是理解Xpath语法的关键。通过了解节点之间的关系,我们可以更好地定位和提取页面中的数据。

1.2 Xpath中节点的关系

在Xpath中,节点之间存在多种关系,包括父子关系、兄弟关系、同级关系等。这些关系对于定位特定节点至关重要。

例如,在一个HTML页面中,<title>标签和<author>标签之间存在兄弟关系。具体来说,<title>是第一个兄弟节点,而<author>则是第二个兄弟节点。

理解这些关系可以帮助我们更高效地编写Xpath表达式,从而准确地提取页面中的数据。

转载地址:http://mvhh.baihongyu.com/

你可能感兴趣的文章
Opentelemetry Metrics SDK
查看>>
流量控制--2.传统的流量控制元素
查看>>
SNMP介绍及使用,超有用,建议收藏!
查看>>
SDUT2161:Simple Game(NIM博弈+巴什博弈)
查看>>
51nod 1596 搬货物(二进制处理)
查看>>
来自星星的祝福(容斥+排列组合)
查看>>
Hmz 的女装(递推)
查看>>
HDU5589:Tree(莫队+01字典树)
查看>>
Codeforces Round #459 (Div. 2):D. MADMAX(记忆化搜索+博弈论)
查看>>
不停机替换线上代码? 你没听错,Arthas它能做到
查看>>
sharding-jdbc 分库分表的 4种分片策略,还蛮简单的
查看>>
分库分表的 9种分布式主键ID 生成方案,挺全乎的
查看>>
MySQL不会丢失数据的秘密,就藏在它的 7种日志里
查看>>
Python网络编程之socket应用
查看>>
Python开发之序列化与反序列化:pickle、json模块使用详解
查看>>
回顾-生成 vs 判别模型-和图
查看>>
Python 的 type 及常用魔法方法(上)
查看>>
采坑 - 字符串的 "" 与 pd.isnull()
查看>>
无序列表 - 链表
查看>>
SQL 查询强化 - 数据准备
查看>>