Beautiful Soup 是一个 Python 库,用于从 HTML 和 XML 文件中提取数据。可以将其与首选解析器集成,以利用各种 Pythonic 习语来导航、搜索和修改解析树。该工具可以自动将传入文档转换为 Unicode,将传出文档自动转换为 UTF-8,并用于屏幕抓取等项目。这是一个很棒的工具,可以节省工作时间。
9.LXML
LXML 是一个基于 Python 的工具,专为 C 库(libxml2 和 libxslt)而设计。它功能丰富,是在 Python 中处理 XML 和 HTML 的最易于使用的库之一。它通过使用 ElementTree API 促进对 libxml2 和 libxslt 库的安全和方便的访问。独特之处在于它将这些库的速度和 XML 特性与原生 Python API 的简单性相结合。此外,还扩展了 ElementTree API 以提供对 XPath、RelaxNG、XML Schema、XSLT 和 C14N 的支持。
相关资源