结构化标记处理工具¶
Python 支持各种模块,以处理各种形式的结构化数据标记。 这包括使用标准通用标记语言(SGML)和超文本标记语言(HTML)的模块,以及使用可扩展标记语言(XML)的几个接口。
- html--- 超文本标记语言支持
- html.parser--- 简单的 HTML 和 XHTML 解析器
- html.entities--- HTML 一般实体的定义
- XML处理模块
- xml.etree.ElementTree--- ElementTree XML API
- xml.dom--- 文档对象模型 API
- xml.dom.minidom--- 最小化的 DOM 实现
- xml.dom.pulldom--- 对构建部分 DOM 树的支持
- xml.sax--- SAX2 解析器支持
- xml.sax.handler--- SAX 处理器的基类- ContentHandler
- DTDHandler
- EntityResolver
- ErrorHandler
- LexicalHandler
- feature_namespaces
- feature_namespace_prefixes
- feature_string_interning
- feature_validation
- feature_external_ges
- feature_external_pes
- all_features
- property_lexical_handler
- property_declaration_handler
- property_dom_node
- property_xml_string
- all_properties
- ContentHandler 对象
- DTDHandler 对象
- EntityResolver 对象
- ErrorHandler 对象
- LexicalHandler 对象
 
- xml.sax.saxutils--- SAX 工具集
- xml.sax.xmlreader--- 用于 XML 解析器的接口
- xml.parsers.expat--- 使用 Expat 进行快速 XML 解析- ExpatError
- error
- XMLParserType
- ErrorString()
- ParserCreate()
- XMLParser对象- Parse()
- ParseFile()
- SetBase()
- GetBase()
- GetInputContext()
- ExternalEntityParserCreate()
- SetParamEntityParsing()
- UseForeignDTD()
- SetReparseDeferralEnabled()
- GetReparseDeferralEnabled()
- buffer_size
- buffer_text
- buffer_used
- ordered_attributes
- specified_attributes
- ErrorByteIndex
- ErrorCode
- ErrorColumnNumber
- ErrorLineNumber
- CurrentByteIndex
- CurrentColumnNumber
- CurrentLineNumber
- XmlDeclHandler()
- StartDoctypeDeclHandler()
- EndDoctypeDeclHandler()
- ElementDeclHandler()
- AttlistDeclHandler()
- StartElementHandler()
- EndElementHandler()
- ProcessingInstructionHandler()
- CharacterDataHandler()
- UnparsedEntityDeclHandler()
- EntityDeclHandler()
- NotationDeclHandler()
- StartNamespaceDeclHandler()
- EndNamespaceDeclHandler()
- CommentHandler()
- StartCdataSectionHandler()
- EndCdataSectionHandler()
- DefaultHandler()
- DefaultHandlerExpand()
- NotStandaloneHandler()
- ExternalEntityRefHandler()
 
- ExpatError 异常
- 示例
- 内容模型描述
- Expat 错误常量- codes
- messages
- XML_ERROR_ASYNC_ENTITY
- XML_ERROR_ATTRIBUTE_EXTERNAL_ENTITY_REF
- XML_ERROR_BAD_CHAR_REF
- XML_ERROR_BINARY_ENTITY_REF
- XML_ERROR_DUPLICATE_ATTRIBUTE
- XML_ERROR_INCORRECT_ENCODING
- XML_ERROR_INVALID_TOKEN
- XML_ERROR_JUNK_AFTER_DOC_ELEMENT
- XML_ERROR_MISPLACED_XML_PI
- XML_ERROR_NO_ELEMENTS
- XML_ERROR_NO_MEMORY
- XML_ERROR_PARAM_ENTITY_REF
- XML_ERROR_PARTIAL_CHAR
- XML_ERROR_RECURSIVE_ENTITY_REF
- XML_ERROR_SYNTAX
- XML_ERROR_TAG_MISMATCH
- XML_ERROR_UNCLOSED_TOKEN
- XML_ERROR_UNDEFINED_ENTITY
- XML_ERROR_UNKNOWN_ENCODING
- XML_ERROR_UNCLOSED_CDATA_SECTION
- XML_ERROR_EXTERNAL_ENTITY_HANDLING
- XML_ERROR_NOT_STANDALONE
- XML_ERROR_UNEXPECTED_STATE
- XML_ERROR_ENTITY_DECLARED_IN_PE
- XML_ERROR_FEATURE_REQUIRES_XML_DTD
- XML_ERROR_CANT_CHANGE_FEATURE_ONCE_PARSING
- XML_ERROR_UNBOUND_PREFIX
- XML_ERROR_UNDECLARING_PREFIX
- XML_ERROR_INCOMPLETE_PE
- XML_ERROR_XML_DECL
- XML_ERROR_TEXT_DECL
- XML_ERROR_PUBLICID
- XML_ERROR_SUSPENDED
- XML_ERROR_NOT_SUSPENDED
- XML_ERROR_ABORTED
- XML_ERROR_FINISHED
- XML_ERROR_SUSPEND_PE
- XML_ERROR_RESERVED_PREFIX_XML
- XML_ERROR_RESERVED_PREFIX_XMLNS
- XML_ERROR_RESERVED_NAMESPACE_URI
- XML_ERROR_INVALID_ARGUMENT
- XML_ERROR_NO_BUFFER
- XML_ERROR_AMPLIFICATION_LIMIT_BREACH