Python计算生态中那些著名的库-文本处理

525 阅读1分钟

PyPDF2

用来处理pdf文件的工具集

提供了一批处理PDF文件的计算功能,支持获取信息、分隔/整合文件、加密解密等,完全Python语言实现,不需要额外依赖,功能稳定

官方网站:mstamy2.github.io/PyPDF2

NLTK

自然语言文本处理第三方库

提供了一批简单易用的自然语言文本处理功能,支持语言文本分类、标记、语法句法、语义分析等,是最优秀的Python自然语言处理库

官方网站:www.nltk.org

Python-docx

创建或更新Microsoft Word文件的第三方库

提供创建或更新.doc .docx等文件的计算功能,增加并配置段落、图片、表格、文字等功能

官方网站:python-docx.readthedocs.io/en/latest/i…