首页 软件 游戏 图书 电影 电视剧
jparser是一个python库,jparser 0.0.11 发布了,用于网页转码,也就是从html源码中抽取正文的结构化数据:文本段落和图片。目前主要针对新闻资讯类页面进行了优化。主要更新内容如下:
Bug fix:
title提取错误
正文区域判断失误bad case
li标签内容遗漏
传承兰台文化,共同保存历史记忆!兰台网收藏软件、游戏、图片、图书、电影、电视剧等互联网档案,是免费和可借阅文本、电影、音乐等档案的数字图书馆。