找回密码
 立即注册
搜索
查看: 1417|回复: 3

[软件] [转需]GNE v0.1 正式发布: 4 行代码开发新闻网站通用爬虫

[复制链接]
     
发表于 2020-1-1 19:44 | 显示全部楼层 |阅读模式
GNE ( GeneralNewsExtractor )是一个通用新闻网站正文抽取模块,输入一篇新闻网页的 HTML, 输出正文内容、标题、作者、发布时间、正文中的图片地址和正文所在的标签源代码。GNE 在提取今日头条、网易新闻、游民星空、 观察者网、凤凰网、腾讯新闻、ReadHub、新浪新闻等数百个中文新闻网站上效果非常出色,几乎能够达到 100%的准确率。

回复

使用道具 举报

     
发表于 2020-1-1 19:50 来自手机 | 显示全部楼层
马一下来自: iPhone客户端
回复

使用道具 举报

     
发表于 2020-1-1 20:08 来自手机 | 显示全部楼层
码一个

—— 来自 HUAWEI BKL-AL20, Android 9上的 S1Next-鹅版 v2.2.0.1
回复

使用道具 举报

     
发表于 2020-1-1 20:20 来自手机 | 显示全部楼层
馬一下
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|上海互联网违法和不良信息举报中心|网上有害信息举报专区|962110 反电信诈骗|举报电话 021-62035905|Stage1st ( 沪ICP备13020230号-1|沪公网安备 31010702007642号 )

GMT+8, 2024-9-27 05:51 , Processed in 0.529874 second(s), 5 queries , Gzip On, Redis On.

Powered by Discuz! X3.5

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表