获得徽章 0
前端摸鱼研究会员 @inceptionpad inc.
看到最近老在提的论文<基于文本及符号密度的网页正文提取方法>,想到反正最近也在从头学Rust,感觉用rust写一次试一试什么的。
虽然还是初版,不过确实对新闻的提取效果挺棒的。不过如果是基于md的文章,比如掘金什么的,p标签的比重很低,反而是其他标签甚至是div的直接文本子代都很多,导致打分函数没办法正确打分。考虑是不是把所有非链接标签全部替换成p标签会好一些Orz。
顺带,感觉我写的代码好丑啊Orz.....
展开
评论
赞了这篇沸点
Cloudreve 是一个可以让你低成本快速搭建起公私兼备的网盘工具,并且支持快速对接七牛、又拍云、阿里云等多家云存储,GitHub 地址:github.com

感谢蓝月明空的纠错
GitHub黑板报于2018-12-28 09:22发布的图片
2
赞了这篇沸点
CommentCoreLibrary 是一套基于 JavaScript 构建的弹幕控制器,提供从基本骨架到高级弹幕的支持,GitHub 地址:github.com,在线体验:jabbany.github.io
GitHub黑板报于2018-11-30 08:54发布的图片
1
前端摸鱼研究会员 @inceptionpad inc.
赞了这篇沸点
发现腾讯新上线了一款音乐App,UI做的超级棒,逼格有点高👍
Veni666于2018-11-16 09:45发布的图片
Veni666于2018-11-16 09:45发布的图片
Veni666于2018-11-16 09:45发布的图片
Veni666于2018-11-16 09:45发布的图片
11
前端摸鱼研究会员 @inceptionpad inc.
前端摸鱼研究会员 @inceptionpad inc.
下一页
个人成就
文章被点赞 120
文章被阅读 13,138
掘力值 331
收藏集
1
关注标签
39
加入于