之前我也做过百度云盘搜索功能,使用的是搜索引擎的的站内搜索功能site:pan.baidu.com,看了现在绝大大多数的网盘搜索都是使用的这个技巧。这次升级的版本是自己独立开发的网盘爬虫,2天爬取了60W搜索(实际上还可以能多,因为瞬时爬取频率太高,百度会封IP,考虑分布式的爬虫或代理IP能很好解决这个问题)。

使用到的技术:前台:PHP(thinkphp框架),后台爬虫:Python,前端界面bootstrap框架

程序部分截图
首页


结果页

后台爬虫管理,还在开发中。。。


爬虫做好了,搜索功能还没做好,只能精确搜索,所以大家注意下关键词。
演示网址:http://pan.whatsoo.com
Logo

这里是“一人公司”的成长家园。我们提供从产品曝光、技术变现到法律财税的全栈内容,并连接云服务、办公空间等稀缺资源,助你专注创造,无忧运营。

更多推荐