2016年10月8日 星期六 晴
国庆期间收到阿里邮件通知,由于我的淘宝店铺已经连续三周没有1个宝贝上架了,如果最后一周还不上架宝贝的话,店铺就要被解散了。不得已,我昨晚上架了一个宝贝,标题是抄其他人的,大概就是可以定做爬虫软件之类的吧。
我本无法插柳,只是想保住店铺,没想到今天倒是来了2笔生意,可惜我都做不了。
客户1. 在大众点评 美团 百度糯米 这三个平台上爬取全国的私人影院店铺信息 店铺名称 数量 地址 联系电话 营业时间 套餐信息 售卖票数 评分 网页链接
这个需求太大:
- 三个不同网站都是知名网站。
- 肯定得用防爬机制,而且数据量估计很大,肯定要IP代理池,要么自己买要么自己爬。
- 这种估计客户认为是小活,我估计客户给2k撑死了。我淘宝标价是50起,但想到来淘宝谈价格的,我觉得他只愿意出最多几百到2k。
我这个月华为项目要过TR5,没时间搞这个性价比低的活,晚上告诉他不接了。
客户2. 下载http://1s1k.eduyun.cn/的课件 分析:
-
网站终止了下载功能,直接在网页里写的是“下载”。
-
网站的资源是来自百度文库的,我可以把图片一页页下载下来搞成一个PDF或者网页,但客户要的是能编辑的课件。
3.客户应该是老师,最多只愿意出一两百吧,我就不继续去研究了。
...