量子统计是断断续续写的,不是每天都有时间写,周末有时候也没有心思。应该算是完成了50%了,今天再完成一个整点统计的功能就60%了,剩下的就是修修补补就好了。
这个应用自用没问题,开发也不是问题(不是白做的,也学到了很多东西),就是商用会有问题:
首先是GAE的稳定性,虽然加了反向代理,不管是Linode还是EC2,但还是有些时候有些地方访问不到,或者速度比较慢,大概每一两天就有一回几分钟或者十几分钟访问不到的情况。
其次是,GAE的免费额度限制:主要是CPU时间,我现在是每分钟Cron一次,每个来访者又处理一遍,每小时又统计一回。想来想去,也没有什么可以优化的地方了,而且我的统计都没有加完呢。
目前情况:只统计一个日访问2000+PV,三四百UV的店铺,CPU Time要占3%~4%(我每分钟都cron一次,每个来访者也处理一下),Incoming Bandwidth要达到1%~2%,Total Stored Data目前占1%。
由此可见,这个APP瓶颈应该是CPU Time,按照4%的上限来算,一个APP最多能用25个这样类型的用户。虽然我可以搞很多APP来支撑流量(我也没其他办法,只能找很多有钱的SIM卡来开账户),也可以均衡负载,但如果一个APP有几个日访问超过10000+的用户呢,CPU也许会超出的?明年GAE还会收费。假设在EC2的VPS也有流量限制。
用GAE开发这样耗CPU的东西,应该不是一个很好的idea,我不一定非得上线卖钱了,维护还很困难,我就希望写完之后自动运行,每周最多维护一次,自己收钱就好的那种。我再想想。
====================================================================================================
2011-07-17 Ajax画图,按小时分析页面基本完成
2011-07-16 Ajax画图
2011-07-11 解决自己使用my97的datepicker的问题,问题得到解决
2011-07-10 选日历空间,最终用了my97的datepicker,调试Ajax
2011-07-02 学习amcharts
2011-06-29 完善画图
2011-06-28 完善按小时分析功能;初步使用Js画图
2011-06-27 修正分页到最后一页还能继续翻页的bug;完善按小时分析功能
2011-06-26 实现右侧功能栏;
增加几个Model(每个字段都是想好怎么节省空间的)及其工程模式命令;
完成每小时的记录(Model的设计和如何实现很重要),每天、每月和每年都数据记录也如法炮制。
2011-06-25 优化实时访问页面,降低cpu_ms从700多ms到200多ms;实现分页。
2011-06-24 尝试设计新数据库失败
2011-06-22 优化Title
2011-06-21 过滤获得的Title;
2011-06-20 优化页面设计;
2011-06-19 访客趋势跟踪;IP Memcache;表格CSS;调研画图采用的库。
2011-06-18 UV统计不准确,完善UV统计,修改UV统计算法,同时使用db.run_in_transaction_custom_retries函数。
整理工程模式命令。
实现访客ID统计,回头客处理。
2011-06-15 增加PV,UV统计功能
2011-06-14 阅读GAE article,引入Seller、Today模型的思考,思考各个模型之间的关系,网站架构
2011-06-13 Memcache同一url的Title,减少网络负担;增加Visiter模型,准备记录来访者
2011-06-12 采用了异步的urlfetch去获取页面title;将最近代码分离称单独的ta模块;完善实时跟踪首页。
2011-06-11 查阅GAE异步urlfetch资料。
2011-06-05 完成IP归属地查询功能;完成图片初步跟踪功能;完成实时访问查看界面。
2011-06-04 项目立项,暂定名为“粒子统计”,模仿“量子统计”做一些功能,一是练兵,二是自用,三是卖钱;确定使用的GAE框架,模板,整合代码。
...