技术上,独立完成个APP从前端到后端开发,难度很高,远非写个简单爬虫程序能相提并论,不过却并非无法完成。更何况,解决不算法还能问系统嘛,消耗积分查询资料本身也是个学习过程。
等他完成奖励
所以很多“小气”网站会设置有反爬虫程序,技术高点要让你什东西都爬不到,要爬下来都是乱码,技术含量低也可以通过访问次数监控,直接锁你IP。
不过12306网站显然没那小气,想想个连用户体验都不在意垄断巨头,会在意那点服务器资源?只要你们别把老子服务器折腾扑街,谁管你!
看着文件夹里不断堆积车次数据,陆舟眼睛转转,寻思着要不要用它来干点啥?
“做个订车票网站?好像有些脱裤子放屁……”
忽然,陆舟心中动。
种典型运用范例,爬虫程序模板在书中都是有提到,而且针对不同种情况,书中还针对算法进行不同程度改良。
当然,12306毕竟不是般BBS论坛,把这个作为初学者练习目标,还是有不小难度。
不过也仅仅是不小而已,对于已经吃透整本书陆学霸来说,问题却是不大。爬虫本身并没有太高技术难度,不到30行代码就搞定整个程序,完美运行无BUG。
然后紧接着就是抓取。
将网站url复制在代码后面,陆舟选择运行,并且将数据生成表格,导入到预先建好文件夹中。
要不……
做个网上订票APP?
这个临时起意想法冒出来,便不可控制地在他心中生根发芽。
虽然网络上有不少第三方订票APP,但官方订票APP还真没有。如果他能做出来个与众不同,卖给那些感兴趣运营商,说不定还能赚点生活费。
涉及到钱问题,陆舟顿时就上心,心中开始不断盘算起来。
紧接着机箱风扇开始嗡嗡作响,电脑变卡顿起来,行行编码从黑色对话框中闪过,被迅速整理进表格中。
看着不断被填充文件夹,靠在椅子上陆舟心中感慨。
“python语言真尼玛方便,难怪那多大牛推荐这玩意儿。”
看着行行数据闪过信息,陆舟还真有种过把黑客瘾错觉。
不过当然,也仅仅是错觉而已,连感觉都谈不上,毕竟这玩意儿和黑客技术完全八竿子打不着边。从服务器上爬取公开信息是不犯法,顶多有挤占别人服务器资源嫌疑,会被各大站长痛恨不已。
请关闭浏览器阅读模式后查看本章节,否则可能部分章节内容会丢失。