网络爬虫是一种按照一定的规则,自动地抓取万维网信息的程序或者脚本。爬虫最常用的是python和java语言,它们二者的区别你知道吗?
python相对Java的优点:
1. Python作为动态语言更适合初学编程者。Python可以让初学者把精力集中在编程对象和思维方法上,而不用去担心语法、类型等等外在因素。而Python清晰简洁的语法也使得它调试起来比Java简单的多。
2. Python有一些Java没有的强大的架构。
3. Python有非常强大的支持异步的框架如Eventlet Networking Library,而Java要实现这些功能要麻烦的多。也因此Python适合一些可扩展的后台应用。(但除此以外Python可扩展性是不如Java的)
4. Python作为脚本语言,更适合开发小的应用,而且极其适合在应用发展初期时用来做原型
缺点:
1. 由于Python的优点也无可避免会有牺牲——由于是动态语言,比Java还慢。
2. Java很适合发展跨平台应用,几乎常见的电脑、智能机都能跑Java。而Python就不一样了…
对于一般性的需求无论java还是python都可以胜任。如需要模拟登陆、对抗防采集选择python更方便些,如果需要处理复杂的网页,解析网页内容生成结构化数据或者对网页内容精细的解析则可以选择java。