勤学思培训网OHOWMM
  • 终于知晓python3入门教程

    Python是一款功能强大的脚本语言,具有丰富和强大的库,重要的是,它还具有很强的可读性,易用易学,非常适合编程初学者入门。以下是小编为你整理的python3入门教程

    环境配置:下载Python并安装,安装完成后,配置windows的环境变量:打开高级系统设置,将Python的安装目录添加到系统变量path中。配置完成后,在cmd命令行,输入命令"Python",出现Python版本号,即配置成功


    [图片0]

    教程学习:上网百度下载一份Python教程,进行学习。初学者入门的话,没必要整份教程看一遍,只需要将基础的语法及模块挑出学习,如:字符串、列表、字典、元组、文件及数据库的操作

    上机实践:单纯地学习教程绝对是没法学好编程语言的,我们需要通过实践将理论知识转为实打实的技能。在学习的过程中,可以在Ulipad上尝试编写脚本,也可以将教程上的代码自己敲一遍。总之,一定要“多敲”

    下载安装步骤

    趁着在家有个干净的windows环境,我自己尝试从头配置Python+webdriver,公司的配置是前辈已经帮忙配好的。本文档在于帮助菜鸟扫盲。有些内容是引用虫师的

    1.下载python,好吧官网有,直接exe安装吧少年,推荐下载,不太稳定(说错别砍我,我很菜)

    2.下载setuptools(python的基础包工具),同样是exe 文件,默认会找到python 的安装路径,将安装到C:Python27Libsite-packages 目录下

    3.下载pip,(python安装包管理工具),我默认解压在了C:pip- 目录下

    4.打开命令提示符(开始---cmd 回车)进入C:pip-目录下输入:

    C:pip- > python install

    (如果提示python 不是内部或外部命令!别急,去配置一下环境变量吧)

    5.再切换到C:Python27scripts 目录下输入:

    C:Python27scripts > easy_install pip

    6、安装selenium,(下载地址: /pypi/selenium )

    如果是联网状态的话,可以直接在C:Python27scripts 下输入命令安装:

    C:Python27scripts > pip install -U selenium

    如果没联网(这个一般不太可能),下载selenium (目前的最新版本)

    并解压把整个目录放到C:Python27Libsite-packages 目录下。

    7、下载selenium 的服务端(/p/selenium/)在页面的左侧

    列表中找到

    selenium-server-standalone-

    对!就是这个东西,把它下载下来并解压;

    在selenium-server-standalone- 目录下使用命令java -jar

    selenium-server-standalone- 启动(如果打不开,查看是否端口被占用:

    netstat -aon|findstr 4444)。

    至此步骤完毕

    接下来是一些注意事项,是我配置想启动的过程中遇到的问题,希望对你们有所帮助:

    1.我写了个入门的python+webdriver脚本:

    出现error:

    Traceback (most recent call last): File "C:", line 1, in from selenium import webdriverimportError: No module named selenium

    解决方案:没有找到selenium,好吧他说selenium没装,但是我真的安装的啊。我勒个去。于是我把我之前selenium-.tar删了,在线用pip命令操作安装selenium,发现用from selenium import webdriver还是报错,于是找啊找,参见该博客.cn/s/

    重启电脑,这里如果不重启,不生效,OK,这个重启电脑搞定这个问题

    2.我相信很多人会去手写python脚本

    请大家注意调用浏览器首字母要大写。。。(今天差点弄死我),如:Firefox,Chrome,Ie

    3.注意得把IEDriverServer跟chromedriver放到对应浏览器的安装目录下

    配置浏览器的环境变量Path:如

    Chrome:C:UserswyxAppDataLocalGoogleChromeApplication

    4.在python的安装目录下也放IEDriverServer,chromedriver

    Python入门

    第一步:Python入门

    这一阶段,你需要学习的知识点:

    如果学习能力还不错的话,这一阶段,只需要一个多月的时间

    教程如下:

    Python入门教程完整版(懂中文就能学会)/s/1miwZ1WW

    第二步:熟悉Scrapy各模块

    教程简介:

    (1)Scrapy的简介。

    主要知识点:Scrapy的架构和运作流程。

    (2)搭建开发环境:

    主要知识点:Windows及Linux环境下Scrapy的安装。

    (3)Scrapy Shell以及Scrapy Selectors的使用。

    (4)使用Scrapy完成网站信息的爬取。

    主要知识点:创建Scrapy项目(scrapy startproject)、定义提取的结构化数据(Item)、编写爬取网站的 Spider 并提取出结构化数据(Item)、编写 Item Pipelines 来存储提取到的Item(即结构化数据)。

    教程下载地址:Scrapy教程 /s/1dF3qhFV

    第三步:Django教程

    教程简介:

    (1)Django的简介。

    主要知识点:MVC设计模式以及Django的MVT。

    (2)搭建开发环境:

    主要知识点:Linux的虚拟环境搭建和应用、Django的安装。

    (3)利用Django框架完成简单的图书项目:

    主要知识点:编写模型,使用API与数据库交互、使用Django的后台管理管理数据、通过视图接收请求,通过模型获

    教程下载地址:Django教程 /s/1nvFlfU5

    第四部:Python全栈教程


    [图片1]

    教程简介:

    (1)HTTP协议的分析:

    HTTP格式。

    包含知识点:HTTP GET请求的格式、HTTP POST请求的格式、HTTP响应的格式。

    (2)HTTP协议的使用(实现Web静态服务器):

    利用HTTP协议实现Web静态服务器。

    包含知识点:浏览器首先向服务器发送HTTP请求、服务器向浏览器返回HTTP响应、使用类。

    (3)服务器动态资源请求(实现Web动态服务器):

    利用WSGI实现Web动态服务器。

    包含知识点:浏览器请求动态页面的过程介绍、WSGI的介绍、定义WSGI接口。

    教程下载地址:

    Python全栈教程 /s/1nvFlfU

    模块期初是用来打开和获取 URL 的。让我们看看你可以用函数 urlopen 可以做的事:

    >>> import >>> url = ('/') >>> () '/' >>> () >>> header = () >>> () ('Date: Fri, 24 Jun 2016 18:21:19 GMT/n' 'Expires: -1/n' 'Cache-Control: private, max-age=0/n' 'Content-Type: text/html; charset=ISO-8859-1/n' 'P3P: CP="This is not a P3P policy! See ' '/support/accounts/answer/?hl=en for more info."/n' 'Server: gws/n' 'X-XSS-Protection: 1; mode=block/n' 'X-frame-Options: SAMEORIGIN/n' 'Set-cookie: '

    'NID=80=tYjmy0JY6flsSVj7DPSSZNOuqdvqKfKHDcHsPIGu3xFv41LvH_Jg6LrUsDgkPrtM2hmZ3j9V76pS4K_cBg7pdwueMQfr0DFzw33SwpGex5qzLkXUvUVPfe9g699Qz4cx9ipcbU3HKwrRYA; ' 'expires=Sat, 24-Dec-2016 18:21:19 GMT; path=/; domain=.; HttpOnly/n' 'Alternate-Protocol: 443:quic/n' 'Alt-Svc: quic=":443"; ma=; v="34,33,32,31,30,29,28,27,26,25"/n' 'Accept-Ranges: none/n' 'Vary: Accept-Encoding/n' 'Connection: close/n' '/n') >>> () 200

    在这里我们包含了需要的模块,然后告诉它打开 Google 的 URL。现在我们就有了一个可以交互的 HTTPResponse 对象。我们要做的第一件事是调用方法 geturl ,它会返回根据 URL 获取的资源。这可以让我们发现 URL 是否进行了重定向。 接下来调用 info ,它会返回网页的元数据,比如请求头信息。因此,我们可以将结果赋给我们的 headers 变量,然后调用它的方法 as_string 。就可以打印出我们从 Google 收到的头信息。你也可以通过 getcode 得到网页的 HTTP 响应码,当前情况下就是 200,意思是正常工作。

    如果你想看看网页的 HTML 代码,你可以调用变量 url 的方法 read。我不准备再现这个过程,因为输出结果太长了。

    请注意 request 对象默认发起 GET 请求,除非你指定了它的 data 参数。如果你给它传递了 data 参数,这样 request 对象将会变成 POST 请求。部分内容选自《Linux就该这么学》感兴趣的可以看下哦