勤学思培训网USEIRY
  • 终于理会python入门级开源项目案例

    算术最基本的操作符,是小学数学的+ - * / ,对于整数,还可以用+=,*=的操作符,对自身的值进行改变(对象引用)。以下是小编为你整理的python入门级开源项目案例

    对于整数的加减乘除,但需要注意的是,整数相除的结果是小数

    PS:在一些其他语言,比如c语言,java,两个整数相除,如果产生小数,直接把小数给忽略掉,而Python刚刚相反,比如1/3,在其他语言的结果是0,在Python则是0.......

    如果需要把整数相除的商作为int类型整数结果,需要转化,int(小数值)

    PS:直接把小数忽略掉,不会进行四舍五入的运算

    列表的相加


    [图片0]

    2个列表相加之后,元素进行合并

    需要注意的是,不能直接用运算符进行减法,乘法,除法运算

    str类型相加(连接符)

    数值相加的数学运算,字符串相加是连接

    比如:'abc'+'def',结果是'abcdef'

    需要注意的是,字符串只能用+号连接,不能用乘除减符号

    +=,-=,*=,/=

    需要注意的是,这种赋值不是改变原本的数据,而且进行运算之后产生一个新的数据,然后a重新指向新数据,原来的数据如果没有被任何标识符引用,那么会进入等待垃圾回收器清理

    另外,这类操作符的左边是一个集合的时候,右边也需要是集合

    有一个需要注意的是

    字符串集合与字符串相加

    比如,['abc']与'def'相加,不能用a = a + b,要用a += b

    解析:直接相加,相当于用列表与字符串相加,如果用+=,会默认把后面的字符串转成列表

    python的注释

    注释是什么?

    我们写程序的时候,是否要标明程序的作用。例如函数、对象、方法的作用、源代码的作者等。

    也就是说python解释器不解释的部分,用来我们开发时可以一目了然的功能标明,就是注释。

    怎么注释呢?

    这里分单行注释和多行注释。

    什么是单行注释?

    也就是说单行注释,标识符为#

    什么是多行注释?

    多行注释一般用于作者、版本标明。标识符为3个'''或者"""

    当然你也可以用单行注释来实现多行注释。

    例如:

    #!/usr/bin/python

    # 这是一个python程序

    # 作者 binn louis zeng

    # 版本:

    # 功能:

    #

    import sys

    ......

    但是多行的情况是这样的:

    #!/usr/bin/python

    '''

    这是一个python程序

    作者 binn louis zeng

    版本:

    功能:


    '''

    import sys

    ......

    或者把'''替换成"""

    跟着我做一遍你就完全能理解啦。

    首先touch

    新建一个py文件。

    vim打开它。

    然后按a插入。

    输入以下代码:

    #!/usr/bin/python

    #print 'test'

    print 'test'

    先来看看我们的代码

    #!/usr/bin/python

    这个是声明解释器路径

    #print 'test'

    这个是注释,不起作用的注释

    print 'test'

    这是一个打印test这个字符串的操作。

    如果#注释生效的话,那么只会打印一个test对不对?

    也就是只执行print 'test'这一条语句

    我们:wq保存退出,然后python 看看结果?

    二进制的实用方法

    0b是二进制,比如a = 0b

    注意:无论几进制,打印出来的都是十进制

    0o表示八进制

    注意:前面是数字0,后面是小写字母x

    0x表示十六进制

    注意:前面的是数字0,后面的是小写字母x,数值用大写字母,A~E

    /与//


    [图片1]

    a/b,带小数的结果

    a//b,忽略小数的结果

    注意:带不带小数,它的结果都是小数

    %取模(余数)

    比如,10/3,正常结果的3.

    如果需要小学算术那样,10/3,求余数

    可以用10 % 3

    divmod(x,y)

    如果需要同时求商与余数,可以用这个函数,这个函数是返回一个元组的

    abs(x)

    获取某个数的绝对值,这个计算比较常用

    采集图片

    首先介绍采集图片的步骤。

    采集图片和采集文本内容的配置方法类似。区别在于需要将存储图片的字段的取值类型设置为“原始数据流”,以及需要填写“链接额外标签”。

    以“凤凰网()”为例,采集新闻内的图片。

    配置频道,创建模板

    第一个模板对应新闻的链接列表,第二个模板对应新闻的正文内容,第三个模板对应新闻正文里链接到的图片。

    配置新闻列表页模板

    模板1用于过滤新闻的链接。

    配置新闻正文页模板

    模板2用于采集新闻的内容数据,以及链接到图片的地址。

    (1)链接抽取

    该链接抽取需要关联模板3(图片),并在“链接额外标签”处填写“src”(图片链接的属性)。地址过滤一般不需要再填写过滤串。

    (2)数据抽取

    数据抽取新闻页的数据内容。关联新闻表单,分别配置各字段的取值。

    配置图片页模板

    (1)创建图片表单

    首先在“表单”选项卡中创建一个用于存储图片的数据表单,设置一个主键字段,一个图片字段。图片字段的变量类型必须是“stream”类,取值类型须为“原始数据流”,扩展主类型为“图片”。这样设置后才能正确的在软件中预览图片,并存入数据库中。

    如果不预先在“表单”选项卡中设置好该数据表单,也可以在模板3中右键创建字段,存储图片的字段的取值类型必须选择“原始数据流”。这样设置也可以采集到图片,但无法在软件中提前预览到图片。

    (2)关联表单

    在模板3中创建数据抽取,关联图片表单,关联后无需进行其他配置操作,即可采集到图片数据了。