Python基础编程之字符编码、数据类型、列表

目录:

  • python简介
  • 字符编码介绍
  • 数据类型

一、Python简介

  Python的创始人为Guido van Rossum。1989年圣诞节期间,在阿姆斯特丹,Guido为了打发圣诞节的无趣,决心开发一个新的脚本解释程序,做为ABC 语言的一种继承。之所以选中Python(大蟒蛇的意思)作为该编程语言的名字,是因为他是一个叫Monty Python的喜剧团体的爱好者。

  python的发展历史

  • 1989年,为了打发圣诞节假期,Guido开始写Python语言的编译器。
  • 1991年,第一个Python编译器诞生。它是用C语言实现的,并能够调用C语言的库文件。从一出生,Python已经具有了:类,函数,异常处理,包含表和词典在内的核心数据类型,以及模块为基础的拓展系统。
  • Granddaddy of Python web frameworks, Zope 1 was released in 1999
  • Python 1.0 - January 1994 增加了 lambda, map, filter and reduce.
  • Python 2.0 - October 16, 2000,加入了内存回收机制,构成了现在Python语言框架的基础
  • Python 2.4 - November 30, 2004, 同年目前最流行的WEB框架Django 诞生
  • Python 2.5 - September 19, 2006
  • Python 2.6 - October 1, 2008
  • Python 2.7 - July 3, 2010
  • In November 2014, it was announced that Python 2.7 would be supported until 2020, and reaffirmed that there would be no 2.8 release as users were expected to move to Python 3.4+ as soon as possible
  • Python 3.0 - December 3, 2008
  • Python 3.1 - June 27, 2009
  • Python 3.2 - February 20, 2011
  • Python 3.3 - September 29, 2012
  • Python 3.4 - March 16, 2014
  • Python 3.5 - September 13, 2015

  解释器:

  • Python是一门跨平台的脚本语言,Python规定了一个Python语法规则,实现了Python语法的解释程序就成为了Python的解释器。
  • CPython(ClassicPython,也就是原始的Python实现,需要区别于其他实现的时候才以CPython称呼;或解作C语言实现的Python)。这是最常用的Python版本。
  • Jython(原名JPython;Java语言实现的Python,现已正式发布)。Jython可以直接调用Java的各种函数库。
  • PyPy(使用Python语言写的Python)
  • IronPython(面向.NET和ECMA CLI的Python实现)。IronPython能够直接调用.net平台的各种函数库。可以将Python程序编译成.net程序。

 编程语言的分类:

  • 低级语言:                                                                 由于计算机内部只能接受二进制代码,因此,用二进制代码0和1描述的指令称为机器指令,全部机器指令的集合构成计算机的机器语言,用机器语言编程的程序称为目标程序。只有目标程序才能被计算机直接识别和执行。但是机器语言编写的程序无明显特征,难以记忆,不便阅读和书写,且依赖于具体机种,局限性很大,机器语言属于低级语言。
  • 高级语言:                                                                 高级语言是大多数编程者的选择。和汇编语言相比,高级语言更能被人们所看懂并大大提高开发效率,并且去掉了与具体操作有关但与完成工作无关的细节。同时,由于省略了很多细节,编程者也就不需要有太多的专业知识。
  • 编译型语言:                                                               编译是指在应用源程序执行之前,就将程序源代码“翻译”成目标代码(机器语言),因此其目标程序可以脱离其语言环境独立执行,使用比较方便、效率较高,运行速度快。但应用程序一旦有bug需要修改源代码,则需要重新对代码进行编译,会很耗费时间;
  • 解释型语言:                                                               执行方式类似于我们日常生活中的“同声翻译”,应用程序源代码一边由相应语言的解释器“翻译”成目标代码(机器语言),一边执行,因此效率比较低,而且不能生成可独立执行的可执行文件,应用程序不能脱离其解释器,但这种方式比较灵活,可以动态地调整、修改应用程序。
  • 动态语言和静态语言
    通常我们所说的动态语言、静态语言是指动态类型语言和静态类型语言。

    (1)动态类型语言:动态类型语言是指在运行期间才去做数据类型检查的语言,也就是说,在用动态类型的语言编程时,永远也不用给任何变量指定数据类型,该语言会在你第一次赋值给变量时,在内部将数据类型记录下来。Python和Ruby就是一种典型的动态类型语言,其他的各种脚本语言如VBScript也多少属于动态类型语言。

    (2)静态类型语言:静态类型语言与动态类型语言刚好相反,它的数据类型是在编译其间检查的,也就是说在写程序时要声明所有变量的数据类型,C/C++是静态类型语言的典型代表,其他的静态类型语言还有C#、JAVA等。

  • 强类型定义语言和弱类型定义语言

    (1)强类型定义语言:强制数据类型定义的语言。也就是说,一旦一个变量被指定了某个数据类型,如果不经过强制转换,那么它就永远是这个数据类型了。举个例子:如果你定义了一个整型变量a,那么程序根本不可能将a当作字符串类型处理。强类型定义语言是类型安全的语言。

    (2)弱类型定义语言:数据类型可以被忽略的语言。它与强类型定义语言相反, 一个变量可以赋不同数据类型的值。

    强类型定义语言在速度上可能略逊色于弱类型定义语言,但是强类型定义语言带来的严谨性能够有效的避免许多错误。另外,“这门语言是不是动态语言”与“这门语言是否类型安全”之间是完全没有联系的!
    例如:Python是动态语言,是强类型定义语言(类型安全的语言); VBScript是动态语言,是弱类型定义语言(类型不安全的语言); JAVA是静态语言,是强类型定义语言(类型安全的语言)。

  python优点与缺点:

  • 优点:
    高级语言;--》无需考虑管理内存;
    可移植性:--》借助pvm跨平台运行;
    可扩展性:--》可调用其他语言模块;
    可嵌入式:--》可以嵌入到C\C++代码中;
  • 缺点:
    速度慢;可忽略;
    代码不能加密;运行状态必须为明文;
    解决方法:核心代码使用C语言;
    线程不能利用多CPU问题;同一时间不能利用多核,同一时间只能跑一个;  

 python变量应用:

  • 变量:

存储在内存中的一段地址空间;
        可变的量;
        存储数据;
        开发最大的忌讳是写重复代码;

  • 变量的命名规则:

变量名只能是字母、数字或下划线的任意组合;
        变量名的第一个字符不能是数字;
        python中关键字不能声明为变量名;

  • 变量的命令规范:

要有描述性;
        python首字母大写一般定义成类名;
        全大写一般为常量;

二、字符编码:

在计算机技术发展的早期,如ASCII(1963年)和EBCDIC(1964年)这样的字符集逐渐成为标准。但这些字符集的局限很快就变得明显,于是人们开发了许多方法来扩展它们。对于支持包括东亚CJK字符家族在内的写作系统的要求能支持更大量的字符,并且需要一种系统而不是临时的方法实现这些字符的编码。基本的 ASCII 字符集共有 128 个字符,其中有 96 个可打印字符,包括常用的字母、数字、标点符号等,另外还有 32 个控制字符。标准 ASCII 码使用 7 个二进位对字符进行编码,对应的 ISO 标准为 ISO646 标准。

  为了满足国内在计算机中使用汉字的需要,中国国家标准总局发布了一系列的汉字字符集国家标准编码,统称为GB码,或国标码。其中最有影响的是于1980年发布的《信息交换用汉字编码字符集 基本集》,标准号为GB 2312-1980,因其使用非常普遍,也常被通称为国标码。GB2312(1980年)一共收录了7445个字符,包括6763个汉字和682个其它符号;占用的码位是72*94=6768,1995年汉字扩展规范GBK1.0收录了21886个符号;现在的PC平台必须支持GB18030;GB18030在2000年取代GBK1.0成功正式国家标准,该标准收录了27484个汉字;从ASCII、GB2312、GBK到GB18030,这些编码是向下兼容的;有些中文的windows的缺省内码还是GBK;

  由于各国的文字编码极不统一,后来出现了Unicode来解决此问题;Unicode(统一码、万国码、单一码),是为了解决传统的字符编码方案的局限而产生的;它为每种语言中的每个字符设定了统一并且唯一的二进制编码,规定虽有的字符和符号最少由16位来表示(2个字符),即:2**16 = 65536

  UTF-8,是对Unicode编码的压缩和优化,他不再使用最少2个字符,而是将后有的字符和符号进行分类;英文一个字节,中文三个字节,欧洲二个字节;

注:python2默认使用是ACSII码;如果要在2中使用中文需要事先声明:

  格式为:#-*- coding: utf-8 -*-
  python2中显示后有可能为乱码;是因为windows默认使用的为gbk字符集;

  python3上默认编码为utf-8,不用事先声明;与python2不同;

三、数据类型:

  • 数值

  int(整型)

>>> name=1
>>> type(name)
<class ‘int‘>
>>> name=10
>>> type(name)
<class ‘int‘>

  long(长整型)python3上面无此概念;只在python2中使用;这里不演示;

  float(浮点型)占字节比较大,c语言中占8个字节;

>>> name=1.5
>>> type(name)
<class ‘float‘>
  • 布尔型

  python中可以直接使用True或False来表示 ;

>>> 3>2
True
>>> 3>5
False
  • 字符串

  常用功能:

    移除空白、分割、长度、索引、切片;

  字符串的拼接一般使用+号;+号的使用不宜太过频繁,每次+号的出现都会创建一个内存空间;比较浪费资源;字符串是不可变类型;

  • 列表

  注:列表中排序是按ASCII字码表来排序;python3中字符串与数字同时存在时不能进行排序;

>>> names=[]
>>> print(names)
[]
>>> names=[‘tom‘,‘jack‘]
列表的添加:
>>> names.append(‘jerry‘)
>>> print(names)
[‘tom‘, ‘jack‘, ‘jerry‘]
>>>
>>> names.insert(1,‘mac‘)
>>> print(names)
[‘tom‘, ‘mac‘, ‘jack‘, ‘jerry‘]
>>>
列表的删除:
>>> del names[2]
>>> print(names)
[‘tom‘, ‘mac‘, ‘jerry‘]
>>>
>>> names.remove(‘mac‘)
>>> print(names)
[‘tom‘, ‘jerry‘]
列表的更改:
>>> names.append(‘mac‘)
>>> names.append(‘jack‘)
>>> names.append(‘rain‘)
>>> names
[‘tom‘, ‘jerry‘, ‘mac‘, ‘jack‘, ‘rain‘]
>>> names
[‘tom‘, ‘jerry‘, ‘mac‘, ‘jack‘, ‘rain‘]
>>> names[1]=‘Jerry‘
>>> names
[‘tom‘, ‘Jerry‘, ‘mac‘, ‘jack‘, ‘rain‘]
列表的查找及切片:
>>> names[1]
‘Jerry‘
>>> names[-1]
‘rain‘
>>> names[0]
‘tom‘
>>> names[::2]
[‘tom‘, ‘mac‘, ‘rain‘]
>>> names[::-1]
[‘rain‘, ‘jack‘, ‘mac‘, ‘Jerry‘, ‘tom‘]
>>> names[1::2]
[‘Jerry‘, ‘jack‘]
  • 运算符
运算操作符 描述符 例子
+ 加法 - 对操作符的两侧增加值 a + b = 30
- 减法 - 减去从左侧操作数右侧操作数 a - b = -10
* 乘法 - 相乘的运算符两侧的值 a * b = 200
/ 除 - 由右侧操作数除以左侧操作数 b / a = 2
% 模 - 由右侧操作数和余返回除以左侧操作数 b % a = 0
** 指数- 执行对操作指数(幂)的计算 a**b = 10 的幂 20
// 地板除 - 操作数的除法,其中结果是将小数点后的位数被除去的商。 9//2 =  4 而 9.0//2.0 = 4.0

比较运算符 描述 示例
== 检查,两个操作数的值是否相等,如果是则条件变为真。 (a == b) 不为 true.
!= 检查两个操作数的值是否相等,如果值不相等,则条件变为真。 (a != b) 为 true.
<> 检查两个操作数的值是否相等,如果值不相等,则条件变为真。 (a <> b) 为 true。这个类似于 != 运算符
> 检查左操作数的值是否大于右操作数的值,如果是,则条件成立。 (a > b) 不为 true.
< 检查左操作数的值是否小于右操作数的值,如果是,则条件成立。 (a < b) 为 true.
>= 检查左操作数的值是否大于或等于右操作数的值,如果是,则条件成立。 (a >= b) 不为 true.
<= 检查左操作数的值是否小于或等于右操作数的值,如果是,则条件成立。 (a <= b) 为 true.
赋值运算符 描述 示例
= 简单的赋值运算符,赋值从右侧操作数左侧操作数 c = a + b将指定的值 a + b 到  c
+= 加法AND赋值操作符,它增加了右操作数左操作数和结果赋给左操作数 c += a 相当于 c = c + a
-= 减AND赋值操作符,它减去右边的操作数从左边操作数,并将结果赋给左操作数 c -= a 相当于 c = c - a
*= 乘法AND赋值操作符,它乘以右边的操作数与左操作数,并将结果赋给左操作数 c *= a 相当于 c = c * a
/= 除法AND赋值操作符,它把左操作数与正确的操作数,并将结果赋给左操作数 c /= a 相当于= c / a
%= 模量AND赋值操作符,它需要使用两个操作数的模量和分配结果左操作数 c %= a is equivalent to c = c % a
**= 指数AND赋值运算符,执行指数(功率)计算操作符和赋值给左操作数 c **= a 相当于 c = c ** a
//= 地板除,并分配一个值,执行地板除对操作和赋值给左操作数 c //= a 相当于 c = c // a

位运算符作用于位和位操作执行位。假设,如果a =60;且b =13;现在以二进制格式它们将如下:

a = 0011 1100

b = 0000 1101

-----------------

a&b = 0000 1100

a|b = 0011 1101

a^b = 0011 0001

~a  = 1100 0011

Python语言支持下位运算符

位运算操作符 描述 示例
& 二进制和复制操作了一下,结果,如果它存在于两个操作数。 (a & b) = 12 即 0000 1100
| 二进制或复制操作了一个比特,如果它存在一个操作数中。 (a | b) = 61 即 0011 1101
^ 二进制异或运算符的副本,如果它被设置在一个操作数而不是两个比特。 (a ^ b) =  49 即  0011 0001
~ 二进制的补运算符是一元的,并有“翻转”位的效果。 (~a ) =  -61 即 1100 0011以2的补码形式由于带符号二进制数。
<< 二进位向左移位运算符。左操作数的值左移由右操作数指定的位数。 a << 2 = 240 即 1111 0000
>> 二进位向右移位运算符。左操作数的值是由右操作数指定的位数向右移动。 a >> 2 = 15 即 0000 1111
逻辑运算符 描述 示例
and 所谓逻辑与运算符。如果两个操作数都是真的,那么则条件成立。 (a and b) 为 true.
or 所谓逻辑OR运算符。如果有两个操作数都是非零然后再条件变为真。 (a or b) 为 true.
not 所谓逻辑非运算符。用于反转操作数的逻辑状态。如果一个条件为真,则逻辑非运算符将返回false。 not(a and b) 为 false.
成员运算操作符 描述 示例
in 计算结果为true,如果它在指定找到变量的顺序,否则false。 x在y中,在这里产生一个1,如果x是序列y的成员。
not in 计算结果为true,如果它不找到在指定的变量顺序,否则为false。 x不在y中,这里产生结果不为1,如果x不是序列y的成员。
标识运算符 描述 例子
is 计算结果为true,如果操作符两侧的变量指向相同的对象,否则为false。 x是y,这里结果是1,如果id(x)的值为id(y)。
is not 计算结果为false,如果两侧的变量操作符指向相同的对象,否则为true。 x不为y,这里结果不是1,当id(x)不等于id(y)。
优先级运算符 描述
** 幂(提高到指数)
~ + - 补码,一元加号和减号(方法名的最后两个[email protected]和 - @)
* / % // 乘,除,取模和地板除
+ - 加法和减法
>> << 左,右按位转移
& 位‘AND‘
^ | 按位异‘或`‘和定期`或‘
<= < > >= 比较运算符
<> == != 等式运算符
= %= /= //= -= += *= **= 赋值运算符
is is not 标识运算符
in not in 成员运算符
not or and 逻辑运算符

  

时间: 01-10

Python基础编程之字符编码、数据类型、列表的相关文章

Python基础(变量、字符编码、数据类型)

变量 变量名由字母.数字(不能为首字符).下划线组成,不能使用关键字 以下关键字不能声明为变量名 ['and', 'as', 'assert', 'break', 'class', 'continue', 'def', 'del', 'elif', 'else', 'except', 'exec', 'finally', 'for', 'from', 'global', 'if', 'import', 'in', 'is', 'lambda', 'not', 'or', 'pass', 'pri

Python基础之 一 字符编码及转换

python2 / python3编码转换 先上图一张: 说明:python编码转换的流程是 先进行decode解码,然后进行encode编码 解释: u'你好'  -->带u表示为unicode编码 b'\xc4\xe3\xba\xc3'   --> 带b的表示bytes类型由于utf8 是unicode的扩展,所以unicode和utf8之间是可以直接打印 注意:所有decode动作都是将已编码文件解码为unicode,然后在进行其他编码格式转换(通过encode) 直接举例说明:#pyt

Python基础 二进制和字符编码

二进制定义 二进制是计算技术中广泛采用的一种数制.二进制数据是用0和1两个数码来表示的数.它的基数为2,进位规则是"逢二进一",借位规则是"借一当二",由18世纪德国数理哲学大师莱布尼兹发现.当前的计算机系统使用的基本上是二进制系统,数据在计算机中主要是以补码的形式存储的.计算机中的二进制则是一个非常微小的开关,用"开"来表示1,"关"来表示0. 二进制与十进制转换 我们已经发现,二进制的第n位代表的十进制值都刚好遵循着2的n

python基础深入(元组、字符串、列表、字典)

python基础深入(元组.字符串.列表.字典) 一.列表 1.追加 1 >>>list = [1,2,3,4] #用于在列表末尾添加新的对象,只能单个添加,该方法无返回值,但是会修改原来的列表. 2 >>>list.append(5) 3 >>>print(list) 4 [1, 2, 3, 4, 5] 2.统计 1 >>>list = [1,"a","b","c",1,4

windows核心编程(字符编码)

一.字符编码 字符集 1)字符集是字符的数字代码集.有ANSI/ASCII.MBCS(Multibytes).Unicode等.比如“汉”字Unicode代码为0x6c49. 编码方案 2)编码方案是记录字符代码的方式.有UTF-8.UTF-16.GB2312等.编码方案分“变长编码”与“定长编码”两种.UTF-8是变长编码(汉字有的两字节有的三字节),而UTF-16是两字节定长的编码. 字符集与编码方案 3)字符集与编码方案是配套的.如GB2312编码,即是GB2312字符集与GB2312编码

python第三天:字符编码、文件操作、函数

作业问题回顾 表格化输出 主要考察字符串的expandtabs的方法,使用空格替换TAB. 百鸡百钱 百鸡百钱的主要是用进行多次判断,然后输出打印. 上课内容 字符编码 概念 编码是计算机用来将人类可读的字符存储成二进制信息而使用的一种格式.字符编码主要针对字符的编码. python中相关的方法 decode:解码,将其他格式的数据转化为unicode格式的数据.转化以后就是Bytes类型的数据.Bytes的数据汉字会转化成字节码,而ascii码会转化成b'meg'的形式.可以接参数,接的参数就

python基础之数字、字符串、列表、元组、字典

第二天Python基础二: 1.运算符: 判断某个东西是否在某个东西里面包含: in  为真 not in  为假 (1).算术运算符: 运算符 描述 实例 + 加  表示两个对象相加 a + b输出结果30 - 减  表示一个数减去另一个数 a - b输出结果-10 * 乘  两个数相乘或是返回一个被重复若干次的字符串 a * b输出结果200 / 除  两个数相除 b / a 输出结果2 ** 幂  返回一个数的n次幂 3 ** 3 输出结果27 % 取余  返回除法的余数 b % a 输出

02python发展史;python;硬盘区别;cd;字符编码;

Python介绍 发展史python2,3默认编码 python 2 vs 3 硬盘区别Windows cd 应用环境变量字符编码模块初识 回顶部 1 发展史 被解救的姜戈 2.4 50万行 Python 2.6 - October 1, 2008 Python 2.6.1 - October 1, 2008 Python 2.6.6 - October 1, 2008 Python 3.0 - December 3, 2008 Python 2.7 - July 3, 2010 #目前业内主流

Python不归路_字符编码操作

文件操作补充 上篇随笔中写了文件操作的几个方法,其中truncate()方法遗漏,truncate()方法作用是截取内容,f.truncate()不带参数会清空文件内容,带参数表示截取从零到参数的位置 字符编码 在<Python不归路_零基础学习二>中我们已经学习了一些编码的知识,比如ASCII一共有255个符号,Unicode中,中文字符占两个字节,英文占一个字节,utf-8是unicode的优化方案,中文字节占三个字符.不同字符编码之间需要相互转化才能正常读取.encode和decode,