IDE的编码方式要与解释器的编码方式保持一致
编码、文字与二进制的对照表
ASCII
ascii编码表中共有256个对应关系,每个对应关系用8个二进制位表示,是最开始的编码,只照顾了美国。
GB-2312和GBK
GB-2312编码是1980年国家信息委员会创建的,建立了汉字与二进制的编码对应关系。
GBK编码是GB-2312的扩展,1995年创建,建立了包含中日韩等文字与二进制的编码对应关系。
unicode(万国码)
ucs2是用固定的两个字节表示字符与二进制的编码对应关系
ucs4是用固定的四个字节表示字符与二进制的编码对应关系,缺点是浪费空间和流量
utf-8
对Unicode进行压缩,用尽可能少的字节表示数据,是国际通用的编码
python中的编码注意事项
python开发中尽量使用utf-8编码,在utf-8编码中,一个汉字用3个字节表示,也有可能用到GBK编码,其他的很少见。
在python的开发中,使用文件存储或网络传输时,不能直接用字符串,需要将字符串压缩为utf-8形式的字节类型后再进行存储和传输。
1 | name = "张三" |
给某个值取个名称,格式:变量名=值
1 | age=23 |
变量名命名的规范
变量名命名的建议
单行注释:#
批量注释:CTRL+?
多行注释:三对双引号
二进制以0b
开头、八进制以0o
开头、十六进制以0x
开头,都是字符串形式
二进制、八进制、十进制和十六进制可以相互转换,比如:
十进制数123转换为其他进制:
bin(123)
oct(123)
hex(123)
其他进制转换为十进制数:
int("ob010110",base=2)
int("0o234573",base=8)
int("0x237ed3",base=16)
算术运算符:加+
减-
乘*
除/
取余%
比较运算符:大于>
小于<
大于等于>=
小于等于<=
等于=
不等于!=
赋值运算符:等于=
算数运算符和等号=
可以简写,比如num+=1
、num*=2
等
成员运算:in
用来判断一个字符串中是否含有一个子串,相反地,用not in
来判断一个字符串中是否不含有一个子串,判断结果是一个布尔值,比如
1 | commet = "好多人都阳性了" |
逻辑运算:逻辑与and
逻辑或or
,一般用于多个条件之间。
and
连接的条件都为真时结果才为真,用or
连接的条件只要有一个为真,结果就为真。and
/or
值时,需要分析结果取决于第几个值,6 and 9 #9
6 or 9 #6
0 and 1 #0
0 or 1 #1
88 and 0 #0
"" and 3 #""
"张三" and "李四" #李四
当表达式中含有多个and
和or
时,先分析and
再分析or
1 | if 条件/真假 : |
1 | if 条件A : |
1 | if 条件A : |
1 | 语句 |
break语句可以终止循环,用于循环内部
continue语句可以跳出本次循环,进入下一次循环的判断
打开文件用的是open()
函数
1 | open(文件路径, mode="打开模式", encoding="编码方式") |
1 | # 不预先指定编码的方式 |
1 | # 预先指定编码的方式(推荐) |
1 | f = open("test.txt",mode="w", encoding="utf-8") #打开文件 |
在编写文件操作相关的代码时,可能会出现忘记关闭文件,使用with
上下文可以解决这个问题,比如:
1 | #开始 |