IDE的编码方式要与解释器的编码方式保持一致
编码、文字与二进制的对照表
ASCII
ascii编码表中共有256个对应关系,每个对应关系用8个二进制位表示,是最开始的编码,只照顾了美国。
GB-2312和GBK
GB-2312编码是1980年国家信息委员会创建的,建立了汉字与二进制的编码对应关系。
GBK编码是GB-2312的扩展,1995年创建,建立了包含中日韩等文字与二进制的编码对应关系。
unicode(万国码)
ucs2是用固定的两个字节表示字符与二进制的编码对应关系
ucs4是用固定的四个字节表示字符与二进制的编码对应关系,缺点是浪费空间和流量
utf-8
对Unicode进行压缩,用尽可能少的字节表示数据,是国际通用的编码
python中的编码注意事项
python开发中尽量使用utf-8编码,在utf-8编码中,一个汉字用3个字节表示,也有可能用到GBK编码,其他的很少见。
在python的开发中,使用文件存储或网络传输时,不能直接用字符串,需要将字符串压缩为utf-8形式的字节类型后再进行存储和传输。
1 | name = "张三" |
给某个值取个名称,格式:变量名=值
1 | age=23 |
变量名命名的规范
变量名命名的建议
单行注释:#
批量注释:CTRL+?
多行注释:三对双引号
二进制以0b开头、八进制以0o开头、十六进制以0x开头,都是字符串形式
二进制、八进制、十进制和十六进制可以相互转换,比如:
十进制数123转换为其他进制:
bin(123)oct(123)hex(123)其他进制转换为十进制数:
int("ob010110",base=2)int("0o234573",base=8)int("0x237ed3",base=16)算术运算符:加+ 减- 乘* 除/ 取余%
比较运算符:大于> 小于< 大于等于>= 小于等于<= 等于= 不等于!=
赋值运算符:等于= 算数运算符和等号=可以简写,比如num+=1、num*=2等
成员运算:in用来判断一个字符串中是否含有一个子串,相反地,用not in来判断一个字符串中是否不含有一个子串,判断结果是一个布尔值,比如
1 | commet = "好多人都阳性了" |
逻辑运算:逻辑与and 逻辑或or,一般用于多个条件之间。
and连接的条件都为真时结果才为真,用or连接的条件只要有一个为真,结果就为真。and/or值时,需要分析结果取决于第几个值,6 and 9 #9 6 or 9 #6 0 and 1 #0 0 or 1 #1 88 and 0 #0 "" and 3 #"" "张三" and "李四" #李四 当表达式中含有多个and和or时,先分析and再分析or1 | if 条件/真假 : |
1 | if 条件A : |
1 | if 条件A : |
1 | 语句 |
break语句可以终止循环,用于循环内部
continue语句可以跳出本次循环,进入下一次循环的判断
打开文件用的是open()函数
1 | open(文件路径, mode="打开模式", encoding="编码方式") |
1 | # 不预先指定编码的方式 |
1 | # 预先指定编码的方式(推荐) |
1 | f = open("test.txt",mode="w", encoding="utf-8") #打开文件 |
在编写文件操作相关的代码时,可能会出现忘记关闭文件,使用with上下文可以解决这个问题,比如:
1 | #开始 |