勤劳的程序员们,这里有 30 条使用 Python 时实用的建议和小技巧。你可以把读这篇文章当做工作间隙的小憩,而且我保证你学到的东西会跟工作时一样多。
如果你关注 Python 的话,应该会知道 Python 2 已经于今年(2020 年)1 月 1 日正式弃用了。这份教程的很多例子都是只支持 Python 3 的,如果你还在用 Python 2.1,那也是时候与时俱进了。你可以在代码中先检查一下你的 Python 版本,以免当前用户的 Python 版本与你的脚本不适配。实现的代码很简单:![](https://image.jiqizhixin.com/uploads/editor/9d268ad0-4ea5-4cc4-af4f-6276d75a77b8/640.png)
![](https://image.jiqizhixin.com/uploads/editor/135127a0-bf1d-491c-9777-f641cd29edd9/640.jpeg)
IPython 其实就是升级版的 shell,单单是自带的自动补全功能就值得你使用它了。不过它的优势不止这些,它那些如魔法般的内置命令行也让是我爱使用它的原因。这些命令有:%cd—修改当前工作路径
%edit—打开编辑器,并在关闭时执行你刚刚输入的代码
%env—显示当前环境变量
%pip install [pkgs]—在不离开 Shell 的情况下安装包
%time and %timeit—为 Python 代码计时
https://ipython.readthedocs.io/en/stable/interactive/magics.html。还有一个有用的功能就是调取之前的命令输出,这里的输入和输出其实都是对象。例如,你可以用 Out[3] 来调取第三条命令的输出。pip3 install ipython
有了列表表达式,你就不再需要用 for loop 来生成一个 list 了。其基本语法是这样的:[ expression for item in list if conditional ]
这就是一个生成包含一串数字的 list 的简单例子。![](https://image.jiqizhixin.com/uploads/editor/5714aae2-ca19-4966-ba49-8c365e2b5017/640.png)
在这条命令里还可以使用表达式(expression),所以也可以做一些数学运算:![](https://image.jiqizhixin.com/uploads/editor/e9daa125-6241-4312-9e4b-65c9c73eda98/640.png)
![](https://image.jiqizhixin.com/uploads/editor/ec5bc52c-716a-41b4-b067-61a503003952/640.png)
最后,你也可以在生成 list 时用 if 语句进行筛选。下面这个例子中,我们只保留了能被 2 整除的值:![](https://image.jiqizhixin.com/uploads/editor/a1e515e9-3645-4b8b-81f6-536487ffd7a8/640.png)
你可以使用 sys.getsizeof() 来查看你创建的对象占用的内存大小:![](https://image.jiqizhixin.com/uploads/editor/9219446e-79e2-4b4f-bce9-a9e8103c1aaa/640.png)
哇,等一下,为什么这么大的 list 只有 48 字节?这是因为 range 函数只返回了一个类似 list 的类。由此可见,相较于直接使用 list,使用 range 能节省很多空间:![](https://image.jiqizhixin.com/uploads/editor/f68d4246-4e65-426f-89da-83bc713af647/640.png)
Python 的函数可以同时返回多个值,也并不需要使用 dictionary,list 或是类这样的数据结构。它的工作机制是这样的![](https://image.jiqizhixin.com/uploads/editor/9331d9fd-82d4-4178-bbff-918b1db338d5/640.png)
这种方式在返回值的数量很少时是可以的,但是如果返回值超过 3 个,那它们就该被放到一个(数据)类中了。
Python 从 3.7 开始提供数据类功能。这种功能与常规的类以及其他类似的功能(返回多个值的函数以及 dictionary)相比较,有以下优势:数据类型有最低代码量要求
因为数据类已经自带了__eq__功能,故而你可以直接进行数据类的对比
数据类自带__repr__,你也可以直接在 debug 时打印出一个数据类
数据类型需要你输入提示,这样 bug 量会大大减少
![](https://image.jiqizhixin.com/uploads/editor/aaedde4a-0518-4df2-b10e-db85718f45a2/640.png)
想更深入的了解数据类,可以参考:https://realpython.com/python-data-classes/![](https://image.jiqizhixin.com/uploads/editor/dc3016c4-5c94-4dbe-82ad-ee2b9165ae75/640.png)
9. 合并 dictionary(Python 3.5+)从 Python 3.5 开始,dictionary 的合并变得更容易了:![](https://image.jiqizhixin.com/uploads/editor/b5c622f0-facf-46eb-b8d1-ea4b4a58a6bc/640.png)
如果有重复的 key,那么第一个词典的这个 key 对应的值会被覆盖掉。![](https://image.jiqizhixin.com/uploads/editor/464a258a-7ce1-40de-898a-be9a24124587/640.png)
你可以把一个字符串分割成一个 list 的字符串。下面的例子中,我们是按照空格分割字符串的:![](https://image.jiqizhixin.com/uploads/editor/55db3956-8c20-4d06-93f0-3a129e791bfe/640.png)
把上一个小技巧反过来,我们也可以把一个 list 变成一个字符串,并在每个词中间插入空格:![](https://image.jiqizhixin.com/uploads/editor/63f7eb19-a23e-473c-b457-d7e22eef358d/640.png)
mylist.join(" ")
好问题!
这是因为 String.join() 可以连接任何可迭代对象,不只是列表。在 String 中用这个函数可以防止这些操作发生在我们不想他发生的地方。![](https://image.jiqizhixin.com/uploads/editor/43c2d147-7ebf-4511-957e-1ddd3d966bbb/640.jpeg)
这个功能有些人喜欢,有些人则很抗拒,因人而异。严格来说,这个功能主要好处就是在分析社交数据时可以更加方便。pip3 install emoji
![](https://image.jiqizhixin.com/uploads/editor/c22af23d-6cb3-4e15-aa5b-8d7918acccb6/640.png)
想要更深入的了解 emoji 模块,可以参考:https://pypi.org/project/emoji/。a[start:stop:step]
Start, Stop 和 Step 都是可选参数。如果你没有定义,它们就会按照如下规则分配默认值:start = 0
end = 方括号里面字符串的最后一个字符
step = 1
![](https://image.jiqizhixin.com/uploads/editor/a8687616-0b87-4b0c-be4e-daa1564f7c5c/640.png)
你可以用刚刚提到的切片操作来翻转字符串和 list。把 step 设置成-1,就成完成翻转操作:![](https://image.jiqizhixin.com/uploads/editor/fe9adcee-44c7-4f14-a240-327876017d57/640.png)
我终于还是发现了一个可以在我文章中提到小猫的机会!当然,你也可能是用这个功能来展示其他的图。首先,你要安装 Pillow,这是 Python Image 库的一个分支:pip3 install Pillow
现在把这个图像下载下来并命名为 kittens.jpg:![](https://image.jiqizhixin.com/uploads/editor/d6454954-5520-4ab3-9067-be9b76510832/640.jpeg)
图源:Pixabay 的 TheDigitalArtist![](https://image.jiqizhixin.com/uploads/editor/4ab0da35-5ee0-4e68-8560-b5f03d35cfee/640.png)
![](https://image.jiqizhixin.com/uploads/editor/ffe5b219-5636-42a4-9f88-50e83b0a4227/640.gif)
Pillow 能做的可不止这些。它可以对图片进行分析、裁剪、过滤、增强、变形等等。如果想要更深入的了解,可以去看一下它的文档:https://pillow.readthedocs.io/en/stable/Python 的内置函数之一就是 map()。map() 的语法如下:所以你可以给它一个函数让其执行,然后还要传给它对应的参数。这个参数可以使任何可迭代对象。下面的例子里我用了 list:![](https://image.jiqizhixin.com/uploads/editor/e941438c-506a-4285-9fbc-769ef6464f41/640.png)
快去看看你的代码,是不是有的地方可以用 map() 而不是 loop!18. 从 list 或是 string 中获取 unique 元素你可以用 set() 来获取 list 或是类似于 list 的对象的 unique 元素,结果返回为一个 set。![](https://image.jiqizhixin.com/uploads/editor/a9367779-fb85-4e95-8611-57b0181e5db7/640.png)
max() 会返回 list 中的最高值。而 key 可以利用一个输入(如本例中的 test.count)来确定你要排序的方式。这个函数会应用于前面可迭代对象的每一项。
test.count 是 list 的内置函数。我们给它一个输入,它会统计那个输入的出现次数。test.count(1) 就会返回 2,test.count(4) 就会返回 4。
set(test) 会返回 unique 值,也就是 {1, 2, 3, 4}
所以这一行代码所做的事就是先找到所有的 unique 值({1, 2, 3, 4}),然后 max 就会对这四个值分别进行 list.count 操作,并返回最大值。你可以创建你自己的进度条,也是很有意思的。但是直接使用 progress 包会快很多:pip3 install progress
![](https://image.jiqizhixin.com/uploads/editor/5a3ca411-f7b3-416f-9bcc-34562900487c/640.png)
![](https://image.jiqizhixin.com/uploads/editor/442a9028-38b1-49bd-b67c-e69b9032feda/640.gif)
图源:Giotgos Verigakis, https://pypi.org/project/progress/你可以用下划线来获得上一条命令的输入,在 IPython 中是这样的:In [1]: 3 * 3
Out[1]: 9In [2]: _ + 3
Out[2]: 12
Python shell 中这条命令也可以用。IPython shell 中你也可以用 Out[n] 来获得 In[n] 的输出。比如说,在上面的例子中,Out[1] 就会返回 9。你可以快速创建一个网页服务器,并将当前的路径作为内容:python3 -m http.server
如果你想跟你的同事分享一些东西,或者测试一些简单的 HTML 网站,那这条命令就很有用了。尽管你可以在代码中用三重引号(“ “ “ ” ” ”)来存储多行字符串,但这并不是理想的方法。你在三重引号间的所有内容都变成了字符串,如下图所示,连格式符都变成了字符串。我比较倾向于使用第二种方式。这种方式可以把很多行合并到一起,同时你的代码格式也会很好。这个方法唯一的缺点就是你要明确定义换行的位置。![](https://image.jiqizhixin.com/uploads/editor/a14a735f-3be9-4399-94e8-a7a92df08241/640.png)
这是那些让你代码在保证可读性的情况下更简洁的方法之一:[on_true] if [expression] else [on_false]
实例如下:
x = "Success!" if (y == 2) else "Failed!"
你可以使用 collection 库来获得 list 中各个 unique 值的计数,并返回成一个 dictionary:![](https://image.jiqizhixin.com/uploads/editor/e0b81f4e-f54c-419c-8ee6-3bb960763bc8/640.png)
26. 比较符链(chaining of comparison operators)Python 里,你可以把比较符连接成一条链,这样代码会更有可读性,而且更简洁。![](https://image.jiqizhixin.com/uploads/editor/4c6a560b-8e70-4e11-b1dd-791da8ffd72c/640.png)
![](https://image.jiqizhixin.com/uploads/editor/1839e258-85d7-40ca-ba76-5723090f430f/640.png)
Colorama 中 Jonathan Hartley 的截屏使用 Colorama,你可以在你的终端上添加点颜色。![](https://image.jiqizhixin.com/uploads/editor/a97a8ab6-cace-4b5d-981d-b28704c2460d/640.png)
python-dateutil 模块对标准的 datatime 模块做了很大的扩充。先下载一下这个模块:pip3 install python-dateutil
你可以用这个库做很多很酷的事情。我只会给你们介绍我发现的很有用的一个例子:日志文件中日期的模糊解析等。![](https://image.jiqizhixin.com/uploads/editor/e7e99e1e-a1f4-4df4-8f3c-32ff19a1c001/640.png)
记住一点:基本的 Python 日期函数对一些问题束手无策的时候,这时 python-deteutil 就能发挥作用。![](https://image.jiqizhixin.com/uploads/editor/3873f2e3-e633-48a9-9156-f17c27d572df/640.jpeg)
Python 2 中,除号(/)默认为整除,除非其中一个被操作数是浮点数。所以你会得到这样的结果:# Python 2
5 / 2 = 2
5 / 2.0 = 2.5
在 Python 3 中,除号的结果默认为浮点数,而//则成为了整除的符号,所以这个时候结果变成了:
Python 3
5 / 2 = 2.5
5 // 2 = 2
如果想要深入了解这一改变,请参考:https://www.python.org/dev/peps/pep-0238/。
30. 使用 chardet 检测 Charset你可以使用 chardet 模块来检测一个文件的 charset。当你在分析大量的文本时,这个模块就会变得很有用。你可以用下面这条命令下载它:pip install chardet
你现在会有一个命令行工具——chardetect,这个工具的使用方式是:chardetect somefile.txt
somefile.txt: ascii with confidence 1.0
https://chardet.readthedocs.io/en/latest/usage.htmlhttps://towardsdatascience.com/30-python-best-practices-tips-and-tricks-caefb9f8c5f5✄------------------------------------------------加入机器之心(全职记者 / 实习生):hr@jiqizhixin.com投稿或寻求报道:content@jiqizhixin.com广告 & 商务合作:bd@jiqizhixin.com