Python爬虫、数据分析与可视化:工具详解与案例实战
上QQ阅读APP看书,第一时间看更新

2.3.1 创建和使用集合

我们可以通过大括号或set()方法来创建集合,不过要创建一个空的集合时必须用set()而不是大括号的形式,因为在Python语言里{}是用来创建一个空字典(dict)的。在如下的SetDemo.py代码里,我们将演示创建和使用集合的常见方法。


01 empIDs = {101, 103, 99, 104, 99, 101}
02 print(empIDs) # {104, 99, 101, 103}
03 empIDs.add(102)
04 print(empIDs) # {99, 101, 102, 103, 104}
05 empIDs.add(99)
06 print(empIDs) # {99, 101, 102, 103, 104}
07 # empID.remove(1000)# error
08 empIDs.remove(101)
09 print(empIDs) # {99, 102, 103, 104}
10 empIDs.discard(1000)
11 empIDs.clear()
12 print(empIDs) # set()
13 print(len(empIDs)) # 0

在第1行里,我们以大括号的方式定义了名为empIDs的集合,其中有重复数据。当我们通过第2行打印该集合时会发现重复数据被去掉了。

在第3行里,我们通过add方法向集合中添加元素,由于被添加的元素102不存在于集合,因此可以被添加。像第5行那样添加已存在的元素,虽然不会报异常,但是该元素不会被添加到集合中。同时,也可以通过第7行和第8行的remove方法删除集合中的元素。注意,像第7行那样被删除的元素不存在时会报异常,而像第8行那样删除存在的元素则不会报异常。

为了让删除时在任何情况下都不报异常,可以像第10行那样使用discard方法。如果要清空集合,则可以如第11行那样调用clear方法。清空后,第12行的打印语句会输出一个空集合,第13行通过len计算该集合长度时会返回0。