# set 数据结构
# `set`(集合)数据结构
`set`(集合)是一个非常有用的数据结构。它与列表(`list`)的行为类似,区别在于`set`不能包含重复的值。
这在很多情况下非常有用。例如你可能想检查列表中是否包含重复的元素,你有两个选择,第一个需要使用`for`循环,就像这样:
~~~
some_list = ['a', 'b', 'c', 'b', 'd', 'm', 'n', 'n']
duplicates = []
for value in some_list:
if some_list.count(value) > 1:
if value not in duplicates:
duplicates.append(value)
print(duplicates)
### 输出: ['b', 'n']
~~~
但还有一种更简单更优雅的解决方案,那就是使用`集合(sets)`,你直接这样做:
~~~
some_list = ['a', 'b', 'c', 'b', 'd', 'm', 'n', 'n']
duplicates = set([x for x in some_list if some_list.count(x) > 1])
print(duplicates)
### 输出: set(['b', 'n'])
~~~
集合还有一些其它方法,下面我们介绍其中一部分。
### 交集
你可以对比两个集合的交集(两个集合中都有的数据),如下:
~~~
valid = set(['yellow', 'red', 'blue', 'green', 'black'])
input_set = set(['red', 'brown'])
print(input_set.intersection(valid))
### 输出: set(['red'])
~~~
### 差集
你可以用差集(difference)找出无效的数据,相当于用一个集合减去另一个集合的数据,例如:
~~~
valid = set(['yellow', 'red', 'blue', 'green', 'black'])
input_set = set(['red', 'brown'])
print(input_set.difference(valid))
### 输出: set(['brown'])
~~~
你也可以用符号来创建集合,如:
~~~
a_set = {'red', 'blue', 'green'}
print(type(a_set))
### 输出: <type 'set'>
~~~
集合还有一些其它方法,我会建议访问官方文档并做个快速阅读。
- 简介
- 序
- 译后感
- 原作者前言
- *args 和 **kwargs
- *args 的用法
- **kwargs 的用法
- 使用 *args 和 **kwargs 来调用函数
- 啥时候使用它们
- 调试 Debugging
- 生成器 Generators
- 可迭代对象(Iterable)
- 迭代器(Iterator)
- 迭代(Iteration)
- 生成器(Generators)
- Map和Filter
- Map
- Filter
- set 数据结构
- 三元运算符
- 装饰器
- 一切皆对象
- 在函数中定义函数
- 从函数中返回函数
- 将函数作为参数传给另一个函数
- 你的第一个装饰器
- 使用场景
- 授权
- 日志
- 带参数的装饰器
- 在函数中嵌入装饰器
- 装饰器类
- Global和Return
- 多个return值
- 对象变动 Mutation
- slots魔法
- 虚拟环境
- 容器 Collections
- 枚举 Enumerate
- 对象自省
- dir
- type和id
- inspect模块
- 推导式 Comprehension
- 列表推导式
- 字典推导式
- 集合推导式
- 异常
- 处理多个异常
- finally从句
- try/else从句
- lambda表达式
- 一行式
- For - Else
- else语句
- open函数
- 目标Python2+3
- 协程
- 函数缓存
- Python 3.2+
- Python 2+
- 上下文管理器
- 基于类的实现
- 处理异常
- 基于生成器的实现