数据容器

更新时间: 2024-03-14 22:16:08

# 数据容器

一种可以容纳多份数据的数据类型，容纳的每一份数据称之为一个元素，每一个元素，可以是任意类型的数据，如字符串、数字、布尔等

数据容器根据特点的不同，如：

是否支持重复元素
是否可以修改
是否有序，等

分为5类：
列表（list）、元祖（tuple）、字符串（str）、集合（set）、字典（dict）

# list列表

# 定义

# 字面量
[元素1, 元素2, 元素3, 元素4,...]

# 定义变量
变量名称 = [元素1, 元素2, 元素3, 元素4,...]

# 定义空列表
变量名称 = []
变量名称 = list()

1
2
3
4
5
6
7
8
9

list可以嵌套，可以存储任何类型的元素

name_list = ['itheima',666,'python',[1,2,3],[4,5,6]]
print(name_list)
print(type(name_list))

1
2
3

# 下标索引

索引从0开始

name_list = ['itheima',666,'python',[1,2,3],[4,5,6]]
print(name_list[0]) # itheim
print(name_list[1]) # 666
print(name_list[2]) # python
print(name_list[3]) # [1,2,3]
print(name_list[4]) # [4,5,6]
print(name_list[3][0]) # 1

1
2
3
4
5
6
7

或者，可以反向所以，也就是从后向前：从-1开始，依次递减(-1, -2, -3....)

name_list = ['itheima',666,'python',[1,2,3],[4,5,6]]
print(name_list[-1]) # [4,5,6]
print(name_list[-2]) # [1,2,3]
print(name_list[-3]) # python
print(name_list[-4]) # 666
print(name_list[-5]) # itheima
print(name_list[-1][-1]) # 6

1
2
3
4
5
6
7

警告

通过下标索引取数据，一定不要超出范围

# 列表的常用操作（方法）

Python中，如果将函数定义为class(类)的成员，那么函数会称之为方法

# 查找某元素的下标

功能：查找指定元素在列表的下标，如果找不到，报错ValueError 语法：列表.index(元素)

name_list = ['itheima',666,'python',[1,2,3],[4,5,6]]
index = name_list.index(666)
print(index) # 1

1
2
3

# 列表的修改方法

修改特定位置（索引）的元素值语法：列表[下标] = 值

name_list = ['itheima',666,'python',[1,2,3],[4,5,6]]
name_list[1] = 123
print(name_list) # ['itheima',123,'python',[1,2,3],[4,5,6]]

1
2
3

插入元素语法：列表.insert(下标，元素),在指定的下标位置，插入指定的元素

my_list = [1,2,3]
my_list.insert(1,'heima')
print(my_list) # [1, 'heima', 2, 3]

1
2
3

追加元素列表.append(元素)，将指定元素，追加到列表的尾部

my_list = [1,2,3]
my_list.append('heima')
print(my_list) # [1, 2, 3, 'heima']

1
2
3

列表.extend(其他数据容器)，将其他数据容器的内容取出，依次追加到列表尾部

my_list = [1,2,3]
my_list.extend(['heima','chengxu','yuan'])
print(my_list) # [1, 2, 3, 'heima', 'chengxu', 'yuan']

1
2
3

删除元素

del 列表[下标]
列表.pop(下标) 这个方法有返回值，返回被删除元素

my_list = [1,2,3]
del my_list[1]
print(my_list) # [1,3]

1
2
3

my_list = [1,2,3]
element = my_list.pop(1)
print(my_list) # [1,3]
print(f"被删除的元素是{element}")

1
2
3
4

删除某元素在列表中的第一个匹配项
列表.remove(元素)

my_list = [1,2,3,2,3]
my_list.remove(2)
print(my_list) # [1, 3, 2, 3]

1
2
3

清空列表
列表.clear()

my_list = [1,2,3,2,3]
my_list.clear()
print(my_list) # []

1
2
3

# 统计某元素在列表中的数量

列表.count(元素)

my_list = [1,2,3,2,3]
num = my_list.count(2)
print(num) # 2

1
2
3

# 统计列表内，有多少元素

len(列表)
可以得到一个int数字，表示列表中的元素数量

my_list = [1,2,3,2,3]
num = len(my_list)
print(num) # 5

1
2
3

# list的遍历

# while循环遍历

my_list = ['a', 'b', 'c']
index = 0
while index < len(my_list):
    print(my_list[index])
    index += 1

1
2
3
4
5

# for循环

my_list = ['a', 'b', 'c']
for x in my_list:
    print(x)

1
2
3

# 元祖

# 格式

元组同列表一样，都是可以封装多个、不同类型的元素在内。

但最大的不同点在于：

元组一旦定义完成，就不可以修改

元祖定义：
定义元组使用小括号，且使用逗号隔开各个数据，数据可以是不同的数据类型

# 定义元组的字面量
(元素，元素，...，元素)
# 定义元组变量
变量名称 = (元素，元素，...，元素)
# 定义空元组
变量名称 = () 
变量名称 = tuple()

1
2
3
4
5
6
7

t1 = ('a', 1, True)
print(t1) # ('a', 1, True)
print(type(t1)) # <class 'tuple'>

1
2
3

注意

如果元组只有一个数据，这个数据后面要添加逗号

t1 = ('a',)

# 元组的相关操作

编号	方法	作用
1	index()	查找某个数据，如果数据存在返回对应的下标，否则报警
2	count()	统计某个数据在当前元组出现的次数
3	len(元组)	统计元组内的元素个数

# while循环

t1 = (1,2,3,4,5,6)

index = 0
while index < len(t1):
    print(f"元组的元素有：{t1[index]}")
    index += 1

1
2
3
4
5
6

# for循环

t1 = (1,2,3,4,5,6)

for element in t1:
    print(f"元组的元素有：{element}")

1
2
3
4

# 数据容器 str(字符串)

字符串是字符的容器，一个字符串可以存放任意数量的字符

# 字符串的下标(索引)

从前向后，下标从[0]开始
从后向前，下标从[-1]开始

警告

同元组一样，字符串是一个: 无法修改的数据容器。所以：

修改指定下标的字符
移除特定下标的字符
追加字符等

均无法完成。如果必须要做，只能得到一个新字符串，老的字符串无法修改

# 字符串的常用操作

查找特定字符串的下标索引值字符串.index(字符串)

  my_str = "itheima and itcast"

  print(my_str.index("and")) # 8

1
2
3

字符串的替换
语法：字符串.replace(字符串1, 字符串2)
功能: 将字符串内的全部：字符串1，替换为字符串2
注意：不是修改字符串本身，而是得到了一个新字符串哦
```
my_str = "itheima and itcast"

print(my_str.replace("and","not")) 
#  "itheima not itcast"
print(my_str)
#  "itheima and itcast"
```
1
2
3
4
5
6
字符串的分割语法：字符串.split(分隔符字符串)
功能：按照指定的分隔符字符串，将字符串划分为多个字符串，并存入列表对象中
注意：字符串本身不变，而是得到了一个列表对象
```
my_str = "itheima and itcast"
print(my_str.split(" "))
# ['itheima', 'and', 'itcast']
```
1
2
3

字符串的规整操作（去前后空格）
语法：字符串.strip()

  my_str = "     itheima and itcast   "
  print(my_str.strip())
  # itheima and itcast

1
2
3

字符串的规整操作（去前后指定字符串）
语法：字符串.strip(字符串)
```
my_str = "12itheima and itcast21"
print(my_str.strip("12"))
# itheima and itcast
```
1
2
3
注意

注意，传入的是"12"，其实就是“1”和“2”都会移除，是按照单个字符串
统计字符串中某字符出现次数

my_str = "12itheima and itcast21"
print(my_str.count("a"))
# a

1
2
3

统计字符串的长度

my_str = "12itheima and itcast21"
print(len(my_str)) # 22

1
2

# 数据容器(序列)的切片

# 序列

序列是指：内容连续、有序，可以使用下标索引的一类数据容器

列表，元组，字符串，均可以视为序列

# 序列常用操作 - 切片

序列支持切片，即：列表、元组、字符串均支持进行切片操作

切片：从一个序列中，取出一个子序列

语法：序列[起始下标:结束下标:步长]
表示从序列中，从指定位置开始，依次取出元素，到指定位置结束，得到一个新序列：

起始下标表示从何处开始，可以留空，留空视作从头开始
结束下标（不含）表示何处结束，可以留空，留空视作截取到结尾
步长表示，依次取元素的间隔
- 步长1表示，一个个取元素
- 步长2表示，每次跳过1个元素取
- 步长N表示，每次跳过N-1个元素取
- 步长为负数表示，反向取（注意，起始下班和结束下标也要反向标记）

此操作不会影响序列本身，而是会得到一个新的序列

# 对list进行切片，从1开始，4结束，步长1
my_list = [0, 1, 2, 3, 4, 5, 6]
result1 = my_list[1:4]
print(f"结果1：{result1}") # 结果1：[1, 2, 3]

# 对tuple进行切片，从头开始，到最后结束，步长1
my_tuple = (0, 1, 2, 3, 4, 5, 6)
result2 = my_tuple[::]
print(f"结果2：{result2}")
# 结果2：(0, 1, 2, 3, 4, 5, 6)

# 对str进行切片，从头开始，到最后结束，步长2
my_str = "01234567"
result3 = my_str[::2]
print(f"结果3：{result3}") # 结果3：0246

# 对str进行切片，从头开始，到最后结束，步长-1
my_str = "01234567"
result4 = my_str[::-1]
print(f"结果4：{result4}")  # 结果4：76543210

# 对列表进行切片，从3开始，到1结束，步长-1
my_list1 = [0, 1, 2, 3, 4, 5, 6]
result5 = my_list1[3:1:-1]
print(f"结果5{result5}") # 结果5[3, 2]

# 对元组进行切片，从头开始，到尾结束，步长-2
my_tuple1 = (0, 1, 2, 3, 4, 5, 6)
result6 = my_tuple[::-2]
print(f"结果6：{result6}")
# 结果6：(6, 4, 2, 0)

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31

# 数据容器：set(集合)

如果场景需要对内容做去重处理，列表、元组、字符串就不方便了。

而集合，最主要的特点就是不支持重复的元素，并且它的内部是无序的

# 集合的定义

基本语法：

# 定义集合字面量
{元素, 元素,...,元素}

# 定义集合变量
变量名称 = {元素, 元素,...,元素}

# 定义空集合
变量名称 = set()

1
2
3
4
5
6
7
8

# 定义集合
my_set = {"传智教育", "黑马程序员", "itheima","传智教育", "黑马程序员", "itheima","传智教育", "黑马程序员", "itheima"}
my_set_empty = set()
# 集合不允许重复，顺序也无法保证
print(f"my_set的内容是：{my_set},类型是:{type(my_set)}")
# my_set的内容是：{'黑马程序员', 'itheima', '传智教育'},类型是:<class 'set'>

print(f"my_set_empty的内容是：{my_set_empty},类型是：{type(my_set_empty)}")
# my_set_empty的内容是：set(),类型是：<class 'set'>

1
2
3
4
5
6
7
8
9

# 集合的常用操作 - 修改

首先，因为集合是无序的，所以集合不支持：下标索引访问

但是集合和列表一样，是允许修改的，所以我们来看看集合的修改方法。

# 添加新元素

语法：集合.add(元素)

my_set = {"hello", "world"}
my_set.add("Python")
my_set.add("hello")
print(my_set) # {'Python', 'world', 'hello'}

1
2
3
4

# 移除元素

语法：集合.remove(元素)

my_set = {"hello", "world","itheima"}
my_set.remove("hello")
print(my_set) # {'itheima', 'world'}

1
2
3

# 从集合中随机取出元素

语法：集合.pop(),从集合中随机取出一个元素
结果：会得到一个元素的结果，同时集合本身被修改，元素被移除

my_set = {"hello", "world","itheima"}
item = my_set.pop()
print(item) # itheima
print(my_set) # {'hello', 'world'}

1
2
3
4

# 清空集合

集合.clear()

# 取出2个集合的差集

语法：集合1.difference(集合2),功能：取出集合1和集合2的差集(集合1有而集合2没有的)
结果：得到一个新集合，集合1和集合2不变

set1 = {1, 2, 3}
set2 = {1, 5, 6}
set3 = set1.difference(set2)
print(set1) # {1, 2, 3}
print(set2) # {1, 5, 6}
print(set3) # {2, 3}

1
2
3
4
5
6

# 消除2个集合的差集

语法：集合1.difference_update(集合2)
功能：对比集合1和集合2，在集合1内，删除和集合2相同的元素
结果：集合1被修改，集合2不变

set1 = {1, 2, 3}
set2 = {1, 5, 6}
set3 = set1.difference_update(set2)
print(set1) # {2, 3}
print(set2) # {1, 5, 6}
print(set3) # None

1
2
3
4
5
6

# 2个集合合并

语法：集合1.union(集合2)
功能：将集合1和集合2组合成新集合
结果：得到新集合，集合1和集合2不变

set1 = {1, 2, 3}
set2 = {1, 5, 6}
set3 = set1.union(set2)
print(set1) # {1, 2, 3}
print(set2) # {1, 5, 6}
print(set3) # {1, 2, 3, 5, 6}

1
2
3
4
5
6

# 统计集合元素数量

len(集合)

# 集合的遍历

集合不支持下标索引，不能用while循环

# 可以用for循环
set1 = {1, 2, 3, 4, 5}
for element in set1:
  print(element)

1
2
3
4

# 数据容器：dict(字典、映射)

# 字典的定义

字典的定义，同样使用{}，不过存储的元素是一个个的键值对，如下语法：

# 定义字典字面量
{key:value, key:value,...key:value}
# 定义字典变量
my_dict = {key:value, key:value, ...,key:value}
# 定义空字典
my_dict = {}
my_dict = dict()

1
2
3
4
5
6
7

my_dict = {"王力宏":99, "周杰伦": 88, "林俊杰": 77}
my_dict2 = {}
my_dict3 = dict()

1
2
3

字典的key不可以重复！

# 字典的数据获取

字典同集合一样，不可以使用下标索引
但是字典可以通过key值来取得对应的value

my_dict = {"王力宏":99, "周杰伦": 88, "林俊杰": 77}
print(my_dict['王力宏']) # 99

1
2

# 字典的常用操作

# 新增元素,更新元素

语法：字典[key] = value

my_dict = {"王力宏":99, "周杰伦": 88, "林俊杰": 77}
my_dict['张学友'] = 100
print(my_dict) 
# {'王力宏': 99, '周杰伦': 88, '林俊杰': 77, '张学友': 100}

my_dict['王力宏'] = 60
print(my_dict)
# {'王力宏': 60, '周杰伦': 88, '林俊杰': 77, '张学友': 100}

1
2
3
4
5
6
7
8

# 删除元素

语法：字典.pop(key)
结果：获得指定key的value,同时字典被修改，指定key的数据被删除

my_dict = {"王力宏":99, "周杰伦": 88, "林俊杰": 77}
value = my_dict.pop("王力宏")
print(my_dict) # {'周杰伦': 88, '林俊杰': 77}
print(value) # 99

1
2
3
4

# 清空字典

字典.clear()

# 获取全部的key

语法：字典.keys()
结果：得到字典中的全部key

my_dict = {"王力宏":99, "周杰伦": 88, "林俊杰": 77}
keys = my_dict.keys()
print(keys)
# dict_keys(['王力宏', '周杰伦', '林俊杰'])

1
2
3
4

# 遍历字典

my_dict = {"王力宏":99, "周杰伦": 88, "林俊杰": 77}

# 方式1 通过获取到全部的key来完成遍历
for key in my_dict.keys():
    print(key)
    print(my_dict[key])

# 方式2 直接对字典进行for循环，每一次循环都是直接得到key
for key in my_dict:
    print(key)
    print(my_dict[key])

1
2
3
4
5
6
7
8
9
10
11

上面两种方式都是一样的

# 统计字典的元素数量，len()函数

my_dict = {"王力宏":99, "周杰伦": 88, "林俊杰": 77}
num = len(my_dict)
print(num) # 3

1
2
3

# 数据容器的通用功能

遍历
len(容器) 统计容器的元素个数
max(容器) 统计容器的最大元素
min(容器) 统计容器的最小元素
list(容器) 将给定容器转换为列表
str(容器) 将给定容器转换为字符串
tuple(容器) 将给定容器转换为元组
set(容器) 将给定容器转换为集合

my_list = [1, 2, 3, 4, 5]
my_tuple = (1, 2, 3, 4, 5)
my_str = "abcdefg"
my_set = {1, 2, 3, 4, 5}
my_dict = {"key1": 1, "key2": 2, "key3": 3, "key4": 4, "key5": 5}

# len元素个数
print(len(my_list)) # 5
print(len(my_tuple)) # 5
print(len(my_str)) # 7
print(len(my_set)) # 5
print(len(my_dict)) # 5

# min最大元素
print(max(my_list)) # 5
print(max(my_tuple)) # 5
print(max(my_str)) # g
print(max(my_set)) # 5
print(max(my_dict)) # key5

# max最小元素
print(min(my_list)) # 1
print(min(my_tuple)) # 1
print(min(my_str)) # a
print(min(my_set)) # 1
print(min(my_dict)) # key1

# 容器转列表
print(list(my_list)) # [1, 2, 3, 4, 5]
print(list(my_tuple)) # [1, 2, 3, 4, 5]
print(list(my_str)) # ['a', 'b', 'c', 'd', 'e', 'f', 'g']
print(list(my_set)) # [1, 2, 3, 4, 5]
print(list(my_dict)) # ['key1', 'key2', 'key3', 'key4', 'key5']

# 容器转元组
print(tuple(my_list)) # (1, 2, 3, 4, 5)
print(tuple(my_tuple)) # (1, 2, 3, 4, 5)
print(tuple(my_str)) # ('a', 'b', 'c', 'd', 'e', 'f', 'g')
print(tuple(my_set)) # (1, 2, 3, 4, 5)
print(tuple(my_dict)) # ('key1', 'key2', 'key3', 'key4', 'key5')

# 容器转字符串
print(str(my_list)) # [1, 2, 3, 4, 5]
print(str(my_tuple)) # (1, 2, 3, 4, 5)
print(str(my_str)) # abcdefg
print(str(my_set)) # {1, 2, 3, 4, 5}
print(str(my_dict)) # {'key1': 1, 'key2': 2, 'key3': 3, 'key4': 4, 'key5': 5}

# 容器转集合
print(set(my_list)) # {1, 2, 3, 4, 5}
print(set(my_tuple)) # {1, 2, 3, 4, 5}
print(set(my_str)) # {'d', 'f', 'a', 'b', 'e', 'g', 'c'}
print(set(my_set)) # {1, 2, 3, 4, 5}
print(set(my_dict)) # {'key4', 'key5', 'key3', 'key2', 'key1'}

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54

# 容器通用排序功能

sorted(容器,[reverse = True])
将给定容器进行排序

my_list = [3, 2, 1, 5, 4]
my_tuple = (1, 3, 2, 4, 5)
my_str = "abcedgf"
my_set = {1, 5, 3, 4, 2}
my_dict = {"key3": 1, "key4": 2, "key1": 3, "key2": 4, "key5": 5}

# 进行容器的排序
print(sorted(my_list)) # [1, 2, 3, 4, 5]
print(sorted(my_tuple)) # [1, 2, 3, 4, 5]
print(sorted(my_str)) # ['a', 'b', 'c', 'd', 'e', 'f', 'g']
print(sorted(my_set)) # [1, 2, 3, 4, 5]
print(sorted(my_dict)) # ['key1', 'key2', 'key3', 'key4', 'key5']

print(sorted(my_list, reverse=True)) # [5, 4, 3, 2, 1]
print(sorted(my_tuple, reverse=True)) # [5, 4, 3, 2, 1]
print(sorted(my_str, reverse=True)) # ['g', 'f', 'e', 'd', 'c', 'b', 'a']
print(sorted(my_set, reverse=True)) # [5, 4, 3, 2, 1]
print(sorted(my_dict, reverse=True)) # ['key5', 'key4', 'key3', 'key2', 'key1']

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18

# 列表的sort方法

在前面我们学习过sorted函数，可以对数据容器进行排序。
在后面的数据处理中，我们需要对列表进行排序，并指定排序规则，sorted函数就无法完成了。

我们补充学习列表的sort方法。
使用方式：
列表.sort(key=选择排序依据的函数, reverse=True|False)

参数key,是要求传入一个函数，表示将列表的每一个元素都传入函数中，返回排序的依据
参数reverse，是否反转排序结果，True表示降序，False表示升序

# 带名函数形式

# 如下嵌套列表，要求对外层列表进行排序，排序的依据是内层列表的第二个元素数字
my_list = [["a",33],["b",55],["c",11]]

# 定义排序方法
def choose_sort_key(element):
    return element[1]

my_list.sort(key=choose_sort_key, reverse=True)
print(my_list)
# [['b', 55], ['a', 33], ['c', 11]]

1
2
3
4
5
6
7
8
9
10

# 匿名lambda形式

# 如下嵌套列表，要求对外层列表进行排序，排序的依据是内层列表的第二个元素数字
my_list = [["a",33],["b",55],["c",11]]

my_list.sort(key=lambda element: element[1], reverse=True)
print(my_list)
# [['b', 55], ['a', 33], ['c', 11]]

1
2
3
4
5
6

# 字符串大小比较

# ASCII码表

在程序中，字符串所用的字符都有其对应的ASCII码表值。

没一个字符都能对应上一个：数字的码值，字符串进行比较就是基于数字的码值大小进行比较的。

# 字符串比较

字符串是按位比较，也就是一位位进行对比，只要有一位大，那么整体就大。

← 函数函数进阶 →