一:数据结构和算法介绍
1 数据结构的概念:
数据结构就是一些有关系的数据的集合,有顺序表,链表,栈,队列,树,图等结构。
2 算法的概念
1 算法(Algorithm)是指解题方案的准确而完整的描述,是一系列解决问题的清晰指令,算法代表着用系统的方法描述解决问题的策略机制。2 不同的算法可能用不同的时间、空间或效率来完成同样的任务。一个算法的优劣可以用空间复杂度与时间复杂度来衡量。3 算法是计算机处理信息的本质,因为计算机程序本质上是一个算法来告诉计算机确切的步骤来执行一个指定的任务。当算法在处理信息时,会从输入设备或数据的存储地址读取数据,把结果写入输出设备或某个存储地址供以后再调用。4 算法是独立存在的一种解决问题的方法和思想。5 对于算法而言,实现的语言并不重要,重要的是思想。6 算法有不同的语言实现版本(如C、Java、Python等)
3 算法的特性
1 输入: 算法具有0个或多个输入2 输出: 算法至少有1个或多个输出3 有穷性: 算法在有限的步骤之后会自动结束而不会无限循环,并且每一个步骤可以在可接受的时间内完成4 确定性:算法中的每一步都有确定的含义5 可行性:算法的每一步都是可行的
4 数据结构和算法的应用
1 写出的程序可以更高效2 面对一些复杂问题可能无从下手,数据结构和算法可以锻炼逻辑思维
二:算法引入
1例题
1 如果 a+b+c=1000,且 a²+b²=c²(a,b,c为自然数),如何求出所有a、b、c可能的组合?(不使用数学公式)2 枚举法 a = 0 b = 1 c = 999
代码实现:
import time# a+b+c=1000,且 a²+b²=c²# 程序用时: 554.3157489299774start = time.time()for a in range(1001): # a取完让b去取 for b in range(1001): for c in range(1001): if a + b + c == 1000 and a**2 + b**2 == c**2: print(a,b,c)end = time.time()print('finish')print('程序用时:',(end-start))
优化:代码实现如下
import time# a+b+c=1000,且 a²+b²=c²# 程序用时: 1.7395479679107666# 程序用时: 1.411323070526123start = time.time()for a in range(1001): # a取完让b去取 for b in range(1001 - a): # a,b已经确定了 c = 1000 - a - b if a**2 + b**2 == c**2: print(a,b,c)end = time.time()print('finish')print('程序用时:',(end-start))
三 算法的效率的衡量
1 执行时间反应算法效率
实现算法程序的执行时间可以反应出算法的效率,即算法的优劣。
2 单靠时间值不一定客观准确
1 单纯依靠运行的时间来比较算法的优劣并不一定是客观准确的。2 程序的运行离不开计算机环境(包括硬件和操作系统),这些客观原因会影响程序运行的速度并反应在程序的执行时间上。
3 时间复杂度与”大O 记法“
1 假定计算机执行算法每一个基本操作的时间是固定的一个时间单位,那么有多少个基本操作就代表会花费多少时间单位。2 虽然对于不同的机器环境而言,确切的单位时间是不同的,但是对于算法进行多少个基本操作(即花费多少时间单位)在规模数量级上却是相同的,由此可以忽略机器环境的影响而客观的反应算法的时间效率。3 对于算法的时间效率,我们可以用“大O记法”来表示。4 “大O记法”:对于单调的整数函数f,如果存在一个整数函数g和实常数c>0,使得对于充分大的n总有f(n)<=c*g(n),就说函数g是f的一个渐近函数(忽略常数),记为f(n)=O(g(n))。也就是说,在趋向无穷的极限意义下,函数f的增长速度受到函数g的约束,亦即函数f与函数g的特征相似。5 时间复杂度:假设存在函数g,使得算法A处理规模为n的问题示例所用时间为T(n)=O(g(n)),则称O(g(n))为算法A的渐近时间复杂度,简称时间复杂度,记为T(n)
4 理解 ”大o记法“
对于算法进行特别具体的细致分析虽然很好,但在实践中的实际价值有限。对于算法的时间性质和空间性质,最重要的是其数量级和趋势,这些是分析算法效率的主要部分。而计量算法基本操作数量的规模函数中那些常量因子可以忽略不计。例如,可以认为3n²和100n²属于同一个量级,如果两个算法处理同样规模实例的代价分别为这两个函数,就认为它们的效率“差不多”,都为n²级。
5 最坏时间复杂度
1 升序排序,用冒泡排序,时间复杂度是多少?用大O记法表示 [1,2,3,4,5,6,7] O(n) [9,8,7,6,5,4,3] O(n^2)2 分析算法时,存在几种可能的考虑: 算法完成工作最少需要多少基本操作,即最优时间复杂度 算法完成工作最多需要多少基本操作,即最坏时间复杂度 算法完成工作平均需要多少基本操作,即平均时间复杂度3 我们主要关注算法的最坏情况,亦即最坏时间复杂度。
6 时间复杂度的几条基本计算规则
1 基本操作,即只有常数项,认为就是O(1)2 顺序结构,时间复杂度按加法进行计算 a + b = c d + e = f3 循环结构,时间复杂度按乘法进行计算4 分支结构,时间复杂度取最大值
7 算法分析
时间复杂度的运算规则: T(n) =n*n*n*(max(1,0))=n^3*1=n^3
8 常见的时
执行次数函数举例 | 阶 | 非正式术语 |
12 | O(1) | 常数阶 |
2n+3 | O(n) | 线性阶 |
3n²+2n+1 | O(n²) | 平方阶 |
5log2n+20 | O(logn) | 对数阶 |
2n+3nlog2n+19 | O(nlogn) | nlogn阶 |
6n³+2n²+3n+4 | O(n³) | 立方阶 |
2^n | O(2^n) | 指数阶 |
图解: 所消耗的时间从小到大:O(1) < O(logn) < O(n) < O(nlogn) < O(n²) < O(n³)< O(n!) < O(n^n)1 练习:说出下列算法的时间复杂度 O(5) O(2n + 1) O(n²+ n + 1) O(3n³+1)
四:Python内置类型性能分析
1 timeit模块
1 可以用来测试一小段Python代码的执行速度。2 计时器类:class timeit.Timer(stmt='pass', setup='pass', timer=) Timer是测量小段代码执行速度的类 stmt:是要测试的代码语句(statment),也可以传方法名 setup:运行语句时,需要的设置,例如为了执行time.time()要引入time包 timer:是一个定时器函数,与平台有关,不需要处理3 函数:timeit.Timer.timeit(number=1000000) Timer类中测试语句执行速度的对象方法 number参数是测试代码时的测试次数,默认为1000000次 方法返回执行代码的平均耗时,一个float类型的秒数
代码实现
# -*- coding:utf-8 -*-def test1(): l = [] for i in range(3000): l.append(i)def test2(): l = [] for i in range(3000): l.insert(0, i)def test3(): l = [i for i in range(3000)]def test4(): l = list(range(3000))def test5(): l = [] for i in range(3000): l.extend([i])def test6(): l = [] for i in range(3000): l = l + [i]def test7(): l = [] for i in range(3000): l += [i]from timeit import Timerprint('开始测试')t1 = Timer("test1()", "from __main__ import test1")print("append:\t\t\t", t1.timeit(number=1000), "秒")t2 = Timer("test2()", "from __main__ import test2")print("insert:\t\t", t2.timeit(number=1000), "秒")t3 = Timer("test3()", "from __main__ import test3")print("推倒:\t\t", t3.timeit(number=1000), "秒")t4 = Timer("test4()", "from __main__ import test4")print("list:\t\t", t4.timeit(number=1000), "秒")t5 = Timer("test5()", "from __main__ import test5")print("extend:\t\t", t5.timeit(number=1000), "秒")t6 = Timer("test6()", "from __main__ import test6")print("+:\t\t", t6.timeit(number=1000), "秒")t7 = Timer("test7()", "from __main__ import test7")print("+=:\t\t", t7.timeit(number=1000), "秒")print('结束测试')
2 列表操作测试
运行测试代码对比append()和insert()
3 list 内置操作的时间复杂度
get slice O(k),k是取切片间隔几个
4 dict 内置操作时间复杂度
五 数据结构的引入
1 什么是数据结构
1 我们为了解决问题,需要将数据保存下来,然后根据数据的存储方式来设计算法实现进行处理,那么数据的存储方式不同就会导致需要不同的算法进行处理。我们希望算法解决问题的效率越快越好,于是我们就需要考虑数据究竟如何保存的问题,这就是数据结构。2 列表和字典就是Python中封装好的数据结构
2 数据结构的概念
1 数据是一个抽象的概念,将其进行分类后得到程序设计语言中的基本类型。如:int,float,char等。数据元素之间不是独立的,存在特定的关系,这些关系便是结构。数据结构指数据对象中数据元素之间的关系。2 Python给我们提供了很多现成的数据结构类型,这些系统自己定义好的,不需要我们自己去定义的数据结构叫做Python的内置数据结构,比如列表、元组、字典。而有些数据组织方式,Python系统里面没有直接定义,需要我们自己去定义实现这些数据的组织方式,这些数据组织方式称之为Python的扩展数据结构,比如栈,队列等。
3 算法与数据结构的区别
1 数据结构是算法的载体2 算法是解决问题的思路3 数据结构是不同的数据组织形式
4抽象数据类型(ADT)
1 抽象数据类型的含义是指一个数学模型以及定义在此数学模型上的一组操作。即把数据类型和数据类型上的运算捆在一起,进行封装。引入抽象数据类型的目的是把数据类型的表示和数据类型上运算的实现与这些数据类型和运算在程序中的引用隔开,使它们相互独立。2 最常用的五种数据运算:插入、删除、修改、查找、排序class Stus(object): def add: def delete: def sort:3 类似于接口,功能定义出来,怎么实现不管