第一章 基础知识概述

10/2/2022 网络爬虫

讲师介绍:石璞东,计算机硕士,人民邮电出版社签约作者,《智能前端技术与实践》作者,百度飞桨领航团金牌团长,阿里云乘风者计划专家博主

考试科目:883 《C程序设计》(第五版)谭浩强,清华大学出版社

参考资料:《C程序设计(第五版)》谭浩强

# 1.1 程序和指令

  • 程序:所谓程序,就是一组计算机能识别和执行的指令;
  • 指令:一个特定的指令序列,用来完成一定的功能,每一条指令使计算机执行特定的操作,只要让计算机执行这个程序,计算机就会自动地执行各条指令,有条不紊地进行工作;

# 1.2 计算机语言

# 1. 计算机编程语言的分类

  • 机器语言
    • 概念:计算机能直接识别和接受的二进制代码成为机器指令,机器指令的集合就是机器语言,如10010011,我们可以将其理解为人类社会发展的原始阶段;
    • 操作方法:当编写完成用0和1组成的指令后,需要用纸带穿孔机以人工的方法在特制的黑色纸带上穿孔,在指定的位置上有孔代表1,无孔代表0,一个程序往往需要一卷长长的纸带,在需要运行此程序时,就将此纸带装在光电输入机上,当光电输入机从纸带读入信息时,有孔处产生一个电脉冲,指令变成电信号,让计算机执行各种操作;
    • 特点:
      • 优点:直接执行,速度快,资源占用少;
      • 缺点:可读性、可移植性差,编程复杂;
  • 汇编语言
    • 概念:又称“符号语言”,即用一些英文字母和数字表示一个指令,如用ADD表示加法操作,用SUB表示减法操作,LD表示“传送”,显然,计算机并不能直接识别和执行符号语言的指令,需要使用一种称为汇编程序的软件,将符号语言的指令转换为机器指令;
  • 高级语言
    • 按转换方式分类:编译型语言、解释型语言;
    • 按客观系统描述分类:面向过程语言、面向对象语言;
    • 按编程范型分类:命令式语言、函数式语言、逻辑式语言、面向对象语言;

参考链接

# 2. 高级语言的不同发展阶段

  • 非结构化的语言:初期的语言属于非结构化的语言,编程风格比较随意,只要符合语法规则即可,没有严格的规范要求,程序中的流程可以随意跳转,人们往往追求程序执行的效率而采用了许多“小技巧”,使程序变的难以阅读和维护,早期的BASICFORTRANALGOL等都属于非结构化的语言;
  • 结构化语言:为了解决以上问题,提出了“结构化程序设计方法”,规定程序必须由具有良好特性的基本结构(顺序结构、分支结构、循环结构)构成,程序中的流程不允许随意跳转,程序总是由上而下顺序执行各个基本结构,C语言属于结构化语言;
  • 面向对象语言:近年来,在处理较大规模的问题时,开始使用面向对象的语言;

# 1.3 C语言介绍

# 1. 概述

C语言是国际上广泛流行的计算机高级语言,其祖先是BCPL语言(Basic Combined Programming Language)。1970年,美国AT&T贝尔实验室的Ken ThompsonBCPL语言为基础,设计出了很多简单且很接近硬件的B语言(取BCPL的第一个字母),但B语言过于简单,功能有限;1972~1973年间,美国贝尔实验室的D.M.Ritchie在B语言的基础上设计出了C语言,C语言既保持了BCPLB语言的优点(精炼,接近硬件),又克服了它们的缺点(过于简单,无数据类型等),C语言的新特点主要表现在具有多种数据类型(如字符、数值、数组、结构体和指针等)。开发C语言的目的在于尽可能降低用它所写的软件对硬件平台的依赖程度,使之具有可移植性。

# 2. 主要特点

  • 语言简洁、紧凑,使用方便、灵活;

  • 运算符丰富(34种);

  • 数据类型丰富(C语言提供的数据类型包括:整型、浮点型、字符型、数组类型、指针类型、结构体类型和共用体类型);

  • 具有结构化的控制语句(如if...else语句、while语句、do...while语句、switch语句和for语句);

  • 语法限制不太严格,程序设计自由度大(如不对数组越界进行检查);

  • 允许直接访问物理地址,能进行位操作,能实现汇编语言的大部分功能,可以直接对硬件进行操作;

  • 程序可移植性好;

  • 生成目标代码的质量高,程序执行效率高;

# 1.4 案例展示

# 1. Let's say Hello,World!

#include <stdio.h>
int main() {
    printf("Hello, World!\n");
    return 0;
}
1
2
3
4
5

程序分析解释:

  • 第一行:用来提供输入输出函数的相关信息,stdio.h是系统提供的一个文件名,即standard input&output的缩写,文件后缀.h的意思是头文件(header file),因为这些文件都是放在程序各文件模块的开头的,输入输出函数的相关信息已事先放在stdio.h文件中,现在用#include指令把这些信息调入供使用;
  • 第二行:其中main是函数的名字,表示主函数,main前面的int表示此函数的类型是int类型,在执行主函数后会得到一个值(即函数值),其值为整型,每一个C语言程序都有必须有一个main函数,函数体由花括号括起来;
  • 第三行:这是一个输出语句,printfC编译系统提供的函数库中的输出函数,在上述代码中,printf函数中双撇号内的字符串Hello,World!按原样输出,\n是换行符,即在Hello,World!后,显示屏上的光标位置移到下一行的开头;
  • 第四行:当main函数执行结束前将整数0作为函数值,返回到调用函数处;

为使程序规范和可移植性,一般建议将main函数指定为int型,并在main函数的最后加一个return 0;语句。

「注解」C语言中的两种注解方式:

  • 单行注释://
  • 块式注释:/**/

# 2. 求两数之和

#include <stdio.h>
int main(){
    int a,b,sum;
    printf("请输入a、b的值:");
    scanf("%d %d",&a,&b);
    sum = a + b;
    printf("两数之和为:%d\n",sum);
    return 0;
}
1
2
3
4
5
6
7
8
9
  • printf函数圆括号内有两个参数:一个是双撇号中的内容两数之和为:%d\n,它是输出格式字符串,作用是输出用户希望输出的字符和输出的格式;第二个参数sum表示要输出的变量的值;

# 3. 求两数中的较大者

#include<stdio.h>
int main(){
    int max(int x,int y);
    int a,b,c;
    printf("请输入a、b的值:");
    scanf("%d %d",&a,&b);
    c = max(a,b); 
    printf("a和b中的较大者为:%d\n",c);
    return 0;
}
int max(int x,int y){  
    int z;
    x > y ? (z=x):(z=y);
    return z;
}
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
  • scanf函数:其作用是输入变量ab的值,其参数包括两部分内容,一是双撇号中的内容,它指定输入的数据按什么格式输入,%d的含义是十进制整数形式;二是输入的数据准备放到哪里,即赋给哪个变量,如上述代码所示,scanf函数中指定的是ab,在ab的前面各有一个&,在C语言中是&地址符,&a的含义是变量a的地址,&b是变量b的地址,执行scanf函数,从键盘读入两个整数,送到变量ab的地址处,然后把这两个整数分别赋给变量ab

# 2. C语言程序的结构特点

  • 一个程序由一个或多个源程序文件组成;
    • 一个源程序文件包含以下3部分:
      • 预处理指令
      • 全局声明
      • 函数定义
  • 函数是C程序的主要组成部分;
  • 一个函数主要包括两个部分;
    • 函数首部:int max(int x, int y)
      • 解释:第一个int表示函数类型,第二个int和第三个int表示参数类型,max表示函数名,xy表示函数参数名;如果函数没有参数,可以写为int main(void)int main()
    • 函数体:
      • 声明部分:定义在本函数中所用到的变量以及对本函数所调用函数的声明;
      • 执行部分:由若干个语句组成,指定在函数中所进行的操作;
  • 程序总是从main函数开始执行的;
  • 程序中对计算机的操作是由函数中的C语句完成的;
  • 在每个数据声明和语句的最后必须有一个分号;
  • c语言本身不提供输入输出语句;
  • 程序应当包含注释;

# 3. 如何运行C语言代码?

计算机不能直接识别和执行用高级语言写的指令,必须用编译程序把C源程序翻译成二进制形式的目标程序,然后在将该目标程序与系统的函数库以及其他目标程序连接起来,形成可执行的目标程序。

在编译好一个C源程序后,一般要经过以下几个步骤方可运行:

  • 上机输入和编译源程序;
  • 对源程序进行编译;
  • 进行连接处理;
  • 运行可执行程序,得到运行结果;