C语言探索之旅 | 第二部分第七课：文件读写

作者谢恩铭，公众号「程序员联盟」（微信号：coderhub）。转载请注明出处。原文：www.jianshu.com/p/4adb95073…

《C语言探索之旅》全系列

内容简介

前言
文件的打开和关闭
读写文件的不同方法
在文件中移动
文件的重命名和删除
第二部分第八课预告

1. 前言

上一课 C语言探索之旅 | 第二部分第六课：创建你自己的变量类型之后，我们来学习很常用的文件读写。

我们学过了这么多变量的知识，已经知道变量实在是很强大的，可以帮助我们实现很多事情。

变量固然强大，还是有缺陷的，最大的缺陷就是：不能永久保存。

因为 C语言的变量储存在内存中，在你的程序退出时就被清除了，下次程序启动时就不能找回那个值了。

“蓦然回首，那人不在灯火阑珊处...”

“今天的你我，怎样重复昨天的故事？这一张旧船票，还能否登上你的破船？”

不能够啊，“涛声不能依旧”啊...

如果这样的话，我们如何在 C语言编写的游戏中保存游戏的最高分呢？怎么用 C语言写一个退出时依然保存文本的文本编辑器呢？

幸好，在 C语言中我们可以读写文件。这些文件会储存在我们电脑的硬盘上，就不会在程序退出或电脑关闭时被清除了。

为了实现文件读写，我们就要用到迄今为止我们所学过的知识：

指针，结构体，字符串，等等。

也算是复习吧。

2. 文件的打开和关闭

为了读写文件，我们需要用到定义在 stdio.h 这个标准库头文件中的一些函数，结构，等。

是的，就是我们所熟知的 stdio.h，我们的“老朋友” printf 和 scanf 函数也是定义在这个头文件里。

下面按顺序列出我们打开一个文件，进行读或写操作所必须遵循的一个流程：

调用“文件打开”函数 fopen（f 是 file（表示“文件”）的首字母；open 表示“打开”），返回一个指向该文件的指针。
检测文件打开是否成功，通过第 1 步中 fopen 的返回值（文件指针）来判断。如果指针为 NULL，则表示打开失败，我们需要停止操作，并且返回一个错误。
如果文件打开成功（指针不为 NULL），那么我们就可以接着用 stdio.h 中的函数来读写文件了。
一旦我们完成了读写操作，我们就要关闭文件，用 fclose（close 表示“关闭”）函数。

首先我们来学习如何使用 fopen 和 fclose 函数，之后我们再学习如何读写文件。

fopen：打开文件

函数 fopen 的原型是这样的：

FILE* fopen(const char* fileName, const char* openMode);

不难看出，这个函数接收两个参数：

fileName：文件名（name 表示“名字”）。是一个字符串类型，而且是 const，意味着不能改变其值。
openMode：打开方式（open 表示“打开”，mode 表示“方式”）。表明我们打开文件之后要干什么的一个指标。只读、只写、读写，等等。

这个函数的返回值，是 FILE *，也就是一个 FILE（file 表示“文件”）指针。

FILE 定义在 stdio.h 中。有兴趣的读者可以自己去找一下 FILE 的定义。

我们给出 FILE 的一般定义：

typedef struct {
    char *fpos; /* Current position of file pointer (absolute address) */
    void *base; /* Pointer to the base of the file */
    unsigned short handle; /* File handle */
    short flags; /* Flags (see FileFlags) */
    short unget; /* 1-byte buffer for ungetc (b15=1 if non-empty) */
    unsigned long alloc; /* Number of currently allocated bytes for the file */
    unsigned short buffincrement; /* Number of bytes allocated at once */
} FILE;

可以看到 FILE 是一个结构体（struct），里面有 7 个变量。当然我们不必深究 FILE 的定义，只要会使用 FILE 就好了，而且不同操作系统对于 FILE 的定义不尽相同。

细心的读者也许会问：“之前不是说结构体的名称最好是首字母大写么，为什么 FILE 这个结构体每一个字母都是大写呢？怎么和常量的命名方式一样呢？”

好问题。其实我们之前建议的命名方式（对于结构体，首字母大写，例如：StructName）只是一个“规范”（虽然大多数程序员都喜欢遵循），并不是一个强制要求。

这只能说明编写 stdio.h 的前辈并不一定遵循这个“规范”而已。当然，这对我们并没什么影响。

以下列出几种可供使用的 openMode ：

r ：只读。r 是 read（表示“读”）的首字母。这个模式下，我们只能读文件，而不能对文件写入。文件必须已经存在。
w ：只写。w 是 write（表示“写”）的首字母。这个模式下，只能写入，不能读出文件的内容。如果文件不存在，将会被创建。
a ：追加。a 是 append（表示“追加”）的首字母。这个模式下，从文件的末尾开始写入。如果文件不存在，将会被创建。
r+ ：读和写。这个模式下，可以读和写文件，但文件也必须已经存在。
w+ ：读和写。预先会删除文件内容。这个模式下，如果文件存在且内容不为空，则内容首先会被清空。如果文件不存在，将会被创建。
a+ ：读写追加。这个模式下，读写文件都是从文件末尾开始。如果文件不存在，将会被创建。

上面所列的模式，其实还可以组合上 b 这个模式。b 是 binary 的缩写，表示“二进制”。对于上面的每一个模式，如果你添加 b 后，会变成 rb，wb，ab，rb+，wb+，ab+ ），该文件就会以二进制模式打开。不过二进制的模式一般不是那么常用。

一般来说，r，w 和 r+ 用得比较多。w+ 模式要慎用，因为它会首先清空文件内容。当你需要往文件中添加内容时，a 模式会很有用。

下面的例子程序就以 r+（读写）的模式打开文件：

#include <stdio.h>

int main(int argc, char *argv[])
{
    FILE* file = NULL;

    file = fopen("test.txt", "r+");

    return 0;
}

于是，file 成为了指向 test.txt 文件的一个指针。

你会问：“我们的 test.txt 文件位于哪里呢？”

text.txt 文件和可执行文件位于同一目录下。

“文件一定要是 .txt 结尾的吗？”

不是，完全由你决定文件的后缀名。你大可以创建一个文件叫做 xxx.level，用于记录游戏的关卡信息。

“文件一定要和可执行文件在同一个文件夹下么？”

也不是。理论上可以位于当前系统的任意文件夹里，只要在 fopen 函数的文件名参数里指定文件的路径就好了，例如：

file = fopen("folder/test.txt", "w");

这样，文件 test.txt 就是位于当前目录的文件夹 folder 里。这里的 folder/test.txt 称为“相对路径”。

我们也可以这样：

file = fopen("/home/user/folder/test.txt", "w");

这里的 /home/user/folder/test.txt 是“绝对路径”。

测试打开文件

在调用 fopen 函数尝试打开文件后，我们需要检测 fopen 的返回值，以判断打开是否成功。

检测方法也很简单：如果 fopen 的返回值为 NULL，那么打开失败；如果不为 NULL，那么表示打开成功。示例如下：

#include <stdio.h>

int main(int argc, char *argv[])
{
    FILE* file = NULL;

    file = fopen("test.txt", "r+");

    if (file != NULL)
    {
        // 读写文件
    }
    else
    {
        // 显示一个错误提示信息
        printf("无法打开 test.txt 文件\n");
    }

    return 0;
}

记得每次使用 fopen 函数时都要对返回值作判断，因为如果文件不存在或者正被其他程序占用，那可能会使当前程序运行失败。

fclose：关闭文件

close 表示“关闭”。

如果我们成功地打开了一个文件，那么我们就可以对文件进行读写了（读写的操作我们下一节再详述）。

如果我们对文件的操作已经结束，那么我们应该关闭这个文件，这样做是为了释放占用的文件指针。

我们需要调用 fclose 函数来实现文件的关闭，这个函数可以释放内存，也就是从内存中删除你的文件（指针）。

函数原型：

int fclose(FILE* pointerOnFile);

这个函数只有一个参数：指向文件的指针。

函数的返回值（int）有两种情况：

0 ：当关闭操作成功时。
EOF（是 End Of File 的缩写，表示“文件结束”。一般等于 -1）：如果关闭失败。

示例如下：

#include <stdio.h>

int main(int argc, char *argv[])
{
    FILE* file = NULL;

    file = fopen("test.txt", "r+");

    if (file != NULL)
    {
        // 读写文件

        // ...

        fclose(file);  // 关闭我们之前打开的文件
    }

    return 0;
}

3. 读写文件的不同方法

现在，我们既然已经知道怎么打开和关闭文件了，接下来我们就学习如何对文件进行读出和写入吧。

我们首先学习如何写入文件（相比读出要简单一些），之后我们再看如何从文件读出。

对文件写入

用于写入文件的函数有好几个，我们可以根据情况选择最适合的函数来使用。

我们来学习三个用于文件写入的函数：

fputc：在文件中写入一个字符（一次只写一个）。是 file put character 的缩写。put 表示“放入”，character 表示“字符”。
fputs：在文件中写入一个字符串。是 file put string 的缩写。string 表示“字符串”。
fprintf：在文件中写入一个格式化过的字符串，用法与 printf 是几乎相同的，只是多了一个文件指针。

fputc

此函数用于在文件中一次写入一个字符。

函数原型：

int fputc(int character, FILE* pointerOnFile);

这个函数包含两个参数：

character：int 型变量，表示要写入的字符。我们也可以直接写 'A' 这样的形式，之前 ASCII 那节的知识点没有忘吧。
pointerOnFile：指向文件的指针。

函数返回 int 值。如果写入失败，则为 EOF；否则，会是另一个值。

示例：

#include <stdio.h>

int main(int argc, char *argv[])
{
    FILE* file = NULL;

    file = fopen("test.txt", "w");

    if (file != NULL)
    {
        fputc('A', file);  // 写入字符 A
        fclose(file);
    }

    return 0;
}

上面的程序用于向 test.txt 文件写入字符 'A'。

fputs

这个函数和 fputc 类似，区别是 fputc 每次是写入一个字符，而 fputs 每次写入一个字符串。

函数原型：

int fputs(const char* string, FILE* pointerOnFile);

类似地，这个函数也接受两个参数：

string：要写入的字符串。
pointerOnFile：指向文件的指针。

如果出错，函数返回 EOF；否则，返回不同于 EOF 的值。

示例：

#include <stdio.h>

int main(int argc, char *argv[])
{
    FILE* file = NULL;

    file = fopen("test.txt", "w");

    if (file != NULL)
    {
        fputs("你好，朋友。\n最近怎么样？", file);
        fclose(file);
    }

    return 0;
}

fprintf

这个函数很有用，因为它不仅可以向文件写入字符串，而且这个字符串是可以由我们来格式化的。用法其实和 printf 函数类似，就是多了一个文件指针。

函数原型：

int fprintf(FILE *stream, const char *format, ...)

示例：

#include <stdio.h>

int main(int argc, char *argv[])
{
    FILE* file = NULL;
    int age = 0;

    file = fopen("test.txt", "w");

    if (file != NULL)
    {
        // 询问用户的年龄
        printf("您几岁了 ? ");
        scanf("%d", &age);

        // 写入文件
        fprintf(file, "使用者年龄是 %d 岁\n", age);
        fclose(file);
    }

    return 0;
}

从文件中读出

我们可以用与写入文件时类似名字的函数，只是略微修改了一些，也有三个：

fgetc：读出一个字符。是file get character 的缩写。get 表示“获取，取得”。
fgets：读出一个字符串。是 file get string 的缩写。
fscanf：与 scanf 的用法类似，只是多了一个文件指针。scanf 是从用户输入读取，而 fscanf 是从文件读取。

这次介绍这三个函数我们会简略一些，因为如果大家掌握好了前面那三个写入的函数，那这三个读出的函数是类似的。只是操作相反了。

fgetc

首先给出函数原型：

int fgetc(FILE* pointerOnFile);

函数返回值是读到的字符。如果不能读到字符，那会返回 EOF。

但是如何知道我们从文件的哪个位置读取呢？是第三个字符处，还是第十个字符处呢？

其实，在我们读取文件时，有一个“游标”（cursor），会跟随移动。

这当然是虚拟的游标，你不会在屏幕上看到它。你可以想象这个游标和你用记事本编辑文件时的闪动的光标类似。这个游标指示你当前在文件中的位置。

之后的小节，我们会学习如何移动这个游标，使其位于文件中特定的位置。可以是开头，也可以是第 7 个字符处。

fgetc 函数每读入一个字符，这个游标就移动一个字符长度。我们就可以用一个循环来读出文件所有的字符。例如：

#include <stdio.h>

int main(int argc, char *argv[])
{
    FILE* file = NULL;
    int currentCharacter = 0;

    file = fopen("test.txt", "r");

    if (file != NULL)
    {
        // 循环读取，每次一个字符
        do
        {
            currentCharacter = fgetc(file);  // 读取一个字符
            printf("%c", currentCharacter);  // 显示读取到的字符
        } while (currentCharacter != EOF);  // 我们继续，直到 fgetc 返回 EOF（表示“文件结束”）为止

        fclose(file);
    }

    return 0;
}

fgets

此函数每次读出一个字符串，这样可以不必每次读一个字符（有时候效率太低）。

这个函数每次最多读取一行，因为它遇到第一个 '\n'（换行符）会结束读取。所以如果我们想要读取多行，需要用循环。

插入一点回车符和换行符的知识：关于“回车”（carriage return）和“换行”（line feed）这两个概念的来历和区别。在计算机还没有出现之前，有一种叫做电传打字机（Teletype Model 33）的玩意，每秒钟可以打 10 个字符。但是它有一个问题，就是打完一行换行的时候，要用去 0.2 秒，正好可以打两个字符。要是在这 0.2 秒里面，又有新的字符传过来，那么这个字符将丢失。于是，研制人员想了个办法解决这个问题，就是在每行后面加两个表示结束的字符。一个叫做“回车”，告诉打字机把打印头定位在左边界；另一个叫做“换行”，告诉打字机把纸向下移一行。这就是“换行”和“回车”的来历，从它们的英语名字上也可以看出一二。后来，计算机被发明了，这两个概念也就被搬到了计算机上。那时，存储器很贵，一些科学家认为在每行结尾加两个字符太浪费了，加一个就可以。于是，就出现了分歧。在 Unix/Linux 系统里，每行结尾只有“<换行>”，即 "\n"；在 Windows 系统里面，每行结尾是“<换行><回车>”，即 "\n\r"；在 macOS 系统里，每行结尾是“<回车>”，即 "\r"。一个直接后果是，Unix/Linux/macOS 系统下的文件在Windows里打开的话，所有文字会变成一行；而 Windows 里的文件在 Unix/Linux/macOS 下打开的话，在每行的结尾可能会多出一个 ^M 符号。 Linux 中遇到换行符会进行“回车 + 换行”的操作，回车符反而只会作为控制字符显示，不发生回车的操作。而 Windows 中要“回车符 + 换行符”才会实现“回车+换行"，缺少一个控制符或者顺序不对都不能正确的另起一行。

函数原型：

char* fgets(char* string, int characterNumberToRead, FILE* pointerOnFile);

示例：

#include <stdio.h>

#define MAX_SIZE 1000  // 数组的最大尺寸 1000

int main(int argc, char *argv[])
{
    FILE* file = NULL;
    char string[MAX_SIZE] = "";  // 尺寸为 MAX_SIZE 的数组，初始为空

    file = fopen("test.txt", "r");

    if (file != NULL)
    {
        fgets(string, MAX_SIZE, file);  // 我们读取最多 MAX_SIZE 个字符的字符串，将其存储在 string 中
        printf("%s\n", string);  // 显示字符串

        fclose(file);
    }

    return 0;
}

这里，我们的 MAX_SIZE 足够大（1000），保证可以容纳下一行的字符数。所以遇到 '\n' 我们就停止读取，因此以上代码的作用就是读取文件中的一行字符，并将其输出。

那我们如何能够读取整个文件的内容呢？很简单，加一个循环。

如下：

#include <stdio.h>

#define MAX_SIZE 1000  // 数组的最大尺寸 1000

int main(int argc, char *argv[])
{
    FILE* file = NULL;
    char string[MAX_SIZE] = "";  // 尺寸为 MAX_SIZE 的数组，初始为空

    file = fopen("test.txt", "r");

    if (file != NULL)
    {
        while (fgets(string, MAX_SIZE, file) != NULL)  // 我们一行一行地读取文件内容，只要不遇到文件结尾
        printf("%s\n", string);  // 显示字符串

        fclose(file);
    }

    return 0;
}

fscanf

此函数的原理和 scanf 是一样的。负责从文件中读取规定样式的内容。

函数原型：

int fscanf(FILE *stream, const char *format, ...)

示例：

例如我们创建一个 test.txt 文件，在里面输入三个数：23, 45, 67。

输入的形式可以是类似下面这样：

每个数之间有空格

每个数之间换一行

#include <stdio.h>

int main(int argc, char *argv[])
{
    FILE* file = NULL;
    int score[3] = {0};  // 包含 3 个最佳得分的数组

    file = fopen("test.txt", "r");

    if (file != NULL)
    {
        fscanf(file, "%d %d %d", &score[0], &score[1], &score[2]);
        printf("最佳得分是 : %d, %d 和 %d\n", score[0], score[1], score[2]);

        fclose(file);
    }

    return 0;
}

运行输出：

最佳得分是：23, 45, 67

4. 在文件中移动

前面我们提到了虚拟的“游标”，现在我们仔细地来学习一下。

每当我们打开一个文件的时候，实际上都存在一个“游标”，标识你当前在文件中所处的位置。

你可以类比我们的文本编辑器，每次你在文本编辑器（例如记事本）里面输入文字的时候，不是有一个游标（光标）可以到处移动么？它指示了你在文件中的位置，也就是你下一次输入会从哪里开始。

总结来说，游标系统使得我们可以在文件中指定位置进行读写操作。

我们介绍三个与文件中游标移动有关的函数：

ftell：告知目前在文件中哪个位置。tell 表示“告诉”。
fseek：移动文件中的游标到指定位置。seek 表示“探寻”。
rewind：将游标重置到文件的开始位置（这和用 fseek 函数来使游标回到文件开始位置是一个效果）。rewind 表示“转回”。

ftell：指示目前在文件中的游标位置

这个函数使用起来非常简单，它返回一个 long 型的整数值，标明目前游标所在位置。函数原型是：

long ftell(FILE* pointerOnFile);

其中，pointerOnFile 这个指针就是文件指针，指向当前文件。

相信不必用例子就知道如何使用了吧。

fseek：使游标移动到指定位置

函数原型为：

int fseek(FILE* pointerOnFile, long move, int origin);

此函数能使游标在文件（pointerOnFile 指针所指）中从位置（origin 所指。origin 表示“初始”）开始移动一定距离（move 所指。move 表示“移动”）。

move 参数：可以是一个正整数，表明向前移动；0，表明不移动；或者负整数，表明回退。
origin 参数：它的取值可以是以下三个值（#define 所定义的常量）中的任意：
- SEEK_SET ：文件开始处。SET 表示“设置”。
- SEEK_CUR ：游标当前所在位置。CUR 是 current（表示“当前”）的缩写。
- SEEK_END ：文件末尾。END 表示“结尾”。

来看几个具体使用实例吧：

// 这行代码将游标放置到距离文件开始处 5 个位置的地方
fseek(file, 5, SEEK_SET);

// 这行代码将游标放置到距离当前位置往后 3 个位置的地方
fseek(file, -3, SEEK_CUR);

// 这行代码将游标放置到文件末尾
fseek(file, 0, SEEK_END);

rewind：使游标回到文件开始位置

这个函数的作用就相当于使用 fseek 来使游标回到 0 的位置

void rewind(FILE* pointerOnFile);

相信使用难不倒大家吧，看函数原型就一目了然了。和 fseek(file, 0, SEEK_SET); 是一个效果。

5. 文件的重命名和删除

我们来学习两个简单的函数，以结束这次的课程：

rename 函数：重命名一个文件（rename 表示“重命名”）。
remove 函数：删除一个文件（remove 表示“移除”）。

这两个函数的特殊之处就在于，不同于之前的一些文件操作函数，它们不需要文件指针作为参数，只需要把文件的名字传给这两个函数就够了。

rename：重命名文件

函数原型：

int rename(const char* oldName, const char* newName);

oldName 就是文件的“旧名字”，而 newName 是文件的“新名字”。

如果函数执行成功，则返回 0；否则，返回非零的 int 型值。

以下是一个使用的例子：

int main(int argc, char *argv[])
{
      rename("test.txt", "renamed_test.txt");

      return 0;
}

很简单吧。

remove：删除一个文件

函数原型：

int remove(const char* fileToRemove);

fileToRemove 就是要删除的文件名。

注意：remove 函数要慎用，因为它不会提示你是否确认删除文件。文件是直接从硬盘被永久删除了，也不会先移动至垃圾箱。想要再找回被删除的文件就只能借助一些特殊的软件了，但是恢复过程可能没那么容易，也不一定能够成功。

实例：

int main(int argc, char *argv[])
{
    remove("test.txt");

    return 0;
}

6. 第二部分第八课预告

今天的课就到这里，一起加油吧！

下一课：C语言探索之旅 | 第二部分第八课：动态分配

我是谢恩铭，公众号「程序员联盟」（微信号：coderhub）运营者，慕课网精英讲师 Oscar 老师，终生学习者。热爱生活，喜欢游泳，略懂烹饪。人生格言：「向着标杆直跑」