一个C文件IO问题
作为练习,我写了下面一个用FILE stream来做读写的C程序, 就是简单的读一个给定的文件,让后将每行打印出来,就像cat命令最简单的用法。
#include <stdio.h>
#include <stdlib.h>
int main(int argc, char * argv[]) {
        if (argc != 2) {
                printf("USAGE: %s FILE_NAME!\n",argv[0]);
                exit(EXIT_FAILURE);
        }
        int BUFFER_SIZE = 1024;
        char buf[BUFFER_SIZE];
        FILE *fp = fopen(argv[1],"r");
        if (fp == NULL) {
                printf("cannot open file: %s!",argv[1]);
                exit(EXIT_FAILURE);
        } else {
                while (!feof(fp)) {
                        fgets(buf,BUFFER_SIZE,fp);
                        printf("%s",buf);
                                        }
                                }
        fclose(fp);
}
然后编译:
gcc -o test test.c
运行:
./test tmp.txt first line last line last line
发现最后一行总是出现两次。怎么回事呢?
查了一下feof的手册才知道,当已经读到文件最后一行时,feof并不会马上返回一个非0值,或者说设置EOF标志,而是在下次调用feof时才设置EOF标志,然后再下次调用feof时才返回非零值,所以while循环总是会多跑一遍。
那么,在这个循环多跑的一遍中,buf字节数组中为什么还是最后一行的内容,而非空呢?
查了一下fgets的返回规则,原来当fgets碰到EOF时,它返回NULL指针,但是buf中的内容保持不变,也就是还保留着最后一次fgets的内容,也就是我们这个例子中的最后一行。这样我们就可以以fgets的返回值来判断是否结束循环。
更改后的程序如下:
#include <stdio.h>
#include <stdlib.h>
int main(int argc, char * argv[]) {
        int BUFFER_SIZE = 128;
        //int RT_CHAR = BUFFER_SIZE + 1;
        char buf[BUFFER_SIZE];
        if (argc != 2 ) {
                printf("Usage: %s FILE_NAME!\n",argv[0]);
                exit(EXIT_FAILURE);
        }
        FILE *fp = fopen(argv[1],"r");
        if ( fp != NULL ) {
               while (fgets(buf,BUFFER_SIZE,fp) != NULL ) {
                       printf("%s",buf);
               }
        } else {
                printf("Cannot open file: %s\n",argv[1]);
                exit(EXIT_FAILURE);
        }
        fclose(fp);
} //end of main()
另外要注意,用feof时,读文件出错也会异常结束,未必一定是文件读完了。
