一个C文件IO问题
作为练习,我写了下面一个用FILE stream来做读写的C程序, 就是简单的读一个给定的文件,让后将每行打印出来,就像cat命令最简单的用法。
#include <stdio.h>
#include <stdlib.h>
int main(int argc, char * argv[]) {
if (argc != 2) {
printf("USAGE: %s FILE_NAME!\n",argv[0]);
exit(EXIT_FAILURE);
}
int BUFFER_SIZE = 1024;
char buf[BUFFER_SIZE];
FILE *fp = fopen(argv[1],"r");
if (fp == NULL) {
printf("cannot open file: %s!",argv[1]);
exit(EXIT_FAILURE);
} else {
while (!feof(fp)) {
fgets(buf,BUFFER_SIZE,fp);
printf("%s",buf);
}
}
fclose(fp);
}
然后编译:
gcc -o test test.c
运行:
./test tmp.txt first line last line last line
发现最后一行总是出现两次。怎么回事呢?
查了一下feof的手册才知道,当已经读到文件最后一行时,feof并不会马上返回一个非0值,或者说设置EOF标志,而是在下次调用feof时才设置EOF标志,然后再下次调用feof时才返回非零值,所以while循环总是会多跑一遍。
那么,在这个循环多跑的一遍中,buf字节数组中为什么还是最后一行的内容,而非空呢?
查了一下fgets的返回规则,原来当fgets碰到EOF时,它返回NULL指针,但是buf中的内容保持不变,也就是还保留着最后一次fgets的内容,也就是我们这个例子中的最后一行。这样我们就可以以fgets的返回值来判断是否结束循环。
更改后的程序如下:
#include <stdio.h>
#include <stdlib.h>
int main(int argc, char * argv[]) {
int BUFFER_SIZE = 128;
//int RT_CHAR = BUFFER_SIZE + 1;
char buf[BUFFER_SIZE];
if (argc != 2 ) {
printf("Usage: %s FILE_NAME!\n",argv[0]);
exit(EXIT_FAILURE);
}
FILE *fp = fopen(argv[1],"r");
if ( fp != NULL ) {
while (fgets(buf,BUFFER_SIZE,fp) != NULL ) {
printf("%s",buf);
}
} else {
printf("Cannot open file: %s\n",argv[1]);
exit(EXIT_FAILURE);
}
fclose(fp);
} //end of main()
另外要注意,用feof时,读文件出错也会异常结束,未必一定是文件读完了。
