输出的类型一般会包含以下的词中的一个: text (文件中仅有 ASCII 字符,可以用 ASCII 终端读此文件,以保证内容的可靠性), executable (文件中保存的是程序编译后的结果,一些UNIX 内核或其它内核能理解这类文件), 或者 data 表示所有其它类型文件(data 一般为二进制文件或者不可打印的). 但是有的常用的文件格式(如core文件、tar包),虽然也包含二进制数据, 却不属于这一类 如果要修改 /usr/share/magic 或者程序本身, preserve these keywords . 当文件为``text'' 类型时,认为此文件为可读文件. 不要象在Berkeley环境中那样做 - 要把``shell commands text''改为``shell script''.
文件系统检查是建立在对 stat(2) 系统调用结果的分析上的. 程序会分析文件是否为空,或者是否是某种特殊文件. 对于所有可在现有系统上使用的文件类型 (比如套接 口文件,动态链接文件,命名管道文件(FIFOs) 等), 只要它在系统头文件 sys/stat.h 中已经定义过,就可以被检查到.
幻数检查用来检查文件中是否有特殊的固定格式的数据. 规范的例子如二进制可执行文件(编译后的程序) a.out ,该文件格式在标准include目录下的 a.out.h 文件中定义,也可能在 exec.h 中定义. 这些文件在文件开始部分附近的一个特殊位置保存有一个'幻数' , 通过幻数告诉UNIX 操作系统此文件是二进制可执行文件, 和其中包含的其它类型. 幻数的概念已经扩展到数据文件.任何在文件固定位置有与文件类型 相关的不变标识符的文件都可以这样表示. 这些文件中的信息可以 从幻数文件 /usr/share/magic 中读取.
如果文件为 ASCII 文件, file 会试图检查它的语言. 语言检查在文件开始的几个块中(任意位置)查找是否有特殊字符串(参看 names.h) 例如,关键字 .br 指出此文件很可能是 troff(1) 输入文件, 而关键字 struct 指出此文件是C程序. 语言检查不如前两组检查可靠,所以放在最后执行.它也用来检查 一些混合文件(例如 tar(1) 存档文件)并确定文件是`ascii text'类型还是`data'类型.
本版本与System V的显著区别就是本版本对空格是作为分隔符来
处理的, 所以不能在格式字符串中包含空格. 例如,现有幻数文
件中的
>10 string language impress (imPRESS data)
要改为
>10 string language\ impress (imPRESS data)
另外, 格式字符串中的反斜线符号也要避免.例如,现有幻数文件中的
0 string \begindata Andrew Toolkit document
要改为
0 string \\begindata Andrew Toolkit document
SunOS releases 3.2及以后的版本包括从System V 发展来的
file(1)
命令,但有所扩展.本版本与Sun的file命令差别不大.它包括对 `&'
操作符的扩展,例如,
>16 long&0x7fffffff >0 not stripped
幻数文件项的顺序非常重要.不同的系统上的幻数项放的顺序可能不同. 如果老的 file 命令使用幻数文件,请将旧的幻数文件改名保存, (如改为 /usr/share/magic.orig) 以便日后做比较用.
$ file file.c file /dev/hda file.c: C program text file: ELF 32-bit LSB executable, Intel 80386, version 1, dynamically linked, not stripped /dev/hda: block special $ file -s /dev/hda{,1,2,3,4,5,6,7,8,9,10} /dev/hda: x86 boot sector /dev/hda1: Linux/i386 ext2 filesystem /dev/hda2: x86 boot sector /dev/hda3: x86 boot sector, extended partition table /dev/hda4: Linux/i386 ext2 filesystem /dev/hda5: Linux/i386 swap file /dev/hda6: Linux/i386 swap file /dev/hda7: Linux/i386 swap file /dev/hda8: Linux/i386 swap file /dev/hda9: empty /dev/hda10: empty
本程序是基于System V 版本的,由Ian Darwin独立设计和编写.
John Gilmore对源代码做了较大修改,在第一版基础上有较大提高. Geoff Collyer发现了一些不足之处,并提供了一些幻数文件项. 本程序一直在完善中.
由Rob McMahon修改, cudcv@warwick.ac.uk, 1989, 并对`&'操作符进行了扩充 (不再仅仅是简单的 `x&y != 0',而是象`x&y op z'这样).
由Guy Harris修改, guy@netapp.com, 1993,完成:
恢复``old-style'' `&' 操作符为原来的功能,因为 1) Rob McMahon所做的修改打破了原来的使用方式, 2) 本版本的 file 命令支持的SunOS 的``new-style'' `&' 操作符也处理 `x&y op z', 3) Rob的修改对某些情况没有考虑到;
引入多级`>';
引入``beshort'', ``leshort'', 等关键字使得程序能够按照一定的比特顺序 查看文件中的比特数,而不是仅按运行 file 时的本地比特顺序查看.
由Ian Darwin和其他作者(包括Christos Zoulas(christos@astron.com))修改, 1990-1999.
本软件独立于美国电话电报公司,Sun微系统公司,Digital设备公司, Lotus发展公司 , California大学董事会,X联盟或者MIT,或者自由软件基金会.
本软件独立于美国商业部的任何出口规定,可以自由用于任何国家和行星.
任何人无需授权即可在任何计算机系统上使用此软件用于任何目的, 可以自由修改和发布,但要遵守以下限制:
1. 作者对使用此软件造成的任何后果不负任何责任,无论多么严重, 即使这些后果是由于软件造成的.
2. 禁止不如实说明本软件的来源,无论是明确说错或是忽略. 由于很少有用户读源码, 所以在文件中一定要说明软件来源.
3. 修改后的版本必须明白的标明,禁止将其作为原始软件.由于很少有用户读源码, 所以在文件中一定要说明软件来源.
4. 禁止删除或修改本通告.
随同本包发布的几个支持文件(getopt, strtok)由 Henry Spencer完成,同样适用以上条款.
随同本包发布的几个支持文件(strtol, strchr)属于公共域的;都做了标记.
文件 tar.h 和 is_tar.c 由 tar 程序组的John Gilmore完成,无需遵从以上条款.
File 使用的一些算法虽然提高了速度,但精确性降低了,因此 在对 ASCII 文件内容操作有时会出错.
对 ASCII 文件的支持(基本上是对编程语言)过于简单,效率较低,需要重新编译并更新.
在一系列连续行后应该跟着有一个``else''从句.
幻数文件和关键词应该有正则表达式的支持. 使用 ASCII TAB 作为分隔符非常不足取,导致很难编辑文件, 但也因此受到保护.
在关键词中使用大写字母是可取的. 例如, troff(1) 命令与查看手册页的宏. 正则表达式支持将使这易于实现.
本程序没有实现对 FORTRAN 的理解. 应该能够通过在开始行中出现的关键字识别出FORTRAN . 正则表达式支持将使这易于实现.
文件 ascmagic 中的关键词表可能应归入Magic文件. 这能通过使用象`*'这样的关键词来实现偏移量.
另一个优化是要对幻数文件排序,这样,我们就可以 在取得第一个比特,第一个词,第一个长整型,等等的时候完成 对它们所有的检查.抱怨在幻数文件项中的冲突.制定一条规则, 将幻数项在文件偏移量的基础上排序,胜过在幻数文件里指定位置吗?
本程序应提供一种方法来评价一种猜测有"多么好". 我们去除了一些先前的设想(如,将 ``From '' 作为文件的最初5个字符) 因为它们不如其它的设想好(如,``Newsgroups:'' 对"Return-Path:"). 如果没有其它的设想提出,就很可能会采纳第一种设想.
本程序比某些file命令执行速度慢.
本手册,特别是本部分,比较长.