跳转到内容

条件配置参考

条件配置参考

条件就是「筛子」,告诉归所:哪类文件需要处理,哪些不需要


按文件的名字筛选,不包含扩展名

填写内容效果
报告文件名包含「报告」两个字就匹配
~$~$ 开头(Office 临时文件,正在被 Word/Excel 占用)
IMG_\d{4}正则写法:匹配 IMG_0001IMG_1234 这样的名字

操作符怎么选:

操作符什么时候用
包含文件名里有这几个字就行
不包含文件名里不能有这几个字
开头是文件名以 xxx 开头
结尾是文件名以 xxx 结尾
正则匹配用表达式精确匹配(进阶用法)

按文件的格式/后缀筛选。

填写内容效果
pdf只处理 PDF 文件
jpg,png,gif处理图片:JPG、PNG、GIF 都算
docx,doc,xlsx,pdf处理常见的办公文档

小技巧:notContains 操作符配合 tmp,bak,cache,可以排除临时文件。


按文件有多大来筛选。

填写内容效果
大于 10MB超过 10MB 的大文件
小于 100KB小于 100KB 的小文件
等于 0空文件

单位写法: B / KB / MB / GB,不区分大小写,可以有空格。


按文件「什么时候创建的」来筛选。

填写内容效果
7d7 天内创建的文件
30d30 天内创建的文件
1h1 小时内创建的文件
180d半年前创建的老文件

典型用法: 修改时间 before 180d,意思是「找那些半年没动过的老文件,移到归档目录」。


和创建时间一样,但统计的是「最后一次修改」的时间。

适合用来清理「长期没动过的僵尸文件」。


按 Windows 文件属性筛选。

属性含义
READONLY只读文件
HIDDEN隐藏文件
SYSTEM系统文件

排除某些路径的文件,不参与这条规则的匹配。

例如:监控整个 下载 文件夹,但想跳过其中的 临时 子文件夹。


按文件里面有没有某个字来筛选。

操作符效果
包含文件内容里有这几个字
不包含文件内容里不能有这几个字
正则匹配用表达式匹配内容(进阶用法)

工作原理: 归所流式读取文件内容,UTF8 解码后匹配关键字,支持跨行匹配。最多支持 5 个关键字,默认跳过 100MB 以上的文件。

注意: 如果文件无法读取(权限问题或二进制文件),会直接跳过这个条件,不影响其他条件的判定。


当一个条件不够用时,可以把多个条件组合起来:

举例:

( 扩展名是 pdf OR 扩展名是 docx ) AND ( 文件名包含「合同」 )

意思是:「找所有 PDF 或 Word 文档,而且文件名里要有『合同』两个字」

在归所里,这通过嵌套条件组来实现,用 JSON 描述就是:

{
"isGroup": true,
"logic": "OR",
"items": [
{"type": "extensionFilter", "op": "contains", "value": "pdf"},
{"type": "extensionFilter", "op": "contains", "value": "docx"}
]
}

在「文件名」和「文件内容」条件里,选「正则匹配」操作符时可以使用:

写法含义举例
^开头^IMG_ → 匹配所有 IMG_ 开头的文件
$结尾\.pdf$ → 匹配所有 .pdf 结尾的文件
\d{4}4个数字IMG_\d{4} → 匹配 IMG_0001
.*任意字符报告.* → 匹配所有含「报告」的文件
[abc]括号里的任意一个[0-9] → 匹配任意一个数字

场景条件设置
所有图片扩展名:jpg,jpeg,png,gif,bmp,webp
近一周的新文件创建时间:7d
大于 100MB 的视频大小:大于 100MB
排除临时文件扩展名 notContainstmp,bak,cache,~
Office 临时文件文件名 startsWith~$