条件配置参考

条件就是「筛子」，告诉归所：哪类文件需要处理，哪些不需要。

7 种条件类型

1. 文件名

按文件的名字筛选，不包含扩展名。

填写内容	效果
`报告`	文件名包含「报告」两个字就匹配
`~$`	以 `~$` 开头（Office 临时文件，正在被 Word/Excel 占用）
`IMG_\d{4}`	正则写法：匹配 `IMG_0001`、`IMG_1234` 这样的名字

操作符怎么选：

操作符	什么时候用
包含	文件名里有这几个字就行
不包含	文件名里不能有这几个字
开头是	文件名以 xxx 开头
结尾是	文件名以 xxx 结尾
正则匹配	用表达式精确匹配（进阶用法）

2. 扩展名

按文件的格式/后缀筛选。

填写内容	效果
`pdf`	只处理 PDF 文件
`jpg,png,gif`	处理图片：JPG、PNG、GIF 都算
`docx,doc,xlsx,pdf`	处理常见的办公文档

小技巧： 用 notContains 操作符配合 tmp,bak,cache，可以排除临时文件。

3. 文件大小

按文件有多大来筛选。

填写内容	效果
`大于 10MB`	超过 10MB 的大文件
`小于 100KB`	小于 100KB 的小文件
`等于 0`	空文件

单位写法： B / KB / MB / GB，不区分大小写，可以有空格。

4. 创建时间

按文件「什么时候创建的」来筛选。

填写内容	效果
`7d`	7 天内创建的文件
`30d`	30 天内创建的文件
`1h`	1 小时内创建的文件
`180d`	半年前创建的老文件

典型用法： 修改时间 before 180d，意思是「找那些半年没动过的老文件，移到归档目录」。

5. 修改时间

和创建时间一样，但统计的是「最后一次修改」的时间。

适合用来清理「长期没动过的僵尸文件」。

6. 文件属性

按 Windows 文件属性筛选。

属性	含义
`READONLY`	只读文件
`HIDDEN`	隐藏文件
`SYSTEM`	系统文件

7. 路径排除（进阶）

排除某些路径的文件，不参与这条规则的匹配。

例如：监控整个 下载 文件夹，但想跳过其中的 临时 子文件夹。

8. 文件内容

按文件里面有没有某个字来筛选。

操作符	效果
包含	文件内容里有这几个字
不包含	文件内容里不能有这几个字
正则匹配	用表达式匹配内容（进阶用法）

工作原理： 归所流式读取文件内容，UTF8 解码后匹配关键字，支持跨行匹配。最多支持 5 个关键字，默认跳过 100MB 以上的文件。

注意： 如果文件无法读取（权限问题或二进制文件），会直接跳过这个条件，不影响其他条件的判定。

组合条件：AND 和 OR 嵌套

当一个条件不够用时，可以把多个条件组合起来：

举例：

( 扩展名是 pdf OR 扩展名是 docx ) AND ( 文件名包含「合同」 )

意思是：「找所有 PDF 或 Word 文档，而且文件名里要有『合同』两个字」

在归所里，这通过嵌套条件组来实现，用 JSON 描述就是：

{
  "isGroup": true,
  "logic": "OR",
  "items": [
    {"type": "extensionFilter", "op": "contains", "value": "pdf"},
    {"type": "extensionFilter", "op": "contains", "value": "docx"}
  ]
}

正则表达式速查

在「文件名」和「文件内容」条件里，选「正则匹配」操作符时可以使用：

写法	含义	举例
`^`	开头	`^IMG_` → 匹配所有 `IMG_` 开头的文件
`$`	结尾	`\.pdf$` → 匹配所有 `.pdf` 结尾的文件
`\d{4}`	4个数字	`IMG_\d{4}` → 匹配 `IMG_0001`
`.*`	任意字符	`报告.*` → 匹配所有含「报告」的文件
`[abc]`	括号里的任意一个	`[0-9]` → 匹配任意一个数字

常用条件组合示例

场景	条件设置
所有图片	扩展名：`jpg,jpeg,png,gif,bmp,webp`
近一周的新文件	创建时间：`7d`
大于 100MB 的视频	大小：`大于 100MB`
排除临时文件	扩展名 `notContains`：`tmp,bak,cache,~`
Office 临时文件	文件名 `startsWith`：`~$`