科大源同步方法与注意事项¶
总述¶
中科大开源镜像站允许下游站点使用 rsync 协议同步站点上的内容。
因可能消耗大量服务器资源,我们不允许下游镜像站点或个人用户使用 HTTP / HTTPS 协议从站点大规模同步数据。 我们会采取技术措施对使用非 rsync 协议进行大量内容同步的用户进行限流或封禁。
rsync 同步方式¶
同步专用域名¶
如需使用 rsync 协议访问科大开源镜像站,请使用 rsync 专用的域名:rsync.mirrors.ustc.edu.cn。
Warning
使用非标准域名访问站点的用户可能无法通过 rsync 进行同步。
同步路径¶
Warning
由于 rsync 协议实现的限制,原有的使用 /repo/ 前缀同步的方式难以进行负载均衡。从 2022 年 4 月 2 日起,同步将不再需要添加 /repo/ 前缀。从 2025 年 6 月 5 日起,原有的 /repo/ 不再保留,请用户注意更换为新的路径。例如,ubuntu 仓库的实际路径即为 rsync://rsync.mirrors.ustc.edu.cn/ubuntu。
Tip
我们强烈推荐用户在实际进行 rsync 同步之前先使用 rsync
工具列出目录内容以实际观察目录结构。例如,用户可以使用如下命令列出
ubuntu 仓库根目录的具体内容:
可同步内容¶
您可以使用 rsync 协议访问站点上绝大部分非反向代理或动态缓存的仓库中的文件内容。
注意事项¶
如您需要从我站小规模进行初始同步或者增量同步文件,您无需告知我们即可开始同步, 但建议在北京时间凌晨(凌晨一点到早上八点)的时间段内进行内容同步。
如您需要进行大量初始同步,请预先通过电子邮件知会并告知我们您的同步计划。
如果您的同步计划会对本站点运行产生较大影响,我们将联系您并提出修改同步计划的建议。
我们保留使用技术手段或其它手段阻断恶意对本站使用 rsync
进行访问的权利。
Tip
使用 rsync 访问站点的用户将在日志输出中看到我站的
MOTD 信息,
请在首次使用前认真阅读提示信息并按提示进行操作。
连接数限制
为避免占用服务器过多资源,我们对 rsync 连接数做出了限制。 目前的限制为:
- 单 IP 5 个并发连接;
- 全局 60 个并发链接。
超出限制的连接将被拒绝访问,请合理安排同步方式以达到最大的同步效率。
Warning
请使用 cron 等定时任务方式管理后台同步,且每个仓库的同步任务不宜超过每天一次(ubuntu 等热门仓库可接受的最高频率为每 6 小时一次)。
请勿编写类似于 while true; rsync ...; done 的脚本,我们会随时封禁超出必要频率的 rsync 请求。
相关链接¶
- rsync 中文维基百科介绍
- rsync 项目官网