ICDIS数据库参数调优大赛

赛事背景:

本赛事依托于ICDIS 2022(The 4th International Conference on Data Intelligence and Security)会议,会议将于2022年8月24日至26日在中国深圳举行。

传统数据库技术往往依赖于启发式算法或者人工干预,例如数据库参数调优、故障诊断、索引推荐等。然而在大数据时代,数据库实例越来越多、场景越来越复杂、数据量越来越大,导致传统数据库技术难以满足大数据的需求。例如云数据库具有百万级别的数据库实例,各个实例的应用场景、用户的使用水平都可能有很大差别,直接使用传统启发式算法难以取得令人满意的结果,而人工干预也很难管理这么多的实例。机器学习技术因其较强的学习能力,逐渐在数据库领域展现潜力和应用前景。

数据库配置中涉及数百个可调的系统参数,控制着数据库组件的多方面表现。配置优化技术通过选择合适的参数组合,提高数据库对当前场景的适应性。比如通过为各类缓存区分配合适的内存空间,尽可能减少磁盘 IO 次数;通过更新优化器估计指标,提高计划选择的表现等。随着算法的改进、计算能力的提升、大数据的变革,深度学习和强化学习为数据库优化技术带来了更大的优化空间。

赛事聚焦以开源数据库MySQL,以及近年风靡的商用数据库Gbase为数据库平台的性能调参技术。

赛程安排:

报名以及认证(7月14日-7月31日,UTC+8):

1. 报名方式:登录比赛官网,完成个人信息注册,即可报名参赛。

2. 选手可1-5人组队,每位选手只能参与一支队伍。

3. 选手需确保报名信息准确有效,组委会有权取消不符合条件队伍的参赛资格以及奖励。

4. 选手报名、组队变更等操作截止时间为7月31日上午8点。

5. 选手以及队伍信息通过腾讯文档进行填写

 

 

6. 大赛官方QQ群请扫描以下二维码加入,最新通知将会第一时间在群内同步。

 

初赛:2022/07/16 8:00 – 2022/07/31 8:00(UTC+8)

说明:初赛赛题详情请前往“赛题说明”板块查看,选手可在初赛环节进行结果提交,结果评审将由评估系统进行。针对选手提交的结果,大赛评审团将会进行复审,最终择排行前20支队伍进入决赛,并进行公示。

每天提供一次代码提交机会,并提供运行日志。

 

决赛:2022/08/04 8:00 – 2022/08/18 23:59(UTC+8)   

说明:决赛赛题详情请前往“赛题说明”板块查看,选手可在决赛环节进行结果提交,结果评审将由评估系统进行。针对选手提交的结果,大赛评审团将会进行复审,最终确定获奖的6支队伍 ,并进行公示。

每天提供二次代码提交机会,并提供运行日志。

答辩:2022/08/24 8:00 – 2022/08/26 18:00(UTC+8)

1. 材料准备:参与答辩队伍需提前准备评审材料,包括代码、解题思路、PPT材料。

2. 评审会:将以答辩会的形式进行,具体安排另行通知。

3. 最终排名:组委会将根据参赛队伍的代码、历史成绩、评委打分,角逐最终奖项,颁发奖金及证书。

参赛对象:

面向全社会开放,高等院校、科研单位、互联网企业等人员均可报名参赛。

奖项设置:

一等奖:1支队伍,每支队伍奖金壹万,颁发获奖证书。

二等奖:2支队伍,每支队伍奖金伍仟,颁发获奖证书。

三等奖:3支队伍,每支队伍奖金贰仟,颁发获奖证书。

​优胜将:初赛排名前20,颁发获奖证书  

参与奖:每个参赛人员均可获得大赛定制的金士顿32G U盘。

鼓励师计划:

从大赛上线开始,报名参赛选手成功邀请身边的小伙伴参赛,将获得鼓励师奖励。邀请达标即可获取,礼品可叠加不限量。

鼓励师奖励——大赛定制电脑双肩背包      条件——邀请4支队伍参赛

腾讯文档.png
官方群.png

大赛组织:

主办单位:

广东省安全智能新技术重点实验室

南大通用数据技术股份有限公司

哈尔滨工业大学(深圳)

协办单位:

广东省计算机学会

深圳市计算机学会

哈工大(深圳)-南大通用数据库技术联合实验室

 

大赛指导委员会:

黄轩 广东省计算机学会秘书长

王轩 哈尔滨工业大学(深圳)教授、广东省安全智能新技术重点实验室主任

毛睿 深圳大学教授

汤庸 华南师范大学教授

丁明峰 南大通用数据技术股份有限公司董事长

 

大赛组织委员会:

罗文坚 哈尔滨工业大学(深圳)教授

漆舒汉 哈尔滨工业大学(深圳)助理教授,哈工大-南大通用数据库技术联合实验室副主任

刘洋 哈尔滨工业大学(深圳)助理教授,哈工大-南大通用数据库技术联合实验室副主任

杨伟伟 南大通用数据技术股份有限公司 总工办主任,哈工大-南大通用数据库技术联合实验室副主任

 

大赛专家委员会:

夏文   哈尔滨工业大学(深圳)副教授

赵伟   南大通用数据技术股份有限公司 CTO

王雪松 南大通用数据技术股份有限公司 研发部长

崔志伟 南大通用数据技术股份有限公司 产品部长

张加佳 哈尔滨工业大学(深圳)副研究员

唐博   南方科技大学助理教授

秦建斌 深圳大学特聘教授 

参赛规则以及注意事项:

移动端暂不支持参赛结果提交和成绩查看,请前往PC端进行提交和查看。

大赛禁止一切作弊及违规行为,包括但不限于抄袭行为、恶意攻击行为等,对于涉嫌作弊违规的选手或团队,经大赛方核实后,平台会采取限制参赛或直接取消成绩排行等处理措施,具体说明请前往“作弊违规说明”查看。

大赛官方有权根据大赛运行情况及相关需求,调整、变更相关比赛规则、奖品信息、比赛时间等全部比赛所涉及的内容,具体以大赛官方最终确认的为准。

初赛赛题说明:

请选手使用以下调参方法提高DBMS(MySQL5.6)在指定负载下的吞吐量(tps),可以使用的方法包括但不限于基于经验的脚本调参方法,启发式调参方法,基于传统机器学习的调参方法,基于强化学习的调参方法等。为了方便参赛者快速熟悉数据库调参并进行应用,举办方将提供专门的数据库调参系统的镜像。(详细情况参见赛题说明)

决赛赛题说明:

本次大赛复赛采用南大通用企业级分布式事务型数据库GBase8s作为待调优的数据库。本次复赛请选手使用某种调参方法提高GBase8s在指定负载下的吞吐量(tps),可以使用的方法包括但不限于基于经验的脚本调参方法,启发式调参方法,基于传统机器学习的调参方法,基于强化学习的调参方法等。为了方便参赛者快速熟悉数据库调参并进行应用,举办方将提供专门的数据库调参系统的镜像。(详细情况参见赛题说明)

作弊违规说明:

竞赛作弊违规是违反竞赛公平公正的竞争宗旨,擅自增加竞争优势的不良竞赛行为。分别为:

 

(1) 抄袭行为: 凡未能保证原创性的竞赛行为均视为抄袭行为。例如:

  • 引用他人的成果未在引用处注明来源的;

  • 连续引用他人代码超过代码总量 30% 的;

  • 直接使用他人博客、GitHub等开源平台,及其他途径公布的创意、算法、参数配置方式等内容而没有任何原创性修改或加工的;

  • 除引用内容外,其他的内容不足以为方案,算法支撑其主要贡献与价值的;

  • 其他情形满足将他人成果直接作为价值产出而非方案的中间过程的工具与材料 (如: 已知条件,数据清洗办法等)的;

  • 私自与其他队伍或非本队伍成员进行互相抄袭的。

 

(2) 不正当竞争行为: 凡未遵从竞赛宗旨,恶意获取高分的行为均被视为不正当竞争行为。例如:

  • 可以通过除竞赛规定途径之外的其他途径接触到竞赛相关数据的人员参加竞赛的;

  • 邀约参赛团队名单之外的人员参与解题与方案设计,或以外包、求助等形式在参赛团队之外完成赛题的;

  • 参赛者以任何形式使用竞赛提供数据之外的任何数据参赛的(大赛主页明确规定可以使用的除外);

  • 人工标注部分或所有测试集,并作为结果进行提交的;

  • 使用竞赛规定外的计算资源的(大赛主页未做任何规定的除外);

  • 在同一个比赛中,使用多个账号参赛的;

  • 利用平台或规则漏洞进行参赛的;

  • 邀约参赛团队名单之外的人员参与解题与方案设计,或以外包、求助等形式在参赛团队之外完成赛题的。

 

(3)蓄意破坏行为:凡通过恶意手段对比赛平台、评估系统和环境进行破坏的均视为蓄意破坏行为。例如:

  • 蓄意上传携带病毒文件的;

  • 蓄意发起对比赛平台、评估系统的攻击,扰乱比赛秩序的。

处理方法:

惩罚等级
惩罚措施描述
1
限制其账号及所在队伍提交权限24小时(1天)
2
限制其账号及所在队伍提交权限72小时(3天)
3
限制其账号及所在队伍提交权限168小时(7天)
4
取消所在队伍参赛资格,删除排名

申诉:

1. 被判定为作弊的队伍均有申诉资格,邮箱:dbtune@cs.hitsz.edu.cn

2. 申诉时,需要提交包括以下但不限于:

  • 竞赛截图

  • 原因说明(详细)

  • 提交结果的计算代码

3. 申诉期限定为被判定为作弊的24小时内,过期不受理

4. 申诉会在24小时内给出结果,但并不会给出判定原因,每支队伍只允许一次申诉,一次申诉不通过则按作弊处理不再修改

5. 申诉通过的队伍会立刻恢复参赛权限并恢复排名

6. 申诉结果本大会专家判定组有全部解释权