算法比赛入门指南 - 问题提炼与模型评估

需要解决的问题

王老师用显微镜拍摄了大量植物叶片细胞图像，发现主要可以分成三类：叶片表皮细胞、保护组织细胞和分生组织细胞。希望让 AI 自动识别图片中是哪种细胞，这样就不需要人工一个个判断。

问题提炼：给定一张 80×60 的植物细胞灰度图，让模型输出它属于哪一类细胞。

📷 三类细胞示例

🖼️

点击查看大图

叶片表皮细胞 · Epidermis

覆盖叶片表面，形状较规则

🔬

点击查看大图

保护组织细胞 · Dermal

排列紧密，负责保护

🌱

点击查看大图

分生组织细胞 · Meristematic

细胞更小，能持续分裂

拖拽一张细胞图片，体验模型的工作流程

示例图片

提示：拖拽到左侧输入接口即可

① 输入接口

📥

把图片拖到这里

② AI 模型处理

🤖

等待输入...

③ 输出结果

📊

结果会显示在这里

如何评价一个 AI 模型？

在算法比赛中，我们会把数据分成两份：训练集用来教模型识别细胞；测试集被评委保密，用来衡量模型的真实能力——只有在测试集上依旧表现不错的模型才算优秀。

步骤一：训练并提交模型

训练集

包含 3,000 张带标签的细胞图片，同学们可以自由使用它来训练任意模型。

📦 3,000 张 · 带标签

提示：同一个训练集可以拖拽给不同模型，比较它们的学习效果。

💡 小贴士：训练完成后记得“提交到评测区”

A

模型 A · 轻量级 CNN

结构简单，训练快，但对复杂纹理不够敏感。

把训练集拖到这里

等待训练集

B

模型 B · 增强版 CNN

结合注意力模块和数据增强，兼顾速度与精度。

把训练集拖到这里

等待训练集

C

模型 C · Vision Transformer

捕捉全局纹理的“巨无霸”，精度最高但训练最慢。

把训练集拖到这里

等待训练集

步骤二：在评测区用隐藏测试集打分

测试集

评委手中“锁住”的 500 张图像。只有提交的模型才能在这里评测，系统只会返回准确率。

🔒 500 张 · 无标签

请拖拽到右侧评测区，查看模型在隐藏数据上的表现。

评测控制台

流程：1) 选择已提交的模型 → 2) 拖拽测试集到下面的评测区 → 3) 查看准确率与点评

🧪

把测试集拖到这里启动评测

未选择模型或未提交将无法评测

尚未评测

--%

提交模型并拖入测试集后，这里会显示真实准确率与建议。

为什么还要 A 榜和 B 榜？

小明一次次打榜，问题出在哪里？

小明参加了一个算法比赛，获得比赛第一的算法可以投入实际应用，为了获得第一名，他开始不断调整模型。下面是他的调试过程：

等待开始 · 训练

点击下方按钮，观察小明如何一步步打榜。

➡️

提交记录

尚未提交

➡️

小明的排名

还没有排名

榜单片段（A 榜）

模型 C95.0
模型 B93.2
模型 A92.5

提示点击“开始小明的打榜”，看看他为了冲分都做了什么。

小明准备进行第 1 次训练与提交。

算法上线后的真实表现

上线当天，小明的新数据通过率只有 72 分，同学们都惊呆了——榜上不是第一名吗？

排行榜成绩

98 分

真实数据成绩

72 分

思考题：小明一直在排行榜上“刷题”，可是一换真实场景就掉分了——你觉得问题出在哪里？

比赛是怎么避免“背模拟题”的？

真正的 AI 赛事会把测试集再细分：一部分给参赛者随时查看成绩，另一部分用于最终排名。

训练集

我们上面训练模型 A/B/C 时用的数据。

公开，可直接访问
用来教模型“细胞该怎么分”

公共测试集（Public Test）

形成 A 榜，榜单实时公开。

不能直接访问
帮助看模型有没有进步

私有测试集（Private Test）

形成 B 榜，比赛结束后公布，用于最终排名

不能直接访问
比赛结束后最终排名

A 榜（公开，可查看实时排名）

模型 A97.5
模型 C94.0
模型 B92.8

像模拟考排名，随时刷新。

B 榜（隐藏，比赛结束后公布，用于最终排名）

模型 C93.5
模型 B88.6
模型 A81.0

相当于中考，决定最终名次。

⏱ 小结：A 榜帮助我们随时调试；B 榜确保模型不是背答案，而是真正掌握了“细胞该怎么分”。这就是为什么比赛会同时设置两个榜单。