需要解决的问题

王老师用显微镜拍摄了大量植物叶片细胞图像,发现主要可以分成三类:叶片表皮细胞、保护组织细胞和分生组织细胞。希望让 AI 自动识别图片中是哪种细胞,这样就不需要人工一个个判断。

问题提炼:给定一张 80×60 的植物细胞灰度图,让模型输出它属于哪一类细胞。

拖拽一张细胞图片,体验模型的工作流程

示例图片

提示:拖拽到左侧输入接口即可

① 输入接口

📥

把图片拖到这里

② AI 模型处理

🤖

等待输入...

③ 输出结果

📊

结果会显示在这里

如何评价一个 AI 模型?

在算法比赛中,我们会把数据分成两份:训练集用来教模型识别细胞;测试集被评委保密,用来衡量模型的真实能力——只有在测试集上依旧表现不错的模型才算优秀。
步骤一:训练并提交模型
训练集

包含 3,000 张带标签的细胞图片,同学们可以自由使用它来训练任意模型。

📦 3,000 张 · 带标签

提示:同一个训练集可以拖拽给不同模型,比较它们的学习效果。

💡 小贴士:训练完成后记得“提交到评测区”
A

模型 A · 轻量级 CNN

结构简单,训练快,但对复杂纹理不够敏感。

把训练集拖到这里
等待训练集
B

模型 B · 增强版 CNN

结合注意力模块和数据增强,兼顾速度与精度。

把训练集拖到这里
等待训练集
C

模型 C · Vision Transformer

捕捉全局纹理的“巨无霸”,精度最高但训练最慢。

把训练集拖到这里
等待训练集
步骤二:在评测区用隐藏测试集打分
测试集

评委手中“锁住”的 500 张图像。只有提交的模型才能在这里评测,系统只会返回准确率。

🔒 500 张 · 无标签

请拖拽到右侧评测区,查看模型在隐藏数据上的表现。

评测控制台

流程:1) 选择已提交的模型 → 2) 拖拽测试集到下面的评测区 → 3) 查看准确率与点评

🧪

把测试集拖到这里启动评测

未选择模型或未提交将无法评测
尚未评测
--%

提交模型并拖入测试集后,这里会显示真实准确率与建议。

为什么还要 A 榜和 B 榜?

小明一次次打榜,问题出在哪里?

小明参加了一个算法比赛,获得比赛第一的算法可以投入实际应用,为了获得第一名,他开始不断调整模型。下面是他的调试过程:

等待开始 · 训练

点击下方按钮,观察小明如何一步步打榜。

➡️

提交记录

尚未提交

➡️

小明的排名

还没有排名

榜单片段(A 榜)

  • 模型 C95.0
  • 模型 B93.2
  • 模型 A92.5
提示点击“开始小明的打榜”,看看他为了冲分都做了什么。
小明准备进行第 1 次训练与提交。

算法上线后的真实表现

上线当天,小明的新数据通过率只有 72 分,同学们都惊呆了——榜上不是第一名吗?

排行榜成绩
98 分
真实数据成绩
72 分
思考题:小明一直在排行榜上“刷题”,可是一换真实场景就掉分了——你觉得问题出在哪里?

比赛是怎么避免“背模拟题”的?

真正的 AI 赛事会把测试集再细分:一部分给参赛者随时查看成绩,另一部分用于最终排名。

训练集

我们上面训练模型 A/B/C 时用的数据。

  • 公开,可直接访问
  • 用来教模型“细胞该怎么分”

公共测试集(Public Test)

形成 A 榜,榜单实时公开。

  • 不能直接访问
  • 帮助看模型有没有进步

私有测试集(Private Test)

形成 B 榜,比赛结束后公布,用于最终排名

  • 不能直接访问
  • 比赛结束后最终排名
A 榜(公开,可查看实时排名)
  • 模型 A97.5
  • 模型 C94.0
  • 模型 B92.8

像模拟考排名,随时刷新。

B 榜(隐藏,比赛结束后公布,用于最终排名)
  • 模型 C93.5
  • 模型 B88.6
  • 模型 A81.0

相当于中考,决定最终名次。

⏱ 小结:A 榜帮助我们随时调试;B 榜确保模型不是背答案,而是真正掌握了“细胞该怎么分”。这就是为什么比赛会同时设置两个榜单。