挑战任务一_天气瓶中的数据科学

发现物质X的结晶奥秘

快速导航

赛题背景

天气瓶是一种美丽的装饰品,起源于19世纪。它内部的液体会随着环境变化形成不同的结晶图案,有时像羽毛,有时像雪花,非常神奇!

科学家在未知星球发现了一种神奇的物质X,它具有特殊的性质:

  • 容易溶解在酒精中,但很难溶解在水中
  • 温度越高,它能溶解得越多
  • 当溶解度低于10克/100克溶剂时,会形成漂亮的羽毛状结晶
  • 当溶解度高于10克/100克溶剂时,会形成美丽的雪花状结晶

结晶形态如何形成?

结晶形态主要由溶解度决定,而溶解度受两个因素影响:

温度

乙醇浓度

溶解度:决定结晶形态的关键

结晶形态

<10g → 羽毛状
>10g → 雪花状

任务说明

任务节奏安排

统一行动

老师讲解和演示时,请先认真听讲,保持节奏一致。

自由探索

到'动手练习'时,按自己的速度完成,节奏快的同学可以继续向下查看。

同学们的求助系统(三步走)

自查

检查拼写、路径

求助同学

小声讨论,互相检查

求助老师

老师和助教会前来支援

我们的目标:一起体验从数据到发现的全过程!

数据集说明

打开data_training文件夹,你会看到许多CSV文件:

data_training/ (训练数据文件夹)
0.csv (乙醇浓度为0%)
5.csv (乙醇浓度为5%)
10.csv (乙醇浓度为10%)
15.csv (乙醇浓度为15%)
...
100.csv (乙醇浓度为100%)

每个CSV文件包含两行数据:

数据示例:5.csv (乙醇浓度5%)

273.15 K 278.15 K 283.15 K 288.15 K ...
0.0112 0.0133 (缺失) 0.0194 ...

科学数据的特点:真实科学环境下的测量数据往往不完美,会有缺失值。

四个核心任务

1修复数据

把每个表中缺失的部分补全。

使用相邻数据的平均值来填充缺失值:

缺失值 = (左边数据 + 右边数据) ÷ 2

例如,在5.csv中,283.15K的缺失值计算为:

(0.0133 + 0.0194) ÷ 2 = 0.01635

2整合数据

补全后把各个表整合为一个大表格。

这个表格将体现:

  • 乙醇质量分数
  • 温度
  • 溶解度值

三者之间的对应关系。

3找到羽毛晶体条件

根据完整的数据表,通过临界值筛选:

  • 筛选出溶解度 < 10g 的数据点
  • 这些就是能产生羽毛状晶体的条件
  • 整理成新表格,包含三列:
    1. 溶解度(g)
    2. 温度(K)
    3. 乙醇浓度(%)

4数据可视化

用热力图(Heatmap)清晰展示所有规律:

  • 展示溶解度如何随温度变化
  • 展示溶解度如何随乙醇浓度变化
  • 用不同颜色标记羽毛状和雪花状结晶区域

通过图表直观理解数据规律。

最终结果格式

完成任务后,你需要生成以下两种结果文件:

1. 物质X溶解度矩阵

乙醇浓度 (%) 273.15 K 278.15 K 283.15 K ...
0 0.0056 0.0066 0.0077 ...
5 0.0112 0.0133 0.0164 ...
... ... ... ... ...

2. 羽毛状晶体产生条件列表

溶解度 (g) 温度 (K) 乙醇浓度 (%)
0.0056 273.15 0
0.0066 278.15 0
... ... ...

Excel模拟步骤

有同学发现,用Excel也可以完成,它的过程是下面这样:

Excel版步骤:

  1. 打开示例CSV文件(如5.csv)
  2. 手动计算并填充缺失值
  3. 将多个文件的数据整理到一个工作表中
  4. 使用排序功能按乙醇浓度排序
  5. 应用筛选功能找出溶解度<10的数据点
  6. 尝试制作图表展示数据规律

Excel手动操作会更清楚地理解数据处理的每一步,但我们在这个任务中用更加数据科学的方式来完成!