赛前的准备
提前三个星期开始学习我们认为比赛可能用到的知识
pyechart的使用(原想用于制图)
Pandas的使用(要求熟练)
数据大屏的制作(完全没准备好)
- 我的准备
- Pandas(主力,掌握度较好)
- Numpy基础使用(事实上完全没有用)
- Matplotlib基础使用(散点图和折线图)
- 咖啡和面包
大家都没吃面包
🙃
- 队友的准备
- Numpy和Pandas的基础使用
- 部分机器学习和数据拟合的算法
- 报告的基本格式
- Jupyter Notebook的使用
- Excel的熟练使用
暴漏出的缺陷
重大缺陷:
- 我们没一个人会构建数据大屏,下午花了很长时间去学习创建数据大屏
- 对比赛题目的了解不够多,所准备的技能未能完全用上
- 没有明确的时间规划,上午进度较快,下午进度严重落后于正常规划,最后时间十分紧张
其他问题:
- 团队之间的交流过少,甚至大家都不知道其他队员做到什么程度
- 队员之间的重叠能力较少,一个队员出了问题,其他队员也无法帮忙,排查问题花了很多时间
对题目的感想
-
分析数据表的时候需要使用到大量的循环嵌套结构,要在写之前先理好思路,不然中间可能会乱套
-
注意判断读取/写入csv和xlsx文件要不要忽略原有的索引值,处理数据时能不能一次完成,
如果需要分次完成,要注意文件的格式化命名,要能方便批量读取,也要能提示文件所含有的内容
-
优先处理数据,处理完数据再画图,画图速度较快,且必须要有处理好的数据才能画出好的图
-
必须对一些常用的数据分析手段有所了解,应该具备比较强的代码阅读能力,这样即使自己不会写,也能很快套用别人的代码并更具自己的需求对代码进行改进
最终结果
A组二等奖