提交要求

  1. 本页面中的习题包括文档与代码,所有题目均写在同一份文档中,并导出为 PDF 格式,命名为 SynX 招新-机器学习类题目-20xxxxxxxxxxx-XXX.pdf。请注意排版。要求提交代码的题目请将代码放在单独的文件夹中。提交时要求将其打包成 ZIP 压缩包,命名为SynX 招新-机器学习类题目-<学号>-<姓名>.zip,例如:
    SynX 招新-机器学习类题目-20xxxxxxxxxxx-XXX.zip
    ├── SynX 招新-机器学习类题目-20xxxxxxxxxxx-XXX.pdf.pdf
    ├── Play with iris
    |   ├── xxx.py
    │   └── xxx.py
    └── Data data
       └── xxx.ipynb

    代码的文件名自拟,同时在文档中标注代码文件名所进行的工作。

  2. ZIP 压缩包通过邮箱提交,邮箱为:[email protected],邮件的主题为 SynX 招新-机器学习类题目-<学号>-<姓名>
  3. 题目提交的截止时间为 2022 年 10 月 9 日 24:00,在截止时间之前,可以无限次的提交。
  4. 本页面的题目不要求全部做出来,但请尽量都看一看,完成感兴趣的题目即可。
  5. 题目在完成的过程中可以利用互联网、教材及包括但不限于图书馆的各种图书资源,也可以与他人交流。遇到困难请一定不要闭门造车,积极讨论,或是向出题人寻求帮助。

Some resources

Supervised Machine Learning: Regression and Classification | Coursera

Deep Learning by deeplearning.ai | Coursera

李宏毅2021/2022春机器学习课程

《动手学深度学习》

神经网络与深度学习

概念

  1. [blame LAuemtihneer]有一个容量 N=1 的训练集,X_{sample1}=(7,3,2)Y_{sample1}=322114,请基于这个单样本的训练集进行机器学习,并利用学习到的模型预测 X_{test}=(4,5,6),结果是:

    1. 561877
    2. 392024
    3. 其他值,请给出值并说出原因
    4. 要给出正确的回答,需要更多样本来建立模型并预测结果
    5. 其他,请给出理由
  2. [blame Darren]查阅、列举、简述传统机器学习常用方法(列举名字和 sklearn 库中的函数名),给出自己对所列方法的简单理解,请一定要写出自己的理解,而不是他人的理解!(思维导图 preferred)

  3. [blame Darren]给出近年 Deep Learning 流行的合理解释(开放);解释 DL 与 ML 的关系,列举常用 DL 模型。

  4. [blame Darren]捡起线代,简述矩阵乘法的四种运算方式(行x列,行操作,列操作,列x行),并:

    1. 简述W. Gilbert Strang 提出的四大子空间(什么是子空间,这四大子空间的性质和彼此的关系),并对下图给出合理的解释:
      四大子空间
    2. 清晰地阐述何为代数,线性代数是怎样的代数,区分向量维度与子空间维度。

实验

大一

  1. [blame Darren]该代码于本地运行并截图,保存在 Markdown 文件中提交。

  2. [blame Darren]Data data【pandas,matplotlib】下载数据,编写脚本,要求输入名字,给出匹配的tel,将脚本和运行图例写于 Markdown 文件中提交。

  3. [blame Darren]Play with iris.【sklearn】下载鸢尾花数据集,研究花萼长度花萼宽度间的回归关系,并可视化回归线,可视化回归线,并用验证曲线研究核心参数合适的取值(如多项式 degree、随机森林棵数等)。将代码(写上注释)和运行图片保存在 Markdown 文件中提交。

大二

  1. [blame Darren]Data data【pandas,matplotlib】下载数据,编写脚本,要求输入名字,给出匹配的 tel;以合适时间尺度为行,性别为列,制作一张美观的热力图,给出可运行代码(注释)、最终效果图。

  2. [blame Darren]Play with iris.【sklearn】下载鸢尾花数据集,研究花萼长度花萼宽度间的回归关系,可视化回归线,并用验证曲线研究核心参数合适的取值(如多项式 degree、随机森林棵数等);在鸢尾花数据集上演示一种降维、聚类方法,可视化聚类结果。

  3. [blame Darren]预测房价【pytorch | tensorflow】注册 Kaggle 账号,下载数据,阅读说明,向 Kaggle 提交预测结果。要求:访问本地数据,生成本地预测结果,baseline 模型是 MLP,最终 score 至少小于 0.14,对代码进行注释,预处理部分可参考here

思考题

[blame LAuemtihneer]

对于下面这样的验证码(https://www.internationalsaimoe.com/captcha),如果让你设计一个方案进行识别,你会如何进行设计?

只需要说出思路即可,不必进行实际开发工作。


0 条评论

发表回复

Avatar placeholder

您的电子邮箱地址不会被公开。 必填项已用 * 标注