每日学习记录20230228_mzR

发布时间 2023-04-11 08:53:01作者: Mo槑

20230228:mzR,Norm,Regression

  1. mzR:
    mzML格式读取是使用proteowizard C++库.
    常用函数:读入数据的openMSfile,提取数据矩阵的header以及提取峰图谱的peaks

  2. Norm范数
    L0 Norm:c(0,0)的L0 Norm等于0,c(1,0)的L0 Norm等于1, c(1,2)等于2
    L1 Norm:用于Manhattan Distance or Taxicab norm这些距离计算,比如说c(3,4):
    img

    L2 Norm:这就是著名的欧式距离计算公式了
    img

    L-infinity norm: 给出这个向量中绝对值最大的,比如c(-6,4,2). L-infinity norm=6

    资料来源

  3. Ridge Regression and Lasso Regression
    原理都差不多,但是惩罚项不一样

    Ridge Regression:

    img

    Lasso Regression:

    img

    他们的惩罚项一个是平方和,一个是绝对值的和.

    一个是L2正则化,一个是L1正则化.

    正因如此,Lasso回归不仅有助于减少过拟合还能帮助我们进行特征选择。

    引用地址