国家生物信息中心和表型组学研究中心公开植物图像及相关性状开放归档库OPIA

发布时间 2023-12-10 16:57:43作者: 生物信息与育种

目录

    植物图像承载着丰富的信息,反映了植物的颜色、形态、生长和健康状态等关键特征。高通量植物表型采集技术广泛用于植物表型组学研究,产生了大量基于图像的性状数据,对种质筛选、植物病虫害鉴定和农艺性状挖掘等方面具有重要价值。

    为了提供有效的数据管理和支持智慧农业,中科院遗传与发育所作物表型组学研究中心与北京基因组研究所(国家生物信息中心)近期合作开发了植物图像及相关性状的开放归档库(Open Plant Image Archive, OPIA),为国内外科研人员提供植物图像及相关性状数据递交与共享的公共服务。

    网站地址:https://ngdc.cncb.ac.cn/opia/

    OPIA示意图

    OPIA整合了56个高质量的植物图像数据集,包括11个物种、6种组织类型,总计566,225张图像、2,417,186个注释实例。这一资源通过标准化人工审编流程,提供了综合性的数据质量评价,并支持用户进行图像预处理和智能预测。

    OPIA采用的数据整理和数据集评估流程包括三个关键步骤。首先,从公开可用的仓库中整合了相关的出版物和数据集标签文件。然后,通过Python脚本过滤和提取所有图像和标签的信息,并从出版物中手动整理所有数据集的元信息。第三,基于十个指标为所有数据集分配评估分数。

    OPIA数据统计(截止2023.8.1)

    OPIA网页的截图,包括(A)缩略图中的数据集,(B)表格中的数据集,和(C)数据集的详细信息。

    OPIA网页的截图,包括(A)i-traits,(B)i-traits的详细信息,和(C)tools。

    作为植物图像及相关性状的综合资源归档库,OPIA对整合来自不同平台和组织类型的植物表型组学数据发挥着关键作用。通过运用不同传感器类型的图像样本和相应标签数据,OPIA促进了研究人员提高智能预测方法的精度,揭示了植物生长的动态规律,推动了全球植物表型组学领域的创新和发展。

    图像及基于图像特征的应用。(A)产量估计、(B)GWAS和GS。

    小编碎碎念:
    这是一个很有价值的数据库,表型组图像对于现代育种而言非常重要,这方面的数据实在太少了。

    Cao Y, Tian D, Tang Z, et al. OPIA: an open archive of plant images and related phenotypic traits. Nucleic Acids Res. 2023


    大家好,我是米源MY,从事生信研究和工作已经十余年了,现在育种行业,致力于将生信、AI和大数据等新技术应用于育种,实现育种现代化。我会不定期更新这些领域的相关信息,如果你感兴趣,欢迎关注我,谢谢!微信公众号:生物信息与育种。个人微信:MiyuanBiotech

    更多信息请关注微信公众号:生物信息与育种