IASML logo v2.0.0
Intelligent Agricultural Solutions of Machine Learning
IASML 是面向动植物育种的机器学习与基因组预测平台,支持 PLINK / TXT / 系谱输入,集成 DRS 特征处理、PedigreeBridge、传统机器学习、深度学习以及 GCRNet / CRNet 残差校正策略。
Genomic prediction DRS PedigreeBridge Deep learning GCRNet / CRNet
0
内置预测模型与残差模型
0
DRS 特征处理策略
0
基因型 / 组学 / 系谱输入
0
深度学习基因组预测模型

核心功能

从 SNP 编码、特征降维、系谱特征构建到模型训练与外部验证,IASML 将常见基因组选择机器学习流程整合为统一命令行与云端工作台。

多源数据输入

支持 PLINK 二进制基因型、TXT 特征矩阵和 ID-Sire-Dam 系谱文件,并可配合表型、协变量和外部验证集。

IASML-DRS

提供 center、sample、score、PCA、SPCA、RP、PLS、sample similarity 和 auto 推荐等特征处理策略。

PedigreeBridge

将 fullpath、origin、sexpath 系谱路径转化为稀疏机器学习特征,也可导出 IASBLUP 可用的系谱相似度 K 矩阵。

模型体系

覆盖 Ridge、Lasso、ElasticNet、SVM、PLS、树模型、XGBoost、DeepGS、DNNGP、PNNGS、Cropformer 和 GPformer。

GCRNet / CRNet

利用外部 GBLUP / EBV 或机器学习 OOF 基线,训练受约束残差网络,在保持稳定性的基础上补充非加性信号。

任务与结果管理

云端按 Job 隔离文件,实时查看日志,自动打包预测结果、模型参数、DR 报告、验证相关性和图像文件。

典型应用场景

v2.0.0 面向机器学习基因组预测、系谱特征工程、残差校正和在线任务管理的常见分析需求。

常规基因组预测

使用 PLINK 012 SNP 或 TXT 特征矩阵,快速运行 Ridge、SVM、PLS、XGBoost 等模型,输出个体预测值与验证相关。

高维标记特征处理

通过 center、sample、score、PCA、SPCA、RP、PLS、SIM 和 auto 策略降低高维 SNP 对机器学习模型的干扰。

系谱特征预测

将 ID-Sire-Dam 系谱转换为 fullpath、origin 或 sexpath 通道特征,用于机器学习预测与父源 / 母源路径解释。

系谱 K 矩阵输出

根据系谱路径特征构建 fullpath 或 sire / dam 相似度矩阵,导出可用于 IASBLUP 后续遗传评估的 K 文件。

GCRNet 残差校正

接入外部 OOF 基线和预测集 EBV / base prediction,在稳定基线之上学习受约束的非线性残差信号。

交叉验证文件制作

按指定折数和随机种子生成训练 / 验证表型文件,便于 IASML、IASBLUP 和外部流程使用统一数据划分。

方法与模型预览

紧凑展示 IASML 在线端涉及的核心模块,用户可以先快速了解,再进入在线运行页选择任务。

输入类型

PLINK bed/bim/fam、TXT marker matrix、Pedigree、phenotype、外部验证集与 GCRNet 基线文件。

DRS 策略

none、center、sample、score、pca、spca、rp、pls、sim、auto;适合从无处理到自动特征处理的多层级测试。

基础模型

Linear、Ridge、Lasso、ElasticNet、SVM、PLS、Decision Tree、Random Forest、GBM、XGBoost。

深度模型

DeepGS、DNNGP、PNNGS、Cropformer、GPformer;支持在自定义模式下设置 epochs、batch size、learning rate 等参数。

残差模型

CRNet 可作为内部基线残差模型;GCRNet 需要外部 OOF 与 base prediction,用于受约束残差增强。

输出管理

预测结果、验证结果、K 矩阵、报告摘要、模型文件、训练曲线、日志与命令配置按任务自动归档。

推荐分析流程

在线平台只是入口,核心计算仍由 IASML.py 完成,便于和本地 / HPC 命令行结果保持一致。

1

上传数据

PLINK / TXT / Pedigree 与表型文件。

2

选择 DRS

中心化、筛选、降维或相似度特征。

3

训练模型

基础模型、深度模型或 CRNet。

4

验证与下载

输出预测、日志、模型与报告文件。

IASML 在线运行

先明确分析目标,再上传对应文件,平台会根据任务类型逐步展开必要参数,避免一次性展示无关选项。

1
选择目标
What to do
2
上传文件
Input files
3
选择性状
Trait / covariates
4
模型策略
Quick / custom
5
运行结果
Log / download
第一步:请选择分析目标,平台会自动带你进入下一步。
01

选择分析目标

先告诉平台你要完成什么任务,后续步骤只显示当前任务需要的参数。

02

上传输入文件

PLINK 三文件会在后端统一重命名为 genotype 前缀,避免路径不一致。

GCRNet 基因型来源
03

选择性状与协变量

上传表型文件后,平台会读取表头并自动生成下拉选择。列号仍按原始文件计算:第 1 列为个体 ID。

请先上传 phenotype 文件。解析成功后会在这里显示可选性状和协变量。
因子型协变量 --f
等待表型文件
数值型协变量 --n
等待表型文件
04

模型策略

默认选择“快速运行”即可;需要完全控制训练细节时切换到“自定义”。线程数由服务器后台统一控制。

sklearn 模型参数
默认使用 IASML 内置参数搜索;选择“手动指定参数”后,平台会根据当前模型生成参数文件并自动传给 --model-params,用户不需要再上传 txt。
DRS 特征处理
深度学习参数
这些参数只在 DeepGS、DNNGP、PNNGS、Cropformer、GPformer 中启用。快速运行时使用 IASML 默认设置。
PedigreeBridge 参数
GCRNet 外部基线
GCRNet 使用外部 OOF 预测值训练残差网络,并使用预测集 EBV / base prediction 作为最终基线。
外部验证

下载中心

软件安装包、示例数据、使用说明书和历史版本。

Linux / HPC

v2.0.0

适合服务器和高性能计算集群。

待上传

Windows

v2.0.0

适合本地快速测试和教学演示。

待上传

示例数据

Demo

PLINK、TXT、pedigree 和 GCRNet 示例。

待整理

使用说明书

Manual

软件参数说明、云平台使用流程和示例命令。

待上传

快速安装

$ conda create -n iasml_cloud python=3.10 -y $ conda activate iasml_cloud $ pip install -r requirements.txt $ python IASML.py --help