多源数据输入
支持 PLINK 二进制基因型、TXT 特征矩阵和 ID-Sire-Dam 系谱文件,并可配合表型、协变量和外部验证集。
v2.0.0
从 SNP 编码、特征降维、系谱特征构建到模型训练与外部验证,IASML 将常见基因组选择机器学习流程整合为统一命令行与云端工作台。
支持 PLINK 二进制基因型、TXT 特征矩阵和 ID-Sire-Dam 系谱文件,并可配合表型、协变量和外部验证集。
提供 center、sample、score、PCA、SPCA、RP、PLS、sample similarity 和 auto 推荐等特征处理策略。
将 fullpath、origin、sexpath 系谱路径转化为稀疏机器学习特征,也可导出 IASBLUP 可用的系谱相似度 K 矩阵。
覆盖 Ridge、Lasso、ElasticNet、SVM、PLS、树模型、XGBoost、DeepGS、DNNGP、PNNGS、Cropformer 和 GPformer。
利用外部 GBLUP / EBV 或机器学习 OOF 基线,训练受约束残差网络,在保持稳定性的基础上补充非加性信号。
云端按 Job 隔离文件,实时查看日志,自动打包预测结果、模型参数、DR 报告、验证相关性和图像文件。
v2.0.0 面向机器学习基因组预测、系谱特征工程、残差校正和在线任务管理的常见分析需求。
使用 PLINK 012 SNP 或 TXT 特征矩阵,快速运行 Ridge、SVM、PLS、XGBoost 等模型,输出个体预测值与验证相关。
通过 center、sample、score、PCA、SPCA、RP、PLS、SIM 和 auto 策略降低高维 SNP 对机器学习模型的干扰。
将 ID-Sire-Dam 系谱转换为 fullpath、origin 或 sexpath 通道特征,用于机器学习预测与父源 / 母源路径解释。
根据系谱路径特征构建 fullpath 或 sire / dam 相似度矩阵,导出可用于 IASBLUP 后续遗传评估的 K 文件。
接入外部 OOF 基线和预测集 EBV / base prediction,在稳定基线之上学习受约束的非线性残差信号。
按指定折数和随机种子生成训练 / 验证表型文件,便于 IASML、IASBLUP 和外部流程使用统一数据划分。
紧凑展示 IASML 在线端涉及的核心模块,用户可以先快速了解,再进入在线运行页选择任务。
PLINK bed/bim/fam、TXT marker matrix、Pedigree、phenotype、外部验证集与 GCRNet 基线文件。
none、center、sample、score、pca、spca、rp、pls、sim、auto;适合从无处理到自动特征处理的多层级测试。
Linear、Ridge、Lasso、ElasticNet、SVM、PLS、Decision Tree、Random Forest、GBM、XGBoost。
DeepGS、DNNGP、PNNGS、Cropformer、GPformer;支持在自定义模式下设置 epochs、batch size、learning rate 等参数。
CRNet 可作为内部基线残差模型;GCRNet 需要外部 OOF 与 base prediction,用于受约束残差增强。
预测结果、验证结果、K 矩阵、报告摘要、模型文件、训练曲线、日志与命令配置按任务自动归档。
在线平台只是入口,核心计算仍由 IASML.py 完成,便于和本地 / HPC 命令行结果保持一致。
PLINK / TXT / Pedigree 与表型文件。
中心化、筛选、降维或相似度特征。
基础模型、深度模型或 CRNet。
输出预测、日志、模型与报告文件。
先明确分析目标,再上传对应文件,平台会根据任务类型逐步展开必要参数,避免一次性展示无关选项。
软件安装包、示例数据、使用说明书和历史版本。
适合服务器和高性能计算集群。
待上传适合本地快速测试和教学演示。
待上传PLINK、TXT、pedigree 和 GCRNet 示例。
待整理软件参数说明、云平台使用流程和示例命令。
待上传