一、 研究目的及意义本项目旨在通过对1017张新疆人群的人脸照片进行landmark标定并经由普式对齐和非线性降维后提取特征,提取特征后,利用高通量基因分型技术,分析数以万计的单核苷酸多态性(SNPs)以及这些SNPs与临床表型和可测性状的相关性。
GWAS分析全基因组层面上开展大样本的、多中心的、重复验证的技术,并对相关基因与复杂性状进行关联研究,从而全面地揭示出不同复杂性状的遗传机制和基础。
二、 研究方法本研究主要可分为三个阶段:1、 利用opencv里的dlib库对来自新疆的1017张人脸照片进行标定,处理这些位点的坐标信息时,需要先进行点的对应(superimposition),最常用的是普式对齐变换,调整面部方向、角度、位移等信息,以避免对下一步的特征提取造成误差。
2、 依据这些调整后landmark坐标位点信息进行面部特征提取,采用非线性方法进行降维。
机器学习邻域基于神经网络的非线性降维方法包括利用Sigmoid,Tanh,ReLU,Leaky ReLU,ELU等多种函数进行分类。
3、 面部特征提取后,进行包括遗传度、Fst/Qst检验、GWAS等分析。
其中用到的分析软件是P,Plink 是一个开放的,免费的全基因组关联分析工具。
其分析的基础是基因型和表型数据。
通过整合gplink 和Haploview 使得结果变得可视化。
剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付
