結直腸癌(CRC)是美國男女中第三大最常見的癌癥,最近的研究表明,在欠發達地區,包括撒哈拉以南非洲(SSA),其發病率正在增加。來自南非大學的研究人員團隊與南卡羅來納大學-Upstate合作開發了一種方法,該方法依賴于雜交特征(基于DNA突變和RNA表達的模式),并評估了其對突變狀態和存活率的預測特性CRC患者。
南非夸祖魯-納塔爾大學的Mohanad Mohammed領導的研究小組研究了來自Affymetrix GeneChip和RNASeq平臺的54個匹配的福爾馬林固定石蠟包埋(FFPE)樣品的可公開獲得的微陣列和RNASeq數據。樣品用于獲得有關突變型和野生型樣品之間差異表達基因的信息。然后,研究人員應用了生物信息學技術,包括使用支持向量機,人工神經網絡,隨機森林,k近鄰,樸素貝葉斯,負二項式線性判別分析和Poisson線性判別分析算法進行分類??伎怂贡壤L險模型用于生存分析。
與每個平臺的基因列表進行比較時,研究人員指出,雜種基因列表在所有分類器中具有最高的準確性,敏感性,特異性和AUC突變狀態,并且可以預測CRC患者的生存率。負二項式線性判別分析方法是對RNASeq數據的最佳執行者,而SVM方法是兩種數據類型中CRC的最合適分類器。研究人員得出結論,發現有9個基因可以預測生存。
Mohammed指出:“該簽名在臨床實踐中可能有用,特別是對于大腸癌的診斷和治療。”未來的研究應確定整合在癌癥生存分析中的有效性以及在類別大小不同的不平衡數據以及在具有多個類別的數據上的應用。該研究已發表在《當前生物信息學》雜志上。