一個國際科研團隊在9月13日出版的《自然》雜志上刊發論文稱,他們開發出一種新算法,來比較“阿爾法折疊”數據庫中所有已預測蛋白質的結構,揭示了不同物種蛋白質之間的相似性。最新研究結果有助科學家理解蛋白質的進化歷程,並為人類免疫蛋白質的起源提供了新見解。
蘇黎世聯邦理工學院科學家開發了名為“折疊搜索聚類”的新算法,可同時分析大量蛋白質結構。研究團隊將該算法應用於“阿爾法折疊”數據庫中2億個已被預測的蛋白質結構,識別出了200多萬個獨特的結構聚類——一組在三維形狀上彼此相似的蛋白質結構,其中1/3的聚類以前沒有被描述或分類。
研究團隊指出,了解蛋白質結構對於研究其功能和進化至關重要,盡管科學家在基於序列的蛋白質結構預測方面取得了重大進展,但計算限制使大規模研究這些結構變得困難。折疊搜索聚類算法能以前所未有的規模對結構和集群進行比較,將完成此類任務的時間減少了幾個數量級:使用現有方法對所有結構進行聚類需要10年,而使用折疊搜索聚類隻需5天時間。
研究還深入探討了這些聚類在進化上的意義。雖然大多數聚類都很古老,但約4%的聚類似乎屬於特定物種,為進化現象提供了新見解,如新基因如何從基因組的非編碼區域產生。研究人員指出,這項工作不僅是為了更有效地進行比較,而且能更好地了解蛋白質的進化史。
這項研究中最有趣的發現之一是:人類免疫系統蛋白質與細菌中發現的蛋白質之間的結構具有相似性。這表明,人類參與免疫系統的蛋白質可能與細菌物種有共同的古老的進化起源,這可能重塑人們對免疫系統的理解,也為未來研究蛋白質功能和進化的奧秘制定了路線圖。