1019026成大探勘競賽.jpg 

【新南瀛記者黃鐘毅報導】成功大學資訊工程學系暨醫學資訊所教授高宏宇教授指導碩士班學生李昕純、方傑以及博士生徐褘佑,建立一套自動擷取生醫文獻中「疾病名詞」並加以歸類的快速有效比對系統,9月參加由美國國家生物科技資訊中心與西班牙國家生物資訊學會在西班牙共同舉辦的BioCreative V「國際生物文獻自動探勘競賽」的「疾病名詞擷取與正規化」競賽項目,擊敗眾強勁國際團隊,一舉奪下首獎,亮麗表現令人激賞。

國際生物文獻自動探勘競賽,對「疾病名詞擷取與正規化」競賽評比訂出至少要達到52.3%的正確率,李昕純等人所建立的系統,在比賽評比的正確率為86.46%,不僅遠高於比賽單位的要求,也超越由美國國家生物科技資訊中心(NCBI)所研發的現有使用工具DNorm 6%,其優異的成果被邀稿將在國際期刊 – Oxford Database journal (impact factor rank in top 10%)上發表。

李昕純表示,在文字探勘或文字挖掘乃指要在巨量資料中找出想要的「文字」進而提供後續的語意分析,而目前大型生物知識庫仍得仰賴大量專家人力從文獻中擷取知識,建置的成本相當龐大。此外,疾病名詞的命名方式相當的多樣化,除了一般常見的同義字外,還存在著組合字、縮寫…等問題。對資訊的「擷取」多少帶來困擾或疏漏,因此建立一套快速、有效的系統來輔助與辨識是件相當重要的議題。

在高宏宇教授指導下,李昕純、方傑及學長徐褘佑等人,先分析疾病命名特徵(包括字根、字首、字尾等),並結合大量醫學字典等進行輔助,透過「機器學習」的方式,建立起疾病名詞擷取探勘模組。

arrow
arrow
    全站熱搜

    黃之寶 發表在 痞客邦 留言(0) 人氣()