Sunday, July 30, 2023

建立工廠瑕疵/醫院疾病判定模型的困難點

  • 今日記事:專題製作題目定案去開門之前,醫學資訊管理師認真回答現階段以機器學習建立工廠瑕疵/醫院疾病判定模型的困難點,互相交流求進步💪
  • 對我的意義:無論是工廠品管要篩出瑕疵品、或是醫院要判斷病人是否罹患特定疾病,該需求項的機器學習預期目的應為「毫無遺漏地找出整體中的少數例外」→ 以評估指標來說,就是會很重視召回率(=靈敏度、真陽性率)。
  • 新發現:但是重視召回率的分類問題難以應用於臨床,因為「很難為召回率設定一個目標值」。比方說95%召回率的檢測疾病機器學習模型對於資料科學家來說相當不錯,但是醫事人員應該沒人能夠接受會有5%病患被遺漏的疾病判定模型 QQ
  • 我的行動:工廠品管瑕疵品篩選建模也和醫院臨床有同樣困境,就算建出召回率高達98%的機器學習模型、資料科學家都興奮到想撒花慶祝了;但是對工廠QC而言,被遺漏的那2%瑕疵品還是不能接受 ← 也就是說,現階段關於工廠瑕疵/醫院疾病判定這種目的為「毫無遺漏地找出整體中的少數例外」的機器學習之難處,第一個是想要檢出的「陽性」數量都遠小於不需被檢出的「陰性」數量,於是要收集數量稀少的「陽性標準答案」並不容易;第二個是醫院和工廠能夠幫資料科學家做出明確分類判斷的人也很有限,致使監督式機器學習中最重要的「陽性標準答案」難以取得【所以實務上資料科學家對於工廠瑕疵品預測的貢獻,比較是在以重要性分析來找出工廠的哪些製造條件會是導致瑕疵品產出的重要影響因子,就像NASA為了確保遠離地球的太空人的飲食安全而建立的HACCP食品安全與品質管理制度

No comments:

Post a Comment