放射科設備 |
超聲科設備 |
手術室設備 |
檢驗科設備 |
實驗室設備 |
理療科設備 |
急救室設備 |
兒科設備 |
眼科設備 |
牙科設備 |
婦科男科設備 |
滅菌消毒設備 |
醫用教學模型 |
美容儀器設備 |
家庭保健器具 |
CR病床 推車 柜 |
ABS病床輪椅 |
醫用耗材 |
新聞中心
人工智能醫療器械設計開發及注冊審查要點
第一部分:人工智能醫療器械的監管信息
首先,我們看下人工智能醫療器械的定義:
人工智能醫療器械是指基于“醫療器械數據”,采用人工智能技術實現其預期用途(即醫療用途)的醫療器械。
醫療器械數據是指醫療器械產生的用于醫療用途的客觀數據,如醫學影像設備產生的醫學圖像數據(如X射線等圖像)、醫用電子設備產生的生理參數數據(如心電等波形數據)、體外診斷設備產生的體外診斷數據(如病理圖像等);
在特殊情形下,通用設備(非監管對象)產生的用于醫療用途的客觀數據亦屬于醫療器械數據,如數碼相機拍攝的用于皮膚疾病診斷的皮膚照片、健康電子產品采集的用于心臟疾病預警的心電數據等。
基于醫療器械數據包括醫療器械數據的生成、使用等情況,其中使用情況含單獨使用醫療器械數據,或者以醫療器械數據為主聯合使用非醫療器械數據(如患者主訴信息、檢驗檢查報告結論、電子病歷、醫學文獻等)。
人工智能醫療器械注冊審查指導原則
1.產品名稱
命名規則:產品名稱應遵循《醫療器械通用名稱命名規則》、《醫用軟件通用名稱命名指導原則》、國家標準、行業標準、規范性文件。
命名格式:
特征詞1(如有) + 特征詞2(如有) + 特征詞3(如有) + 核心詞
具體可參考《醫用軟件通用名稱命名指導原則》(已存入Ima知識庫 「御器素問」,點擊下劃線加入)中輔助決策類軟件(表1)和非輔助決策類軟件(表2~表9),如果表2~表9中的產品使用人工智能技術,則需要將核心詞中的“軟件”替換為“輔助決策軟件”進行命名。
例如放射治療輪廓勾畫軟件如采用非人工智能技術,命名為“放射治療輪廓勾畫軟件”;如采用人工智能技術,則命名為“放射治療輪廓勾畫輔助決策軟件”。
醫用軟件通用名稱命名指導原則
2.管理屬性界定
從范圍上來講,人工智能>機器學習>深度學習,但由于機器學習是人工智能重要且最核心的子集,目前的指導原則對于人工智能和機器學習并未進行嚴格區分。
但需要注意的是:基于知識管理的醫學人工智能產品不屬于人工智能醫療器械。原因在于,對醫學知識真偽優劣的評判不屬于醫療器械范疇。例如,知識圖譜或量表等,其最高評價是衛生部門相關工作辦法。人工智能技術主要作為外部參考價值,而非具體評價標準。此外,醫學人工智能產品若基于非醫療器械數據,主要針對醫學知識進行管理,也不屬于人工智能醫療器械。即使基于醫療器械數據且應用了人工智能技術,但未實現產品醫療用途,或醫療用途被用于非醫療用途或非醫療功能的網站,也不屬于人工智能醫療器械。簡單總結如下:
作為醫療器械管理需同時滿足:
處理對象為醫療器械數據;
核心功能為數據處理、分析等;
實際用于醫療用途。
不作為醫療器械管理的情形:
處理非醫療器械數據(如患者主訴)、核心功能非數據處理,或用途非醫療。
3.管理類別的界定
算法成熟度低(未充分驗證):
輔助決策(如病灶識別、治療建議):三類
非輔助決策(如數據測量提供參考):二類
算法成熟度高(已驗證):按現行《醫療器械分類目錄》和分類界定文件等執行。
第二部分:人工智能醫療器械的分類
人工智能醫療器械可從多維度分類:
監管角度
分為人工智能獨立軟件(利用人工智能實現預期用途的醫療器械管理軟件)和人工智能軟件組件(硬件設備中用于圖像處理等的人工智能軟件)。
用途
分為輔助決策(醫生助手,醫生有最終決策權)和非輔助決策(獨立工具)。
功能
包括處理功能(前后處理,以醫生終端用戶功能為界限)、控制功能(機械臂控制、閉環數據預防控制等)和安全功能(安全措施、報警預警等)。
算法
分為三個階段,傳統有監督與無監督學習(差別在數據標注);基于模型或數據驅動;黑盒與白盒算法(從性能區分)。
成熟度
全新產品(上市但安全有效性未充分證實,有潛在風險)和成熟產品(安全有效性已證實) 。各維度相互交叉,無嚴格界限,需綜合考慮算法特性與監管要求,產品只要算法、功能、用途中有一項全新即視為全新產品。
第三部分:人工智能醫療器械的更新
從大范圍來看,人工智能醫療器械更新具有防衛作用。人工智能醫療器械更新相關要點:
1.軟件更新分類及處理
分重大和輕微軟件更新。重大需申請變更注冊;輕微可體系控制,下次變更注冊提交現場變更情況。
2.算法更新類型
(1)算法驅動性更新
含算法結構、流程、編程框架等。算法重新訓練(棄原數據用新數據)屬此類,重大且易更新。
(2)數據驅動性更新
因訓練數量增加的算法更新,中等風險,需申請變更注冊。算法性能評估結果與前次注冊有統計差異為重大軟件更新。算法更新有累積效應,微小變化累積可能影響產品性能。
(3)算法重新訓練更新
將原訓練數據棄用,采用全新訓練數據進行重新導入。這種情況視為算法驅動性更新,屬于重大且容易更新的領域。
對于基于數據類型的算法而言,是否屬于重大軟件更新主要根據算法性能評估結果來評判。如果算法性能評估結果發生顯著性改變,則屬于重大軟件更新。顯著性改變是指算法性能評估結果與前次注冊相比存在統計差異的情況。從2.0版本開始,需注意與前次注冊相比,而非與前次更新相比。算法更新有累積效應,微小變化累積可能影響產品性能。若僅關注每次更新的微小變化,可能難以察覺顯著性差異。然而,當累積到一定程度時,這些微小變化可能對產品性能產生重大影響。因此,將更新分為算法更新和數據系統性分析是必要的,尤其是考慮到基于數據的算法更新相對較快。
3.更新管理方式
如果每次算法更新都需要進行變更注冊,無論是對企業還是監管機構來說,都是一種資源的過度占用。為了減輕各方的負擔,可以通過質量體系控制那些未產生顯著性改變的數據驅動性更新,無需申請變更注冊。
人工智能醫療器械其他類型的算法更新、軟件更新以及重大軟件更新判定原則詳見「醫療器械軟件指導原則」、「醫療器械網絡安全指導原則」。
4.軟件版本命名規則
此外還需關注人工智能更新的命名規則及相關要求,根據「深度學習輔助決策醫療器械軟件審評要點」(已存入Ima知識庫 「御器素問」,點擊下劃線加入)中明確規定:
軟件版本命名規則應當涵蓋算法驅動型軟件更新和數據驅動型軟件更新,明確并區分重大軟件更新和輕微軟件更新,其中重大軟件更新應當列舉全部典型情況。
深度學習輔助決策醫療器械軟件審評要點
5 更新審評關注點
所有軟件更新都應依據質量管理體系要求,開展適配更新類型、內容和程度的驗證與確認活動。算法驅動型和數據驅動型軟件更新,需開展算法性能評估、臨床評價等活動,確保更新后的安全性與有效性。
軟件更新臨床評價要匹配安全性級別:
C 級高風險軟件
適用范圍實質變更原則上需開展臨床試驗,其他變更可用回顧性研究進行臨床評價。
B、A 級中低風險軟件
可通過回顧性研究開展軟件更新臨床評價。
第四部分:審評關注要點
1.風險管理:
整體而言,與其他醫療器械相同,基于全生命周期的風險管理仍然是人工智能醫療器械的基本策略,相關考慮可參考「醫療器械軟件注冊技術審查指導原則」、「醫療器械網絡安全注冊技術審查指導原則」、「移動醫療器械注冊技術審查指導原則」、「醫療器械生產質量管理規范獨立軟件附錄」(已全部存入Ima知識庫 「御器素問」,點擊下劃線加入)。
貫穿全生命周期,基于預期用途(目標疾病、緊迫性)、使用場景(適用人群、場所)和核心功能。
關注漏診(假陰性)導致診療延誤、誤診(假陽性)導致不必要診療的風險。
進口軟件需評估中外人種、流行病學、診療規范差異。
深度學習是基于海量數據和高算力的黑盒算法。審評要點聚焦軟件的數據質量控制、算法泛化能力、臨床使用風險 ,臨床使用風險受數據質量控制、算法泛化能力直接影響,以及算力計算資源(運行環境)失效間接影響。
2.設計開發核心階段:
軟件典型設計開發過程通常可分為需求分析、數據收集、算法設計、驗證與確認等階段。
(1)需求分析
需求分析對產品設計開發至關重要。在需求分析階段,需要啟動主動分析質控相關工作,不能等到產品完成后才考慮相關質控標準。需求分析應以應用需求為導向,結合產品用途和法規要求,綜合考慮功能需求。包括法規要求、指導原則和標準要求等。有些產品在設計、開發和施工時,未考慮醫療器械相關要求,導致法規指導原則和標準無法滿足需求。因此,在需求分析時,要重點關注法規指導原則和標準相關要求。
需求分析以軟件臨床需求與使用風險為導向,結合預期用途、使用場景、核心功能,綜合考量法規、標準、用戶等多方面需求,重點關注數據收集、算法性能、臨床使用限制等要求。
數據收集:需考慮數據來源的合規性、數據的充分性和多樣性(多家機構、多地域、多設備),考慮疾病構成、人群分布及統計指標。數據來源必須符合相關法律法規要求,數據量要足夠大,尤其是在深度學習場景中,以確保性能指標的合規性。同時,數據應盡可能涵蓋不同情況和類型,以提升算法的泛化能力和性能。此外,還需關注數據分布的合理性和臨床相關統計數據的分布情況,避免數據分布偏差對產品性能產生影響。
算法性能評價:需考慮評價標準,包括假陽性和假陰性率、重復性與再現性、魯棒性、線性、剛性、健康性和實質性等相關要求。不同產品的要求不同,需結合具體情況,適應性能指標。在進行評判時,還需考慮金標準和參考標準的確定、實現和驗證,這是評判算法性能的關鍵。
臨床使用限制:沒有一個完美的產品能解決所有臨床場景的問題,產品都有其適用范圍。在設計產品時,需考慮產品能滿足哪些臨床適用場景,這與產品聲稱密切相關。聲稱范圍越大,產品證據和覆蓋面的充分性要求就越高。因此,在產品需求分析階段,應當考慮臨床禁用、慎用等場景,避免過度宣傳導致實際使用中的問題。
(2)數據收集
按數據存在時間分為前端采集數據(采集前不存在)和歷史數據,兩者可結合使用。應當考慮數據采集、數據預處理、數據標注、數據集構建等活動的質控要求,以保證數據質量和算法設計質量。
(a)數據采集:
設備兼容性、操作規范、數據脫敏要求;歷史數據需評估質量:由臨床機構實施,需把控采集設備、過程及數據脫敏質控。設備質控明確兼容性(基于生成方式列明設備信息)與采集要求(方式、協議、參數等);過程質控建立操作規范,明確人員選拔、培訓及流程;使用歷史數據需明確設備與質量評估要求。采集數據須脫敏,明確脫敏類型、規則等。
(b)數據預處理
流程工具需驗證,樣本分布需均衡且避免偏倚:臨床機構轉移脫敏數據形成原始庫,區分模態。預處理考慮數據處理(濾波等方法)與清洗(規則、方法)質控,明確軟件工具信息及處理影響。處理后形成基礎庫,需說明樣本類型、量(含確定依據及不足風險)與分布(考慮偏性風險)。
(c)數據標注
標注人員資質管理、仲裁流程、標注質量評估(重復性/再現性):涵蓋標注資源管理、過程質控與質量評估。資源管理包括人員(選拔、培訓、考核)與基礎設施(場所、軟件);過程質控建立規范,明確標注人員、流程、分歧處理等;質量評估明確評估要素。標注后形成標注庫,樣本相關要求同基礎庫。
(d)數據集構建
訓練集需均衡,測試集需模擬真實分布且無交集;數據擴增需分析風險: 基于標注庫構建訓練、調優(若有)、測試集,明確劃分方法、依據與比例。訓練集保均衡,測試與調優集貼合臨床,且三者無交集。可擴增訓練、調優集小樣本數據,測試集擴增需分析影響;明確擴增方式、方法、倍數及風險,擴增后對比數據庫差異,驗證樣本合理性 。
(3)算法設計
算法設計與訓練要點如下:
算法選擇-需明確結構、框架、輸入輸出,考慮量化誤差等問題。明確名稱、類型,依據黑盒、白盒等模型及數據等進行結構設計,在輸入輸出流程圖中提供算法框架、運行環境與選擇依據,說明算法適用場景及選用原因。
算法訓練:提供訓練數據集、評估指標、訓練及調優方式,重點給出訓練數據量和評估指標曲線,證明訓練有效。深度學習訓練數據量越多越好,雖無公認下限,一般認為萬級較合理,需結合實際調整,用訓練曲線平穩或收斂證明數據量充分、算法性能達標。
網絡安全防護
依軟件用途、場景和功能,基于網絡安全特性確定能力建設要求,應對框架漏洞攻擊、數據污染等威脅。
算法性能評估:基于測試集(訓練集與測試集不交叉)評估,黑盒算法要分析影響因素和穩定性,從輸出角度明確影響性能的因素并限定指標,如明確 CT 圖像層厚等參數范圍,給出項目提示信息保障產品安全有效。基于測試集評估,明確假陰性與假陽性等指標,分析采集設備等影響因素,為軟件驗證確認提供基礎。
(4)驗證與確認
從產品角度考慮,算法性能評估是軟件驗證的技術基礎,而軟件驗證又是軟件確認的技術基礎。軟件確認有多種方式,例如軟件確認測試和用戶測試。用戶測試可以基于測試庫進行下載測試,或者結合臨床評價和臨床實驗。需結合產品用途,從輔助決策因素判斷是全新還是成熟的角度,并結合不同情況開展相關臨床評價。
臨床評價可以使用回顧性研究和歷史數據。對于輔助決策類軟件,如果屬于全新類型,原則上需要開展臨床評價。對于非輔助決策類軟件,如果屬于全新類型,原則上也需要開展臨床評價,具體要求還需視臨床評價的指導原則而定。
(a)軟件驗證
通過客觀證據證明軟件開發、更新階段輸出滿足輸入要求,含驗證測試(單元、集成、系統測試)與設計評審等活動。需明確法規、標準等多方面測試要求,保障軟件安全有效,為確認奠定基礎。
(b)軟件確認
通過客觀證據證明軟件滿足用戶需求與預期目的,包括確認測試(用戶測試)、臨床評價、設計評審等活動,確認測試需在真實或模擬場景下基于需求開展。
基本原則
臨床評價是主要確認方式,依據《醫療器械臨床評價技術指導原則》提交資料。進口軟件需提供中外差異影響資料,不滿足時在中國開展臨床試驗,使用境外數據需符合相關指導原則要求。
軟件確認測試(用戶測試),可基于測評數據庫
-算法性能比較分析,若各類測試場景(含臨床評價)算法性能變異度較大則需分析原因并進行必要限定。
在不同測試場景和臨床平臺中,如果算法系統的編輯度較大,需要分析原因并鑒定。編輯人物較多可能意味著算法轉化能力存在問題,需限定在某些情況下才會產生。為確保產品安全性和有效性,需進行系統性的訓練和管控評估。
-結合算法訓練、算法性能評估、臨床評價等結果開展算法性能綜合評價,針對訓練樣本量和測試樣本量過少、測試結果明顯低于算法設計目標、算法性能變異度過大等情況,對適用范圍、使用場景、核心功能進行必要限制。
臨床評價
高風險(C級)需臨床試驗,中低風險(B/A級)可用回顧性研究。
(c)臨床評價
基本原則:優先選擇同品種產品或金標準對照;進口軟件需補充中國人群驗證。
臨床試驗設計:
遵循《醫療器械臨床試驗質量管理規范》,參照「醫療器械臨床試驗設計指導原則」設計。優先選同品種或臨床金標準進行非劣效對照,無合適對象可采用替代方法,界值確定需有臨床依據,可選擇 MRMC 設計。觀察指標結合實際選擇敏感性等,入排標準保證樣本合理充分,結果建議第三方獨立評價,實施機構應具代表性、廣泛性以驗證算法泛化能力。
觀察指標:敏感性、特異性、ROC/AUC為主,可擴展時間效率等。
實施機構需代表性(非訓練數據來源機構)、多中心參與。
回顧性研究:
可用于臨床評價,設計時嚴格控制多種偏倚,采用多機構同期數據、分層分析等方法。高風險(C 級)軟件原則上開展臨床試驗,回顧性研究可作預試驗或補充;中低風險(B、A 級)軟件,回顧性研究可作預試驗或替代臨床試驗,安全性級別依軟件用途等綜合判定 。
(5)相關技術考量
(a)適用范圍擴展
-基本原則
軟件中深度學習、傳統機器學習功能均需分別開展需求分析、數據收集、算法設計、驗證與確認活動。
-深度學習非輔助決策軟件功能
前處理功能原則上需算法性能評估、臨床評價;流程優化功能僅需算法性能評估;常規后處理功能一般僅需算法性能評估,全新功能需臨床評價,臨床評價可參考傳統器械方法。
-傳統機器學習軟件功能
輔助決策功能需明確特征提取信息;非輔助決策功能參照深度學習非輔助決策功能,同時明確特征提取信息。
(b)第三方數據庫
第三方數據庫可用于算法性能評估,用于軟件確認測試需評估其充分性、適宜性和有效性。
測評數據庫:需權威(權威機構標注)、科學(統計學樣本量)、規范(嚴格質控)。
公開數據庫:公開數據庫因無封閉性不能作測評數據庫,可用于算法性能評估,用于訓練需評估其適用性。
(c)網絡與數據安全過程控制
軟件全生命周期需考慮網絡與數據安全,上市前開發與上市后使用階段均要管控。數據轉移明確方法與防護;內部活動在封閉網絡開展;涉及外方的開放網絡活動明確防護;數據采集、使用考慮與臨床機構接口;各數據庫(集)進行數據備份,明確備份及恢復方法。
(d)云計算服務與移動計算終端
使用云計算需明確服務模式等要求;使用移動計算終端需結合終端特性明確性能指標。兩者網絡安全要求詳見網絡安全指導原則。
(6)注冊申報資料
產品名稱:體現處理對象(如CT圖像)、目標疾病、臨床用途(輔助篩查)。
在產品注冊方面,注冊證信息中對人工智能獨立軟件和人工智能軟件組件存在不同要求,需特別注意。產品名稱的結構組成范圍需根據產品具體情況明確。產品名稱應遵循命名原則,例如增加“輔助分診、評估、檢測和診斷”等要求,但不應直接寫入“人工智能”,以符合醫療器械命名的規范性。結構組成可以體現人工智能算法名稱,如“深度學習輔助檢測模塊”,以突出人工智能醫療器械的特點,與其他普通產品區分。
適用范圍:明確預期用途、使用限制、適用場景及設備要求。
研究資料:
數據來源合規聲明、算法性能影響因素分析。
第三方數據庫使用情況說明(數據量、分布、評估結果)。
軟件研究資料應根據產品風險進行區分,原則與軟件指導原則一致。對于中高風險產品,全新算法需提交算法研究報告。具體要求是在成熟類型下,明確算法基本信息,對算法進行簡化描述。對于低風險產品,僅需明確算法基本信息,無需提交算法研究資料。結合產品風險和算法的成熟程度,考慮提交項目算法和研究資料以保持基本信息的完整性。
說明書內容:
臨床使用限制、算法性能總結(測試集指標)、臨床評價結果。
深度學習需補充訓練集信息(訓練指標、數據分布)。
特殊情況:
針對特殊情況,需從人因可用性角度考慮,提交相應的用戶培訓方案。方案驗證資料包括軟件安全級別和高風險產品。考慮到部分產品由患者直接使用或基層醫療機構使用,可能需要非專業人員或醫療經驗較少的人員操作,因此需提供用戶培訓方案,以確保產品的安全性和有效性。
產品技術要求:
產品技術要求主要針對基于測評數據庫測試的產品,可以體現測評數據庫情況要求。普通第三方數據庫或非測評數據庫的測試指標在研究資料中體現,而非在產品技術要求中體現。產品技術要求相對特殊,參數中還包括說明書的相關要求。主要內容包括:
使用限制和提示:根據算法系統的綜合評價結果,進行必要的限制,如使用限制、提示、警示以及人群使用情況等。
設備兼容性要求:在數據采集要求較高、監控要求較高、采集過程質控要求較高的情況下,說明書中需明確設備兼容性要求、采集參數要求,并注意采集過程中質控計劃的要求。
輔助決策類產品要求:需明確算法性能評估總結和臨床評價,并啟動控制決策指標定義。例如,產品中有的是室性,有的是毛玻璃,定義應明確,可能是基于臨床指南、共識或文獻,也可能是自己制定的相關定義。
基于數據的算法要求:采用基于數據的算法需提供算法序列準備信息,如深度學習。基于數據的算法對數據本身要求較高,需要補充相關信息,以輔助用戶使用時考慮相關要求。
第五部分:其他技術考量
(一)注冊單元和檢測單元
注冊單元和檢測單元的劃分原則主要來源于2022年修訂版的軟件指導原則。對于人工智能獨立軟件和軟件組件,注冊單元和檢測單元的劃分與獨立軟件和軟件組件的基本要求有所不同。需要強調的是,即使軟件的核心功能相同,但如果核心算法類型不同,每類算法對應的檢測單元都需要單獨進行檢測。例如,傳統算法和深度學習算法雖然功能相同,但由于算法類型不同,都需要分別進行檢測。
(二)網絡安全與數據安全
在人工智能醫療器械領域,網絡安全和數據安全至關重要。在網絡安全指導原則的基礎上:
需明確數據傳輸的安全要求,確保數據從醫院到企業之間的傳輸安全,避免數據泄露或污染。
對于內部數據處理活動,原則上應在封閉或隔離的網絡環境中進行,以防止數據泄露。
對于涉及外部交互的活動,如數據共享或遠程訪問,需要明確開放網絡的目標和安全措施。
此外,無論何種數據庫,都需要進行數據備份,并明確備份的相關要求。
數據采集和上市后使用過程中,醫療機構與企業之間的接口設計至關重要。需要考慮接口的安全性、兼容性和管理方案,確保數據傳輸的順暢和安全。
(三)移動計算與云計算
移動計算和云計算的具體要求取決于移動計算技術的使用場景。根據2022年修訂版軟件指導原則,云計算相關內容已從移動醫療器械指導原則轉移到軟件指導原則中。
使用云計算時,需參考軟件指導原則的主要監管要求,并符合醫療信息化安全指導原則。建議加強對醫療體系的保護,盡管云計算是一種新型技術,但需考慮使用過程中可能產生的風險。具體可參考醫療器械軟件指導原則中的相關內容,尤其是軟件用戶界面部分。
對于人工智能軟件組件的醫療設備,需參考其他相關性內容,確保其符合醫療器械的安全性和有效性要求。
(四)算法相關考量
白盒與黑盒算法:在深度學習中,白盒算法和黑盒算法的質控要求有所不同。白盒算法需明確特征、分類、屬性和轉移方式等細節。對于黑盒算法,雖然無法直接了解其內部機制,但需從輸出角度評估算法性能,分析影響算法性能的因素,并提供穩定性分析報告,以確保產品安全性和有效性。
壓力測試與對抗測試:壓力測試是針對罕見或特殊數據樣本的掃描測試,側重于評估算法在極端情況下的表現。根據產品實際情況,如果聲稱用于特定場景(如海邊使用),則必須進行相關測試。如果未開展或測試結果不佳,需對產品進行進一步測試,并在必要時進行限制。
對抗測試則是基于真實數據生成對抗樣本,評估算法的魯棒性和抗干擾能力。壓力測試與對抗測試的評價重點不同,建議在條件具備時進行對抗測試。如果未進行或測試結果不佳,同樣需要進行限制。
對于人工智能新技術,如集成學習、遷移學習、強化學習和聯邦學習等,目前在申報產品中尚未廣泛應用。因此,對于這些新技術,僅提供原則和基本要求,無具體要求。主要包括兩個方面:一是提供算法基本信息,與算法選擇的要求一致;二是結合算法類型和特性,提供驗證和確認資料,包括系統測試和用戶測試資料。
(五)持續學習與自身學習
在持續學習或自身學習過程中,考慮到其特殊性,用戶和注冊人需共同承擔產品質量責任。責任劃分需遵循上位法和相關法律法規,明確責任劃分的重要性。算法更新對產品性能的影響具有高度不確定性,相同產品的輸入狀態和設置在不同醫療機構使用時,數據可能具有自身特點。對于持續學習產品,經過一段時間后,其性能可能會發生變化,部署到不同醫院時,同樣的產品可能表現出不同的性能。因此,變更的不確定性和產品評價一致性是法律性保證的關鍵。
在這種情況下,對于持續學習和自身學習,要求關閉功能或暫停,僅用于算法訓練或臨床科研,不能直接用于臨床。可以進行非臨床使用,但暫時不能直接用于臨床。按照質量管理體系要求,對算法更新的安全性進行嚴格確認。如果涉及重大更新,需申請變更注冊。
(六)算法編程框架
算法編程框架可分為兩類:自研算法框架和現成算法框架。現成算法框架可視為外部軟件環境,可參考自研軟件和現成軟件的相關研究,提交相關注冊資料。對于現成算法框架,如果產品更新或版本更新,需根據更新類型進行分類。例如,功能型更新屬于重大軟件更新;效率型更新僅提高運行效率,通常屬于輕微軟件更新;服務器更新通常屬于輕微軟件更新,但如果涉及產品質量,影響安全性和有效性,則仍屬于重大更新。
(七)人工智能芯片
人工智能芯片本身并非監管對象,但如果用于人工智能醫療器械,需根據具體情況考慮相對監管要求。獨立軟件和人工智能芯片不屬于上述三方面內容,例如產品結構組成屬于軟件運行環境范疇。對于人工智能芯片,注冊證中的結構組成不會寫入人工智能芯片,因為人工智能芯片可能不是軟件運行環境的一部分,僅體現在產品技術要求和運行環境中。對于軟件組件,人工智能芯片作為產品需要進行整體評價,無論是獨立軟件還是軟件組件,都需要提供相關資料明確人工智能芯片的基本信息。
第六部分:相關法規規范性文件
簡要列舉人工智能醫療器械相關的主要規范性文件,以便大家在產品開發中參考。
審評要點
深度學習輔助決策醫療器械軟件審評要點,2019.7
肺炎 CT 影像輔助分診與評估軟件審評要點(試行),2020.3
審評指導原則
人工智能醫療器械注冊審查指導原則,2022.3
肺結節 CT 圖像輔助檢測軟件注冊審查指導原則,2022.5
糖尿病視網膜病變眼底圖像輔助診斷軟件注冊審查指導原則,2022.6
醫療器械軟件注冊審查指導原則(2022 年修訂版),2022.3
醫療器械網絡安全注冊審查指導原則(2022 年修訂版),2022.3
移動醫療器械注冊技術審查指導原則,2017.12
臨床評價指導原則
《醫療器械臨床評價技術指導原則》
《醫療器械注冊申報臨床評價報告技術指導原則》
《決策是否開展醫療器械臨床試驗技術指導原則》
《醫療器械臨床試驗設計指導原則》
《接受醫療器械境外臨床試驗數據技術指導原則》
《醫療器械臨床評價等同性論證技術指導原則》
規范性文件
EP 清單
醫療器械安全和性能的基本原則,2020.3
醫療器械安全和性能基本原則符合性技術指南,2022.7
管理類指導原則
人工智能醫用軟件產品分類界定指導原則,2021.7
醫用軟件通用名稱命名指導原則,2021.7
質量管理體系
醫療器械生產質量管理規范附錄獨立軟件,2019.7
醫療器械生產質量管理規范獨立軟件現場檢查指導原則,2020.5
醫療器械臨床試驗質量管理規范 2022版
醫療器械臨床試驗項目檢查要點及判定原則
以上文件已全部存入Ima知識庫 「御器素問」,點擊藍色下劃線字體即可獲取加入方式。
第七部分:結束語
綜上所述,通過對審評一部彭亮老師相關解讀的學習,以及多部指導原則的學習分析,我們深入探究了人工智能醫療器械在管理屬性與類別界定、分類、更新管理、注冊審查要點及技術考量等方面的內容。這些關鍵環節環環相扣,每一處的注意事項都不容忽視。希望本文能為諸君在人工智能醫療器械領域的探索與實踐提供些許有價值的參考,助力大家在該領域更好地前行。
本文由廣州佳譽醫療器械有限公司/佛山浩揚醫療器械有限公司聯合編輯