作者:國工智能實施團隊—曹靜
前言
科技橫飛的時代,大部分實驗室管理系統(tǒng)(LIMS)都擁有數(shù)十上百的分析儀器設(shè)備,一臺儀器檢測數(shù)十個項目,實驗室的溫度、濕度、壓強與實驗結(jié)果的相關(guān)性越來越受人們的關(guān)注。國工智能實驗室管理系統(tǒng)融合了國工智能數(shù)據(jù)大腦平臺,平臺內(nèi)提供上百中統(tǒng)計學(xué)相關(guān)算法及機器學(xué)習(xí)算法,對實驗室的數(shù)據(jù)進行分析、挖掘,提高企業(yè)產(chǎn)品附加值及行業(yè)競爭力。本次案例就因子分析與實驗室LIMS系統(tǒng)相融合進行探討及應(yīng)用舉例。
含義
因子分析是指根據(jù)相關(guān)性大小把變量分組,使得同組內(nèi)的變量之間相關(guān)性較高,但不同組的變量不相關(guān)或相關(guān)性較低,每組變量代表一個基本結(jié)構(gòu)—即公共因子。使用因子分析可通過評估變量之間的相關(guān)來評估數(shù)據(jù)的結(jié)構(gòu),使用此分析可以將每個原始變量建模為這些底層因子的線性函數(shù)。
案例
某企業(yè)LIMS實驗室想了解溫度、濕度、壓強、實驗結(jié)果這四個因子之間的相關(guān)性,在不同的溫度、濕度、壓強下對同一個樣品進行測試,得到7次實驗結(jié)果如表1所示,試分析不同的溫度、濕度、壓強、實驗結(jié)果的相關(guān)性大小。
溫度 |
濕度 |
壓強 |
實驗結(jié)果 |
20 |
58 |
70 |
40.32 |
22 |
54 |
75 |
39.16 |
24 |
50 |
80 |
37.25 |
26 |
46 |
85 |
36.01 |
28 |
44 |
90 |
34.74 |
30 |
40 |
95 |
34.03 |
32 |
36 |
100 |
33.89 |
表1 不同溫度、濕度、壓強得到的實驗結(jié)果
要驗證溫度、濕度、壓強、實驗結(jié)果這四個因子之間是否存在相關(guān)性及相關(guān)性大小,因此可以采用因子分析進行檢驗。
分析過程
使用國工數(shù)據(jù)大腦組件對國工實驗室系統(tǒng)數(shù)據(jù)進行讀取,直接訪問數(shù)據(jù)庫獲取數(shù)據(jù)集。
圖1 RDBMS讀取組件
使用集成好算法的因子分析組件進行數(shù)據(jù)的因子分析處理,對組件參數(shù)進行設(shè)置,變量字段配置為溫度、濕度、壓強、實驗結(jié)果,因為共有4個變量,所以要提取的因子數(shù)配置為2,單擊運行,從調(diào)試面板中查看分析結(jié)果。
圖2 因子分析組件及參數(shù)配置
圖3 結(jié)果分析
檢查載荷模式,以確定對每個變量影響最強的因子。接近于-1或1的載荷表明因子對變量的影響非常強。接近0的載荷表明因子對變量的影響很弱。有些變量可能對多個因子施加高載荷。
非旋轉(zhuǎn)因子載荷通常很難解釋,因子旋轉(zhuǎn)簡化了載荷結(jié)構(gòu),并且使因子載荷更容易解釋。使用旋轉(zhuǎn)的因子載荷,可以得出如下結(jié)論:
濕度(0.998)和結(jié)果值(0.986)在因子1上具有較大的正載荷,溫度(0.999)、濕度(0.998)、壓強(0.999)和結(jié)果值(1)在因子3上具有較大的正載荷,所以這兩個因子共同解釋數(shù)據(jù)變異的0.999或99.9%。
與LIMS系統(tǒng)相融合
國工數(shù)據(jù)大腦平臺可直接獲取實驗室LIMS系統(tǒng)中的實驗數(shù)據(jù),直接將實驗數(shù)據(jù)對接到創(chuàng)建好的因子分析模型中,根據(jù)得出的結(jié)果分析溫度、濕度、壓強、實驗結(jié)果在因子1和因子2的相關(guān)性。
參數(shù)說明
因子載荷:表示因子對變量的解釋程度。載荷范圍可以為-1到1,國工數(shù)據(jù)大腦因子分析組件會計算非旋轉(zhuǎn)因子載荷和旋轉(zhuǎn)因子載荷。
變量:分析研究對象的變量。
要提取的因子數(shù):因子數(shù)必須至少為1且不得超過總變量數(shù),為了取得最佳結(jié)構(gòu),數(shù)據(jù)中的每3個變量擁有的因子不得超過一個。例如,有12個變量,則最多提前4個因子。
方差貢獻率:使用方差貢獻率(%Var)可確定因子解釋的方差量。保留解釋可接受方差水平的因子。
方差(特征值):如果使用主分量提供因子,則方差等于特征值。可使用特征值的大小確定因子數(shù)。保留具有最大特征值的因子。
適用范圍
不同的變量選擇因子數(shù)之后,分析因子對變量的是否有影響。
精餾回收工藝是醫(yī)藥化工行業(yè)中的最為重要的典型單元操作之一,在原料藥、精細化工、輕工業(yè)等各個領(lǐng)域都有極其廣泛的應(yīng)用。由于精餾過程的復(fù)雜性,精餾工藝過程的終點現(xiàn)階段仍需要生產(chǎn)工人每隔一定時間取樣送實驗室檢測,通過氣相色譜測定含量,卡爾費休滴定法
中秋節(jié)是中國傳統(tǒng)節(jié)日之一,也是一年中最重要、最盛大的節(jié)日之一。在這一天,以明亮的月亮和家人團聚為特點,承載著人們無盡的思念和美好的祝福。 國慶、中秋兩節(jié)遇, 合家團圓精神俱。 團團圓圓過中秋, 歡歡喜喜
2023年8月28日,國工智能與鎂伽科技舉行戰(zhàn)略合作簽約儀式,國工智能董事長柳彥宏與鎂伽科技創(chuàng)始人兼首席執(zhí)行官黃瑜清先生代表雙方簽訂正式戰(zhàn)略合作協(xié)議,標志著AI輔助化工研發(fā)領(lǐng)先者、智能自動化實驗室引領(lǐng)者開啟強強聯(lián)合發(fā)展之路。&n
創(chuàng)新是一個民族進步的靈魂,是一個國家興旺發(fā)達的不竭動力,也是中華民族最深沉的民族稟賦。在激烈的國際競爭中,惟創(chuàng)新者進,惟創(chuàng)新者強,惟創(chuàng)新者勝。 5月27日