ซื้อคริปโต ตลาด สปอต ฟิวเจอร์สGOLD Earn ศูนย์กิจกรรม

เพิ่มเติม

การบำรุงรักษาเชิงคาดการณ์ (PdM) คือวิธีการเปลี่ยนชิ้นส่วนก่อนที่จะเสียหายพอดี โดยเป้าหมายคือการคำนวณอายุการใช้งานที่เหลืออยู่ (RUL) ของเครื่องยนต์โดยอิงจากการบำรุงรักษาเชิงคาดการณ์ (PdM) คือวิธีการเปลี่ยนชิ้นส่วนก่อนที่จะเสียหายพอดี โดยเป้าหมายคือการคำนวณอายุการใช้งานที่เหลืออยู่ (RUL) ของเครื่องยนต์โดยอิงจาก

การทำนายความล้มเหลวของเครื่องยนต์เจ็ทด้วย Python และ AutoML

แหล่งที่มา: Hackernoon

2025/12/22 16:43

3 นาทีในการอ่าน

แชร์

OPEN$0,18193-6,37%

หากมีข้อเสนอแนะหรือข้อกังวลเกี่ยวกับเนื้อหานี้ โปรดติดต่อเราได้ที่ crypto.news@mexc.com

ในอุตสาหกรรมการบิน "การทำให้สิ่งต่างๆ พัง" ไม่ใช่ตัวเลือก

หากเซิร์ฟเวอร์ล้ม คุณก็รีสตาร์ทมัน แต่หากเครื่องยนต์เจ็ทล้มเหลวกลางอากาศ ผลที่ตามมาจะร้ายแรงมาก นี่คือเหตุผลที่อุตสาหกรรมการบินกำลังเปลี่ยนจาก การบำรุงรักษาเชิงป้องกัน (Preventive Maintenance) (การเปลี่ยนชิ้นส่วนตามกำหนดเวลาไม่ว่าจะจำเป็นหรือไม่) ไปสู่ การบำรุงรักษาเชิงคาดการณ์ (Predictive Maintenance - PdM) (การเปลี่ยนชิ้นส่วนก่อนที่มันจะพังพอดี)

สำหรับนักวิทยาศาสตร์ข้อมูล นี่คือปัญหาการถดถอยอนุกรมเวลาที่ท้าทายที่สุด เป้าหมายคือการคำนวณ อายุการใช้งานที่เหลืออยู่ (Remaining Useful Life - RUL) ของเครื่องยนต์โดยอาศัยข้อมูลเซ็นเซอร์ (อุณหภูมิ, ความดัน, การสั่นสะเทือน)

ตามเดิม สิ่งนี้ต้องการโมเดลฟิสิกส์ที่ซับซ้อนหรือสถาปัตยกรรม Deep Learning ที่ปรับแต่งด้วยตนเอง (LSTMs) แต่เมื่อเร็วๆ นี้ การเรียนรู้ของเครื่องอัตโนมัติ (Automated Machine Learning - AutoML) ได้พัฒนาไปถึงจุดที่สามารถทำได้ดีกว่าการปรับแต่งด้วยตนเอง

ในคู่มือนี้ โดยอ้างอิงจากการวิเคราะห์โดยใช้ ชุดข้อมูล NASA C-MAPSS เราจะสร้างไปป์ไลน์เพื่อทำนายความล้มเหลวของเครื่องยนต์โดยใช้โอเพ่นซอร์สสองตัวหลัก: AWS AutoGluon และ H2O.ai

ไปป์ไลน์ PdM

เราไม่ได้แค่จำแนกภาพที่นี่ เรากำลังจัดการกับข้อมูลอนุกรมเวลาหลายตัวแปร ไปป์ไลน์ต้องการแปลงบันทึกเซ็นเซอร์ดิบให้เป็นเป้าหมายการถดถอย (RUL)

ขั้นตอนที่ 1: ข้อมูล (NASA C-MAPSS)

เรากำลังใช้ชุดข้อมูลที่มีชื่อเสียง NASA Commercial Modular Aero-Propulsion System Simulation (C-MAPSS) ซึ่งประกอบด้วยข้อมูลจำลองการทำงานจนกว่าจะเสียหาย

อินพุต: เซ็นเซอร์ 21 ตัว (อุณหภูมิรวม, ความดันที่ทางเข้าพัดลม, ความเร็วคอร์, ฯลฯ)
เป้าหมาย: อายุการใช้งานที่เหลืออยู่ (RUL)

การคำนวณ RUL

ชุดข้อมูลไม่ได้ให้ RUL โดยตรง มันให้ วงจร ปัจจุบันแก่เรา เราต้องคำนวณเป้าหมาย

ตรรกะ: RUL = วงจรสูงสุดของเครื่องยนต์ - วงจรปัจจุบัน

import pandas as pd # Load dataset (Simulated example structure) # Columns: ['unit_number', 'time_in_cycles', 'sensor_1', ... 'sensor_21'] df = pd.read_csv('train_FD001.txt', sep=" ", header=None) # 1. Calculate the maximum life of each engine unit max_life = df.groupby('unit_number')['time_in_cycles'].max().reset_index() max_life.columns = ['unit_number', 'max_life'] # 2. Merge back to original dataframe df = df.merge(max_life, on='unit_number', how='left') # 3. Calculate RUL (The Target Variable) df['RUL'] = df['max_life'] - df['time_in_cycles'] # Drop columns we don't need for training (like max_life) df = df.drop(columns=['max_life']) print(df[['unit_number', 'time_in_cycles', 'RUL']].head())

ขั้นตอนที่ 2: เมตริก (ทำไมความแม่นยำถึงผิด)

ในการบำรุงรักษาเชิงคาดการณ์ "ความแม่นยำ" แบบธรรมดาใช้ไม่ได้ผล เราต้องวัดว่าการทำนายของเรา คลาดเคลื่อน ไปแค่ไหน

เราอาศัย RMSE (Root Mean Square Error)

หากเครื่องยนต์มีเวลาเหลืออีก 50 วัน และเราทำนาย 45 ข้อผิดพลาดคือ 5
หากเราทำนาย 100 ข้อผิดพลาดคือ 50 (โทษอย่างหนัก)

import numpy as np def calculate_rmse(y_true, y_pred): """ y_true: The actual Remaining Useful Life y_pred: The model's prediction """ mse = np.mean((y_true - y_pred)**2) return np.sqrt(mse)

หมายเหตุ: การวิเคราะห์ยังเน้นย้ำ RMSLE (Logarithmic Error) สิ่งนี้สำคัญมากเพราะการทำนายอายุการใช้งานต่ำเกินไป (ทำนายเสียหายเร็วกว่าจริง) ปลอดภัย แต่การทำนายสูงเกินไป (ทำนายเสียหายช้ากว่าความเป็นจริง) เป็นอันตราย RMSLE จัดการข้อผิดพลาดสัมพัทธ์ได้ดีกว่าในมาตราส่วนที่แตกต่างกัน

ขั้นตอนที่ 3: การประลอง AutoML

เราทดสอบสองเฟรมเวิร์กเพื่อดูว่าตัวไหนสามารถจัดการกับข้อมูลเซ็นเซอร์ที่ซับซ้อนและมีสัญญาณรบกวนได้ดีกว่าโดยไม่ต้องปรับแต่งด้วยตนเองมากมาย

คู่แข่งที่ 1: AutoGluon (ผู้ชนะ)

AutoGluon (พัฒนาโดย AWS) ใช้กลยุทธ์การซ้อนและการรวมโมเดลหลายตัว (Neural Nets, LightGBM, CatBoost) โดยอัตโนมัติ

โค้ด:

from autogluon.tabular import TabularPredictor # AutoGluon handles feature engineering automatically # 'RUL' is our target label calculated in Phase 1 predictor = TabularPredictor(label='RUL', eval_metric='root_mean_squared_error').fit( train_data=df_train, time_limit=600, # Train for 10 minutes presets='best_quality' ) # Inference y_pred = predictor.predict(df_test) results = predictor.evaluate(df_test) print(f"AutoGluon RMSE: {results['root_mean_squared_error']}")

คู่แข่งที่ 2: H2O AutoML

H2O เป็นผู้เชี่ยวชาญในพื้นที่นี้ เป็นที่รู้จักในด้านความสามารถในการคำนวณแบบกระจายที่ปรับขนาดได้

โค้ด:

import h2o from h2o.automl import H2OAutoML h2o.init() # Convert pandas df to H2O Frame hf_train = h2o.H2OFrame(df_train) hf_test = h2o.H2OFrame(df_test) # Train aml = H2OAutoML(max_models=20, seed=1) aml.train(y='RUL', training_frame=hf_train) # Inference preds = aml.predict(hf_test) perf = aml.leader.model_performance(hf_test) print(f"H2O RMSE: {perf.rmse()}")

ขั้นตอนที่ 4: ผลลัพธ์

การวิเคราะห์เผยให้เห็นความแตกต่างอย่างมากในประสิทธิภาพเมื่อนำไปใช้กับชุดข้อมูลเซ็นเซอร์เฉพาะนี้

| ไลบรารี | เมตริก | เป้าหมาย: RUL | ผลลัพธ์ (ต่ำกว่าดีกว่า) | |----|----|----|----| | AutoGluon | RMSE | RUL | 14.07 | | H2O | RMSE | RUL | 44.85 |

**การวิเคราะห์: \ AutoGluon มีประสิทธิภาพเหนือกว่า H2O อย่างมาก (14.07 เทียบกับ 44.85) ในบริบทของเครื่องยนต์เจ็ท ค่าความคลาดเคลื่อน 14 วงจร เป็นที่ยอมรับได้สำหรับการกำหนดตารางการบำรุงรักษา ค่าความคลาดเคลื่อน 44 วงจร ทำให้โมเดลไร้ประโยชน์

ทำไม AutoGluon ถึงชนะ?

การซ้อน: AutoGluon เก่งในการซ้อนหลายชั้น รวมจุดแข็งของโมเดลแบบต้นไม้และโครงข่ายประสาท
การจัดการฟีเจอร์: มันจัดการกับสัญญาณรบกวนของเซ็นเซอร์ดิบได้ดีกว่าโดยไม่ต้องการขั้นตอนการลดสัญญาณรบกวนด้วยตนเอง

สรุป: หยุดการปรับแต่ง เริ่มการซ้อน

สำหรับแอปพลิเคชันอุตสาหกรรมที่เกี่ยวข้องกับข้อมูลหลายตัวแปรที่ซับซ้อน AutoML ไม่ใช่แค่เครื่องมือสร้างต้นแบบอีกต่อไป—มันคือความสามารถในการผลิต

โดยการเปลี่ยนจากการเลือกโมเดลด้วยตนเองไปสู่แนวทางแบบรวมอัตโนมัติเช่น AutoGluon นักพัฒนาสามารถลดเวลาวิศวกรรมจากหลายสัปดาห์เป็นหลายชั่วโมง ในขณะที่บรรลุความแม่นยำที่เหนือกว่า

บทเรียนสำคัญสำหรับนักพัฒนา: เมื่อสร้างแอป Industrial IoT จงมุ่งเน้นความพยายามของคุณใน ขั้นตอนที่ 1 (Data Engineering) การทำความสะอาดบันทึกเซ็นเซอร์และการคำนวณ RUL ที่ถูกต้อง ปล่อยให้ AutoML จัดการการเลือกโมเดล

โอกาสทางการตลาด

ราคา OpenLedger(OPEN)

$0,18193

$0,18193$0,18193

+0,04%

USD

OpenLedger (OPEN) กราฟราคาสด

พูลรางวัล 200,000 USDT

เทรด GOLD, SILVER & น้ำมัน ทุกคนได้รับรางวัล

ข้อจำกัดความรับผิดชอบ: บทความที่โพสต์ซ้ำในไซต์นี้มาจากแพลตฟอร์มสาธารณะและมีไว้เพื่อจุดประสงค์ในการให้ข้อมูลเท่านั้น ซึ่งไม่ได้สะท้อนถึงมุมมองของ MEXC แต่อย่างใด ลิขสิทธิ์ทั้งหมดยังคงเป็นของผู้เขียนดั้งเดิม หากคุณเชื่อว่าเนื้อหาใดละเมิดสิทธิของบุคคลที่สาม โปรดติดต่อ crypto.news@mexc.com เพื่อลบออก MEXC ไม่รับประกันความถูกต้อง ความสมบูรณ์ หรือความทันเวลาของเนื้อหาใดๆ และไม่รับผิดชอบต่อการดำเนินการใดๆ ที่เกิดขึ้นตามข้อมูลที่ให้มา เนื้อหานี้ไม่ถือเป็นคำแนะนำทางการเงิน กฎหมาย หรือคำแนะนำจากผู้เชี่ยวชาญอื่นๆ และไม่ถือว่าเป็นคำแนะนำหรือการรับรองจาก MEXC