生成式 AI 幫助工程師挖掘隱藏在非結構化數據中的深層洞察
發布時間:2026-02-25 來源:轉載 責任編輯:lily
【導讀】生成式AI(GenAI)dejueqi,bujinnengjiangfensandefeijiegouhuashujuyujiegouhuachuanganqishujushenduronghe,gengjianggongchengshidejiaosecongfansuodeshujuqingxizhongjiefangchulai,zhuanxianggenggaojiedezhanlvefenxiyujuece。congtataqicheliyongjiansuozengqiangshengcheng(RAG)技術構建上下文感知的故障診斷助手,到哥本哈根大學通過圖論與大模型結合加速食品科學發現,GenAI正zheng展zhan現xian出chu超chao越yue基ji礎chu代dai碼ma編bian寫xie的de巨ju大da潛qian力li。然ran而er,盡jin管guan普pu及ji率lv日ri益yi提ti升sheng,許xu多duo工gong程cheng師shi仍reng受shou限xian於yu傳chuan統tong用yong法fa或huo對dui工gong作zuo流liu整zheng合he的de擔dan憂you,尚shang未wei充chong分fen挖wa掘jue其qi在zai預yu測ce性xing維wei護hu和he複fu雜za係xi統tong分fen析xi中zhong的de深shen層ceng價jia值zhi。
您是否知道,生成式 AI(GenAI)可以幫助工程師在幾秒鍾內診斷汽車故障,甚至在設備出現問題之前預測潛在失效?GenAI 正在通過加速數據分析和算法開發,讓這些場景從設想走向現實,使工程師能夠充分發揮專業知識,挖掘可執行的洞察。
工程團隊每年都會產生數 TB 級的數據。根據 Gartner 的估算,其中多達 80% 屬於非結構化數據。服務記錄、研究論文和技術人員記錄中蘊含著關鍵的組織知識,但由於格式不一致,難以有效解析。GenAI 工具能夠幫助工程師整合結構化與非結構化數據,實現過去難以大規模開展的分析工作。對工程師而言,這意味著更快速的故障排查、更高效的設計流程以及更快的技術發現。
工程師在使用 GenAI 時的盲區
盡管 GenAI 在重塑工程工作方麵具有高度靈活性,但其能力與工程師日常使用方式之間仍存在差距。許多工程師仍將 GenAI 主要用於編寫基礎代碼或生成文檔,而不是將其應用於更高級的工程流程。
為更好地了解工程師對 GenAI 的態度及其實際應用情況,MathWorks 於 2025 年 12 月在社交媒體上進行了一項非正式投票。反饋結果揭示了多項重要洞察,包括:
-83% 的工程師至少每月使用一次 GenAI,其中最常見的應用場景是“編寫代碼”和“文檔與報告生成”。
-工程師對 GenAI 的最大擔憂是其與現有工作流程的整合(46%)。在擁有六年以上經驗的工程師中,這一比例更是升至 75%。
這些數據表明,大多數工程師已經在使用 GenAI,但尚未將其應用於戰略性工程任務。希望提升 GenAI 使用能力的工程師應考慮將其用於準備和分析非結構化數據。
利用服務手冊、工程文檔和維修記錄構建麵向技術人員的聊天助手
汽車故障排查通常需要在不同品牌和車型中診斷複雜問題。盡管大語言模型(LLM)包含大量公開的汽車知識,但它們缺乏細節豐富的品牌專屬信息。為彌合這一差距,塔塔汽車的工程師采用了一種名為檢索增強生成(RAG)的 GenAI 技術,將 LLM 的通用知識與內部專有數據結合,從而生成具有上下文針對性的建議。
工程師利用 RAG 開發了一個具備上下文感知能力的聊天助手,能夠檢索內部文檔並基於這些內容生成故障排查回複。他們使用 MATLAB® 構建了 RAG 工作流程,使其應用(稱為 ServiceSage)可以搜索服務手冊、工程文檔和維修記錄。當技術人員向 ServiceSage 提問時,問題會被轉化為 GenAI 能理解的數值表示,係統隨後查找最相關的文檔。由於 RAG 執行的是語義搜索,問題的具體措辭並不關鍵,它會根據相關概念進行推斷。相關文檔隨後被輸入 AI 模型,模型將其與通用知識結合,生成清晰、可理解的回答。
這(zhe)種(zhong)方(fang)法(fa)具(ju)有(you)成(cheng)本(ben)效(xiao)益(yi)且(qie)可(ke)擴(kuo)展(zhan),無(wu)需(xu)進(jin)行(xing)昂(ang)貴(gui)的(de)模(mo)型(xing)再(zai)訓(xun)練(lian),並(bing)能(neng)處(chu)理(li)大(da)量(liang)此(ci)前(qian)未(wei)被(bei)充(chong)分(fen)利(li)用(yong)的(de)文(wen)本(ben)數(shu)據(ju)。借(jie)助(zhu)該(gai)方(fang)法(fa),團(tuan)隊(dui)能(neng)夠(gou)快(kuai)速(su)識(shi)別(bie)根(gen)本(ben)原(yuan)因(yin),提(ti)供(gong)上(shang)下(xia)文(wen)相(xiang)關(guan)的(de)指(zhi)導(dao),並(bing)縮(suo)短(duan)維(wei)修(xiu)周(zhou)期(qi)。通(tong)過(guo) GenAI,工程師可以高效分析大量文本數據,並將其融入故障排查流程中。
利用全球與曆史科研資料推進食品科學發現
科學研究通常涉及跨越數十年、laiziduogediqudedalianglunwen,xiangyaoxitongshulimouyizhutidesuoyouyanjiuhuozhaochuqizhongqianzailianxi,ruowuxianjingongjujihubukeneng。gebenhagendaxuedeshipinkexueyanjiurenyuanzaifenxipangdaziliaoxunzhaozhutiguanlianshimianlinzheyitiaozhan。LLM 雖然能夠總結單篇文獻,但難以在海量數據中梳理整體關聯。為解決該問題,研究人員在使用 LLM 前,將 GenAI 與傳統技術相結合——如文本預處理與清洗、信息提取等——為非結構化文本建立結構。
哥本哈根大學團隊在整個流程中多次使用 GenAI,包括:
1清理並標準化了數千份格式不一致的 PDF 文件。
2在元數據缺失時自動生成關鍵字。
3將文本轉換為詞元(tokens),並標記異常長的詞語,以識別隱藏在文中的化學物質名稱。
4將論文拆分為段落和關鍵字後構建知識圖譜。圖譜中的每個節點代表一個段落或化學名稱,節點之間的連接則體現主題之間的關聯。
隨後,團隊使用 MATLAB 對該數據集應用圖論方法,識別各概念之間的關聯路徑。接著,他們將這些結構化的文本子集輸入 LLM,由模型生成摘要並解釋不同主題之間的關係——這(zhe)些(xie)關(guan)係(xi)若(ruo)由(you)人(ren)工(gong)分(fen)析(xi),可(ke)能(neng)需(xu)要(yao)數(shu)周(zhou)時(shi)間(jian)。最(zui)終(zhong),他(ta)們(men)構(gou)建(jian)了(le)一(yi)套(tao)能(neng)夠(gou)將(jiang)分(fen)散(san)研(yan)究(jiu)轉(zhuan)化(hua)為(wei)可(ke)執(zhi)行(xing)洞(dong)察(cha)的(de)流(liu)程(cheng),大(da)幅(fu)加(jia)速(su)了(le)食(shi)品(pin)科(ke)學(xue)研(yan)究(jiu)的(de)推(tui)進(jin)。
盡管 GenAI 帶來了顯著價值——研究人員通過該流程節省了數天的人工處理時間——但成功仍高度依賴人工判斷與手動工作。團隊在將數據輸入 GenAI 之前投入了數百小時進行實驗與數據準備。通過反複試驗,他們才確定將文本按段落進行切分最為有效,因為 GenAI 無法自動作出這種判斷。GenAI 的強大之處隻有在具備高質量數據和嚴謹工程方法的前提下才能充分發揮。
將維護數據轉化為前瞻性洞察
傳統的預測性維護(PdM)主要依賴傳感器的數值數據,用來跟蹤溫度、振動、壓ya力li等deng變bian化hua,以yi捕bu捉zhuo設she備bei故gu障zhang前qian的de異yi常chang模mo式shi。許xu多duo組zu織zhi還hai會hui收shou集ji維wei護hu日ri誌zhi和he技ji術shu人ren員yuan記ji錄lu等deng文wen本ben信xin息xi,這zhe些xie內nei容rong能neng夠gou提ti供gong傳chuan感gan器qi無wu法fa捕bu捉zhuo的de關guan鍵jian背bei景jing,例li如ru故gu障zhang症zheng狀zhuang、維修過程以及可能的根因判斷。

生成式 AI 幫助工程師處理來自設備日誌和服務記錄的非結構化數據,從而改進預測性維護流程。
文本信息並不能取代傳感器數據;工程師可以利用 GenAI 將其標準化,使其能夠與傳統信號協同使用。例如,GenAI 可以總結維護記錄、統一不一致的術語,或標注關鍵事件(如組件故障或重複出現的故障類型)。這些標注數據隨後可與時間序列傳感器數據對齊,為 PdM 模型的開發提供更清晰的目標與上下文。

生成式 AI 幫助技術人員將服務記錄與傳感器數據結合,以更快速、更準確地完成汽車故障診斷。
GenAI 還可以支持工程流程的其他環節。工程師可以使用它起草和優化用於數據清洗、特te征zheng工gong程cheng或huo探tan索suo性xing分fen析xi的de代dai碼ma,也ye可ke以yi用yong它ta評ping估gu不bu同tong的de建jian模mo方fang法fa。然ran而er,領ling域yu知zhi識shi在zai整zheng個ge過guo程cheng依yi然ran至zhi關guan重zhong要yao。隻zhi有you經jing驗yan豐feng富fu的de工gong程cheng師shi才cai能neng判pan斷duan特te征zheng是shi否fou具ju有you物wu理li意yi義yi、模型行為是否符合係統動力學,以及輸出結果是否反映真實的故障模式或隻是數據噪聲。
與所有 PdM 方法一樣,基於 GenAI 的(de)工(gong)作(zuo)流(liu)程(cheng)在(zai)部(bu)署(shu)前(qian)需(xu)要(yao)經(jing)過(guo)嚴(yan)格(ge)驗(yan)證(zheng)。一(yi)個(ge)在(zai)原(yuan)型(xing)或(huo)小(xiao)規(gui)模(mo)測(ce)試(shi)集(ji)中(zhong)表(biao)現(xian)良(liang)好(hao)的(de)模(mo)型(xing),未(wei)必(bi)能(neng)夠(gou)應(ying)對(dui)真(zhen)實(shi)環(huan)境(jing)中(zhong)的(de)多(duo)變(bian)條(tiao)件(jian)。工(gong)程(cheng)師(shi)應(ying)使(shi)用(yong)具(ju)有(you)代(dai)表(biao)性(xing)的(de)數(shu)據(ju)集(ji)進(jin)行(xing)驗(yan)證(zheng),對(dui)模(mo)型(xing)進(jin)行(xing)多(duo)工(gong)況(kuang)壓(ya)力(li)測(ce)試(shi),並(bing)加(jia)入(ru)確(que)定(ding)性(xing)檢(jian)查(zha)以(yi)確(que)保(bao)其(qi)健(jian)壯(zhuang)性(xing)。這(zhe)些(xie)最(zui)佳(jia)實(shi)踐(jian)適(shi)用(yong)於(yu)所(suo)有(you) PdM 方法,無論是否包含 GenAI,再次強調成功的 PdM 不僅依賴先進工具,更依賴紮實的工程判斷。
工程師們仍隻觸及 GenAI 的表層
與任何工具一樣,GenAI 應在方法論指導下使用,而非被泛化應用於所有問題。當任務涉及大量非結構化數據,或需要處理語言驅動的輸入時,GenAI 的價值最為突出。工程師需要戰略性地整合 GenAI,拓展領域專業知識,並思考如何在自身的設計方法中切實應用這一工具。
總結
生成式AIsuiyizhanxianchuzhongsugongchengliuchengdeqiangdanengli,danmuqiandaduoshuyingyongrengtingliuzaibiaoceng,shangweiwanquanzhuanhuaweituidongjishuchuangxindehexinyinqing。zhenzhengdetupobuzaiyumangmuyilaimoxingdetongyongnengli,erzaiyujiangGenAI戰略性地嵌入嚴謹的工程方法論中:通(tong)過(guo)人(ren)工(gong)判(pan)斷(duan)指(zhi)導(dao)數(shu)據(ju)預(yu)處(chu)理(li),利(li)用(yong)領(ling)域(yu)知(zhi)識(shi)驗(yan)證(zheng)模(mo)型(xing)輸(shu)出(chu)的(de)物(wu)理(li)意(yi)義(yi),並(bing)將(jiang)非(fei)結(jie)構(gou)化(hua)文(wen)本(ben)洞(dong)察(cha)與(yu)傳(chuan)統(tong)傳(chuan)感(gan)器(qi)數(shu)據(ju)有(you)機(ji)結(jie)合(he)。無(wu)論(lun)是(shi)加(jia)速(su)故(gu)障(zhang)排(pai)查(zha)還(hai)是(shi)優(you)化(hua)預(yu)測(ce)性(xing)維(wei)護(hu),成(cheng)功(gong)的(de)鑰(yao)匙(chi)始(shi)終(zhong)掌(zhang)握(wo)在(zai)那(na)些(xie)能(neng)夠(gou)駕(jia)馭(yu)工(gong)具(ju)、堅持嚴格驗證並具備深厚專業背景的工程師手中。

- 噪聲中提取真值!瑞盟科技推出MSA2240電流檢測芯片賦能多元高端測量場景
- 10MHz高頻運行!氮矽科技發布集成驅動GaN芯片,助力電源能效再攀新高
- 失真度僅0.002%!力芯微推出超低內阻、超低失真4PST模擬開關
- 一“芯”雙電!聖邦微電子發布雙輸出電源芯片,簡化AFE與音頻設計
- 一機適配萬端:金升陽推出1200W可編程電源,賦能高端裝備製造
- 芯科科技Tech Talks與藍牙亞洲大會聯動,線上線下賦能物聯網創新
- 冬季續航縮水怎麼辦?揭秘熱管理係統背後的芯片力量
- 從HDMI 2.1到UFS 5.0:SmartDV以領先IP矩陣夯實邊緣計算基石
- 小空間也能實現低噪供電!精密測量雙極性電源選型指南,覆蓋小功率到大電流全場景
- 直擊藍牙亞洲大會 2026:Nordic 九大核心場景演繹“萬物互聯”新體驗
- 車規與基於V2X的車輛協同主動避撞技術展望
- 數字隔離助力新能源汽車安全隔離的新挑戰
- 汽車模塊拋負載的解決方案
- 車用連接器的安全創新應用
- Melexis Actuators Business Unit
- Position / Current Sensors - Triaxis Hall





