近日,由香港中文大學(深圳)、上海交通大學、上海財經大學、杉數科技等聯合研發的ORLM智能決策大模型相關成果被運籌學領域國際頂級期刊《運籌學》(Operations Research)正式接收,這是該期刊創刊70余年來首次收錄關于大語言模型的研究論文。

在此論文中,港中大(深圳)團隊參與提出的ORLM模型展現出顯著的工程應用價值:在決策問題的建模環節,該模型能夠大幅提升工程師的工作效率,可以輔助工程師將決策問題中建模環節效率大大提升,同時較其他大模型提升10%-25%的準確率,這將顯著提升工業場景中的人機協作效率。此次研究成果實現了開源大語言模型在自動化優化建模領域的重要突破,不僅填補了該方向的學術空白,更為企業決策優化提供了可落地的技術路徑。

港中大(深圳)團隊核心貢獻

香港中文大學(深圳)科研團隊在項目中發揮了重要作用,其中包括:

??共同第一作者:計算機與信息工程博士生唐正陽,負責框架設計和實驗驗證;

??通訊作者:數據科學學院王本友教授和王子卓教授。

三位研究者在優化決策、大語言模型訓練與數學推理方面各展所長,充分體現了港中大(深圳)在人工智能與運籌學交叉領域的研究實力,也再次展示了大學在前沿科技領域的創新能力和國際影響力。

?

研究背景與意義

傳統運籌學的瓶頸與大模型解決方案

運籌學作為一門優化決策的科學,廣泛應用于工業、物流、金融等領域。其中,優化建模與求解技術是運籌學實際應用的核心環節。然而,傳統運籌優化方法長期面臨兩大挑戰:

??高度依賴專家經驗,存在建模周期長、泛化能力弱等瓶頸;

??現有基于閉源大模型(如GPT-4)的解決方案雖能提升效率,卻面臨數據隱私泄露、技術壟斷等問題。

此研究中所提出的ORLM為解決這些行業痛點提供了創新方案。該研究首次提出了一種創新的、可定制化的開源大語言模型訓練框架OR-INSTRUCT,專為優化建模任務設計。該框架支持對開源大模型進行領域定制訓練,顯著提升了模型在自動化建模與求解方面的能力。在制造、物流、電商與零售等多個行業測試中展現出卓越性能:

效率、精度與信息安全全面提升

??決策效率提升:輔助工程師平均縮短2小時決策時間;

??決策質量優化:使決策準確率提升10%-25%;

??數據安全保障:通過本地化部署,解決企業數據隱私泄露風險的定制難題。

?

技術創新與突破

從數據生產到場景落地的完整閉環

方法上,聯合研究團隊構建了從數據生產、模型訓練到場景落地的完整技術閉環,主要包括三大技術創新:

創新的OR-INSTRUCT框架

研究團隊設計了一種半自動化的數據生成方法——OR-Instruct,結合擴展策略(Expansion)與增強策略(Augmentation),有效緩解了高質量標注數據匱乏的問題,從600余條基礎數據出發共合成30,000余條高質量訓練樣本。

首個工業級優化建模基準數據集

團隊構建了IndustryOR基準數據集,涵蓋13個行業與5類典型問題(包括線性、整數、混合整數、非線性及其他),并設有多級難度劃分。相比國際已有數據集,IndustryOR在多樣性與現實性方面具有顯著優勢。

開源模型系列“ORLMs”

實驗結果表明,開源模型系列“ORLMs”在多個公開基準數據集上的表現均顯著優于如GPT-4等的主流閉源模型及其他開源大模型,達到了當前該領域的最先進水平。

?

學生作者介紹

唐正陽

港中大(深圳)計算機與信息工程專業博士研究生

研究領域:

自然語言處理、信息檢索、應用機器學習

個人簡介:

唐正陽現為香港中文大學(深圳)計算機與信息工程專業博士研究生,師從王本友教授。目前他在阿里巴巴通義千問團隊實習,此前曾在微軟亞洲研究院、騰訊QQ瀏覽器搜索以及阿里巴巴夸克搜索等多個知名團隊積累了豐富的實習與工作經驗。

他的研究專注于提升大語言模型在數學推理領域的能力,涵蓋自然語言推理、優化建模、工具集成推理以及自我進化評估等創新方向,已在ICML、ICLR、Operations Research、COLING和KDD等頂級機器學習會議、Workshop和期刊上發表多篇論文。

他開發的算法已成功應用于多個領域,包括在2022年MSMAROCO段落排序權威榜單中名列第三,以及在2022全球語言與智能挑戰賽中斬獲亞軍。

?

教授介紹

王本友

港中大(深圳)數據科學學院 助理教授

研究領域:

自然語言處理、信息檢索、應用機器學習

個人簡介:

王本友教授于2022年在意大利帕多瓦大學取得博士學位(受歐盟瑪麗居里獎學金資助),曾在丹麥哥本哈根大學、加拿大蒙特利爾大學、荷蘭阿姆斯特丹大學、華為諾亞方舟實驗室、中國科學院理論物理所、社科院語言所交流訪問。王教授的主要研究方向為大模型應用、多模態大語言模型、AI4Math和Human-Agent Interaction。他曾四次獲得了會議最佳論文或提名獎,包括CCF A類會議SIGIR 2017的最佳論文提名獎、CCF B類會議NAACL 2019最佳可解釋NLP論文,CCF C類會議NLPCC 2022的最佳論文和ICLR 2025 Financial AI最佳論文。他還獲得了華為火花獎、騰訊犀牛鳥項目、滴滴蓋亞學者項目和華為AI百校計劃。團隊開發了醫療大模型華佗GPT等多個大模型,相關工作得到了Nature、金融時報(Financial Times)、CCTV、環球時報、深圳衛視、南方都市報等采訪和報道。

?

王子卓

港中大(深圳)數據科學學院教授、副院長(教學)

研究領域:

隨機和魯棒優化、數據驅動決策問題、定價和收益管理

個人簡介:

王子卓博士現為數據科學學院教授、副院長(教學)。王子卓教授于2007年本科畢業于清華大學數學與應用數學系,2011年獲得斯坦福大學金融數學碩士學位,2012年獲斯坦福大學管理科學與工程博士學位。王子卓曾任職明尼蘇達大學工業與系統工程系助理教授、副教授。王子卓教授現擔任廣東省人工智能數理基礎實驗室主任。

王子卓教授的主要研究方向為在線機器學習及收益與運營管理。在機器學習方面,王子卓教授在在線學習方面做了開創性的工作,對在線線性規劃、在線凸規劃問題中獲得了開創性的結果。在收益管理方面,王子卓教授對消費者行為,商品定價和市場量化營銷有著深入研究。他在運籌學和管理科學國際頂尖雜志上發表過超過60篇文章,在國內國際會議上多次應邀進行報告,并擔任Management Science、Operations Research、M&SOM、POMS等頂級管理科學雜志編委,并且獲得多項學術獎項。王子卓教授曾經或正在主持包括來自中國國家自然科學基金、美國國家自然基金等多項研究項目,總金額超千萬元人民幣。

王子卓教授在工業界有著豐富的經驗,曾參與IBM定價項目,也曾為希捷、美國運通等做過項目咨詢,也曾在華爾街量化基金擔任過研究員。2016年起,王子卓與他人共同創立杉數科技并擔任CTO,過去九年在國內為超百家企業做智能決策方面的咨詢與服務,客戶包括京東、順豐、滴滴、華為、南航等國內領頭企業。

?

港中大(深圳)數據科學學院介紹

數據科學學院是香港中文大學(深圳)人工智能的科研與教學基地,致力于為學校提供包括計算機科學、統計學、大數據科學等在內的人工智能基礎教育。學院現有90余位來自世界各地的全職教授,匯聚了多位國際知名學者,超過35%的全職教授為院士、會士或全球頂尖科學家。這些學者在機器學習、自然語言處理、計算機視覺等前沿領域具有卓越的學術成就與科研貢獻。作為學校在人工智能領域的重要支柱,數據科學學院不斷推動技術創新與跨學科合作,為培養具備全球視野的人工智能人才提供了堅實的基礎。