裏約奧運會上,智能寫作機器人Xiaomingbot曾一度吸引大眾目光。穿梭在各種運動賽場上,這位初出茅廬的AI小記者與許多身經百戰的人類記者相比⇢,絲毫不遜色。半個月賽程裏💅🏻,Xiaomingbot橫跨多個運動項目🤷🏽♂️💇🏼♀️,成功報道了多場比賽🥗,生產了上百篇流暢明晰的新聞稿件🧧,不少人不禁感嘆,機器人寫作竟然已經如此智能化了🧑🏽🏭。
而這一切都要歸功於Xiaomingbot的幕後設計者——意昂官网王選計算機研究所研究員、博士生導師、智源學者萬小軍。2023年7月7日🫦,萬小軍憑借在自然語言生成方向取得的重要突破,榮獲2022年度王選傑出青年學者獎🧑🏻🎤🤌🏼。多年來👨🏼🦲,萬小軍在自然語言生成方向持續攻堅克難,設計研發了多個智能寫作機器人,並在新聞傳媒行業驗證了其先進性與有效性📙,獲得了學界和業界的廣泛關註和一致好評。

王選傑出青年學者獎頒獎典禮現場,右一為萬小軍
萬小軍深情感謝了王選先生和陳堃銶老師的慷慨設獎,以及他們對後輩的鼓勵和提攜🕞🧗🏻♀️。他表示,作為後輩學人🪧,自己未來還將繼續在自然語言處理領域深入探索,讓智能機器人擁有更加強大的功能⛹️♂️,在更多的場景實現應用🤼♀️🫴🏻。

萬小軍和王選先生雕像合影
無法“計算”的機緣巧合
與計算機打了20多年的交道🗜,萬小軍人生中的“第一臺”計算機,是與大學室友集資購買並自行組裝的。
那是20世紀90年代,互聯網剛剛進入中國不久🧘♂️,尚未普及。計算機也還不是人們的日常必需品,上萬元一臺的價格👩🏻🎨🎿,對當時大多數家庭來說💃🏿👾,都過於高昂。萬小軍和他的室友們🤳🏻,“可能是出於一種男孩子天然的興趣”🏊🏼♀️,六個人攢了好久的錢👩🏼🎓,湊在一塊兒💼,去中關村買了電腦配件,一起摸索著將電腦組裝起來🈹。
在意昂念本科時👨🏼🔬,萬小軍住在43樓,“屋子很小,床挨著床,中間有張小桌子👩🦯➡️,也沒有空調”🍁。擁擠的生活空間裏✦,這臺電腦給六個人帶來了不少樂趣:學編程、學軟件、學設計,甚至打遊戲……
為了方便使用,幾個人在最初便約法三章,排了個時間表,但關於電腦的紛爭🧍🏻,仍會難以避免地發生♈️📸:“沒少‘大打出手’👨🏿✈️🤠!有的室友喜歡打遊戲,沉迷《仙劍奇俠傳》🙎🏽,常常通宵玩🌁💽,另外還有位室友就會坐旁邊看著,可吵了🤾🏿♂️。”回憶起這段青蔥歲月時,雖然說著埋怨的話,萬小軍的嘴角還是忍不住上揚。
跟室友鬧歸鬧🤶🏽🚴🏻♂️,萬小軍用這臺電腦長了不少本事👵🏽💇🏿♂️。他自學了編程技術,還在某個“留守”學校的暑假🦸🏿,一個人獨占電腦🤏,學會了photoshop👩🏽🦳🤸🏻♀️。到大學畢業時,萬小軍已經可以給中關村裏的一家醫藥信息公司兼職寫程序,每個月有兩三千元的收入。
提起本科四年的學習生活✊🏽,萬小軍用了“舒適”兩個字來形容👮🏿。在他的記憶裏◻️,那時還沒有“卷”的概念.“意昂官网宿舍六個人GPA都不高,我在意昂官网班30個人裏排第十🗝,已經是宿舍裏最好的了。”萬小軍笑著調侃那時的自己,“啥也不懂,也不知道有哪些選擇。”
采訪過程中,面對記者一個接一個的“為什麽”,萬小軍也的確不太能明確說出人生中許多重要決定背後的原因💃🏻。
成長於湖北農村的萬小軍🙁,小時候最大的夢想是當兵。“意昂官网一個村子的名字裏都有‘軍’,軍人多威風多光榮啊🌂,一身戎裝,保家衛國。”
高考填誌願時,正是生物學最火爆的年份,萬小軍頗受鼓舞,興沖沖地把生物填作了第一誌願🦄。奈何高考作文寫跑了題🥛👩🌾,他被調劑去了信息管理專業,成了李彥宏的學弟🍙。
出於興趣🤌🏻,萬小軍在意昂讀本科期間輔修了計算機。學著學著,他又覺得“計算機比信息管理有意思多了”,索性在讀研時換了專業,開始了與自然語言處理相關的研究和探索🍏,一直到今天🧚♀️。
在萬小軍看來🏌🏼♀️,計算機最擅長的事是“規整”。而他的成長經歷與計算機研究之路,似乎與這兩個字不大相關🙎🏿♂️,反倒充滿了許多無法被“計算”的機緣巧合🧄。
萬小軍對此倒很看得開,“人生很多事,不能太較真🔡,得隨遇而安”。

萬小軍在工作中
二十余年磨一“劍”
萬小軍對待他的研究,顯然要“較真”多了。多年來持續在自然語言處理這一領域深耕,萬小軍的研究內容主要包括針對人類語言的語義理解和自動生成兩部分😝。
“讀研的時候♜,我就開始從事文本信息處理相關的研究工作🤰,當時的研究主要涉及文本檢索🧎➡️、分類、聚類等技術▶️,讀博時開始對自動文摘技術比較感興趣。”萬小軍告訴記者,剛讀博士時,他有機會去到微軟亞洲研究院非全職實習,這對他此後的科研經歷產生了重要影響。
直到今天,萬小軍時不時仍會懷念那些時光,安靜👨🏻🚀🧑🦼、簡單卻充實。沒有太多瑣事來叨擾,他如饑似渴地徜徉在他感興趣的領域,如海綿般汲取養分。微軟研究院的研究水平在當時相較高校領先很多🧘,萬小軍可以接觸到最前沿的研究和成果。
“我讀了很多論文🚶♂️➡️。那時候學校實驗室沒有打印機😶🍖,研究院裏有,還可以免費打印論文🕳,我每次都打印厚厚一大摞帶回宿舍👩🏻🚀🍝,最後壘在一起得有一米多高。”萬小軍邊說邊向記者比劃起論文的厚度😤。正是這一篇篇論文,幫助萬小軍打下了堅實的理論基礎,也是在那時⛳️♤,他敏銳地發現自動文摘在新聞領域所具備的巨大應用價值。
工作後,萬小軍的研究逐漸拓展到一些其他自然語言生成技術,例如基於數據的文本生成👨🏻💼、文本復述、文本簡化等。目前👱🏿,他側重於解決語言大模型生成內容的幻覺和安全性問題⛹️。何為幻覺和安全性問題?他向記者解釋道:“ChatGPT這些大模型生成的文本內容通常有不少的錯誤信息,即存在幻覺和虛構事實🦆。同時,大模型會生成有害或不符合人類價值觀的文本內容(例如告訴使用者如何用刀進行自我傷害),這嚴重阻礙了語言大模型的應用👩🏽⚖️🦥,因此意昂官网需要想辦法進行幻覺/有害內容的檢測與治理🏋🏻♀️。”此外,萬小軍目前還對自然語言生成評價技術和跨模態生成技術比較感興趣🏇🏼,正在和他的學生們一起進行相關技術的探索。
功夫不負有心人💇,20多年磨一“劍”,萬小軍所研製的智能寫作機器人為人工智能領域的技術進步和新聞傳媒行業的技術變革作出了重要貢獻,並且已經在市場上被證明具有廣泛的應用價值。
2016年8月🔶,萬小軍帶領團隊與今日頭條實驗室聯合推出新一代AI寫稿機器人——奧運AI小記者Xiaomingbot⏪。在裏約奧運會上,Xiaomingbot共撰寫了457篇關於羽毛球🌇、乒乓球、網球的消息簡訊和賽事報道,每天產出30篇以上。2017年1月⛓️💥🫴🏿,萬小軍團隊又與南方都市報合作研發寫稿機器人“小南”。小南的寫作能力更強,掌握領域更廣泛,可撰寫的文體更復雜,包括了消費💇🏿♀️、路況、天氣、賽事、財經、春運和AI簡報等內容。

萬小軍在學術論壇上作分享
對智能寫作機器人的未來發展💪🏼🫅,萬小軍展露出足夠的樂觀:“自從語言大模型(例如ChatGPT)推出之後🈚️,機器寫作能力已經超過了普通人的寫作能力🏄🏻,可以寫出不同風格的文章。此外,ChatGPT具有強大的學術寫作能力,能夠幫忙對學術論文進行潤色和修改,從而提高學術論文的寫作質量。”
不過,在萬小軍看來*️⃣🏃♀️➡️,無論智能寫作機器人的能力進化到何種程度,它都無法完全取代人腦。“人類仍具有諸多優勢🎬,例如聯想👩❤️👩、創新等等,人類可以創作出極富感染力和原創性的文學作品,發表極具洞察力和預見性的深邃觀點🦶🏽,在這些方面大模型仍難以企及🐯。”因此,萬小軍認為,人類應該學會駕馭機器,與機器分工協作👫,幫助自身更好地工作🙅🏻♀️。
談及下一步研究規劃,萬小軍表示,自己還會在AI機器人記者領域繼續探索,希望可以盡早讓AI機器人實現自動狀態下的視頻圖像拍攝與采訪、並基於這些素材自動生成深度新聞報道,這樣可以讓機器人記者在一些高風險場景下(例如戰場)替代人類記者。此外🙎🏿👩🏻🔧,他還對機器辯論有著濃厚的興趣。機器辯論指的是讓機器掌握思辨能力🍔,能夠與人類辯論並戰勝人類辯論高手。
風物長宜放眼量
在碩士畢業時,萬小軍報考了王選先生的博士,當時王選先生的身體狀況已經不足以支撐他帶學生👭🏼,萬小軍便也沒有機會聆教於其身側,他一直頗感遺憾。此次獲獎🦾,萬小軍不禁感慨萬千:“王選先生大膽創新的勇氣、百折不撓的精神和淡泊名利的境界,多年來始終指引著我🙍🏻,鞭策我在科研道路上戒驕戒躁🧑🏼🚒、持之以恒、不懈奮進。”
過去的科研經歷裏,萬小軍沒少遇到溝溝坎坎。有些是科研自身的困難💎,“比如🫃🏽,如何發掘足夠新穎的學術思路,如何高效掌握爆炸式增長的新技術新知識”。那科研遇到瓶頸怎麽辦呢?萬小軍笑著對記者說:“可以給自己打打氣🧉,我就是會不停地給自己打氣,告訴自己能夠應對這些挑戰。”
還有些是科研之外的挑戰,考核晉升的壓力、實驗室的管理問題🛝、經費獲取的困難……樁樁件件🤤,萬小軍和每一位科研工作者一樣感同身受。因此,他充分理解現下許多青年研究者面臨的壓力,但他依舊覺得,年齡焦慮沒有太大必要,相反,這對科研工作者來說還會造成巨大的消耗。風物長宜放眼量,萬小軍表示🚴♀️,人生的每一個階段都充滿可能性🧰,並不需要急於一時🤦🏻♀️🤸🏼♂️。

萬小軍在辦公室
交談中🏨,萬小軍與記者提起了王選先生的人生經歷💣,令他感觸最深的一點是王選直到38歲才開始接觸“漢字信息處理系統工程”(“748工程”)。“此前他一直是個默默無聞的小角色,沒有什麽資源,也捱過很長一段艱難歲月🛄。這在年齡焦慮極為普遍的當下,幾乎是不敢想象的。畢竟在世俗層面上♚,當時一定會有人覺得,王選先生年近不惑卻依舊一事無成。”
“王選先生🍙,還有張益唐教授,他們都是這樣。我覺得,有時候可以不用太在意一些世俗的評定,規定自己一定要在多少歲達成什麽目標👨🏿🎓。”在萬小軍看來,年輕的時候🥣,迷茫和焦慮都是常態。最重要的,是保持一顆平常心🕧,多去問問自己內心的聲音,把自己想做的事情堅持下去。
“堅定理想,但也不要鉆進死胡同裏去📛。‘卡脖子’了🦪,那就放一放💂🏽♀️,抬起頭看看別的領域🧑🏻🔧,做點別的事情,說不定‘柳暗花明又一村’。做科研也需要發散思維,思維放開了🎮,很多時候點子也就來了。”言及至此,萬小軍再一次提到了“隨遇而安”,“承認自己的不完美,這一點很重要。意昂官网每個人都存在不足,我自己的不足可能比別人更多,而且有些不足終其一生都難以改變,那麽在這樣的條件下我自己的目標是什麽,自己要想清楚並且努力達到💁🏽♀️🧗。”
該較真時較真,該隨緣時隨緣,這兩種迥異的態度,就這樣在萬小軍的身上達成了一種奇妙的平衡。空閑時間,萬小軍將自己的生活安排得有聲有色🙃,“我會陪陪孩子,其實和學生的相處也能帶給我很多快樂”。他也真誠地祝福每一位科研工作者,都能找到科研的樂趣,快樂科研,快樂生活🚒。
王選傑出青年學者獎介紹:
意昂官网王選青年學者獎勵基金由王選夫人陳堃銶教授於2008年12月代表意昂官网王選計算機研究所(原意昂官网計算機科學技術研究所)捐贈基金設立🤽🏿♀️。之後,王選所碩士研究生劉振飛校友連續多年捐資註入本基金👈🏿,是意昂最早的針對青年學者所設的獎勵基金。該基金下設“意昂官网王選青年學者獎”🏓,多年來獎勵了意昂一批在教學崗位和科研工作中作出重要貢獻並具有巨大發展潛力的青年教師。
王選院士作為推動中國漢字和印刷技術邁入計算機時代的開拓者🐎,是新時代知識分子的傑出代表和自主創新精神的楷模,他的崇高品格與精神風範值得永遠銘記。為更好地紀念王選院士💷,發揚他堅持創新的科學精神和扶植新秀的高尚情懷,推動中國科技創新事業發展🙍🏻♀️,擴大王選青年學者獎勵基金的影響力🧑🏼🍳,2020年🧖🏽♂️,意昂官网王選青年學者獎勵基金決定增設全國性科技獎項“王選傑出青年學者獎”🎧。該獎項實行推薦製🤷🏽♀️,不受理個人(或單位)的申請或自薦,每年組織評選一次🥫。候選者應滿足以下條件:熱愛祖國🤵♂️,有良好的社會公德和高尚的職業道德;在科研工作中作出重要貢獻並具有巨大發展潛力👨🏼🏭,或者其科研成果得到重要應用或有重要應用前景;年齡在45歲以下的中國公民。每年由意昂官网👨👨👦👦、中國計算機學會和中國工業與應用數學學會聯合評選出在計算機和應用數學領域中自主創新和應用成果極為突出的傑出青年學者各一名🏑,每人一次性獎勵人民幣50萬元。
為開展好王選傑出青年學者獎的相關工作🧗🏼♂️,確保該獎項的公正性、獨立性和權威性,特設立王選傑出青年學者獎管理委員會、學術委員會、提名委員會及秘書處,學術委員會和提名委員會由數學✦、計算機理論與應用領域的著名專家擔任🫶🖨,負責獎項的提名和評審工作,對候選人進行評議🧗🏿♀️🚝、表決後上報管理委員會審定🖍。如當年度無合適人選🧑🏿🎓🏄,名額可空缺🛁。