“譯”語知洲爭做多模態語料垂類模型首創先鋒
國務院發布的《關于推動外貿保穩提質的意見》中明確要求跨境電商企業應用足用好新技術,推動跨境電商加快發展提質增效。隨著全球化進程的加快和web3.0時代的到來,跨境商貿活動日益頻繁,對高質量小語種翻譯需求也隨之增加。然而,市場上缺乏精確性和針對性的語言資源服務,限制了商貿活動的高效開展。另一方面,2024年全國兩會上提出開展“人工智能+”行動引爆新質生產力革命。如何利用尖端技術,填補商貿領域高質量小語種數據的重大需求,成為企業推動全球運營并進行數字化轉型的關鍵。

在此背景下,北京外國語大學的仇浩杰和胡然帶領團隊首創性地提出了全球首個跨境商貿智能語料庫調用模型的想法,通過整合公開及專有數據,設計并搭建將文本語料與圖片、音頻、視頻一一映射的多模態語料庫,提供異常高級別的語言精確性,填補了商貿領域高質量小語種數據和服務的空白。
“譯”語知洲團隊運用獨特的數據獲取和高精度的處理方式,對不同語種的實施差異化的數據管理,利用人機協同模式進行數據分析與標注,保證語料庫的高價值及數據的可靠性和應用的高效性。另外,團隊還應用先進的人工智能算法設計和語言學腦機接口技術開發了一種基于句法和語法學原理的樹狀圖算法,使智能語言模型更符合人類認知習慣,為用戶提供高質高量的語言服務體驗。多模態語料庫的開發極大豐富了語料庫的應用,使其能處理分析跨媒體的語言信息,為與數字人等新一代數字技術的融合提供堅實的數據基礎和技術支撐。

項目負責人仇浩杰來自北京外國語大學亞洲學院。越南語的專業背景使他在心中種下搭建非通用語語料庫并將其落地應用的種子。擁有扎實語言功底和對語言學、人工智能技術有濃厚興趣的他了解到商貿領域高質量小語種數據服務的市場痛點后,決心深耕多模態語料庫的搭建,最終將這個項目帶到了公眾面前。項目的另一位核心人員胡然則充分利用其國際經濟與貿易的專業知識,為項目的產品設計、市場拓展和商業化提供了重要支持。從語言學習者到全國乃至全世界首個跨境商貿智能語料庫調用模型的開創者,變的是身份,不變的是他們深耕熱愛并為社會做貢獻的決心。

在項目過程中,仇浩杰與胡然等項目伙伴進行了多次線下會議與討論,在一次一次的打磨中將項目的細節不斷優化,在一次一次的討論中不斷完善項目,力求完美。同時他深入學習語言訓練材料的清洗、篩選、標注以及算法設計的相關知識,申請國家實用新型專利3項,軟件著作權3項,增添項目科技硬實力。項目組積極與各大企業合作,廣泛征求意見和建議,確保產品能夠真正滿足市場需求。

商貿領域對高質量小語種數據的需求大,市場痛點多,急需注入新的活力以解決實際問題。在數字技術和計算語言學的垂類融合突破下,“譯”語知洲項目深耕人工智能+新文科沃土,以青年之力從語言、貿易和技術三個方面,積極響應國家“十四五”規劃號召,為全球通訊提供了關鍵資產,推動了相關產業的發展,極大地解決了非通用語種領域的就業挑戰,做商貿領域的通訊新星。
聲明:本網轉發此文章,旨在為讀者提供更多信息資訊,所涉內容不構成投資、消費建議。文章事實如有疑問,請與有關方核實,文章觀點非本網觀點,僅供讀者參考。

