



近日,國務院國資委集中發布了首批10余個行業30項央企人工智能行業高質量數據集優秀建設成果,中國電科司法領域高質量數據集成功入選。
中國電科在國務院國資委的指導下,以央企“AI+”專項行動為契機,以司法領域高質量數據集為抓手,全面推進人工智能科技創新、產業發展和賦能應用,已形成一批標志性成果,并賦能行業高質量發展。
最高人民法院聯合中國電科組建的中國司法大數據研究院是我國公共數據資源授權運營的先行先試單位,自成立以來便在司法領域高質量數據集建設方面積極探索。組建數據標注團隊,構建基于法律知識體系指引的數據標注系統,通過“人機協同”方式,長期開展專業領域數據標注。以積累的“法律法規、司法解釋、指導案例、裁判文書”等作為基礎數據源,歸納形成包括“法律問答、法條推薦、案件認知”等在內的27類司法語料庫,共計550萬對精調語料,精心打造數億條知識條目,形成一套專業的法律大模型語料和知識庫。結合法律實務,發布法律大模型測試數據集,可在問題記憶、問題理解、邏輯推理、結論生成和內容安全方面對法律大模型進行全面的質量評估。
后續,中國電科將聯合重點行業主管部門與產業鏈相關企業,加快匯聚行業內跨區域、跨層級的通識類和專識類數據集,牽引帶動產業各方深化數據要素協同共享、優化數據資源高效安全開發利用,加快推進高質量數據集落地驗證與迭代優化,營造更加繁榮活躍的數據產業生態。