法律人工智能是指人工智能技術(shù)在法律中的應(yīng)用,其目標(biāo)是充分提升法治效能。我國(guó)的智慧法院、智慧檢務(wù)建設(shè)等國(guó)家重大工程,就是法律人工智能的落地應(yīng)用。目前,法律人工智能的系統(tǒng)工程標(biāo)桿是“上海刑事案件智能輔助辦案系統(tǒng)”,其將公檢法三機(jī)關(guān)的刑事業(yè)務(wù)在一個(gè)云平臺(tái)內(nèi)打通,部分實(shí)現(xiàn)了自動(dòng)法律推理,大幅提升了工作實(shí)效和程序公正性。法律人工智能研發(fā)中的問(wèn)題主要有理論建模和具體應(yīng)用兩大類,可以總結(jié)為十大前沿問(wèn)題。
法律推理的形式模型。法律推理的形式建模是實(shí)現(xiàn)自動(dòng)法律推理最基礎(chǔ)的問(wèn)題。自動(dòng)推理與智能密切相關(guān)。智能即會(huì)思維。什么叫“會(huì)思維”?英國(guó)數(shù)學(xué)家圖靈認(rèn)為,如果機(jī)器能在互不接觸的相當(dāng)長(zhǎng)時(shí)間內(nèi)與人類對(duì)話,而被對(duì)方誤判為人類的概率達(dá)到一定程度,那就有理由說(shuō)這臺(tái)機(jī)器“會(huì)思維”。這就是“圖靈測(cè)試”。這表明,人工智能的關(guān)鍵在于能否實(shí)現(xiàn)自動(dòng)推理。作為人工智能子領(lǐng)域,法律人工智能的關(guān)鍵就在于法律自動(dòng)推理的實(shí)現(xiàn)。為此,需要給出面向自動(dòng)法律推理的形式模型。有三種可能的法律推理建模方案:一是規(guī)則推理方案,即利用演繹推理將法律規(guī)范編碼成法律解釋庫(kù)和案件事實(shí)庫(kù),以實(shí)現(xiàn)自動(dòng)法律演繹推理;二是案例推理方案,即利用類比推理將案例編碼成法律解釋庫(kù)和案件事實(shí)庫(kù),以實(shí)現(xiàn)自動(dòng)法律類比推理;三是數(shù)據(jù)推理方案,即利用歸納推理將有價(jià)值的法律信息編碼成法律解釋庫(kù)和案件事實(shí)庫(kù),以實(shí)現(xiàn)自動(dòng)法律大數(shù)據(jù)推理。在成文法國(guó)家,第一種方案是最主要的。
法律決策的計(jì)算模型。能行可計(jì)算是人工智能得以實(shí)現(xiàn)的必要條件。“能行”強(qiáng)調(diào)要有實(shí)效,“可計(jì)算”強(qiáng)調(diào)能夠通過(guò)編輯方式來(lái)實(shí)現(xiàn)。法律決策能行可計(jì)算是法律人工智能的前提條件。法律決策可分為立法、執(zhí)法、司法和守法決策,其理性根基即立法論證、執(zhí)法論證、司法論證和守法論證。然而,傳統(tǒng)法律論證主要由人工完成,優(yōu)度完全取決于法律論證者的知識(shí)結(jié)構(gòu)和論證能力,而作為自然人的論證者總有知識(shí)結(jié)構(gòu)、價(jià)值取向等局限,得出的結(jié)論難免存在主觀偏差。在法律決策中,尤其是在法律論證者經(jīng)驗(yàn)不足的階段,常常會(huì)犯常識(shí)或邏輯錯(cuò)誤,而設(shè)計(jì)相關(guān)法律決策輔助系統(tǒng),保障法律問(wèn)題部分可計(jì)算,可以減少這類錯(cuò)誤發(fā)生。概言之,為了逼近客觀性,充分利用人工智能技術(shù)是一種切實(shí)可行的方案。
證據(jù)推理的計(jì)算模型。證據(jù)推理的計(jì)算模型是實(shí)現(xiàn)自動(dòng)法律證據(jù)推理的前提條件。在審判過(guò)程中,法律從業(yè)者通過(guò)證據(jù)累積來(lái)確認(rèn)或否認(rèn)有關(guān)法律假設(shè)。服務(wù)司法證明過(guò)程的法律人工智能應(yīng)用必須具備為用戶提供在案件中進(jìn)行證據(jù)表達(dá)和推理的復(fù)雜能力,因此,研發(fā)者必須使用復(fù)雜的技術(shù)來(lái)表示、探索、推斷和分析訴訟過(guò)程中出現(xiàn)的假設(shè)和證據(jù)的可替代性解釋。這需要計(jì)算技術(shù)來(lái)表示訴訟參與者、實(shí)體、事件和世界情形語(yǔ)境,將解釋證據(jù)的替代假設(shè)進(jìn)行結(jié)構(gòu)化處理,通過(guò)評(píng)估證據(jù)的相關(guān)性和權(quán)重來(lái)確證或否定假設(shè),做出假設(shè)真實(shí)的推論,而將貝葉斯推理網(wǎng)絡(luò)與人工智能中的知識(shí)表示組合起來(lái),就可以對(duì)事實(shí)論證進(jìn)行結(jié)構(gòu)化分析。
法律推理多主體建模。法律審判是建立在訴訟基礎(chǔ)之上的,而訴訟是一種三方法律論證博弈。利用人工智能中的多主體系統(tǒng)思想,就能實(shí)現(xiàn)訴訟論證博弈的邏輯建模。在計(jì)算機(jī)科學(xué)中,多主體系統(tǒng)又稱多智能體系統(tǒng),是指由多個(gè)相互作用的智能體組成的計(jì)算機(jī)系統(tǒng)。典型的多智能體系統(tǒng)研究指向軟件智能體,其主體可以是機(jī)器人、人或人機(jī)組合團(tuán)隊(duì),智能則可以包括條理方法、功能方法、程序方法、算法搜索或強(qiáng)化學(xué)習(xí)。多智能體系統(tǒng)可以解決單個(gè)智能體或單個(gè)系統(tǒng)難以解決甚至不可解決的問(wèn)題。法律訴訟恰恰是一種多主體互動(dòng)的論證活動(dòng)。訴訟中,起訴、應(yīng)訴和裁判三方需要就法律論證中的法律規(guī)范及其解釋、法律證據(jù)及其支持的事實(shí)主張以及法律論證的強(qiáng)度進(jìn)行互動(dòng),做出相應(yīng)法律決策。多主體系統(tǒng)為智能訴訟系統(tǒng)(如智慧法院等)提供了可能的建模方案。
可執(zhí)行立法檢驗(yàn)建模。黨的十八大提出了“科學(xué)立法”。從邏輯學(xué)角度講,科學(xué)立法就是將法律體系視為一個(gè)準(zhǔn)邏輯體系,要求法律體系原則上具有一致性、完備性、有效性和可靠性。其中,最為核心的是一致性,因?yàn)橥陚湫、可靠性和有效性均可通過(guò)法官的自由裁量權(quán)彌補(bǔ),而一致性卻很難。法律體系的一致性,要求法律體系原則上無(wú)矛盾,不應(yīng)出現(xiàn)法律沖突。不一致會(huì)導(dǎo)致法律體系紊亂和法律從業(yè)者無(wú)所適從,并削弱司法公信力。同一法律內(nèi)部的沖突,立法者一般可自行解決,但不同部門法以及上下位法的沖突往往超出立法者能力范圍。而自動(dòng)實(shí)現(xiàn)法律法規(guī)體系一致性檢測(cè)的法律人工智能,將大大提升我們的科學(xué)立法水平。
文本自動(dòng)分類與總結(jié)。該問(wèn)題包括兩個(gè)方面:一是法律文本的自動(dòng)分類。當(dāng)前,大多數(shù)法律文件以電子形式提交,但對(duì)這些電子文件的分類多停留在傳統(tǒng)的人工階段,而利用機(jī)器學(xué)習(xí)技術(shù)中的文本自動(dòng)分類技術(shù),可實(shí)現(xiàn)法律文本的自動(dòng)分類。智慧司法的一大目標(biāo)就是要借此提高文件的歸檔效率和后期利用率。二是文本中法律論證的自動(dòng)總結(jié)。法律決策建立在法律論證之上,而法律論證埋藏在法律文本之中。借助機(jī)器學(xué)習(xí)中的文本自動(dòng)總結(jié)技術(shù),可以大大提高法律論證挖掘的效率。更重要的是,使用傳統(tǒng)的人工方法挖掘法律論證,其質(zhì)量主要取決于論證挖掘者的能力和水平,優(yōu)度參差不齊,而研發(fā)法律文本的自動(dòng)總結(jié)應(yīng)用程序,可以普遍提升論證挖掘優(yōu)度,并確保論證挖掘質(zhì)量的穩(wěn)定性和評(píng)估的客觀性。
法律信息的自動(dòng)提取。法律信息提取過(guò)程中產(chǎn)生的信息是后續(xù)立法和構(gòu)建新的法律論證的基礎(chǔ),也是處理電子證據(jù)的有效手段和幫助用戶評(píng)估相關(guān)信息的能行工具的重要組成部分。但由于數(shù)據(jù)量過(guò)于龐大,對(duì)法律信息手工分析顯然不可行。自動(dòng)信息提取的任務(wù)就是從非結(jié)構(gòu)化或半結(jié)構(gòu)化的機(jī)器可讀文檔中自動(dòng)提取并生成結(jié)構(gòu)化信息。在大多數(shù)情況下,信息提取涉及通過(guò)自然語(yǔ)言處理分析人類語(yǔ)言文本。目前,人工智能技術(shù)已支持多媒體文檔信息的處理,如圖像、音頻和視頻文檔的自動(dòng)注釋和內(nèi)容提取。法律信息自動(dòng)提取涉及一般自然語(yǔ)言的文本處理和具體法律領(lǐng)域語(yǔ)言處理,因此,相關(guān)模型需要同時(shí)兼顧這兩個(gè)方面。
電子取證的機(jī)器學(xué)習(xí)。電子取證是指在法律訴訟或法律調(diào)查中為回應(yīng)舉證要求而進(jìn)行的電子存儲(chǔ)信息的辨識(shí)、收集和舉證。這些電子存儲(chǔ)信息包括文檔、電子郵件、音頻、視頻、數(shù)據(jù)庫(kù)、社交媒體等。電子數(shù)據(jù)不僅數(shù)量巨大,取證過(guò)程和技術(shù)往往也很復(fù)雜。電子文檔富有動(dòng)態(tài)性,常常包含如時(shí)間—日期戳、作者和收信人等元數(shù)據(jù)。為避免證據(jù)后期被篡改或毀損,需保存電子存儲(chǔ)信息的原始內(nèi)容和元數(shù)據(jù),并置于法律監(jiān)管之下。數(shù)據(jù)分析就是要篩選和隔離明顯不相關(guān)的電子信息,將數(shù)據(jù)托管于安全環(huán)境中,使得編寫(xiě)文檔代碼的審閱人員可以訪問(wèn)這些數(shù)據(jù),了解它們與法律事項(xiàng)的關(guān)系。使用計(jì)算機(jī)輔助評(píng)估、預(yù)測(cè)編碼和其他用于電子取證的分析軟件,可以大幅降低法律從業(yè)者審查證據(jù)的時(shí)間等人力成本。
法律信息的檢索系統(tǒng)。法律信息檢索是一門應(yīng)用于包括法律法規(guī)、判例和學(xué)術(shù)論著在內(nèi)的法律文本的信息檢索科學(xué),是法律信息學(xué)的一個(gè)領(lǐng)域。通過(guò)電子手段可獲得的法律文件數(shù)量龐大且呈爆炸式增長(zhǎng),故法律信息精準(zhǔn)檢索日漸重要。一般來(lái)講,為了達(dá)到信息檢索的目標(biāo),有三種可運(yùn)用的檢索技術(shù)——布爾檢索、法律文本手工分類和法律文本自然語(yǔ)言處理。對(duì)于整體的法律文檔而言,目前通常使用的方法是布爾檢索法,也就是與特定術(shù)語(yǔ)進(jìn)行精確匹配。一般來(lái)說(shuō),研究人員相信他們通過(guò)這種方法已經(jīng)檢索了大多數(shù)的相關(guān)文件,事實(shí)上這種方法的平均查全率只有20%,所遺漏信息可能相當(dāng)重要。法律信息檢索試圖通過(guò)增加相關(guān)文檔的數(shù)量(高查全率)和減少不相關(guān)文檔的數(shù)量(高準(zhǔn)確率)提高法律搜索的效率。但這是一項(xiàng)艱巨的任務(wù),因?yàn)樵诜深I(lǐng)域行話和多義詞非常普遍,而且有些詞義還經(jīng)常變化。
法律機(jī)器人的研發(fā)。法律機(jī)器人是一類面向客戶的法律人工智能應(yīng)用程序,用于自動(dòng)執(zhí)行具體法律任務(wù),如文檔自動(dòng)化和計(jì)算機(jī)輔助法律檢索。從智能搜索機(jī)器人、表單程式機(jī)器人到法律咨詢機(jī)器人,法律機(jī)器人的用戶界面多種多樣。根據(jù)任務(wù)的不同,面向律師事務(wù)所客戶的法律機(jī)器人解決方案往往需要在律師監(jiān)督下運(yùn)行,而面向消費(fèi)者和企業(yè)客戶的法律機(jī)器人解決方案則通常不需要法律專業(yè)人士的直接監(jiān)督。法律機(jī)器人不是用來(lái)取代諸如法官、律師等法律從業(yè)者的,它是人類智能之延伸,是法律人的得力助手,而并不會(huì)替代法律人。
(作者:熊明輝,系中山大學(xué)哲學(xué)系教授,國(guó)家“2011計(jì)劃”司法文明協(xié)同創(chuàng)新中心教授)