各地无序部署DeepSeek实无必要,该项工作需系统性开展。当前检察机关正处于信息化工作远未结束,数字化工作基础展开伊始,智能化浪潮迎面扑来的关键时刻,更需我们冷静下来,科学认识大语言模型的能力和检察机关的真实需求。当前,依托大语言模型能力对既有案件进行要素化,形成数据资源以供各级院创新业务场景使用是当务之急。最为优先的业务场景,就是案卡智能填录,或者从某种意义上说:消灭案卡。
一、失序的现状
(一)大干快上的DeepSeek部署
在最高检、省院都还在摸索的时候,个别区县院就完成了“消费级显卡驱动AI检察”的魔幻场景。区县院几张消费级显卡用作体验应该还是可以,但用作业务支持就有点开玩笑了。从来都是“最高检省院主建、市县院主战”,无论是什么系统,市县院最重要职责就是提好一线需求,用好建成系统。如果是利旧来尝鲜DeepSeek还好,新购服务器来追逐热点就有点交智商税了。
(二)各自为政的知识库建设
当DeepSeek问答不能满足业务需求的时候,有些区县院的同学听说DeepSeek+本地知识库很香,然后就开始搞本地知识库,或者说的更专业一点,“构建本院专业法律知识库,启动检索增强生成(RAG)系统项目”——话说,这也不是基层检察院能够承担的项目啊!不客气的说,就算3000名小学生凑在一起,也写不出可媲美全国检察业务专家的公诉案件审查报告啊!
(三)天马行空的数字赋能
比如通过对话式交互来解决智能提取问题。有个公众号说(在没有技术积累背景下)通过部署DeepSeek梳理了电子卷宗,一键提取了关键证据……话说,这是怎样将电子卷宗“喂”给DeepSeek的?又是怎样和检察业务应用系统接口的?这是技术突破还是皇帝的新衣?至于你们信不信,我反正不信。 又比如审判监督。有个公众号说实现了智能辅助审判监督,结果在一个不太显眼的截图里面DeepSeek是这样回答的:“我只关注判决结果,不考虑案件事实、证据或量刑情节……综上所述,判决结果符合法律规定,没有问题。” (不考虑案件事实?沉默三秒……) 说好了,咱不内卷了,不要把想要实现的当成已经实现的,不要把小范围的探索当成经验宣传。这样憋着劲搞“公众号”AI攻坚战,把大家的胃口掉的高高的,这让投入几千万资金、几百位检察官实在干活的院情何以堪?本来搞出来的是很酷炫的东西,在这“绚烂”的图景下也黯然失色。
二、依旧的现实
五年之前,CU检《关于案卡和系统,可以开一场三天三夜的吐槽大会》一文,检察官就提出灵魂之问:“如果填报的信息从来都生成不了有用的数据,我们一次次填报的意义到底又在哪里?”如果不是有长期项目积累基础,绝大部分院部署好的DeepSeek只能通过对话框提供服务,这种方式作为知识提供是可以的,但要具体到案件却力有不逮——你如何让DeepSeek识别你的电子卷宗?在DeepSeek和生产系统没有接口的情况下,2.0系统依然有很多流程、很多的案卡、很多的文书……如果大语言模型无法直接为检察业务系统赋能,对话式交互生成再完美的Markdown文本也只是数字花瓶。
三、冷静的思考
(一)广义信息化的各个阶段
现在AI检察炒的如火如荼,仿佛之前的工作已经成了“牛夫人”。但还是要请大家冷静冷静,当前检察机关正处于这么一个时刻:信息化工作远未结束,数字化工作基础展开伊始,今年就直面智能化的浪潮!可以说今年的任务比往年都重,这三个方向都必须齐头并进,如果只提AI,那就是“猴子掰苞谷”,而我们获得的,也只会是浮沙之上的高塔。
(二)关注的大语言模型基础能力
-
OCR:光学字符识别能力,将图片转为文字,提供基础感知能力。
-
NLU:自然语言理解能力,理解内容,对电子卷宗、法律文书进行快速解析和关键信息提取,提供业务感知能力。
-
NLG:自然语言生成能力,生成内容,在理解的基础上生成我们需要文书,提供业务支持能力。
(三)业务需求的层级
-
AI书记员:以案件要素提取为基础的案卡填录、文书校对等基础功能全覆盖,实现案件的全要素化。
-
AI检察官助理:突破证据摘要与分析、类案检索与推送、信息检索与智能问答、量刑建议及量刑均衡等业务场景。
-
AI检察官:探索全量大数据分析、法律文书生成、公文写作等业务场景。
实践中,OCR识别错一个字可能改变案件性质,NLU误解一个条文或将颠覆司法公正。就现有的技术能力,我们现在需要的不是AI检察官,而是AI书记员。让技术回归工具本质,让机器做机器擅长的事,让检察官做检察官该做的事,才是这场技术革命的真正要义。
四、光明的未来
(一)筑好智能化之梦:大语言模型的应用方式
知识可以共享的,但案件信息不是。DeepSeek应用方式主要包括对话式交互和API接口调用。前者适合最高检在检察大数据中心集中部署“满血版”DeppSeek,集中攻关检察系统垂直大模型,构建全国检察知识库,在工作网向全国四级检察院提供知识服务。后者适合由各省级院部署检察系统垂直大模型区域镜像,站在检察业务应用系统后端通过API提供能力支持,构建本省基础库、主题库、专题库,依托生产系统的细粒度权限对内容和服务进行精准控制,有效赋能具体个案办理。
(二)夯实数字化之基:数据治理是无法回避的主题
检察机关还缺乏以数据为中心的对象资源形成与调用机制。有观点认为“最好的数据治理,将是用户感受不到治理的存在,却能时刻享受到精准数据服务所带来的无形之美”。从数字检察体系来思考,数据采集、数据治理、数据服务的具体工作都不容回避,不过由于其过于宏大,在本文不展开了。
(三)填好信息化之坑:说好了,咱将来不填案卡了
回到五年前检察官的灵魂之问,我们是不是可以做点什么了?是的,大语言模型的能力如此惊艳,我们以前想干而干不成的事情,可以考虑了:依托大语言模型能力对既有案件进行要素化,形成数据资源以供各级院创新业务场景使用! 以案卡智能填充为例:
-
多即是少。即便生产系统有那么多的案卡,上级院依然需要下级院上报各种数据——因为还不够,永远不够。就算毒品案件新增了毒品类型和数量的案卡项,那危险驾驶罪的血液酒精含量呢?在专业化背景下,对案件要素采集需求只会越来越多,依赖新增案卡全面描述案件是不可持续的。
-
少即是多。依赖大语言模型的能力,我们完全可以以电子卷宗和文书卷宗为基础全面解析案件要素,探索建立包括案件基础信息、主体信息、行为要素、证据信息、法律适用、程序事项、量刑要素、社会影响、质量评价等内容在内的案件全要素标签体系,用于结构化解析和标注案件信息,从而通过提供多维度的分析视角,构建立体化的案件管理体系。
是的,将来不需要人工填录案卡,但检察官和各级管理者却可以利用更多的案卡,真正让检察官从数据采集者角色华丽变身为数据使用者角色,真正有获得感。也许有一天,电子卷宗(最好同步建设数字卷宗体系)上传即生成全案要素,基础案卡项和动态案卡项均详细罗列在检察官的个案界面上,从此,人工填录案卡成为历史! ——不过首先,我们得聊聊哪个院负责哪个罪名的全案要素和动态案卡项,平均一个地级市负责一至两个罪名吧~
备注
-
根据检务科技新动态调研,案卡填录和类案推送在限定的多个需求中高居榜首(83.1%),这也是重温五年前有关案卡填录旧文的原动力。
-
对案件的要素解析,DeepSeek也不一定是最佳的模型,需要评估各个大语言模型的能力选择最为适合的,标题也只是蹭个热点。
-
案例若有得罪之处,还请多多谅解,都是为了这项工作行稳致远。
-
点击原文可查阅五年前关于案卡的讨论。
相关链接
-
,已失效。
-
-