AlphaGo 的成功离不开几个先决条件:标注零成本、存在一个上帝视角告诉机器明确的输赢结果、完全信息下的博弈等,所有这些条件在法律(乃至绝大多数垂直领域)均不存在,其中,没有大规模现成可用的标签数据是法律 AI 领域的最大现实。玩家们不仅需要选择正确的机器学习算法、积极融入先进的深度学习模型,还要把法律知识图谱放进系统中,针对性地准确处理特定问题。所有这些都大大加大了法律 AI 的落地难度,也暗示了智能背后大量的人力工程。然而,很大程度上影响用户体验的并非定罪量刑预测、类案推送这类高精尖应用,而是诸如数据互通、卷宗电子化等基础设施。尽管难题不少,但我们也要看到各种炒作和极端言论正逐渐让位于务实讨论,学界认为未来十年会是 NLP 的黄金十年,也描画了一副更加智能的法律 AI 图景。我们仍然值得对这个领域抱以乐观。
当 20 岁的温州乐清女孩赵培辰坐上钟元的滴滴顺风车后,就再也没有回来。距离最后一条求救微信十多个小时后,钟元被警方逮捕,残酷真相也随之揭开:
接到赵培辰后,钟元选择了一条极为生僻的路线,行至无人处后将其手脚捆绑起来,胶布封嘴,索要钱财。
9000 多元到手后,钟元再次将车开到信号不好的偏僻处,强奸了赵培辰,并用匕首刺其颈部,致其死亡。随后抛尸,离开。
这就是震惊国人的「滴滴顺风车司机杀人案」。
两个应用场景:经典、前卫
目前,案件正在审理中。笔者尝试粗颗粒地描述一下法官「加工」案件的过程:
在犯罪构成要件的指引下,拆分案件事实,将不同事实部分「封装」到相应构成要素中。
比如,捆绑、用胶布封嘴的行为,是否构成「当场使用暴力」(抢劫的行为要素之一)?用匕首刺其颈部,致受害人死亡,是否属于非法剥夺他人生命(杀人)?
构成要件「封装」完毕后,法官还要考虑其他要素,比如,犯罪特殊形态(是否存在中止?)和罪数(数罪并罚?),等等。
最后,根据所涉条文(比如《中华人民共和国刑法》第二十四条、第二百六十三条、第二百三十二条等)完成定罪与量刑。
不过,这仅仅完成了一半的工作。
裁判不是追求独创性的文学创作,恰恰相反,法官需要将个案嵌入类案体系,力求同案同判。
和主要服务 B、C 端的美国法律科技市场不同,当前中国法律智能市场中,面向 G、B 端的法律智能公司占到近 50%,无论上述哪一个工作环节——定罪量刑预测还是类案分析,都是这些公司力图覆盖的经典场景。