在北京市人民检察院的一间办公室里,一台以国产算力设备为支撑的人工智能一体机正高速运转。大屏幕上,成千上万的信息数据如潮水般流过,由北京市检察机关拥有自主知识产权的“3+N”控告申诉大数据模型矩阵系统逐一“思考”、解析。

不到一分钟,系统就从纷繁复杂的信息中捕捉到了存在潜在风险的社会矛盾纠纷、可以导入案件程序办理的线索信息,并对执法司法工作情况实时开展反向审视——这不是科幻片场景,而是北京市检察机关日常工作中的真实一幕。

近几年,北京检察控告申诉部门一直在思索如何将大数据模型这种新质生产力与新时代“枫桥经验”相结合,打造出“数智枫桥·数治北京”这一北京样板。

如今,这种“大数据模型”已融入到北京检察机关的日常工作之中,形成了“枫控智检”“索迹智见”“法脉智鉴”三大模型领衔的“3+N”数智检察模型矩阵,每天有数以十万计的涉法涉诉数据被智能处理。检察官成为了“数据指挥官”,从“办一案”走向“治一片”,从“被动应对”走向“提前预防”。“科技赋能,就是为平安北京赋能。检察官的办案思维与最新的人工智能技术相结合,提前预警预防矛盾纠纷,就是我们最大的成效。”北京市人民检察院党组成员、副检察长祁治国说。

大数据模型成为检察官办案“助手” 矛盾纠纷化解率超九成

在北京市人民检察院里,不到半米高的人工智能一体机正在高速运转,一体机电脑连接的大屏幕上显示,大数据模型正在对一条条检察信访信息进行分析、处理。没多久,系统就给出了信访信息中反映出的各类检察监督线索信息,供检察官进一步甄别。

“这是北京市人民检察院研发的‘索迹智见’涉法涉诉监督线索筛查研判大数据模型,检察官可利用这套系统,从群众信访材料中智能、准确、高效地探寻各类矛盾纠纷线索的‘蛛丝马迹’,迅速提取出信访事项中的具体涉法诉求。”北京市人民检察院第十检察部主任宋文国告诉北京青年报记者,通过运用“索迹智见”,检察官能够及时发现各类监督线索信息,导入司法程序办理,实现矛盾纠纷法治化实质化解,化解率超95%。

在祁治国看来,相比叠加大量人力去阅读、分析海量材料,“索迹智见”这样的大数据模型可以大大节约检察机关的时间成本,让检察官们“好钢用在刀刃上”,全力去解决、处理大数据模型发现的监督线索,从而在第一时间处理化解矛盾纠纷。这是北京市检察机关运用新质生产力打造新时代“枫桥经验”北京样本的生动体现。

如今在北京市检察机关中,像“索迹智见”这样的大数据模型并不少见。在北京检察整个控告申诉条线的共同努力下,目前北京市检察机关已建设起“枫控智检”矛盾纠纷风险评估、“索迹智见”涉法涉诉监督线索筛查研判、“法脉智鉴”案事件反向审视三个主要大数据模型和应用于医保欺诈监督、预付卡规范治理等领域的多个小模型,形成了“3+N”大数据模型矩阵系统。

“枫控智检”大数据模型通过梳理海量的信息材料,对矛盾纠纷风险进行评估研判,高效、准确地发现高风险矛盾纠纷事项,并将相应的风险信息及时通报相关单位,确保将矛盾纠纷的风险消灭于萌芽状态。

而“法脉智鉴”大数据模型则立足于查找引发矛盾纠纷的“缘由”,反向审视司法、执法机关工作人员的办案、执法情况。通过对大数据的分析,锁定出群众反映较多的矛盾纠纷、案件类型以及相关的司法或执法工作人员,这有助于检察机关追溯司法办案、执法工作中存在的问题,发现并移交违纪违法线索,并提出源头治理的意见建议。

化矛盾纠纷于未然 大数据模型每天处理信息数以万计

在大数据的帮助下,检察官们在调查、处理矛盾纠纷时,随时可以打开智能化的“工具箱”,用最合适的大数据工具辅助开展工作。

“以前检察机关往往是在矛盾纠纷出现之后再介入处理,现在有了大数据模型的帮助,我们可以在矛盾纠纷出现前,就将其化解于未然。”祁治国说,目前这些大数据模型已经全面覆盖了北京市检察机关刑事、民事、行政、公益诉讼“四大检察”业务,每天都可以处理数以万计的数据信息。

西城区人民检察院办理了一起西城区某小区居民因为停车纠纷而划车的案件。“按照传统的思维,这起案件判决后,检察官的工作就告一段落了。可引发这起案件背后的矛盾根源并未得到解决。”祁治国表示,检察官们调查后发现,那几年,西城区因停车纠纷引发的各类刑事案件共有48件,其中因停车引发的寻衅滋事类案件占到该罪名案件的61.22%,而故意毁坏财物罪中的占比更高,达到81.81%。

西城区人民检察院协调公安机关及相关部门,调取了大量相关数据,结合多年来出现过停车纠纷的具体地点,测算出了西城区15个街道的风险水平。相关数据被引入大数据模型后,形成了一张西城区停车纠纷的热力图,所有需治理的风险点位一目了然,甚至能精确到经纬度。

有了这份热力图,检察官们联合街道建立专项协调机制,在部分胡同增设停车位,并设置了多个非机动车停放区。随后,这一协调机制铺开到整个西城区,随着工作推进,西城区人民检察院受理的因停车纠纷引发的刑事案件数量明显下降了。

“回顾这些工作,我们检察机关也思考了很多,得出三点总结。一是通过个案办理,到类案监督,再到溯源治理,就可以实现由‘案’到‘治’的转变。二是通过大数据模型,从批量发现案件线索、办理检察案件,到减少线索、降低案件,可以实现从办案到预防的转变。三是通过检察履职的‘我管’,到各有关职能单位、部门形成合力的‘都管’,可以实现从个案办理到系统性解决的转变。”祁治国说。

他表示,总结起来,检察机关践行新时代“枫桥经验”,就是坚持问题导向、系统解决、创新思维。据此,这能帮助检察机关更好地化解社会矛盾纠纷、融入社会综合治理。

检察官给大数据模型做训练 教其办案逻辑

从2024年8月开始,北京市人民检察院张琦就作为研发团队的一员,参与到了该院大数据模型的研发工作之中。他坦言,作为一名法学专业毕业的法律从业者,他花了很长时间去思考如何将检察人员的法律思维与人工智能模型结合在一起。

“去年12月份,我们就做出了第一款用于检察业务的大数据模型,但受制于当时的算法、算力水平,这款模型的效果并不算好。领导们鼓励大家说,我们努力迈出了第一步,接下来还要继续往下走。”张琦回忆说,到了今年春天,国内各种开源的人工智能算法有了长足进步,这给检察机关开发大数据模型提供了有力支持。

很快,利用这些新算法搭建的人工智能模型研发成功。试用后,包括张琦在内的检察人员发现这款模型的效果甚至超出了他们的预期。张琦说,检察人员和技术人员通力合作,训练人工智能模型像检察人员一样思考,复刻检察办案逻辑,去模拟检察官的办案过程。“其实我们在日常工作中,也会去进行风险评估,去寻找信访材料中的涉法诉求,并反向审视司法、执法机关工作人员的办案、执法情况。现在我们把这套逻辑教给人工智能模型,让它去处理海量的数据和信息,让人工智能在短时间内可以处理海量数据信息的优势发挥得淋漓尽致。”

这份工作并不简单。张琦坦言,通用型的人工智能模型对于某些法律专用术语的理解与司法实践还存在较大偏差,对于检察业务逻辑的理解还不完善。针对一些特殊领域的数据,研发团队还会采取“数据标注”的方式,即对数千条数据进行人工标注(给数据添加注释和标签,以明确数据的含义和类别),然后“喂”给人工智能,用这种“笨办法”来让大数据模型学习、掌握检察人员的思考方式,最终彻底突破了瓶颈,确保它能够完全按照检察人员的思维来处理问题。

大数据模型分析数据超22亿条 为国家追回税款等超2.4亿元

这样的大数据模型,很快起到了成效。此前检察机关发现,部分加油站会通过“体外账户”收付款、账簿凭证弄虚作假、篡改税控软件数据等手段隐匿收入、偷逃税款。

北京市检察机关运用大数据模型,全面分析超过22亿条数据,发现了大量违法线索,督促相关企业补缴税款及滞纳金共计2.4亿余元。

此外,针对办案中发现的问题,北京市检察院向市税务局制发了检察建议,助力堵塞漏洞。

如今,北京市检察院打造的大数据模型仍在根据各级检察机关的工作需要,不断孵化出新的模块或新的模型。祁治国认为,社会是一个系统,这就要求检察官用系统观念来解决社会所面对的问题。而大数据模型就是在海量数据中,系统科学地发现问题、处理问题的绝佳帮手。通过不断创新,让检察工作不断走在时代的最前沿。

用大数据为预付卡商家“跑路”建起“防火墙” 市民投诉降四成

近年来,在北京市检察院的指导下,各级基层检察院也将人工智能和大数据模型变为了“数智”好帮手。在这些新质生产力的帮助下,检察机关能够有效地发现社会中问题的征兆,变“被动防控”为“主动预防”。

此前,商家向消费者兜售预付卡后“跑路”的情况,引发了不少消费者投诉。有的家长为孩子在培训机构充值数万元,结果血本无归。关注到这些情况后,朝阳区检察院的检察官们想到了利用大数据模型来解决问题。

朝阳区检察院第六检察部副主任李静雯说,2024年初经过调研后他们发现,很多销售预付卡的机构“跑路”前,都是有征兆的。“当时我们调研了体育健身、艺术培训、托育早教、美容美发这4个行业共34家销售预付卡后‘跑路’的企业作为样本,发现很多企业都存在一个共性,那就是没有就发售预付卡的行为向行业主管部门备案,也未开设专门的账户进行资金监管。”

而根据国家和北京市的相关规定,经营者发行预付卡超过一定数量、金额规模应当向行业主管部门备案,发卡企业应确定一个商业银行账户作为资金存管账户,并与存管银行签订存管协议。这些“跑路”企业的做法无疑违反了上述规定。

李静雯表示,发现这一问题后,检察官们梳理了公开网络中形成的经营预付卡企业数据以及12345投诉线索等,和行政机关备案的预付卡企业数据等进行数据碰撞,发现了100多条发卡企业存在应备案未备案问题的线索。随后,检察官们根据大数据模型发现的可疑线索,多次到销售预付卡的企业实地调查取证,了解企业的资金走向,确认企业是否存在违规行为。

这之后,朝阳区检察院根据收集到的证据开展了公益诉讼检察履职,多次与相关监管单位召开座谈会议,并制发检察建议。相关部门及时开展专项监督检查,先后对372家企业责令整改,备案企业新增102家,资金存管平台入驻企业增加206家,累计存管资金量由105.22万元增长至8967.07万元,消费者预存资金的安全性有了显著提升。

检察机关根据已“跑路”企业的大数据画像提炼出了14个预警指标,植入到朝阳区针对预付卡搭建的“朝阳预警通”平台,为消费者做好预警工作。与此同时,单用途预付卡规范治理大数据模型已被应用到北京16个区级检察院,并向内蒙古、陕西等多地检察机关推广应用。

“2024年底,我们收到了一个好消息,12345平台涉预付卡问题投诉信息同比下降了40%。这说明我们的工作是非常有意义的。”李静雯说。

大数据模型助检察官升级思维 “办一案”变为“治一片”

北京市检察院第三分院第一检察部副主任王金倩也在办案中,尝试用大数据模型解决老百姓最关心的问题。

此前辖区基层检察院曾办理过一起交通肇事案件,事故发生在一所学校附近。检察承办人在审查案卷材料并走访案发现场后发现,学校门前路段没有设置红绿灯、缺少限速减速提示标志,可能给学生上下学带来安全隐患。

承办人进一步调查后发现,区内还有一些学校不同程度地存在周边道路交通基础设施缺失的情况,于是着手办理了相关行政公益诉讼案件。北京市检察院第三分院第一检察部副主任王金倩在采访中回忆,该案上报到北京市检察院第三分院,引起了她和其他检察官的关注。

“在全市范围内,是否还有其他学校周边的道路存在类似的安全隐患呢?”王金倩说,如果没有大数据模型,按照往常的办案思路,检察官就需要到各个学校实地调查,一天下来最多也就跑五六所学校,花费大量时间成本的同时,最后往往只能就某个个案进行处理。

但现在,检察官们有了可依靠的大数据模型。

“我们在模型中整合了教育部门提供的学校地址信息,并结合了交管部门提供的交通设施布设数据,最后又整合了12345市民服务热线中涉及的校园周边交通秩序的投诉内容。”王金倩说,模型会根据学校的位置以及周边的设施等情况,迅速分析出哪些学校周边道路存在安全隐患,检察官再根据大数据模型发现的线索,去实地调查走访,工作效率得以大大提高。

如今,这款大数据模型已部署到北京各区检察机关,通过该模型批量筛查存在交通安全隐患的校园周边道路线索,最终发现行政公益诉讼线索1389条,行政公益诉讼立案211件,向各类行政主体制发检察建议及磋商函209份。“我在朝阳区的一所高中担任法治副校长。在我们开展相关行动后,有一天我发现相关部门翻新了学校门口的交通设施,将原本有些模糊的人行横道线等重画了一遍。很多家长也反馈说,经过翻新,校园门口的交通秩序有了明显改善。”

“大数据模型不仅仅是一个方便我们服务社会的工具,更是在改变我们的办案思维。”王金倩说,由于大数据模型需要先把共性特点教给人工智能,然后让人工智能去处理、碰撞海量的数据,这就要求检察官具备发现事物共性的思维,将“办一案”的思路转变为“治一片”。

有一次,王金倩办理了一起校车危险驾驶案,发现司机有残疾证。“按照国家规定,校车司机需要满足特定的条件,不能有可能危及行车安全的疾病病史。有了之前处理大数据模型的经验,我就在想,是否还有其他校车司机存在类似的问题。”

王金倩去车管所调取了校车驾驶人资质的名单,和残联方面的数据开展了大数据比对,最终发现了部分安全隐患,督促相关部门进行了处理,并在这些部门的配合下,在危险发生之前,先将漏洞消除掉了。

“技术在不断进步,我们作为检察官,也需要跟上时代的脚步,不断努力学习,转变我们的思维,和技术共同进步。”王金倩表示。

用数据发掘隐藏的线索 让罪恶无处遁形

除了通过应用大数据模型为民造福,还有一些以往难以被发现的犯罪线索借助北京检察机关大数据模型被发现。

“医保骗保是一类较特殊的犯罪,这种犯罪一般也不会有被害人报案,且为规避侦查通常使用现金交易,隐蔽性非常强,传统的侦查手段难以有效发现线索。”北京市检察院第一检察部检察官助理刘凡石介绍了这样一起案件。

公安机关抓获了一名利用医保买药后倒卖药品的犯罪分子,缴获的手机中发现了海量的涉嫌违规出售、收购医保药品行为的聊天记录,并发现700多个专门用于药品交易的微信群。

检察机关在对案件进行研究后,意识到可以利用人工智能技术去深入挖掘这些聊天记录背后的犯罪线索。“如果要用人工去调查这些聊天记录,将耗费巨大的人力物力,最终成效也难以保证。但应用人工智能技术,我们就可以处理这些海量的聊天信息,筛查出相应的办案线索,再用人工进一步调查核实,效率可以大大提升。”刘凡石说。

通过这起案件的调查,检察机关发现了医保骗保犯罪行为的大量共性特点,比如有的骗保人员会在同一天去多个医院跨院就诊开药等。基于发现的这些特点,检察机关设计开发了医保欺诈全链条监督大数据模型。“这款大数据模型是在北京市检察院领导下,由北京市检一分院牵头,全市各家基层检察院共同参与研发而成的,我们大家为此成立了工作专班,反复推敲其背后的思考逻辑。”

“我们把医保骗保行为的特点、共性总结出来,将这些共性特点转化为人工智能能够理解的技术路径,然后将海量的医疗大数据交给人工智能进行筛查,帮我们找出其中疑似医保骗保行为的线索。”刘凡石表示,这个过程不但帮助检察机关发现了大量平时难以发现的线索,帮助追捕追诉漏罪漏犯、形成案件串并,还有助于帮助检察干警思考,这些犯罪行为共性特点背后反映出的制度漏洞,并通过检察建议等方式,督促相关部门尽快堵住这些漏洞。“在应用大数据模型之前,我们往往将眼光聚焦到当前办理的案件上,而应用大数据模型之后,我们会主动总结案件犯罪行为的特点,将这些特点教给人工智能去理解识别,让它协助我们去处理海量的数据。这个过程中,我们也会主动去思考案件背后的共性问题,也让我们用更宏观的视角去处理案件。”

不过刘凡石坦言,这个调整思路的过程并非易事,在研发促进医保欺诈全链条监督大数据模型的过程中,研发人员先后修改了二三十次模型逻辑规则,确保能用好每一份算力。“这个模型升级的过程,也是我们不断升级运用大数据思维助理检察履职办案的过程。这期间我们不但要做加法,还要多做减法,让模型的逻辑更精简,才能不断提升模型产出线索的精准性,减少二次人工核查的工作量。”

这期间,检察机关也得到了市医保局、公安机关等相关部门的大力支持,多部门协同发力,共同确保医保资金用在最需要的群众身上。

如今,通过这款大数据模型,北京市检察机关累计筛查出各类医保骗保线索1100余条,在公安机关支持配合下累计查获犯罪嫌疑人180余人。

大数据成为女童守护者 助医生履行强制报告义务落到实处

同样利用大数据模型发现隐藏犯罪的还有北京市检察院第一分院第七检察部检察官助理荣杰。他和团队成员发现一些女童遭到性侵后,知情人没有主动报案,这导致受害者无法及时得到法律的救助,也不利于未成年人的健康成长。

为了破解这个难题,检察机关和卫健委合作,通过大数据碰撞的方式发现疑似未成年人遭遇侵害的线索,并由此开展调查。在大数据模型的帮助下,数起隐藏的恶劣犯罪被发现。

12岁的小静(化名)不幸遭到侵害,由于医生没有履行强制报告义务,直到检察机关用大数据模型发现了蛛丝马迹,犯罪分子才被警方抓获,并最终受到了法律的严惩。

荣杰介绍,通过大数据模型的帮助,检察机关发现并向相关行政主管部门移送未履行强制报告义务线索12条,督促行政主管部门处罚9家单位、8名个人。

针对部分医护人员未履行强制报告义务的情况,检察机关和卫健委合作,持续为妇幼方面的医护人员开展培训,说明在哪些情况下医护人员必须要进行报告,从而保护未成年人的身心健康。

“我们检察机关每个季度都会对所有受理的审查起诉案件进行倒查,确认相关单位是否履行了强制报告义务。让我倍感欣慰的是,今年以来的案件中,北京检察机关再没有发现一起医生未履行强制报告义务的情况。”荣杰说,“我们仍会不断用好大数据模型,守护好未成年人健康成长。我们深知,每多挖掘一个监督线索,就是多保护和帮助一个孩子。”

祁治国表示,北京市检察院非常注重“3+N”大数据模型矩阵系统在全国的推广应用。截至今年11月,北京市检察院“数智枫桥·数治北京”技术工作室已先后接待30多家相关单位参观调研。“模型采取模块化建设思路,可以方便地实现相关兄弟单位间的共建、共享、共用。”

对话北京市人民检察院副检察长祁治国:创新应变,数智赋能践行新时代“枫桥经验”的实践路径

北青报:打造北京检察“数智枫桥·数治北京”解决方案的初衷是什么?

祁治国:随着我国城镇化进程快速推进,人口流动频繁,城乡结构发生了深刻变化,传统治理模式已难以应对。这就要求我们主动去“识变”,根据这些变化调整我们的工作思路。北京检察机关在参与化解这些社会矛盾风险的实践中注意到,传统的化解方式还存在一些短板,比如以往我们很多是风险爆发后才介入处理,是被动处理而非主动处理。在依靠传统方式开展工作的同时,我们也在主动思考,如何克服这些短板不足?我们注意到,人工智能大数据模型的高速发展,这种新质生产力已经在多个领域改变了原有的工作模式,极大地提高了工作效率与工作成效。能不能把智能工具和我们化解矛盾风险工作相结合,从而坚持好和发展好新时代的“枫桥经验”,这种思考就是我们打造北京检察“数智枫桥·数治北京”解决方案的初衷。

北青报:北京检察是如何打造出了“数智枫桥·数治北京”这一解决方案的?

祁治国:有了之前提到的“识变”,我们就要努力“应变”,用科技的手段,把我们的想法变为工作实效。这要求我们引入人工智能模型,用系统的、大数据的思维去思考。我们建立起了“3+N”控告申诉大数据模型矩阵系统,这个大数据模型矩阵系统可以让我们实现从“办一案”走向“治一片”,从“被动应对”向“提前预防”进行转变。应该讲,是科技的力量与北京检察官的大数据思维,让我们把曾经的不可能,变为了今天的可能。

举例说,拖欠税费的案件因为数据量很大,调查起来非常困难。但我们打造了检察监督税费大数据模型,聚焦水资源税等重点领域,以国有财产保护领域公益诉讼,推动了拖欠税费征缴工作的开展。这就是“科技赋能”给检察工作带来的质的飞跃。

北青报:能不能用一句最简单的话,概括北京检察“数智枫桥·数治北京”的核心内容?

祁治国:在我看来,我们的“数智枫桥·数治北京”的核心内容可以用16个字来概括:系统施治、科技赋能、协同联动、预防在前。这是北京检察机关勇于“求变”的生动体现。

我们通过转变思想观念,应用科技手段,实现了矛盾风险最大程度的预防与化解,这就是我们控告申诉工作的现实意义所在,也是我们坚持和发展新时代“枫桥经验”打造出的“北京样板”。

摄影/马向峰

更多热点速报、权威资讯、深度分析尽在北京日报App

来源:政知见

如遇作品内容、版权等问题,请在相关文章刊发之日起30日内与本网联系。版权侵权联系电话:010-85202353