JurisBert
JurisBert, es una iniciativa de la Suprema Corte de Justicia de la Nación (SCJN) de México, nace en agosto del 2020, a propuesta de la Unidad General de Administración del Conocimiento Jurídico (UGACJ), para entrenar un Modelo del Lenguaje contextualizado al ámbito jurídico. Su principal objetivo es generar aplicaciones de Procesamiento del Lenguaje Natural (PLN) que coadyuven a la labor jurisdiccional del Alto Tribunal mediante el aprovechamiento del conocimiento de la SCJN plasmado en documentos no estructurados que generan las áreas jurisdiccionales.
En 2021, esta iniciativa tomó mayor relevancia con la llegada de la Reforma Judicial y el inicio de la undécima época del SJF, puesto que la creación de JurisBert tiene como objetivos principales la ayuda a la identificación del precedente y la creación de Plataformas de Recuperación de Información.
Como parte de la Transformación Digital impulsada por la SCJN, en razón de generar un esquema de “Gobierno Abierto” mediante la Colaboración e Innovación y en el contexto de la operación remota obligada por la contingencia sanitaria derivada del virus SARS COV 2, se pone a disposición de toda la comunidad esta innovación tecnológica pretendiendo con ello la retribución del conocimiento generado por el Alto Tribunal a la ciudadanía.
Es su primer versión, JurisBert es un modelo del lenguaje basado en Transformadores, teniendo como base SpanBERTa
from transformers import AutoTokenizer, AutoModel
tokenizer = AutoTokenizer.from_pretrained("scjnugacj/jurisbert")
model = AutoModel.from_pretrained("scjnugacj/jurisbert")
from transformers import pipeline
fill_mask = pipeline(
"fill-mask",
model="scjnugacj/jurisbert",
tokenizer="scjnugacj/jurisbert"
)
fill_mask("interés superior del <mask>.")
[
{
"score": 0.941512405872345,
"token": 3152,
"token_str": " menor",
"sequence": "interés superior del menor"
},
{
"score": 0.046888645738363266,
"token": 3337,
"token_str": " niño",
"sequence": "interés superior del niño"
},
{
"score": 0.004166217986494303,
"token": 9386,
"token_str": " adolescente",
"sequence": "interés superior del adolescente"
},
{
"score": 0.0008063237182796001,
"token": 4914,
"token_str": " menores",
"sequence": "interés superior del menores"
},
{
"score": 0.0006806919700466096,
"token": 48133,
"token_str": " infante",
"sequence": "interés superior del infante"
}
]
Términos de uso
Al descargar este modelo usted ha aceptado quedar vinculado por los términos establecidos en este aviso legal. El propietario del modelo se reserva el derecho de enmendar, modificar o sustituir estos términos de uso en cualquier momento y sin previo aviso.
Cuando una persona o entidad despliegue o proporcione sistemas, servicios, y/o cualquier tecnología a terceros usando este modelo y/o alguno derivado del mismo, deben tener en cuenta que es su responsabilidad mitigar los riesgos derivados de su uso y cumplir con la normativa aplicable en todo momento.
En ningún caso el propietario de los modelos (SCJN – Suprema Corte de Justicia de la Nación) ni la ( UGACJ - Unidad General de Administración del Conocimiento Juridico) serán responsables de los resultados derivados del uso que se de a estos modelos.
Uso previsto
Este modelo fue creado con la finalidad de que cualquier persona o institución pueda crear herramientas de consulta de información jurídica del Estado Mexicano basados en modelos de lenguaje.