Para colaborar o pedir ayuda


Tenemos un foro donde se pueden aportar contribuciones o pedir ayuda: el foro de usuarios de LanguageTool. Podéis dejar un mensaje o abrir un hilo en español, aunque el foro está en inglés. Para ayudarnos a discriminar lo mensajes, empezad el hilo con [es], así sabré que está relacionado con el español. Más información en la página de cómo colaborar.

Cómo colaborar con LanguageTool en español

LanguageTool exige mucho esfuerzo para obtener un conjunto de reglas de calidad. El objetivo es generalizar lo más posible y detectar el máximo número de incorrecciones con un conjunto de reglas mínimo. La política de calidad exige elegir cuidadosamente las reglas a aplicar, por lo que algunas reglas quedarán fuera del alcance y algunas otras requerirán un desarrollo más profundo.

En otro caso, habría muchas reglas de "fuerza bruta" que rebajarían el rendimiento y la mantenibilidad.

Se agradece cualquier esfuerzo de colaboración, en especial el de detección de falsos positivos (reglas que no deberían dispararse).

Falsos positivos


En general, las reglas buscan patrones literales (como en *"a grosso modo") o de valores sintácticos ( como "no + imperativo") atendiendo a un contexto (como en "tu al final de la oración").

En demasiadas ocasiones las palabras pueden tener diferentes valores dependiendo de la posición en la oración. Por ejemplo, "Amigo" puede valer como un nombre ("Tengo un amigo en ti"), un adjetivo ("Fue víctima del fuego amigo") o un verbo ("Yo amigo a los rivales dándoles vino"). A veces esto es difícil de controlar y saltan errores fantasma (falsos positivos).

La política de LanguageTool en español es "dejar pasar un error gramatical antes que disparar un error fantasma".

Incorrecciones no detectadas


Las incorrecciones más importantes para LanguageTool en español son las tipográficas; es decir; cuando nos comemos una letra al escribir o nos olvidamos de un acento. Barbaridades del tipo *"Sin ecuánime" queriendo decir "sine qua non" se incluyen, incluso cosas más finas como el dequeísmo y queísmo, pero no es el objetivo principal encontrar errores del tipo "haber" por "a ver". LanguageTool en español da prioridad a los redactores con conocimientos gramaticales básicos.

Cómo informar


  1. Comprobar si el caso existe ya.
  2. Utilizar el revisor de la comunidad.
  3. (Opcional) Utilizar el editor de reglas y generar un parche. He creado una guía.
  4. Abrir un nuevo hilo en el foro de la comunidad, con la marca [es] delante.
Un par de ejemplos:

Falso positivo


[es] Falso positivo en "a la par"

Cuando pruebo la oración "Es simpático a la par que trabajador.",  salta la regla DET_NOM_FEM [1] y obtengo:

  • Posible falta de concordancia de género entre «la» y «par». [Ver Regla] 
    Es simpático a la par que trabajador. 

La expresión es correcta y agradecería que se corrigiera.

He actualizado la regla añadiendo |par al segundo token como sigue:

<rule id="ID" name="Concordancia femenino en Determinante + nombre"> <pattern case_sensitive="yes"> <token postag="D.{2}F.*" postag_regexp="yes"></token> <token postag="N.{1}M.*" postag_regexp="yes"> <exception negate_pos="yes" postag="N.{1}M.*" postag_regexp="yes" scope="current"></exception> <exception regexp="yes">botones|\p{Lu}\p{L}*</exception> <exception inflected="yes" regexp="yes">la|do|número|par</exception> </token></pattern> <exception></exception> <message>Posible falta de concordancia de género entre «<match no="1">» y «<match no="2">».</match></match></message> <short>Concordancia de género dudosa.</short> <example type="incorrect">Me gusta <marker>esa teléfono</marker> para ti.</example> <example type="correct">Me gusta ese coche para ti.</example> </rule>


Un saludo,
Juan Martorell

Mejoras propuestas


[es] Té como sustantivo sin tilde

LanguageTool no detecta la falta de ortografía en para la oración "El te me gusta mucho". He probado la regla TE_N y no contempla el "te" detrás del artículo.

He creado una regla usando el generador de reglas de la web:

<rule id="ID" name="TE_ARTICULO"> <pattern> <token regexp="yes">el|un|algún|ningún</token> <token>te</token> <token negate_pos="yes" postag="V.*" postag_regexp="yes"></token> </pattern> <message>El <suggestion>té</suggestion> (bebida) lleva tilde.</message> <url>http://languagetool-es.blogspot.com/</url> <short>El 'té' (bebida) lleva tilde.</short> <example type="incorrect"><marker>El te me</marker> gusta mucho. Traigo un te especial. A ver si encontramos algún te de esos que te gustan.</example> <example type="correct">El té me gusta mucho.</example> <example type="correct">Ese te vale.</example> <example type="incorrect">Traigo un te especial.</example> <example type="incorrect">A ver si encontramos algún te de esos que te gustan.</example> </rule>
Un saludo,
Juan Martorell

Cuanta más información se suministre, más sencillo será trabajar en la solución.



3 comentarios :

  1. ¿Cuál es preferible Quiero presentarme o Me quiero presentar?
    ¿Puedes presentarte? o Te puedes presentar?

    ResponderEliminar
  2. Hola! Me interesaría contactar al coordinador de esta página Juan Martorrell para hacerle una consulta sobre mi interés en crear un diccionario Hunspell para ES-CR. ¡Gracias!

    ResponderEliminar