Para colaborar o pedir ayuda


Tenemos un foro donde se pueden aportar contribuciones o pedir ayuda: el foro de usuarios de LanguageTool. Podéis dejar un mensaje o abrir un hilo en español, aunque el foro está en inglés. Para ayudarnos a discriminar lo mensajes, empezad el hilo con [es], así sabré que está relacionado con el español. Más información en la página de cómo colaborar.

lunes, 27 de septiembre de 2010

Liberada LanguageTool 1.1

Ya está disponible para descargar LanguageTool 1.1. Esto supone un hito importante ya que es la primera versión de LanguageTool que incluye un soporte explotable para el español. Las anteriores versiones incluían soporte para el español, pero era un soporte más teórico que práctico.

Ahora se incluye un sintetizador para español (se generan sugerencias cambiando la flexión de las palabras), una segmentación optimizada (se separan las oraciones con más precisión), un diccionario actualizado (con más palabras y con menos errores) y un completo conjunto de reglas que ayudan a encontrar los errores más frecuentes que se comenten al escribir en español. Además, se incluyen unos cuantos falsos amigos inglés-español para los que escriben en una segunda lengua.

Para ver el soporte que LanguageTool ofrece para los distintos idiomas, se puede visitar la página de idiomas soportados por LanguageTool (en inglés).

Que nadie se deje impresionar por los idiomas con muchas reglas. Siguiendo el Principio de Pareto, el 80% de los errores cometibles se detectan con el 20% de las reglas formulables. Además, también he comprobado que lo que otros han resuelto con ocho o diez reglas, a veces se podía resolver en una sola.

Tener pocas reglas no será un problema si se detectan suficientes errores potenciales. Muy por el contrario, eso aumentará el rendimiento, con lo que la herramienta procesará más texto en menos tiempo.

lunes, 20 de septiembre de 2010

Hoja de ruta

Al final los líderes de desarrollo de LanguageTool se han decidido y han planificado una hoja de ruta para la liberación de sucesivas versiones del software.

En realidad es una hoja escueta en la que prácticamente sólo hay fechas. De una hoja de ruta normalmente se espera algo más, al menos qué funcionalidades o prestaciones se tiene pensado incluir.

Pero algo es algo:

26 de septiembre 2010: LanguageTool 1.1
Esta versión ya incluirá un soporte aprovechable de español, además de algunas mejoras e incidencias resueltas. Incluirá soporte inicial para bielorruso y malayo. Incluye soporte para revisión de textos bilingües.

Finales de 2010: LanguageTool 1.2

Finales de marzo de 2011: LanguageTool 1.3

Para más información, se puede consultar la hoja oficial de ruta de LanguageTool (en inglés).

martes, 1 de junio de 2010

Qué es y qué no es un corrector gramatical

Un corrector gramatical automático es un asistente para la redacción. Su función es destacar potenciales incorrecciones y, eventualmente, faltas de estilo. Sin embargo, casi nunca puede sustituir al buen criterio del redactor ni, desde luego, suplir todo desconocimiento de Ortografía y Gramática.

El corrector gramatical llega allí donde el ortográfico no llega. El corrector ortográfico busca cada palabra en su diccionario y, la que no encuentra, la marca como errónea. El corrector gramatical busca combinaciones de palabras y cuando encuentra una que cumple ciertas reglas, la señala. Por ejemplo, si escribiéramos *«eso lo dijiste tu» el corrector gramatical detectaría la regla "«tu» al final de la oración" y sugeriría permutar «tu» por «tú».

El corrector señalará aquellas construcciones dudosas o que sean directamente erróneas, de forma que el redactor pueda cambiarlas bien aceptando la sugerencia o bien modificando el texto de otra forma. También está la opción de ignorar la recomendación e incluso de ignorar las siguientes aplicaciones de la misma regla (sería útil, por ejemplo, si en el texto abundaran las palabras separadas por dos espacios intencionadamente). La decisión --y, en definitiva, la responsabilidad de lo que se escribe-- es siempre del escritor.

El corrector gramatical puede señalar:

  • Algunos errores tipográficos. Si escribimos *«todavía no a venido», el corrector ortográfico aceptará todas las palabras como correctas, ya que están en el diccionario. Sin embargo, el corrector gramatical nos sugerirá permutar «a» por «ha», ya que tal como queda escrito no tiene sentido en español.
  • Algunos errores morfosintácticos. Si escribimos *«la águila», el corrector gramatical nos sugerirá permutar «la» por «el». Si nos dejamos una «s» en un plural, el corrector gramatical podría detectarlo.
  • Algunos errores sintácticos. Si escribimos «pienso de que», el corrector nos ofrecerá eliminar la preposición «de».
  • Algunos errores de puntuación. Nos avisará, por ejemplo, si hemos omitido cerrar comillas o paréntesis.
  • Algunas faltas de estilo. Expresiones muy manidas, o de mal gusto, pueden ser detectadas también. En ocasiones, lo que señala el corrector puede ser un falso positivo, ya que la construcción es correcta en español. Sin embargo suele ser útil también el falso positivo, ya que si una construcción despista al corrector gramatical, es que la construcción tiene cierta complejidad y por tanto será eventualmente difícil de comprender para un lector. Así, si se quiere producir un texto claro, el corrector gramatical puede ayudar en este sentido.

El corrector gramatical no puede:

  • Desambiguar oraciones con significado distinto. Por ejemplo «me tomé solo un café» y «me tomé sólo un café» tienen significado distinto, pero para un corrector automático es virtualmente imposible adivinar si el redactor quería decir que se tomó un café sin compañía o si lo único que se tomó fue un café.
  • Señalar todas las posibilidades de contorsión del idioma. Precisamente es la versatilidad del español la que hace que se puedan decir muchas cosas de forma distinta. Sin embargo, si nos ponemos a mezclar palabras sin sentido, probablemente escapen al corrector gramatical, ya que éste necesita una cierta estructura para funcionar bien. Un caso particular es cuando el corrector ortográfico ha detectado un error. Puede que el corrector gramatical detecte otro que no sea tal. En este caso, antes de atender los avisos del corrector gramatical, es recomendable atender los del corrector ortográfico.
El buen corrector gramatical es el que guarda un equilibrio entre lo que detecta y lo que deja pasar. Lo importante es detectar la mayoría de los deslices que se cometen al escribir normalmente.

sábado, 29 de mayo de 2010

Instalación de LanguageTool en OpenOffice

ATENCIÓN: Este tutorial es antiguo y se guarda para referencia. Recomiendo, en su lugar, ir a Instalación de LanguageTool en Libreoffice/OpenOffice


Introducción

LanguageTool puede instalarse como una extensión de OpenOffice. En este artículo veremos en pasos sencillos cómo hacerlo.

Requisitos previos

Para instalar LanguageTool, se necesita:
  • OpenOffice.org 3.0 ó superior y
  • Java (JRE 5.0 ó superior)
Una forma rápida de asegurarse de que la instalación será correcta en Ubuntu y derivados es tener instalado el paquete openoffice.org-java-common.

En Windows bastará con tener instalada la última versión de Java. Puede descargarse desde la página oficial.

Descarga del software

La versión liberada de LanguageTool se puede descargar desde su página principal.

La versión actual (a 27/09/10) es LanguageTool-1.1.oxt. Esta es la primera que viene con una importante cantidad de reglas para español.

Para obtener otras versiones, bien antiguas bien en desarrollo, puede hacerse desde la página de descargas. Las actualizaciones importantes irán reflejadas en este blog.

Instalación

Para instalar la extensión, abrir OpenOffice.org o cualquiera de sus aplicaciones de forma que podamos acceder al menú Herramientas --> Administrador de extensiones:

Desde el administrador de extensiones, pulsar el botón [Añadir]:

Seleccionamos el archivo previamente descargado (el nombre de archivo en la ilustración puede variar dependiendo de la versión actual de LanguageTool):

El complemento se instalará a continuación:

Después de esta operación el complemento ya estará disponible para usarse. Writer ya subrayará en azul los candidatos a error gramatical u ortográfico que detecte.

Configuración

LanguageTool permite configurar las reglas que se aplicarán al texto objeto de análisis. La configuración por defecto (la que viene predeterminada) será la más apropiada para la mayoría de los usuarios, pero es posible que algún redactor tenga necesidades distintas. Por ejemplo, puede surgir la necesidad de activar la opción de la concordancia predicativa (viene desactivada por defecto). De este modo se detectarán problemas potenciales en oraciones del tipo *«el salmón es frescos» pero también se dispararán falsas alarmas en oraciones como «La vida es sueño».

Para configurar la extensión, desde Writer, seleccionar en el menú Herramientas --> LanguageTool:
En la pantalla de configuración, seleccionar las reglas o categorías de reglas para activar/desactivar:

Es aconsejable seleccionar el idioma nativo del redactor, sobre todo si se tiene previsto elaborar trabajos en otros idiomas. De esta manera, cuando escribamos en inglés, por ejemplo, LanguageTool detectará potenciales falsos amigos. Así, cada vez que escribamos una palabra del catálogo de falsos amigos, LanguageTool nos la marcará. Por ejemplo, si escribiendo en inglés ponemos «sensible» LanguageTool nos marcará la palabra y nos ofrecerá la alternativa «sensitive».

Desinstalación

Simplemente nos dirigimos al administrador de extensiones de nuevo y pulsamos en el botón [Eliminar] que está en la lista:
OpenOffice nos perguntará si estamos seguros de eliminar la extensión. Es seguro desinstalar la extensión, lo único es que la configuración de las reglas y la lengua nativa se pierde y lo tendríamos que volver a configurar al reinstalar.

Conclusión


LanguageTool es muy sencillo de instalar, configurar y desinstalar. Espero que sirva de ayuda a los demás como me está sirviendo a mí.

martes, 25 de mayo de 2010

Un corrector gramatical Open Source para OpenOffice

Siempre me pareció fantástico disponer de una alternativa libre a los paquetes ofimáticos. El acabado de OpenOffice ha mejorado sensiblemente en los últimos años, igualando y superando en muchos aspectos a sus competidores de software propietario. Lo único que realmente he echado de menos en OpenOffice, concretamente en Writer, ha sido un corrector gramatical como tienen algunos de sus competidores. Buscando y rebuscando encontré LanguageTool, un corrector gramatical libre, pensado para ser multi-idioma, y para integrarse en OpenOffice.

Desgraciadamente, el soporte para español era testimonial. Básicamente consistía en unos pocos ejemplos (una regla en java y ocho en XML) y ni siquiera había un encargado de reglas en español. Sin embargo, el catalán y el gallego contaban con ¡más de ciento cincuenta reglas cada uno!

El español, lengua de Cervantes, segunda lengua más hablada nativamente del mundo detrás del chino, estaba prácticamente abandonada en el proyecto, a pesar de que estaba soportada desde finales de 2006. Esto no podía ser.

Así que decidí involucrarme en el proyecto. No tenía excusa para no hacerlo, ya que cumplo con todos los requisitos que son necesarios para una tarea de estas características: Conocimientos de programación, manejo de expresiones regulares, XML, Java, control de código y gestión de proyectos, compromiso con el software libre y por último pero no por ello menos importante, dominio del español. Esto último no resulta tan obvio a juzgar por lo que se ha extendido últimamente la fea costumbre de patear el Diccionario y de infligir dolorosos arrastrones a la Gramática.

Hoy, unas semanas después, tenemos un corrector gramatical libre, en español, y preparado para usarse integrado en OpenOffice. Dista mucho de ser perfecto, pero creo que será bastante útil para el que lo use.

Acepto ayuda de todo tipo: falsos positivos y nuevas reglas. Podéis probar en línea en la comunidad. Para hacerme llegar las aportaciones, podéis hacerlo a través de comentarios en este blog, que para eso se ha creado.

(NOTA: LanguageTool 1.0.0 tiene un soporte de español muy, pero que muy básico. Hasta que se libere la siguiente versión, recomiendo instalar la versión en desarrollo)