Los documentos de Microsoft Word, casi omnipresentes en los entornos empresariales, pueden considerarse un mal necesario para los usuarios de Linux. Claro que se pueden abrir archivos de Word en LibreOffice, pero es un dolor de cabeza esperar a que una pesada aplicación gráfica cargue el documento. Antiword es una solución que se ejecuta en tu terminal, perfecta para personas con ordenadores lentos o sistemas sin entorno gráfico.

Antiword ha sido portado a FreeBSD, BeOS, OS/2, Mac OS X, Amiga, VMS, NetWare, Plan9, EPOC, Zaurus PDA, MorphOS, Tru64/OSF, Minix, Solaris y DOS. Para este artículo, me centraré en su uso en Linux.

Características principales

Antiword le permite ver y convertir documentos de MS Word desde la línea de comandos. Puede convertir a los siguientes formatos:

  • Texto sin formato
  • Texto con formato
  • PDF
  • Postscript
  • XML (actualmente sólo se admite DocBook)

Limitaciones

Antes de que te emociones demasiado, tengo que mencionar que Antiword se actualizó por última vez en 2005 y no es compatible con los documentos DOCX más recientes. Tampoco puedes usarlo para editar tus documentos.

Cómo obtener Antiword

Si tu distribución de Linux tiene un gestor de paquetes, lo más probable es que puedas encontrar Antiword en uno de sus repositorios.

Si no es así, obtenga el archivo .tar.gz de la página de Antiword en Freecode. Extrae el archivo y entra en el directorio antiword-0.37. Luego ejecuta

makesudomakeinstall

Uso

Para los siguientes consejos de uso, voy a utilizar mi currículum como documento de ejemplo. Este es el aspecto que tiene en LibreOffice:

antiword-document-libreoffice

La forma más básica de utilizar antiword es simplemente mostrar el documento:

antiword curriculum.doc

anti-palabra-documento

Como puede ver, el comando por defecto no conserva ciertos aspectos del formato como el tamaño de la fuente, la cursiva y el subrayado, pero hace un buen trabajo presentando el texto de forma legible.

Para mostrar la información de formato, utilice la bandera “-f” en su comando:

antiword -f curriculum.doc

antipalabras

No, esto no muestra realmente el formato en un estilo WYSIWYG; más bien, le informa de ello con una sintaxis similar a la de las marcas. Por ejemplo, muestra el _texto subrayado_ con guiones bajos y el *texto en negrita* con asteriscos.

Para convertir su documento de Word en un archivo PDF, debe especificar un tamaño de papel utilizando el indicador “-a”. Antiword admite los siguientes tamaños de papel:

  • 10×14
  • a3
  • a4
  • a5
  • b4
  • b5
  • ejecutivo
  • folio
  • legal
  • carta
  • nota
  • cuarto
  • declaración
  • tabloide

Puede utilizar los mismos tamaños de papel al convertir un documento a Postscript, pero en ese caso debe utilizar el indicador “-p”.

Este ejemplo convierte el documento en un archivo PDF de tamaño tabloide:

antiword -a currículum tabloide.doc > currículum-tabloide.pdf

Este es el archivo PDF resultante que se muestra en Okular:

anti-palabra-tabloide

¡No está mal! El subrayado de puntos y el hipervínculo de la dirección de correo electrónico han desaparecido, pero en general, la conversión ha sido un éxito.

Si está convirtiendo a Postscript, también puede utilizar la opción “-L” para imprimir en modo horizontal.

Este ejemplo convertirá el documento a formato DocBook:

antiword -x db curriculum.doc > curriculum-docbook.docbook

La conversión también conservará los metadatos, incluidos el nombre del autor y la fecha de creación del documento. Este es el aspecto del XML sin procesar:

antiword-docbook-xml

Y este es el aspecto del archivo DocBook en LibreOffice:

antiword-docbook-libreoffice

Puede ver que tiene un aspecto diferente al del documento original de Word, pero la estructura se ha conservado en su mayor parte. La conversión a DocBook con Antiword probablemente funcione mejor con los documentos de Word que fueron creados con la conversión a XML en mente.

Para ver qué más se puede hacer con Antiword -incluyendo la restauración de texto que ha sido modificado en MS Word- consulte la página de manual (también está en línea).