lunes, 21 de enero de 2013

Crear diccionarios de palabras por idiomas

Cómo crear un diccionario de palabras con ASPELL en texto plano:
#! /usr/bin/python
import os, sys

if len(sys.argv)<2:
        print "crear-dict.py idioma"
        sys.exit(0)

first=True
for LANG in sys.argv:
        if first:
                first=False
                continue
        print "Generando dicconario "+LANG
        os.system(" aspell --lang="+LANG+" dump master | aspell --lang="+LANG+" expand | tr ' ' '\n' >> dict.txt")

Su uso es muy sencillo. Si queremos crear un diccionario en euskera
./crear-dict.py eu
Que queremos crear uno de Castellano y Euskera en el mismo fichero ejecutamos:
./crear-dict.py es eu